diff --git "a/2D/log_1105_2d_random.job" "b/2D/log_1105_2d_random.job"
new file mode 100644--- /dev/null
+++ "b/2D/log_1105_2d_random.job"
@@ -0,0 +1,760 @@
+nohup: ignoring input
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:441: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:309: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/timm/models/layers/__init__.py:48: FutureWarning: Importing from timm.models.layers is deprecated, please import via timm.layers
+  warnings.warn(f"Importing from {__name__} is deprecated, please import via timm.layers", FutureWarning)
+/root/miniconda3/envs/med/lib/python3.9/site-packages/huggingface_hub/file_download.py:943: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.
+  warnings.warn(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/pytorch_lightning/callbacks/model_checkpoint.py:432: UserWarning: ModelCheckpoint(save_last=True, save_top_k=None, monitor=None) is a redundant configuration. You can save the last checkpoint with ModelCheckpoint(save_top_k=None, monitor=None).
+  rank_zero_warn(
+GPU available: True, used: True
+TPU available: False, using: 0 TPU cores
+IPU available: False, using: 0 IPUs
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+Running on GPUs 0,1,2,3,4,5,6,7
+LatentDiffusion: Running in eps-prediction mode
+DiffusionWrapper has 859.53 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Manual init: model.diffusion_model.input_blocks.0.0.weight
+Deleting key model.diffusion_model.input_blocks.0.0.weight from state_dict.
+Restored from stable_diffusion/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt with 352 missing and 199 unexpected keys
+Missing Keys: ['model.diffusion_model.input_blocks.0.0.weight', 'cond_stage_model.model.logit_scale', 'cond_stage_model.model.visual.trunk.cls_token', 'cond_stage_model.model.visual.trunk.pos_embed', 'cond_stage_model.model.visual.trunk.patch_embed.proj.weight', 'cond_stage_model.model.visual.trunk.patch_embed.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.norm.weight', 'cond_stage_model.model.visual.trunk.norm.bias', 'cond_stage_model.model.visual.head.proj.weight', 'cond_stage_model.model.text.transformer.embeddings.word_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.position_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.token_type_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.bias', 'cond_stage_model.model.text.proj.0.weight', 'cond_stage_model.model.text.proj.2.weight']
+Unexpected Keys: ['model_ema.decay', 'model_ema.num_updates', 'cond_stage_model.transformer.text_model.embeddings.position_ids', 'cond_stage_model.transformer.text_model.embeddings.token_embedding.weight', 'cond_stage_model.transformer.text_model.embeddings.position_embedding.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.bias', 'cond_stage_model.transformer.text_model.final_layer_norm.weight', 'cond_stage_model.transformer.text_model.final_layer_norm.bias']
+Keeping EMAs of 688.
+Merged modelckpt-cfg: 
+{'target': 'pytorch_lightning.callbacks.ModelCheckpoint', 'params': {'dirpath': 'logs/train_instructpix2pix_2d_random/checkpoints', 'filename': '{epoch:06}', 'verbose': True, 'save_last': True}}
+Caution: Saving checkpoints every n train steps without deleting. This might require some free space.
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+0it [00:00, ?it/s]6342it [00:00, 1278675.00it/s]
+5073
+0it [00:00, ?it/s]361it [00:00, 3607.84it/s]370it [00:00, 3600.29it/s]
+0it [00:00, ?it/s]6342it [00:00, 1232921.25it/s]
+5073
+0it [00:00, ?it/s]359it [00:00, 3580.40it/s]370it [00:00, 3574.07it/s]
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:441: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:441: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:309: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/timm/models/layers/__init__.py:48: FutureWarning: Importing from timm.models.layers is deprecated, please import via timm.layers
+  warnings.warn(f"Importing from {__name__} is deprecated, please import via timm.layers", FutureWarning)
+/root/miniconda3/envs/med/lib/python3.9/site-packages/huggingface_hub/file_download.py:943: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.
+  warnings.warn(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:441: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:309: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/timm/models/layers/__init__.py:48: FutureWarning: Importing from timm.models.layers is deprecated, please import via timm.layers
+  warnings.warn(f"Importing from {__name__} is deprecated, please import via timm.layers", FutureWarning)
+/root/miniconda3/envs/med/lib/python3.9/site-packages/huggingface_hub/file_download.py:943: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.
+  warnings.warn(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:441: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:309: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/timm/models/layers/__init__.py:48: FutureWarning: Importing from timm.models.layers is deprecated, please import via timm.layers
+  warnings.warn(f"Importing from {__name__} is deprecated, please import via timm.layers", FutureWarning)
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+Running on GPUs 0,1,2,3,4,5,6,7
+LatentDiffusion: Running in eps-prediction mode
+DiffusionWrapper has 859.53 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Manual init: model.diffusion_model.input_blocks.0.0.weight
+Deleting key model.diffusion_model.input_blocks.0.0.weight from state_dict.
+Restored from stable_diffusion/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt with 352 missing and 199 unexpected keys
+Missing Keys: ['model.diffusion_model.input_blocks.0.0.weight', 'cond_stage_model.model.logit_scale', 'cond_stage_model.model.visual.trunk.cls_token', 'cond_stage_model.model.visual.trunk.pos_embed', 'cond_stage_model.model.visual.trunk.patch_embed.proj.weight', 'cond_stage_model.model.visual.trunk.patch_embed.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.norm.weight', 'cond_stage_model.model.visual.trunk.norm.bias', 'cond_stage_model.model.visual.head.proj.weight', 'cond_stage_model.model.text.transformer.embeddings.word_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.position_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.token_type_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.bias', 'cond_stage_model.model.text.proj.0.weight', 'cond_stage_model.model.text.proj.2.weight']
+Unexpected Keys: ['model_ema.decay', 'model_ema.num_updates', 'cond_stage_model.transformer.text_model.embeddings.position_ids', 'cond_stage_model.transformer.text_model.embeddings.token_embedding.weight', 'cond_stage_model.transformer.text_model.embeddings.position_embedding.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.bias', 'cond_stage_model.transformer.text_model.final_layer_norm.weight', 'cond_stage_model.transformer.text_model.final_layer_norm.bias']
+Keeping EMAs of 688.
+Merged modelckpt-cfg: 
+{'target': 'pytorch_lightning.callbacks.ModelCheckpoint', 'params': {'dirpath': 'logs/train_instructpix2pix_2d_random/checkpoints', 'filename': '{epoch:06}', 'verbose': True, 'save_last': True}}
+Caution: Saving checkpoints every n train steps without deleting. This might require some free space.
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+0it [00:00, ?it/s]6342it [00:00, 1280891.61it/s]
+5073
+0it [00:00, ?it/s]/root/miniconda3/envs/med/lib/python3.9/site-packages/huggingface_hub/file_download.py:943: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.
+  warnings.warn(
+356it [00:00, 3550.70it/s]370it [00:00, 3546.50it/s]
+0it [00:00, ?it/s]6342it [00:00, 1202055.04it/s]
+5073
+0it [00:00, ?it/s]342it [00:00, 3418.71it/s]370it [00:00, 3425.19it/s]
+initializing ddp: GLOBAL_RANK: 1, MEMBER: 2/8
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:441: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:309: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/timm/models/layers/__init__.py:48: FutureWarning: Importing from timm.models.layers is deprecated, please import via timm.layers
+  warnings.warn(f"Importing from {__name__} is deprecated, please import via timm.layers", FutureWarning)
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+Running on GPUs 0,1,2,3,4,5,6,7
+LatentDiffusion: Running in eps-prediction mode
+DiffusionWrapper has 859.53 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Manual init: model.diffusion_model.input_blocks.0.0.weight
+Deleting key model.diffusion_model.input_blocks.0.0.weight from state_dict.
+Restored from stable_diffusion/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt with 352 missing and 199 unexpected keys
+Missing Keys: ['model.diffusion_model.input_blocks.0.0.weight', 'cond_stage_model.model.logit_scale', 'cond_stage_model.model.visual.trunk.cls_token', 'cond_stage_model.model.visual.trunk.pos_embed', 'cond_stage_model.model.visual.trunk.patch_embed.proj.weight', 'cond_stage_model.model.visual.trunk.patch_embed.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.norm.weight', 'cond_stage_model.model.visual.trunk.norm.bias', 'cond_stage_model.model.visual.head.proj.weight', 'cond_stage_model.model.text.transformer.embeddings.word_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.position_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.token_type_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.bias', 'cond_stage_model.model.text.proj.0.weight', 'cond_stage_model.model.text.proj.2.weight']
+Unexpected Keys: ['model_ema.decay', 'model_ema.num_updates', 'cond_stage_model.transformer.text_model.embeddings.position_ids', 'cond_stage_model.transformer.text_model.embeddings.token_embedding.weight', 'cond_stage_model.transformer.text_model.embeddings.position_embedding.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.bias', 'cond_stage_model.transformer.text_model.final_layer_norm.weight', 'cond_stage_model.transformer.text_model.final_layer_norm.bias']
+Keeping EMAs of 688.
+Merged modelckpt-cfg: 
+{'target': 'pytorch_lightning.callbacks.ModelCheckpoint', 'params': {'dirpath': 'logs/train_instructpix2pix_2d_random/checkpoints', 'filename': '{epoch:06}', 'verbose': True, 'save_last': True}}
+Caution: Saving checkpoints every n train steps without deleting. This might require some free space.
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+0it [00:00, ?it/s]6342it [00:00, 1286031.52it/s]
+5073
+0it [00:00, ?it/s]/root/miniconda3/envs/med/lib/python3.9/site-packages/huggingface_hub/file_download.py:943: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.
+  warnings.warn(
+363it [00:00, 3621.85it/s]370it [00:00, 3614.98it/s]
+0it [00:00, ?it/s]6342it [00:00, 1188998.57it/s]
+5073
+0it [00:00, ?it/s]360it [00:00, 3596.42it/s]370it [00:00, 3589.77it/s]
+initializing ddp: GLOBAL_RANK: 2, MEMBER: 3/8
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:441: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+Running on GPUs 0,1,2,3,4,5,6,7
+LatentDiffusion: Running in eps-prediction mode
+DiffusionWrapper has 859.53 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Manual init: model.diffusion_model.input_blocks.0.0.weight
+Deleting key model.diffusion_model.input_blocks.0.0.weight from state_dict.
+Restored from stable_diffusion/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt with 352 missing and 199 unexpected keys
+Missing Keys: ['model.diffusion_model.input_blocks.0.0.weight', 'cond_stage_model.model.logit_scale', 'cond_stage_model.model.visual.trunk.cls_token', 'cond_stage_model.model.visual.trunk.pos_embed', 'cond_stage_model.model.visual.trunk.patch_embed.proj.weight', 'cond_stage_model.model.visual.trunk.patch_embed.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.norm.weight', 'cond_stage_model.model.visual.trunk.norm.bias', 'cond_stage_model.model.visual.head.proj.weight', 'cond_stage_model.model.text.transformer.embeddings.word_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.position_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.token_type_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.bias', 'cond_stage_model.model.text.proj.0.weight', 'cond_stage_model.model.text.proj.2.weight']
+Unexpected Keys: ['model_ema.decay', 'model_ema.num_updates', 'cond_stage_model.transformer.text_model.embeddings.position_ids', 'cond_stage_model.transformer.text_model.embeddings.token_embedding.weight', 'cond_stage_model.transformer.text_model.embeddings.position_embedding.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.bias', 'cond_stage_model.transformer.text_model.final_layer_norm.weight', 'cond_stage_model.transformer.text_model.final_layer_norm.bias']
+Keeping EMAs of 688.
+Merged modelckpt-cfg: 
+{'target': 'pytorch_lightning.callbacks.ModelCheckpoint', 'params': {'dirpath': 'logs/train_instructpix2pix_2d_random/checkpoints', 'filename': '{epoch:06}', 'verbose': True, 'save_last': True}}
+Caution: Saving checkpoints every n train steps without deleting. This might require some free space.
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+0it [00:00, ?it/s]6342it [00:00, 1299666.58it/s]
+5073
+0it [00:00, ?it/s]359it [00:00, 3581.06it/s]370it [00:00, 3575.76it/s]
+0it [00:00, ?it/s]/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:309: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+6342it [00:00, 1228593.41it/s]
+5073
+0it [00:00, ?it/s]357it [00:00, 3565.20it/s]370it [00:00, 3540.02it/s]
+initializing ddp: GLOBAL_RANK: 3, MEMBER: 4/8
+/root/miniconda3/envs/med/lib/python3.9/site-packages/timm/models/layers/__init__.py:48: FutureWarning: Importing from timm.models.layers is deprecated, please import via timm.layers
+  warnings.warn(f"Importing from {__name__} is deprecated, please import via timm.layers", FutureWarning)
+/root/miniconda3/envs/med/lib/python3.9/site-packages/huggingface_hub/file_download.py:943: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.
+  warnings.warn(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:441: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+initializing ddp: GLOBAL_RANK: 0, MEMBER: 1/8
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+Running on GPUs 0,1,2,3,4,5,6,7
+LatentDiffusion: Running in eps-prediction mode
+DiffusionWrapper has 859.53 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Manual init: model.diffusion_model.input_blocks.0.0.weight
+Deleting key model.diffusion_model.input_blocks.0.0.weight from state_dict.
+Restored from stable_diffusion/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt with 352 missing and 199 unexpected keys
+Missing Keys: ['model.diffusion_model.input_blocks.0.0.weight', 'cond_stage_model.model.logit_scale', 'cond_stage_model.model.visual.trunk.cls_token', 'cond_stage_model.model.visual.trunk.pos_embed', 'cond_stage_model.model.visual.trunk.patch_embed.proj.weight', 'cond_stage_model.model.visual.trunk.patch_embed.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.norm.weight', 'cond_stage_model.model.visual.trunk.norm.bias', 'cond_stage_model.model.visual.head.proj.weight', 'cond_stage_model.model.text.transformer.embeddings.word_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.position_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.token_type_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.bias', 'cond_stage_model.model.text.proj.0.weight', 'cond_stage_model.model.text.proj.2.weight']
+Unexpected Keys: ['model_ema.decay', 'model_ema.num_updates', 'cond_stage_model.transformer.text_model.embeddings.position_ids', 'cond_stage_model.transformer.text_model.embeddings.token_embedding.weight', 'cond_stage_model.transformer.text_model.embeddings.position_embedding.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.bias', 'cond_stage_model.transformer.text_model.final_layer_norm.weight', 'cond_stage_model.transformer.text_model.final_layer_norm.bias']
+Keeping EMAs of 688.
+Merged modelckpt-cfg: 
+{'target': 'pytorch_lightning.callbacks.ModelCheckpoint', 'params': {'dirpath': 'logs/train_instructpix2pix_2d_random/checkpoints', 'filename': '{epoch:06}', 'verbose': True, 'save_last': True}}
+Caution: Saving checkpoints every n train steps without deleting. This might require some free space.
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+0it [00:00, ?it/s]6342it [00:00, 783444.05it/s]
+5073
+0it [00:00, ?it/s]300it [00:00, 2992.80it/s]370it [00:00, 3084.48it/s]
+0it [00:00, ?it/s]6342it [00:00, 1217515.38it/s]
+5073
+0it [00:00, ?it/s]343it [00:00, 3422.61it/s]370it [00:00, 3423.77it/s]
+initializing ddp: GLOBAL_RANK: 4, MEMBER: 5/8
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:309: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/timm/models/layers/__init__.py:48: FutureWarning: Importing from timm.models.layers is deprecated, please import via timm.layers
+  warnings.warn(f"Importing from {__name__} is deprecated, please import via timm.layers", FutureWarning)
+/root/miniconda3/envs/med/lib/python3.9/site-packages/huggingface_hub/file_download.py:943: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.
+  warnings.warn(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/transformers/utils/generic.py:309: FutureWarning: `torch.utils._pytree._register_pytree_node` is deprecated. Please use `torch.utils._pytree.register_pytree_node` instead.
+  _torch_pytree._register_pytree_node(
+/root/miniconda3/envs/med/lib/python3.9/site-packages/timm/models/layers/__init__.py:48: FutureWarning: Importing from timm.models.layers is deprecated, please import via timm.layers
+  warnings.warn(f"Importing from {__name__} is deprecated, please import via timm.layers", FutureWarning)
+/root/miniconda3/envs/med/lib/python3.9/site-packages/huggingface_hub/file_download.py:943: FutureWarning: `resume_download` is deprecated and will be removed in version 1.0.0. Downloads always resume when possible. If you want to force a new download, use `force_download=True`.
+  warnings.warn(
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+Running on GPUs 0,1,2,3,4,5,6,7
+LatentDiffusion: Running in eps-prediction mode
+DiffusionWrapper has 859.53 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Manual init: model.diffusion_model.input_blocks.0.0.weight
+Deleting key model.diffusion_model.input_blocks.0.0.weight from state_dict.
+Restored from stable_diffusion/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt with 352 missing and 199 unexpected keys
+Missing Keys: ['model.diffusion_model.input_blocks.0.0.weight', 'cond_stage_model.model.logit_scale', 'cond_stage_model.model.visual.trunk.cls_token', 'cond_stage_model.model.visual.trunk.pos_embed', 'cond_stage_model.model.visual.trunk.patch_embed.proj.weight', 'cond_stage_model.model.visual.trunk.patch_embed.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.norm.weight', 'cond_stage_model.model.visual.trunk.norm.bias', 'cond_stage_model.model.visual.head.proj.weight', 'cond_stage_model.model.text.transformer.embeddings.word_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.position_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.token_type_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.bias', 'cond_stage_model.model.text.proj.0.weight', 'cond_stage_model.model.text.proj.2.weight']
+Unexpected Keys: ['model_ema.decay', 'model_ema.num_updates', 'cond_stage_model.transformer.text_model.embeddings.position_ids', 'cond_stage_model.transformer.text_model.embeddings.token_embedding.weight', 'cond_stage_model.transformer.text_model.embeddings.position_embedding.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.bias', 'cond_stage_model.transformer.text_model.final_layer_norm.weight', 'cond_stage_model.transformer.text_model.final_layer_norm.bias']
+Keeping EMAs of 688.
+Merged modelckpt-cfg: 
+{'target': 'pytorch_lightning.callbacks.ModelCheckpoint', 'params': {'dirpath': 'logs/train_instructpix2pix_2d_random/checkpoints', 'filename': '{epoch:06}', 'verbose': True, 'save_last': True}}
+Caution: Saving checkpoints every n train steps without deleting. This might require some free space.
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+0it [00:00, ?it/s]6342it [00:00, 1278367.74it/s]
+5073
+0it [00:00, ?it/s]360it [00:00, 3599.42it/s]370it [00:00, 3590.66it/s]
+0it [00:00, ?it/s]6342it [00:00, 1203142.43it/s]
+5073
+0it [00:00, ?it/s]363it [00:00, 3622.39it/s]370it [00:00, 3616.71it/s]
+initializing ddp: GLOBAL_RANK: 5, MEMBER: 6/8
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+Running on GPUs 0,1,2,3,4,5,6,7
+LatentDiffusion: Running in eps-prediction mode
+DiffusionWrapper has 859.53 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Manual init: model.diffusion_model.input_blocks.0.0.weight
+Deleting key model.diffusion_model.input_blocks.0.0.weight from state_dict.
+Restored from stable_diffusion/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt with 352 missing and 199 unexpected keys
+Missing Keys: ['model.diffusion_model.input_blocks.0.0.weight', 'cond_stage_model.model.logit_scale', 'cond_stage_model.model.visual.trunk.cls_token', 'cond_stage_model.model.visual.trunk.pos_embed', 'cond_stage_model.model.visual.trunk.patch_embed.proj.weight', 'cond_stage_model.model.visual.trunk.patch_embed.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.norm.weight', 'cond_stage_model.model.visual.trunk.norm.bias', 'cond_stage_model.model.visual.head.proj.weight', 'cond_stage_model.model.text.transformer.embeddings.word_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.position_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.token_type_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.bias', 'cond_stage_model.model.text.proj.0.weight', 'cond_stage_model.model.text.proj.2.weight']
+Unexpected Keys: ['model_ema.decay', 'model_ema.num_updates', 'cond_stage_model.transformer.text_model.embeddings.position_ids', 'cond_stage_model.transformer.text_model.embeddings.token_embedding.weight', 'cond_stage_model.transformer.text_model.embeddings.position_embedding.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.bias', 'cond_stage_model.transformer.text_model.final_layer_norm.weight', 'cond_stage_model.transformer.text_model.final_layer_norm.bias']
+Keeping EMAs of 688.
+Merged modelckpt-cfg: 
+{'target': 'pytorch_lightning.callbacks.ModelCheckpoint', 'params': {'dirpath': 'logs/train_instructpix2pix_2d_random/checkpoints', 'filename': '{epoch:06}', 'verbose': True, 'save_last': True}}
+Caution: Saving checkpoints every n train steps without deleting. This might require some free space.
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+0it [00:00, ?it/s]6342it [00:00, 1289085.34it/s]
+5073
+0it [00:00, ?it/s]361it [00:00, 3603.06it/s]370it [00:00, 3597.11it/s]
+0it [00:00, ?it/s]6342it [00:00, 1213350.18it/s]
+5073
+0it [00:00, ?it/s]364it [00:00, 3630.13it/s]370it [00:00, 3625.17it/s]
+initializing ddp: GLOBAL_RANK: 6, MEMBER: 7/8
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+Running on GPUs 0,1,2,3,4,5,6,7
+LatentDiffusion: Running in eps-prediction mode
+DiffusionWrapper has 859.53 M params.
+making attention of type 'vanilla' with 512 in_channels
+Working with z of shape (1, 4, 32, 32) = 4096 dimensions.
+making attention of type 'vanilla' with 512 in_channels
+Manual init: model.diffusion_model.input_blocks.0.0.weight
+Deleting key model.diffusion_model.input_blocks.0.0.weight from state_dict.
+Restored from stable_diffusion/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt with 352 missing and 199 unexpected keys
+Missing Keys: ['model.diffusion_model.input_blocks.0.0.weight', 'cond_stage_model.model.logit_scale', 'cond_stage_model.model.visual.trunk.cls_token', 'cond_stage_model.model.visual.trunk.pos_embed', 'cond_stage_model.model.visual.trunk.patch_embed.proj.weight', 'cond_stage_model.model.visual.trunk.patch_embed.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.0.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.0.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.1.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.1.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.2.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.2.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.3.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.3.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.4.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.4.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.5.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.5.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.6.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.6.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.7.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.7.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.8.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.8.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.9.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.9.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.10.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.10.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.qkv.bias', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.weight', 'cond_stage_model.model.visual.trunk.blocks.11.attn.proj.bias', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.norm2.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc1.bias', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.weight', 'cond_stage_model.model.visual.trunk.blocks.11.mlp.fc2.bias', 'cond_stage_model.model.visual.trunk.norm.weight', 'cond_stage_model.model.visual.trunk.norm.bias', 'cond_stage_model.model.visual.head.proj.weight', 'cond_stage_model.model.text.transformer.embeddings.word_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.position_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.token_type_embeddings.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.weight', 'cond_stage_model.model.text.transformer.embeddings.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.0.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.1.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.2.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.3.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.4.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.5.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.6.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.7.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.8.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.9.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.10.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.query.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.key.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.self.value.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.attention.output.LayerNorm.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.intermediate.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.dense.bias', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.weight', 'cond_stage_model.model.text.transformer.encoder.layer.11.output.LayerNorm.bias', 'cond_stage_model.model.text.proj.0.weight', 'cond_stage_model.model.text.proj.2.weight']
+Unexpected Keys: ['model_ema.decay', 'model_ema.num_updates', 'cond_stage_model.transformer.text_model.embeddings.position_ids', 'cond_stage_model.transformer.text_model.embeddings.token_embedding.weight', 'cond_stage_model.transformer.text_model.embeddings.position_embedding.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.0.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.1.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.2.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.3.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.4.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.5.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.6.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.7.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.8.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.9.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.10.layer_norm2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.k_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.v_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.q_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.self_attn.out_proj.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc1.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.mlp.fc2.bias', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.weight', 'cond_stage_model.transformer.text_model.encoder.layers.11.layer_norm2.bias', 'cond_stage_model.transformer.text_model.final_layer_norm.weight', 'cond_stage_model.transformer.text_model.final_layer_norm.bias']
+Keeping EMAs of 688.
+Merged modelckpt-cfg: 
+{'target': 'pytorch_lightning.callbacks.ModelCheckpoint', 'params': {'dirpath': 'logs/train_instructpix2pix_2d_random/checkpoints', 'filename': '{epoch:06}', 'verbose': True, 'save_last': True}}
+Caution: Saving checkpoints every n train steps without deleting. This might require some free space.
+[patch] torch.load monkey-patched for legacy Lightning/NumPy ckpt
+0it [00:00, ?it/s]6342it [00:00, 1267102.18it/s]
+5073
+0it [00:00, ?it/s]361it [00:00, 3602.75it/s]370it [00:00, 3594.28it/s]
+0it [00:00, ?it/s]6342it [00:00, 1219245.36it/s]
+5073
+0it [00:00, ?it/s]364it [00:00, 3636.73it/s]370it [00:00, 3629.77it/s]
+initializing ddp: GLOBAL_RANK: 7, MEMBER: 8/8
+----------------------------------------------------------------------------------------------------
+distributed_backend=nccl
+All DDP processes registered. Starting ddp with 8 processes
+----------------------------------------------------------------------------------------------------
+
+/root/miniconda3/envs/med/lib/python3.9/site-packages/pytorch_lightning/core/datamodule.py:423: LightningDeprecationWarning: DataModule.setup has already been called, so it will not be called again. In v1.6 this behavior will change to always call DataModule.setup.
+  rank_zero_deprecation(
+LOCAL_RANK: 7 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
+LOCAL_RANK: 3 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
+LOCAL_RANK: 5 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
+LOCAL_RANK: 4 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
+LOCAL_RANK: 0 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
+LOCAL_RANK: 2 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
+LOCAL_RANK: 6 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
+LOCAL_RANK: 1 - CUDA_VISIBLE_DEVICES: [0,1,2,3,4,5,6,7]
+
+  | Name              | Type                     | Params
+---------------------------------------------------------------
+0 | model             | DiffusionWrapper         | 859 M 
+1 | first_stage_model | AutoencoderKL            | 83.7 M
+2 | cond_stage_model  | FrozenBioMedCLIPEmbedder | 195 M 
+3 | model_ema         | LitEma                   | 0     
+---------------------------------------------------------------
+859 M     Trainable params
+279 M     Non-trainable params
+1.1 B     Total params
+4,556.356 Total estimated model params size (MB)
+#### Data #####
+train, CTReportDataset, 5073
+validation, CTReportDatasetinfer, 40
+accumulate_grad_batches = 4
+++++ NOT USING LR SCALING ++++
+Setting learning rate to 1.00e-04
+Setting up LambdaLR scheduler...
+Project config
+model:
+  base_learning_rate: 0.0001
+  target: ldm.models.diffusion.ddpm_edit.LatentDiffusion
+  params:
+    ckpt_path: stable_diffusion/models/ldm/stable-diffusion-v1/v1-5-pruned-emaonly.ckpt
+    linear_start: 0.00085
+    linear_end: 0.012
+    num_timesteps_cond: 1
+    log_every_t: 200
+    timesteps: 1000
+    first_stage_key: edited
+    cond_stage_key: edit
+    image_size: 64
+    channels: 4
+    cond_stage_trainable: false
+    conditioning_key: hybrid
+    monitor: val/loss_simple_ema
+    scale_factor: 0.18215
+    use_ema: true
+    load_ema: false
+    scheduler_config:
+      target: ldm.lr_scheduler.LambdaLinearScheduler
+      params:
+        warm_up_steps:
+        - 0
+        cycle_lengths:
+        - 10000000000000
+        f_start:
+        - 1.0e-06
+        f_max:
+        - 1.0
+        f_min:
+        - 1.0
+    unet_config:
+      target: ldm.modules.diffusionmodules.openaimodel.UNetModel
+      params:
+        image_size: 32
+        in_channels: 8
+        out_channels: 4
+        model_channels: 320
+        attention_resolutions:
+        - 4
+        - 2
+        - 1
+        num_res_blocks: 2
+        channel_mult:
+        - 1
+        - 2
+        - 4
+        - 4
+        num_heads: 8
+        use_spatial_transformer: true
+        transformer_depth: 1
+        context_dim: 768
+        use_checkpoint: true
+        legacy: false
+    first_stage_config:
+      target: ldm.models.autoencoder.AutoencoderKL
+      params:
+        embed_dim: 4
+        monitor: val/rec_loss
+        ddconfig:
+          double_z: true
+          z_channels: 4
+          resolution: 256
+          in_channels: 3
+          out_ch: 3
+          ch: 128
+          ch_mult:
+          - 1
+          - 2
+          - 4
+          - 4
+          num_res_blocks: 2
+          attn_resolutions: []
+          dropout: 0.0
+        lossconfig:
+          target: torch.nn.Identity
+    cond_stage_config:
+      target: ldm.modules.encoders.modules.FrozenBioMedCLIPEmbedder
+data:
+  target: main.DataModuleFromConfig
+  params:
+    batch_size: 8
+    num_workers: 8
+    train:
+      target: ldm.data.ct_clip_data_train.CTReportDataset
+      params:
+        data_folder: /workspace/jifu/data/dataset/train_fixed
+        csv_file: /workspace/jifu/data/data_json/radiology_text_reports/train_reports.csv
+    validation:
+      target: ldm.data.ct_clip_data_inference.CTReportDatasetinfer
+      params:
+        data_folder: /workspace/jifu/data/dataset/valid_fixed
+        csv_file: /workspace/jifu/data/data_json/radiology_text_reports/valid_reports.csv
+        labels: /workspace/jifu/data/data_json/multi_abnormality_labels/valid_predicted_labels.csv
+
+Lightning config
+callbacks:
+  image_logger:
+    target: main.ImageLogger
+    params:
+      batch_frequency: 200000000
+      max_images: 2
+      increase_log_steps: false
+trainer:
+  max_epochs: 2000
+  benchmark: true
+  accumulate_grad_batches: 4
+  check_val_every_n_epoch: 1000000
+  accelerator: ddp
+  gpus: 0,1,2,3,4,5,6,7
+
+Validation sanity check: 0it [00:00, ?it/s]Validation sanity check:   0%|          | 0/1 [00:00<?, ?it/s]#### Data #####
+train, CTReportDataset, 5073
+validation, CTReportDatasetinfer, 40
+accumulate_grad_batches = 4
+++++ NOT USING LR SCALING ++++
+Setting learning rate to 1.00e-04
+Setting up LambdaLR scheduler...
+#### Data #####
+train, CTReportDataset, 5073
+validation, CTReportDatasetinfer, 40
+accumulate_grad_batches = 4
+++++ NOT USING LR SCALING ++++
+Setting learning rate to 1.00e-04
+Setting up LambdaLR scheduler...
+#### Data #####
+train, CTReportDataset, 5073
+validation, CTReportDatasetinfer, 40
+accumulate_grad_batches = 4
+++++ NOT USING LR SCALING ++++
+Setting learning rate to 1.00e-04
+Setting up LambdaLR scheduler...
+#### Data #####
+train, CTReportDataset, 5073
+validation, CTReportDatasetinfer, 40
+accumulate_grad_batches = 4
+++++ NOT USING LR SCALING ++++
+Setting learning rate to 1.00e-04
+Setting up LambdaLR scheduler...
+#### Data #####
+train, CTReportDataset, 5073
+validation, CTReportDatasetinfer, 40
+accumulate_grad_batches = 4
+++++ NOT USING LR SCALING ++++
+Setting learning rate to 1.00e-04
+Setting up LambdaLR scheduler...
+#### Data #####
+train, CTReportDataset, 5073
+validation, CTReportDatasetinfer, 40
+accumulate_grad_batches = 4
+++++ NOT USING LR SCALING ++++
+Setting learning rate to 1.00e-04
+Setting up LambdaLR scheduler...
+#### Data #####
+train, CTReportDataset, 5073
+validation, CTReportDatasetinfer, 40
+accumulate_grad_batches = 4
+++++ NOT USING LR SCALING ++++
+Setting learning rate to 1.00e-04
+Setting up LambdaLR scheduler...
+We strongly recommend passing in an `attention_mask` since your input_ids may be padded. See https://huggingface.co/docs/transformers/troubleshooting#incorrect-output-when-padding-tokens-arent-masked.
+We strongly recommend passing in an `attention_mask` since your input_ids may be padded. See https://huggingface.co/docs/transformers/troubleshooting#incorrect-output-when-padding-tokens-arent-masked.
+We strongly recommend passing in an `attention_mask` since your input_ids may be padded. See https://huggingface.co/docs/transformers/troubleshooting#incorrect-output-when-padding-tokens-arent-masked.
+We strongly recommend passing in an `attention_mask` since your input_ids may be padded. See https://huggingface.co/docs/transformers/troubleshooting#incorrect-output-when-padding-tokens-arent-masked.
+We strongly recommend passing in an `attention_mask` since your input_ids may be padded. See https://huggingface.co/docs/transformers/troubleshooting#incorrect-output-when-padding-tokens-arent-masked.
+We strongly recommend passing in an `attention_mask` since your input_ids may be padded. See https://huggingface.co/docs/transformers/troubleshooting#incorrect-output-when-padding-tokens-arent-masked.
+We strongly recommend passing in an `attention_mask` since your input_ids may be padded. See https://huggingface.co/docs/transformers/troubleshooting#incorrect-output-when-padding-tokens-arent-masked.
+We strongly recommend passing in an `attention_mask` since your input_ids may be padded. See https://huggingface.co/docs/transformers/troubleshooting#incorrect-output-when-padding-tokens-arent-masked.
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/distributed/distributed_c10d.py:4807: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/distributed/distributed_c10d.py:4807: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+Validation sanity check: 100%|██████████| 1/1 [00:33<00:00, 33.75s/it]/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/distributed/distributed_c10d.py:4807: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/distributed/distributed_c10d.py:4807: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/distributed/distributed_c10d.py:4807: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/distributed/distributed_c10d.py:4807: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/distributed/distributed_c10d.py:4807: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/distributed/distributed_c10d.py:4807: UserWarning: No device id is provided via `init_process_group` or `barrier `. Using the current device set by the user. 
+  warnings.warn(  # warn only once
+                                                                      Training: -1it [00:00, ?it/s]Training:   0%|          | 0/80 [00:00<00:00, 24966.10it/s]Epoch 0:   0%|          | 0/80 [00:00<00:00, 6288.31it/s]  Epoch 0:   1%|▏         | 1/80 [01:07<44:13, 33.58s/it]  Epoch 0:   1%|▏         | 1/80 [01:07<44:13, 33.58s/it, loss=0.0414, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.00021, train/loss_step=0.0414, global_step=0.000, lr_abs=0.0001]Epoch 0:   2%|▎         | 2/80 [01:07<29:19, 22.56s/it, loss=0.0414, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.00021, train/loss_step=0.0414, global_step=0.000, lr_abs=0.0001]Epoch 0:   2%|▎         | 2/80 [01:07<29:19, 22.56s/it, loss=0.0393, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000209, train/loss_step=0.0373, global_step=0.000, lr_abs=0.0001]Epoch 0:   4%|▍         | 3/80 [01:08<21:52, 17.04s/it, loss=0.0393, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000209, train/loss_step=0.0373, global_step=0.000, lr_abs=0.0001]Epoch 0:   4%|▍         | 3/80 [01:08<21:52, 17.04s/it, loss=0.0382, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000143, train/loss_step=0.036, global_step=0.000, lr_abs=0.0001]  /root/miniconda3/envs/med/lib/python3.9/site-packages/torch/autograd/graph.py:829: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed.  This is not an error, but may impair performance.
+grad.sizes() = [320, 320, 1, 1], strides() = [320, 1, 320, 320]
+bucket_view.sizes() = [320, 320, 1, 1], strides() = [320, 1, 1, 1] (Triggered internally at /pytorch/torch/csrc/distributed/c10d/reducer.cpp:334.)
+  return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/autograd/graph.py:829: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed.  This is not an error, but may impair performance.
+grad.sizes() = [320, 320, 1, 1], strides() = [320, 1, 320, 320]
+bucket_view.sizes() = [320, 320, 1, 1], strides() = [320, 1, 1, 1] (Triggered internally at /pytorch/torch/csrc/distributed/c10d/reducer.cpp:334.)
+  return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/autograd/graph.py:829: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed.  This is not an error, but may impair performance.
+grad.sizes() = [320, 320, 1, 1], strides() = [320, 1, 320, 320]
+bucket_view.sizes() = [320, 320, 1, 1], strides() = [320, 1, 1, 1] (Triggered internally at /pytorch/torch/csrc/distributed/c10d/reducer.cpp:334.)
+  return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/autograd/graph.py:829: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed.  This is not an error, but may impair performance.
+grad.sizes() = [320, 320, 1, 1], strides() = [320, 1, 320, 320]
+bucket_view.sizes() = [320, 320, 1, 1], strides() = [320, 1, 1, 1] (Triggered internally at /pytorch/torch/csrc/distributed/c10d/reducer.cpp:334.)
+  return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/autograd/graph.py:829: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed.  This is not an error, but may impair performance.
+grad.sizes() = [320, 320, 1, 1], strides() = [320, 1, 320, 320]
+bucket_view.sizes() = [320, 320, 1, 1], strides() = [320, 1, 1, 1] (Triggered internally at /pytorch/torch/csrc/distributed/c10d/reducer.cpp:334.)
+  return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/autograd/graph.py:829: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed.  This is not an error, but may impair performance.
+grad.sizes() = [320, 320, 1, 1], strides() = [320, 1, 320, 320]
+bucket_view.sizes() = [320, 320, 1, 1], strides() = [320, 1, 1, 1] (Triggered internally at /pytorch/torch/csrc/distributed/c10d/reducer.cpp:334.)
+  return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/autograd/graph.py:829: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed.  This is not an error, but may impair performance.
+grad.sizes() = [320, 320, 1, 1], strides() = [320, 1, 320, 320]
+bucket_view.sizes() = [320, 320, 1, 1], strides() = [320, 1, 1, 1] (Triggered internally at /pytorch/torch/csrc/distributed/c10d/reducer.cpp:334.)
+  return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
+/root/miniconda3/envs/med/lib/python3.9/site-packages/torch/autograd/graph.py:829: UserWarning: Grad strides do not match bucket view strides. This may indicate grad was not created according to the gradient layout contract, or that the param's strides changed since DDP was constructed.  This is not an error, but may impair performance.
+grad.sizes() = [320, 320, 1, 1], strides() = [320, 1, 320, 320]
+bucket_view.sizes() = [320, 320, 1, 1], strides() = [320, 1, 1, 1] (Triggered internally at /pytorch/torch/csrc/distributed/c10d/reducer.cpp:334.)
+  return Variable._execution_engine.run_backward(  # Calls into the C++ engine to run the backward pass
+Epoch 0:   5%|▌         | 4/80 [01:18<19:59, 15.78s/it, loss=0.0382, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.000143, train/loss_step=0.036, global_step=0.000, lr_abs=0.0001]Epoch 0:   5%|▌         | 4/80 [01:18<19:59, 15.78s/it, loss=0.0352, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=9.58e-5, train/loss_step=0.026, global_step=0.000, lr_abs=0.0001] Epoch 0:   6%|▋         | 5/80 [01:19<16:32, 13.24s/it, loss=0.0352, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=9.58e-5, train/loss_step=0.026, global_step=0.000, lr_abs=0.0001]Epoch 0:   6%|▋         | 5/80 [01:19<16:32, 13.24s/it, loss=0.0375, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000304, train/loss_step=0.0469, global_step=1.000, lr_abs=0.0001]Epoch 0:   8%|▊         | 6/80 [01:19<14:04, 11.42s/it, loss=0.0375, v_num=0, train/loss_simple_step=0.0469, train/loss_vlb_step=0.000304, train/loss_step=0.0469, global_step=1.000, lr_abs=0.0001]Epoch 0:   8%|▊         | 6/80 [01:19<14:04, 11.42s/it, loss=0.0397, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.00304, train/loss_step=0.0504, global_step=1.000, lr_abs=0.0001] Epoch 0:   9%|▉         | 7/80 [01:20<12:13, 10.05s/it, loss=0.0397, v_num=0, train/loss_simple_step=0.0504, train/loss_vlb_step=0.00304, train/loss_step=0.0504, global_step=1.000, lr_abs=0.0001]Epoch 0:   9%|▉         | 7/80 [01:20<12:13, 10.05s/it, loss=0.043, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000697, train/loss_step=0.0629, global_step=1.000, lr_abs=0.0001]Epoch 0:  10%|█         | 8/80 [01:42<13:38, 11.36s/it, loss=0.043, v_num=0, train/loss_simple_step=0.0629, train/loss_vlb_step=0.000697, train/loss_step=0.0629, global_step=1.000, lr_abs=0.0001]Epoch 0:  10%|█         | 8/80 [01:42<13:38, 11.36s/it, loss=0.0401, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.29e-5, train/loss_step=0.0196, global_step=1.000, lr_abs=0.0001]Epoch 0:  11%|█▏        | 9/80 [01:43<12:12, 10.31s/it, loss=0.0401, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.29e-5, train/loss_step=0.0196, global_step=1.000, lr_abs=0.0001]Epoch 0:  11%|█▏        | 9/80 [01:43<12:12, 10.31s/it, loss=0.0381, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.5e-5, train/loss_step=0.0221, global_step=2.000, lr_abs=0.0001] Epoch 0:  12%|█▎        | 10/80 [01:44<11:04,  9.50s/it, loss=0.0381, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=8.5e-5, train/loss_step=0.0221, global_step=2.000, lr_abs=0.0001]Epoch 0:  12%|█▎        | 10/80 [01:44<11:04,  9.50s/it, loss=0.0392, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000207, train/loss_step=0.0497, global_step=2.000, lr_abs=0.0001]Epoch 0:  14%|█▍        | 11/80 [01:44<10:03,  8.75s/it, loss=0.0392, v_num=0, train/loss_simple_step=0.0497, train/loss_vlb_step=0.000207, train/loss_step=0.0497, global_step=2.000, lr_abs=0.0001]Epoch 0:  14%|█▍        | 11/80 [01:44<10:03,  8.75s/it, loss=0.039, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000146, train/loss_step=0.0369, global_step=2.000, lr_abs=0.0001] Epoch 0:  15%|█▌        | 12/80 [01:45<09:11,  8.12s/it, loss=0.039, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000146, train/loss_step=0.0369, global_step=2.000, lr_abs=0.0001]Epoch 0:  15%|█▌        | 12/80 [01:45<09:11,  8.12s/it, loss=0.04, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000235, train/loss_step=0.0511, global_step=2.000, lr_abs=0.0001] Epoch 0:  16%|█▋        | 13/80 [01:46<08:27,  7.57s/it, loss=0.04, v_num=0, train/loss_simple_step=0.0511, train/loss_vlb_step=0.000235, train/loss_step=0.0511, global_step=2.000, lr_abs=0.0001]Epoch 0:  16%|█▋        | 13/80 [01:46<08:27,  7.57s/it, loss=0.0408, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000552, train/loss_step=0.0494, global_step=3.000, lr_abs=0.0001]Epoch 0:  18%|█▊        | 14/80 [01:46<07:48,  7.10s/it, loss=0.0408, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000552, train/loss_step=0.0494, global_step=3.000, lr_abs=0.0001]Epoch 0:  18%|█▊        | 14/80 [01:46<07:48,  7.10s/it, loss=0.0419, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000592, train/loss_step=0.0565, global_step=3.000, lr_abs=0.0001]Epoch 0:  19%|█▉        | 15/80 [01:47<07:14,  6.69s/it, loss=0.0419, v_num=0, train/loss_simple_step=0.0565, train/loss_vlb_step=0.000592, train/loss_step=0.0565, global_step=3.000, lr_abs=0.0001]Epoch 0:  19%|█▉        | 15/80 [01:47<07:14,  6.69s/it, loss=0.0421, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000391, train/loss_step=0.0457, global_step=3.000, lr_abs=0.0001]Epoch 0:  20%|██        | 16/80 [02:28<09:20,  8.76s/it, loss=0.0421, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.000391, train/loss_step=0.0457, global_step=3.000, lr_abs=0.0001]Epoch 0:  20%|██        | 16/80 [02:28<09:20,  8.76s/it, loss=0.0437, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000422, train/loss_step=0.0673, global_step=3.000, lr_abs=0.0001]Epoch 0:  21%|██▏       | 17/80 [02:29<08:43,  8.30s/it, loss=0.0437, v_num=0, train/loss_simple_step=0.0673, train/loss_vlb_step=0.000422, train/loss_step=0.0673, global_step=3.000, lr_abs=0.0001]Epoch 0:  21%|██▏       | 17/80 [02:29<08:43,  8.30s/it, loss=0.0438, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.00019, train/loss_step=0.0452, global_step=4.000, lr_abs=0.0001] Epoch 0:  22%|██▎       | 18/80 [02:30<08:09,  7.90s/it, loss=0.0438, v_num=0, train/loss_simple_step=0.0452, train/loss_vlb_step=0.00019, train/loss_step=0.0452, global_step=4.000, lr_abs=0.0001]Epoch 0:  22%|██▎       | 18/80 [02:30<08:09,  7.90s/it, loss=0.0463, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000945, train/loss_step=0.0891, global_step=4.000, lr_abs=0.0001]Epoch 0:  24%|██▍       | 19/80 [02:30<07:39,  7.53s/it, loss=0.0463, v_num=0, train/loss_simple_step=0.0891, train/loss_vlb_step=0.000945, train/loss_step=0.0891, global_step=4.000, lr_abs=0.0001]Epoch 0:  24%|██▍       | 19/80 [02:30<07:39,  7.53s/it, loss=0.0457, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000125, train/loss_step=0.0343, global_step=4.000, lr_abs=0.0001]Epoch 0:  25%|██▌       | 20/80 [02:36<07:27,  7.47s/it, loss=0.0457, v_num=0, train/loss_simple_step=0.0343, train/loss_vlb_step=0.000125, train/loss_step=0.0343, global_step=4.000, lr_abs=0.0001]Epoch 0:  25%|██▌       | 20/80 [02:36<07:27,  7.47s/it, loss=0.0495, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.0017, train/loss_step=0.123, global_step=4.000, lr_abs=0.0001]    Epoch 0:  26%|██▋       | 21/80 [02:37<07:01,  7.15s/it, loss=0.0495, v_num=0, train/loss_simple_step=0.123, train/loss_vlb_step=0.0017, train/loss_step=0.123, global_step=4.000, lr_abs=0.0001]Epoch 0:  26%|██▋       | 21/80 [02:37<07:01,  7.15s/it, loss=0.0502, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000352, train/loss_step=0.0554, global_step=5.000, lr_abs=0.0001]Epoch 0:  28%|██▊       | 22/80 [02:37<06:37,  6.86s/it, loss=0.0502, v_num=0, train/loss_simple_step=0.0554, train/loss_vlb_step=0.000352, train/loss_step=0.0554, global_step=5.000, lr_abs=0.0001]Epoch 0:  28%|██▊       | 22/80 [02:37<06:37,  6.86s/it, loss=0.0509, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000233, train/loss_step=0.0502, global_step=5.000, lr_abs=0.0001]Epoch 0:  29%|██▉       | 23/80 [02:38<06:15,  6.60s/it, loss=0.0509, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000233, train/loss_step=0.0502, global_step=5.000, lr_abs=0.0001]Epoch 0:  29%|██▉       | 23/80 [02:38<06:15,  6.60s/it, loss=0.0513, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000226, train/loss_step=0.0441, global_step=5.000, lr_abs=0.0001]Epoch 0:  30%|███       | 24/80 [03:08<07:01,  7.52s/it, loss=0.0513, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.000226, train/loss_step=0.0441, global_step=5.000, lr_abs=0.0001]Epoch 0:  30%|███       | 24/80 [03:08<07:01,  7.52s/it, loss=0.0528, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000251, train/loss_step=0.0568, global_step=5.000, lr_abs=0.0001]Epoch 0:  31%|███▏      | 25/80 [03:08<06:38,  7.25s/it, loss=0.0528, v_num=0, train/loss_simple_step=0.0568, train/loss_vlb_step=0.000251, train/loss_step=0.0568, global_step=5.000, lr_abs=0.0001]Epoch 0:  31%|███▏      | 25/80 [03:08<06:38,  7.25s/it, loss=0.0537, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000418, train/loss_step=0.065, global_step=6.000, lr_abs=0.0001]  Epoch 0:  32%|███▎      | 26/80 [03:10<06:21,  7.06s/it, loss=0.0537, v_num=0, train/loss_simple_step=0.065, train/loss_vlb_step=0.000418, train/loss_step=0.065, global_step=6.000, lr_abs=0.0001]Epoch 0:  32%|███▎      | 26/80 [03:10<06:21,  7.06s/it, loss=0.0529, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000123, train/loss_step=0.0335, global_step=6.000, lr_abs=0.0001]Epoch 0:  34%|███▍      | 27/80 [03:11<06:01,  6.83s/it, loss=0.0529, v_num=0, train/loss_simple_step=0.0335, train/loss_vlb_step=0.000123, train/loss_step=0.0335, global_step=6.000, lr_abs=0.0001]Epoch 0:  34%|███▍      | 27/80 [03:11<06:01,  6.83s/it, loss=0.0517, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000661, train/loss_step=0.0395, global_step=6.000, lr_abs=0.0001]Epoch 0:  35%|███▌      | 28/80 [03:24<06:07,  7.06s/it, loss=0.0517, v_num=0, train/loss_simple_step=0.0395, train/loss_vlb_step=0.000661, train/loss_step=0.0395, global_step=6.000, lr_abs=0.0001]Epoch 0:  35%|███▌      | 28/80 [03:24<06:07,  7.06s/it, loss=0.0521, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000179, train/loss_step=0.0265, global_step=6.000, lr_abs=0.0001]Epoch 0:  36%|███▋      | 29/80 [03:25<05:49,  6.85s/it, loss=0.0521, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000179, train/loss_step=0.0265, global_step=6.000, lr_abs=0.0001]Epoch 0:  36%|███▋      | 29/80 [03:25<05:49,  6.85s/it, loss=0.0527, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=7.000, lr_abs=0.0001]Epoch 0:  38%|███▊      | 30/80 [03:25<05:32,  6.64s/it, loss=0.0527, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000131, train/loss_step=0.0351, global_step=7.000, lr_abs=0.0001]Epoch 0:  38%|███▊      | 30/80 [03:25<05:32,  6.64s/it, loss=0.0515, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000108, train/loss_step=0.0254, global_step=7.000, lr_abs=0.0001]Epoch 0:  39%|███▉      | 31/80 [03:26<05:15,  6.45s/it, loss=0.0515, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000108, train/loss_step=0.0254, global_step=7.000, lr_abs=0.0001]Epoch 0:  39%|███▉      | 31/80 [03:26<05:15,  6.45s/it, loss=0.0506, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=6.87e-5, train/loss_step=0.0195, global_step=7.000, lr_abs=0.0001] Epoch 0:  40%|████      | 32/80 [03:54<05:40,  7.10s/it, loss=0.0506, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=6.87e-5, train/loss_step=0.0195, global_step=7.000, lr_abs=0.0001]Epoch 0:  40%|████      | 32/80 [03:54<05:40,  7.10s/it, loss=0.05, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000255, train/loss_step=0.0394, global_step=7.000, lr_abs=0.0001] Epoch 0:  41%|████▏     | 33/80 [03:54<05:24,  6.90s/it, loss=0.05, v_num=0, train/loss_simple_step=0.0394, train/loss_vlb_step=0.000255, train/loss_step=0.0394, global_step=7.000, lr_abs=0.0001]Epoch 0:  41%|████▏     | 33/80 [03:54<05:24,  6.90s/it, loss=0.0498, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000244, train/loss_step=0.044, global_step=8.000, lr_abs=0.0001]Epoch 0:  42%|████▎     | 34/80 [04:00<05:16,  6.87s/it, loss=0.0498, v_num=0, train/loss_simple_step=0.044, train/loss_vlb_step=0.000244, train/loss_step=0.044, global_step=8.000, lr_abs=0.0001]Epoch 0:  42%|████▎     | 34/80 [04:00<05:16,  6.87s/it, loss=0.0479, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.72e-5, train/loss_step=0.0181, global_step=8.000, lr_abs=0.0001]Epoch 0:  44%|████▍     | 35/80 [04:01<05:01,  6.70s/it, loss=0.0479, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.72e-5, train/loss_step=0.0181, global_step=8.000, lr_abs=0.0001]Epoch 0:  44%|████▍     | 35/80 [04:01<05:01,  6.70s/it, loss=0.0473, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000162, train/loss_step=0.0353, global_step=8.000, lr_abs=0.0001]Epoch 0:  45%|████▌     | 36/80 [04:06<04:52,  6.66s/it, loss=0.0473, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000162, train/loss_step=0.0353, global_step=8.000, lr_abs=0.0001]Epoch 0:  45%|████▌     | 36/80 [04:06<04:52,  6.66s/it, loss=0.045, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.25e-5, train/loss_step=0.0215, global_step=8.000, lr_abs=0.0001]  Epoch 0:  46%|████▋     | 37/80 [04:06<04:39,  6.50s/it, loss=0.045, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=8.25e-5, train/loss_step=0.0215, global_step=8.000, lr_abs=0.0001]Epoch 0:  46%|████▋     | 37/80 [04:06<04:39,  6.50s/it, loss=0.0455, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.00128, train/loss_step=0.0536, global_step=9.000, lr_abs=0.0001]Epoch 0:  48%|████▊     | 38/80 [04:07<04:26,  6.34s/it, loss=0.0455, v_num=0, train/loss_simple_step=0.0536, train/loss_vlb_step=0.00128, train/loss_step=0.0536, global_step=9.000, lr_abs=0.0001]Epoch 0:  48%|████▊     | 38/80 [04:07<04:26,  6.34s/it, loss=0.0428, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000138, train/loss_step=0.0348, global_step=9.000, lr_abs=0.0001]Epoch 0:  49%|████▉     | 39/80 [04:07<04:14,  6.20s/it, loss=0.0428, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.000138, train/loss_step=0.0348, global_step=9.000, lr_abs=0.0001]Epoch 0:  49%|████▉     | 39/80 [04:07<04:14,  6.20s/it, loss=0.0425, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000105, train/loss_step=0.0296, global_step=9.000, lr_abs=0.0001]Epoch 0:  50%|█████     | 40/80 [04:30<04:23,  6.60s/it, loss=0.0425, v_num=0, train/loss_simple_step=0.0296, train/loss_vlb_step=0.000105, train/loss_step=0.0296, global_step=9.000, lr_abs=0.0001]Epoch 0:  50%|█████     | 40/80 [04:30<04:23,  6.60s/it, loss=0.0375, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=0.000225, train/loss_step=0.0223, global_step=9.000, lr_abs=0.0001]Epoch 0:  51%|█████▏    | 41/80 [04:33<04:13,  6.51s/it, loss=0.0375, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=0.000225, train/loss_step=0.0223, global_step=9.000, lr_abs=0.0001]Epoch 0:  51%|█████▏    | 41/80 [04:33<04:13,  6.51s/it, loss=0.0369, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000204, train/loss_step=0.0442, global_step=10.00, lr_abs=0.0001]Epoch 0:  52%|█████▎    | 42/80 [04:33<04:02,  6.37s/it, loss=0.0369, v_num=0, train/loss_simple_step=0.0442, train/loss_vlb_step=0.000204, train/loss_step=0.0442, global_step=10.00, lr_abs=0.0001]Epoch 0:  52%|█████▎    | 42/80 [04:33<04:02,  6.37s/it, loss=0.0361, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000169, train/loss_step=0.0326, global_step=10.00, lr_abs=0.0001]Epoch 0:  54%|█████▍    | 43/80 [04:36<03:52,  6.29s/it, loss=0.0361, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.000169, train/loss_step=0.0326, global_step=10.00, lr_abs=0.0001]Epoch 0:  54%|██���██▍    | 43/80 [04:36<03:52,  6.29s/it, loss=0.0353, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000159, train/loss_step=0.0298, global_step=10.00, lr_abs=0.0001]Epoch 0:  55%|█████▌    | 44/80 [04:44<03:47,  6.33s/it, loss=0.0353, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000159, train/loss_step=0.0298, global_step=10.00, lr_abs=0.0001]Epoch 0:  55%|█████▌    | 44/80 [04:44<03:47,  6.33s/it, loss=0.0341, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.00013, train/loss_step=0.0319, global_step=10.00, lr_abs=0.0001] Epoch 0:  56%|█████▋    | 45/80 [04:45<03:37,  6.21s/it, loss=0.0341, v_num=0, train/loss_simple_step=0.0319, train/loss_vlb_step=0.00013, train/loss_step=0.0319, global_step=10.00, lr_abs=0.0001]Epoch 0:  56%|█████▋    | 45/80 [04:45<03:37,  6.21s/it, loss=0.033, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000168, train/loss_step=0.0438, global_step=11.00, lr_abs=0.0001]Epoch 0:  57%|█████▊    | 46/80 [04:45<03:26,  6.09s/it, loss=0.033, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000168, train/loss_step=0.0438, global_step=11.00, lr_abs=0.0001]Epoch 0:  57%|█████▊    | 46/80 [04:45<03:26,  6.09s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000389, train/loss_step=0.0407, global_step=11.00, lr_abs=0.0001]Epoch 0:  59%|█████▉    | 47/80 [04:46<03:16,  5.97s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.000389, train/loss_step=0.0407, global_step=11.00, lr_abs=0.0001]Epoch 0:  59%|█████▉    | 47/80 [04:46<03:16,  5.97s/it, loss=0.0332, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.00013, train/loss_step=0.0348, global_step=11.00, lr_abs=0.0001] Epoch 0:  60%|██████    | 48/80 [05:18<03:27,  6.50s/it, loss=0.0332, v_num=0, train/loss_simple_step=0.0348, train/loss_vlb_step=0.00013, train/loss_step=0.0348, global_step=11.00, lr_abs=0.0001]Epoch 0:  60%|██████    | 48/80 [05:18<03:27,  6.50s/it, loss=0.0331, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=8.82e-5, train/loss_step=0.0251, global_step=11.00, lr_abs=0.0001]Epoch 0:  61%|██████▏   | 49/80 [05:27<03:22,  6.54s/it, loss=0.0331, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=8.82e-5, train/loss_step=0.0251, global_step=11.00, lr_abs=0.0001]Epoch 0:  61%|██████▏   | 49/80 [05:27<03:22,  6.54s/it, loss=0.035, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000977, train/loss_step=0.0738, global_step=12.00, lr_abs=0.0001]Epoch 0:  62%|██████▎   | 50/80 [05:27<03:12,  6.42s/it, loss=0.035, v_num=0, train/loss_simple_step=0.0738, train/loss_vlb_step=0.000977, train/loss_step=0.0738, global_step=12.00, lr_abs=0.0001]Epoch 0:  62%|██████▎   | 50/80 [05:27<03:12,  6.42s/it, loss=0.0358, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000228, train/loss_step=0.042, global_step=12.00, lr_abs=0.0001] Epoch 0:  64%|██████▍   | 51/80 [05:28<03:03,  6.31s/it, loss=0.0358, v_num=0, train/loss_simple_step=0.042, train/loss_vlb_step=0.000228, train/loss_step=0.042, global_step=12.00, lr_abs=0.0001]Epoch 0:  64%|██████▍   | 51/80 [05:28<03:03,  6.31s/it, loss=0.0366, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000144, train/loss_step=0.0346, global_step=12.00, lr_abs=0.0001]Epoch 0:  65%|██████▌   | 52/80 [05:28<02:53,  6.20s/it, loss=0.0366, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000144, train/loss_step=0.0346, global_step=12.00, lr_abs=0.0001]Epoch 0:  65%|██████▌   | 52/80 [05:28<02:53,  6.20s/it, loss=0.036, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000198, train/loss_step=0.028, global_step=12.00, lr_abs=0.0001]   Epoch 0:  66%|██████▋   | 53/80 [05:31<02:45,  6.15s/it, loss=0.036, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000198, train/loss_step=0.028, global_step=12.00, lr_abs=0.0001]Epoch 0:  66%|██████▋   | 53/80 [05:31<02:45,  6.15s/it, loss=0.036, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000465, train/loss_step=0.0427, global_step=13.00, lr_abs=0.0001]Epoch 0:  68%|██████▊   | 54/80 [05:32<02:37,  6.04s/it, loss=0.036, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.000465, train/loss_step=0.0427, global_step=13.00, lr_abs=0.0001]Epoch 0:  68%|██████▊   | 54/80 [05:32<02:37,  6.04s/it, loss=0.0379, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.00038, train/loss_step=0.0558, global_step=13.00, lr_abs=0.0001]Epoch 0:  69%|██████▉   | 55/80 [05:32<02:28,  5.95s/it, loss=0.0379, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.00038, train/loss_step=0.0558, global_step=13.00, lr_abs=0.0001]Epoch 0:  69%|██████▉   | 55/80 [05:32<02:28,  5.95s/it, loss=0.0375, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000149, train/loss_step=0.028, global_step=13.00, lr_abs=0.0001] Epoch 0:  70%|███████   | 56/80 [06:07<02:34,  6.44s/it, loss=0.0375, v_num=0, train/loss_simple_step=0.028, train/loss_vlb_step=0.000149, train/loss_step=0.028, global_step=13.00, lr_abs=0.0001]Epoch 0:  70%|███████   | 56/80 [06:07<02:34,  6.44s/it, loss=0.0377, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=9.69e-5, train/loss_step=0.0266, global_step=13.00, lr_abs=0.0001]Epoch 0:  71%|███████▏  | 57/80 [06:16<02:29,  6.49s/it, loss=0.0377, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=9.69e-5, train/loss_step=0.0266, global_step=13.00, lr_abs=0.0001]Epoch 0:  71%|███████▏  | 57/80 [06:16<02:29,  6.49s/it, loss=0.0363, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=8.59e-5, train/loss_step=0.0246, global_step=14.00, lr_abs=0.0001]Epoch 0:  72%|███████▎  | 58/80 [06:16<02:20,  6.38s/it, loss=0.0363, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=8.59e-5, train/loss_step=0.0246, global_step=14.00, lr_abs=0.0001]Epoch 0:  72%|███████▎  | 58/80 [06:16<02:20,  6.38s/it, loss=0.0368, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000225, train/loss_step=0.0451, global_step=14.00, lr_abs=0.0001]Epoch 0:  74%|███████▍  | 59/80 [06:17<02:12,  6.29s/it, loss=0.0368, v_num=0, train/loss_simple_step=0.0451, train/loss_vlb_step=0.000225, train/loss_step=0.0451, global_step=14.00, lr_abs=0.0001]Epoch 0:  74%|███████▍  | 59/80 [06:17<02:12,  6.29s/it, loss=0.0363, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.65e-5, train/loss_step=0.0196, global_step=14.00, lr_abs=0.0001] Epoch 0:  75%|███████▌  | 60/80 [06:17<02:03,  6.19s/it, loss=0.0363, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=7.65e-5, train/loss_step=0.0196, global_step=14.00, lr_abs=0.0001]Epoch 0:  75%|███████▌  | 60/80 [06:17<02:03,  6.19s/it, loss=0.0369, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000137, train/loss_step=0.0337, global_step=14.00, lr_abs=0.0001]Epoch 0:  76%|███████▋  | 61/80 [06:22<01:57,  6.17s/it, loss=0.0369, v_num=0, train/loss_simple_step=0.0337, train/loss_vlb_step=0.000137, train/loss_step=0.0337, global_step=14.00, lr_abs=0.0001]Epoch 0:  76%|███████▋  | 61/80 [06:22<01:57,  6.17s/it, loss=0.0367, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000156, train/loss_step=0.0411, global_step=15.00, lr_abs=0.0001]Epoch 0:  78%|███████▊  | 62/80 [06:22<01:49,  6.08s/it, loss=0.0367, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000156, train/loss_step=0.0411, global_step=15.00, lr_abs=0.0001]Epoch 0:  78%|███████▊  | 62/80 [06:22<01:49,  6.08s/it, loss=0.0365, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000105, train/loss_step=0.0293, global_step=15.00, lr_abs=0.0001]Epoch 0:  79%|███████▉  | 63/80 [06:23<01:41,  5.99s/it, loss=0.0365, v_num=0, train/loss_simple_step=0.0293, train/loss_vlb_step=0.000105, train/loss_step=0.0293, global_step=15.00, lr_abs=0.0001]Epoch 0:  79%|███████▉  | 63/80 [06:23<01:41,  5.99s/it, loss=0.037, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.00017, train/loss_step=0.0393, global_step=15.00, lr_abs=0.0001]  Epoch 0:  80%|████████  | 64/80 [06:48<01:40,  6.29s/it, loss=0.037, v_num=0, train/loss_simple_step=0.0393, train/loss_vlb_step=0.00017, train/loss_step=0.0393, global_step=15.00, lr_abs=0.0001]Epoch 0:  80%|████████  | 64/80 [06:48<01:40,  6.29s/it, loss=0.0365, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=0.000126, train/loss_step=0.0207, global_step=15.00, lr_abs=0.0001]Epoch 0:  81%|████████▏ | 65/80 [07:02<01:36,  6.41s/it, loss=0.0365, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=0.000126, train/loss_step=0.0207, global_step=15.00, lr_abs=0.0001]Epoch 0:  81%|████████▏ | 65/80 [07:02<01:36,  6.41s/it, loss=0.0362, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000148, train/loss_step=0.0376, global_step=16.00, lr_abs=0.0001]Epoch 0:  82%|████████▎ | 66/80 [07:03<01:28,  6.32s/it, loss=0.0362, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000148, train/loss_step=0.0376, global_step=16.00, lr_abs=0.0001]Epoch 0:  82%|████████▎ | 66/80 [07:03<01:28,  6.32s/it, loss=0.0365, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000245, train/loss_step=0.0482, global_step=16.00, lr_abs=0.0001]Epoch 0:  84%|████████▍ | 67/80 [07:03<01:21,  6.23s/it, loss=0.0365, v_num=0, train/loss_simple_step=0.0482, train/loss_vlb_step=0.000245, train/loss_step=0.0482, global_step=16.00, lr_abs=0.0001]Epoch 0:  84%|████████▍ | 67/80 [07:03<01:21,  6.23s/it, loss=0.0365, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000258, train/loss_step=0.0351, global_step=16.00, lr_abs=0.0001]Epoch 0:  85%|████████▌ | 68/80 [07:04<01:13,  6.15s/it, loss=0.0365, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.000258, train/loss_step=0.0351, global_step=16.00, lr_abs=0.0001]Epoch 0:  85%|████████▌ | 68/80 [07:04<01:13,  6.15s/it, loss=0.0377, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000359, train/loss_step=0.0476, global_step=16.00, lr_abs=0.0001]Epoch 0:  86%|████████▋ | 69/80 [07:07<01:07,  6.10s/it, loss=0.0377, v_num=0, train/loss_simple_step=0.0476, train/loss_vlb_step=0.000359, train/loss_step=0.0476, global_step=16.00, lr_abs=0.0001]Epoch 0:  86%|████████▋ | 69/80 [07:07<01:07,  6.10s/it, loss=0.0355, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000166, train/loss_step=0.0299, global_step=17.00, lr_abs=0.0001]Epoch 0:  88%|████████▊ | 70/80 [07:07<01:00,  6.02s/it, loss=0.0355, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000166, train/loss_step=0.0299, global_step=17.00, lr_abs=0.0001]Epoch 0:  88%|████████▊ | 70/80 [07:07<01:00,  6.02s/it, loss=0.0357, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000911, train/loss_step=0.0472, global_step=17.00, lr_abs=0.0001]Epoch 0:  89%|████████▉ | 71/80 [07:08<00:53,  5.94s/it, loss=0.0357, v_num=0, train/loss_simple_step=0.0472, train/loss_vlb_step=0.000911, train/loss_step=0.0472, global_step=17.00, lr_abs=0.0001]Epoch 0:  89%|████████▉ | 71/80 [07:08<00:53,  5.94s/it, loss=0.0362, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000782, train/loss_step=0.0436, global_step=17.00, lr_abs=0.0001]Epoch 0:  90%|█████████ | 72/80 [07:28<00:49,  6.14s/it, loss=0.0362, v_num=0, train/loss_simple_step=0.0436, train/loss_vlb_step=0.000782, train/loss_step=0.0436, global_step=17.00, lr_abs=0.0001]Epoch 0:  90%|█████████ | 72/80 [07:28<00:49,  6.14s/it, loss=0.0358, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=7.7e-5, train/loss_step=0.0205, global_step=17.00, lr_abs=0.0001]  Epoch 0:  91%|█████████▏| 73/80 [07:39<00:43,  6.21s/it, loss=0.0358, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=7.7e-5, train/loss_step=0.0205, global_step=17.00, lr_abs=0.0001]Epoch 0:  91%|█████████▏| 73/80 [07:39<00:43,  6.21s/it, loss=0.035, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=9.24e-5, train/loss_step=0.0264, global_step=18.00, lr_abs=0.0001]Epoch 0:  92%|█████████▎| 74/80 [07:40<00:36,  6.13s/it, loss=0.035, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=9.24e-5, train/loss_step=0.0264, global_step=18.00, lr_abs=0.0001]Epoch 0:  92%|█████████▎| 74/80 [07:40<00:36,  6.13s/it, loss=0.0347, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000309, train/loss_step=0.0502, global_step=18.00, lr_abs=0.0001]Epoch 0:  94%|█████████▍| 75/80 [07:40<00:30,  6.06s/it, loss=0.0347, v_num=0, train/loss_simple_step=0.0502, train/loss_vlb_step=0.000309, train/loss_step=0.0502, global_step=18.00, lr_abs=0.0001]Epoch 0:  94%|█████████▍| 75/80 [07:40<00:30,  6.06s/it, loss=0.0361, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000642, train/loss_step=0.0556, global_step=18.00, lr_abs=0.0001]Epoch 0:  95%|█████████▌| 76/80 [07:41<00:23,  5.99s/it, loss=0.0361, v_num=0, train/loss_simple_step=0.0556, train/loss_vlb_step=0.000642, train/loss_step=0.0556, global_step=18.00, lr_abs=0.0001]Epoch 0:  95%|█████████▌| 76/80 [07:41<00:23,  5.99s/it, loss=0.0369, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.00023, train/loss_step=0.0431, global_step=18.00, lr_abs=0.0001] Epoch 0:  96%|█████████▋| 77/80 [07:44<00:17,  5.96s/it, loss=0.0369, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.00023, train/loss_step=0.0431, global_step=18.00, lr_abs=0.0001]Epoch 0:  96%|█████████▋| 77/80 [07:44<00:17,  5.96s/it, loss=0.038, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000221, train/loss_step=0.0465, global_step=19.00, lr_abs=0.0001]Epoch 0:  98%|█████████▊| 78/80 [07:45<00:11,  5.89s/it, loss=0.038, v_num=0, train/loss_simple_step=0.0465, train/loss_vlb_step=0.000221, train/loss_step=0.0465, global_step=19.00, lr_abs=0.0001]Epoch 0:  98%|█████████▊| 78/80 [07:45<00:11,  5.89s/it, loss=0.0384, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000498, train/loss_step=0.0528, global_step=19.00, lr_abs=0.0001]Epoch 0:  99%|█████████▉| 79/80 [07:45<00:05,  5.82s/it, loss=0.0384, v_num=0, train/loss_simple_step=0.0528, train/loss_vlb_step=0.000498, train/loss_step=0.0528, global_step=19.00, lr_abs=0.0001]Epoch 0:  99%|█████████▉| 79/80 [07:45<00:05,  5.82s/it, loss=0.0399, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000238, train/loss_step=0.0487, global_step=19.00, lr_abs=0.0001]Epoch 0: 100%|██████████| 80/80 [08:07<00:00,  6.02s/it, loss=0.0399, v_num=0, train/loss_simple_step=0.0487, train/loss_vlb_step=0.000238, train/loss_step=0.0487, global_step=19.00, lr_abs=0.0001]Epoch 0: 100%|██████████| 80/80 [08:07<00:00,  6.02s/it, loss=0.0394, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=8.01e-5, train/loss_step=0.0235, global_step=19.00, lr_abs=0.0001] /root/miniconda3/envs/med/lib/python3.9/site-packages/pytorch_lightning/trainer/callback_hook.py:102: LightningDeprecationWarning: The signature of `Callback.on_train_epoch_end` has changed in v1.3. `outputs` parameter has been removed. Support for the old signature will be removed in v1.5
+  warning_cache.deprecation(
+Average Epoch time: 487.24 seconds
+Average Peak memory 77400.19MiB
+Epoch 0:   0%|          | 0/80 [00:00<00:00, 7449.92it/s, loss=0.0394, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=8.01e-5, train/loss_step=0.0235, global_step=19.00, lr_abs=0.0001]Epoch 1:   0%|          | 0/80 [00:00<00:00, 2727.12it/s, loss=0.0394, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=8.01e-5, train/loss_step=0.0235, global_step=19.00, lr_abs=0.0001]Epoch 1:   1%|▏         | 1/80 [00:44<29:20, 22.29s/it, loss=0.0394, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=8.01e-5, train/loss_step=0.0235, global_step=19.00, lr_abs=0.0001]  Epoch 1:   1%|▏         | 1/80 [00:44<29:20, 22.29s/it, loss=0.0403, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000878, train/loss_step=0.059, global_step=20.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   2%|▎         | 2/80 [00:45<19:31, 15.02s/it, loss=0.0403, v_num=0, train/loss_simple_step=0.059, train/loss_vlb_step=0.000878, train/loss_step=0.059, global_step=20.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   2%|▎         | 2/80 [00:45<19:31, 15.02s/it, loss=0.0401, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=20.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   4%|▍         | 3/80 [00:45<14:36, 11.39s/it, loss=0.0401, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=0.000104, train/loss_step=0.0264, global_step=20.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   4%|▍         | 3/80 [00:45<14:36, 11.39s/it, loss=0.0398, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000152, train/loss_step=0.0338, global_step=20.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   5%|▌         | 4/80 [00:46<11:40,  9.22s/it, loss=0.0398, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000152, train/loss_step=0.0338, global_step=20.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   5%|▌         | 4/80 [00:46<11:40,  9.22s/it, loss=0.0405, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.00349, train/loss_step=0.0349, global_step=20.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:   6%|▋         | 5/80 [00:46<09:42,  7.77s/it, loss=0.0405, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.00349, train/loss_step=0.0349, global_step=20.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   6%|▋         | 5/80 [00:46<09:42,  7.77s/it, loss=0.0404, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000346, train/loss_step=0.0342, global_step=21.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   8%|▊         | 6/80 [00:47<08:18,  6.73s/it, loss=0.0404, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000346, train/loss_step=0.0342, global_step=21.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   8%|▊         | 6/80 [00:47<08:18,  6.73s/it, loss=0.0411, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000675, train/loss_step=0.0627, global_step=21.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   9%|▉         | 7/80 [00:47<07:14,  5.96s/it, loss=0.0411, v_num=0, train/loss_simple_step=0.0627, train/loss_vlb_step=0.000675, train/loss_step=0.0627, global_step=21.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:   9%|▉         | 7/80 [00:47<07:14,  5.96s/it, loss=0.0421, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000812, train/loss_step=0.0545, global_step=21.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  10%|█         | 8/80 [01:18<10:28,  8.72s/it, loss=0.0421, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000812, train/loss_step=0.0545, global_step=21.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  10%|█         | 8/80 [01:18<10:28,  8.72s/it, loss=0.0422, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.00308, train/loss_step=0.0499, global_step=21.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  11%|█▏        | 9/80 [01:19<09:21,  7.91s/it, loss=0.0422, v_num=0, train/loss_simple_step=0.0499, train/loss_vlb_step=0.00308, train/loss_step=0.0499, global_step=21.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  11%|█▏        | 9/80 [01:19<09:21,  7.91s/it, loss=0.0439, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00301, train/loss_step=0.0647, global_step=22.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  12%|█▎        | 10/80 [01:19<08:26,  7.23s/it, loss=0.0439, v_num=0, train/loss_simple_step=0.0647, train/loss_vlb_step=0.00301, train/loss_step=0.0647, global_step=22.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  12%|█▎        | 10/80 [01:19<08:26,  7.23s/it, loss=0.0445, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000827, train/loss_step=0.0582, global_step=22.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  14%|█▍        | 11/80 [01:20<07:40,  6.67s/it, loss=0.0445, v_num=0, train/loss_simple_step=0.0582, train/loss_vlb_step=0.000827, train/loss_step=0.0582, global_step=22.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  14%|█▍        | 11/80 [01:20<07:40,  6.67s/it, loss=0.0447, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.00208, train/loss_step=0.0491, global_step=22.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  15%|█▌        | 12/80 [01:20<07:01,  6.20s/it, loss=0.0447, v_num=0, train/loss_simple_step=0.0491, train/loss_vlb_step=0.00208, train/loss_step=0.0491, global_step=22.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  15%|█▌        | 12/80 [01:20<07:01,  6.20s/it, loss=0.0453, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000374, train/loss_step=0.0308, global_step=22.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  16%|█▋        | 13/80 [01:21<06:28,  5.80s/it, loss=0.0453, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000374, train/loss_step=0.0308, global_step=22.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  16%|█▋        | 13/80 [01:21<06:28,  5.80s/it, loss=0.0457, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000179, train/loss_step=0.035, global_step=23.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]  Epoch 1:  18%|█▊        | 14/80 [01:21<05:59,  5.44s/it, loss=0.0457, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000179, train/loss_step=0.035, global_step=23.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  18%|█▊        | 14/80 [01:21<05:59,  5.44s/it, loss=0.0449, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000132, train/loss_step=0.0349, global_step=23.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  19%|█▉        | 15/80 [01:22<05:33,  5.13s/it, loss=0.0449, v_num=0, train/loss_simple_step=0.0349, train/loss_vlb_step=0.000132, train/loss_step=0.0349, global_step=23.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  19%|█▉        | 15/80 [01:22<05:33,  5.13s/it, loss=0.044, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000167, train/loss_step=0.0365, global_step=23.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  20%|██        | 16/80 [02:01<07:36,  7.13s/it, loss=0.044, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000167, train/loss_step=0.0365, global_step=23.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  20%|██        | 16/80 [02:01<07:36,  7.13s/it, loss=0.0445, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000451, train/loss_step=0.0527, global_step=23.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  21%|██▏       | 17/80 [02:01<07:06,  6.77s/it, loss=0.0445, v_num=0, train/loss_simple_step=0.0527, train/loss_vlb_step=0.000451, train/loss_step=0.0527, global_step=23.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  21%|██▏       | 17/80 [02:01<07:06,  6.77s/it, loss=0.0435, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.00013, train/loss_step=0.0277, global_step=24.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  22%|██▎       | 18/80 [02:02<06:39,  6.44s/it, loss=0.0435, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.00013, train/loss_step=0.0277, global_step=24.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  22%|██▎       | 18/80 [02:02<06:39,  6.44s/it, loss=0.0422, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000121, train/loss_step=0.0265, global_step=24.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  24%|██▍       | 19/80 [02:06<06:24,  6.31s/it, loss=0.0422, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000121, train/loss_step=0.0265, global_step=24.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  24%|██▍       | 19/80 [02:06<06:24,  6.31s/it, loss=0.0407, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=6.49e-5, train/loss_step=0.0188, global_step=24.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  25%|██▌       | 20/80 [02:06<06:01,  6.03s/it, loss=0.0407, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=6.49e-5, train/loss_step=0.0188, global_step=24.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  25%|██▌       | 20/80 [02:06<06:01,  6.03s/it, loss=0.0412, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000147, train/loss_step=0.0332, global_step=24.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  26%|██▋       | 21/80 [02:07<05:41,  5.79s/it, loss=0.0412, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.000147, train/loss_step=0.0332, global_step=24.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  26%|██▋       | 21/80 [02:07<05:41,  5.79s/it, loss=0.0397, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.00017, train/loss_step=0.0294, global_step=25.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  28%|██▊       | 22/80 [02:14<05:38,  5.84s/it, loss=0.0397, v_num=0, train/loss_simple_step=0.0294, train/loss_vlb_step=0.00017, train/loss_step=0.0294, global_step=25.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  28%|██▊       | 22/80 [02:14<05:38,  5.84s/it, loss=0.0387, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=2.51e-5, train/loss_step=0.00678, global_step=25.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  29%|██▉       | 23/80 [02:14<05:20,  5.62s/it, loss=0.0387, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=2.51e-5, train/loss_step=0.00678, global_step=25.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  29%|██▉       | 23/80 [02:14<05:20,  5.62s/it, loss=0.0406, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.00159, train/loss_step=0.0724, global_step=25.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]  Epoch 1:  30%|███       | 24/80 [02:53<06:27,  6.92s/it, loss=0.0406, v_num=0, train/loss_simple_step=0.0724, train/loss_vlb_step=0.00159, train/loss_step=0.0724, global_step=25.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  30%|███       | 24/80 [02:53<06:27,  6.92s/it, loss=0.04, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=0.000122, train/loss_step=0.0213, global_step=25.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  31%|███▏      | 25/80 [02:53<06:07,  6.68s/it, loss=0.04, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=0.000122, train/loss_step=0.0213, global_step=25.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  31%|███▏      | 25/80 [02:53<06:07,  6.68s/it, loss=0.0389, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.14e-5, train/loss_step=0.0139, global_step=26.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  32%|███▎      | 26/80 [02:54<05:48,  6.45s/it, loss=0.0389, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.14e-5, train/loss_step=0.0139, global_step=26.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  32%|███▎      | 26/80 [02:54<05:48,  6.45s/it, loss=0.0376, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000171, train/loss_step=0.0356, global_step=26.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  34%|███▍      | 27/80 [02:54<05:30,  6.23s/it, loss=0.0376, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000171, train/loss_step=0.0356, global_step=26.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  34%|███▍      | 27/80 [02:54<05:30,  6.23s/it, loss=0.0363, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000169, train/loss_step=0.0277, global_step=26.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  35%|███▌      | 28/80 [02:55<05:13,  6.04s/it, loss=0.0363, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.000169, train/loss_step=0.0277, global_step=26.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  35%|███▌      | 28/80 [02:55<05:13,  6.04s/it, loss=0.035, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000106, train/loss_step=0.0254, global_step=26.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  36%|███▋      | 29/80 [02:55<04:58,  5.85s/it, loss=0.035, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000106, train/loss_step=0.0254, global_step=26.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  36%|███▋      | 29/80 [02:55<04:58,  5.85s/it, loss=0.0332, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000102, train/loss_step=0.0288, global_step=27.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  38%|███▊      | 30/80 [03:00<04:50,  5.82s/it, loss=0.0332, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000102, train/loss_step=0.0288, global_step=27.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  38%|███▊      | 30/80 [03:00<04:50,  5.82s/it, loss=0.0324, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000187, train/loss_step=0.0414, global_step=27.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  39%|███▉      | 31/80 [03:00<04:37,  5.65s/it, loss=0.0324, v_num=0, train/loss_simple_step=0.0414, train/loss_vlb_step=0.000187, train/loss_step=0.0414, global_step=27.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  39%|███▉      | 31/80 [03:00<04:37,  5.65s/it, loss=0.0318, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000354, train/loss_step=0.0369, global_step=27.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  40%|████      | 32/80 [03:40<05:21,  6.70s/it, loss=0.0318, v_num=0, train/loss_simple_step=0.0369, train/loss_vlb_step=0.000354, train/loss_step=0.0369, global_step=27.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  40%|████      | 32/80 [03:40<05:21,  6.70s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000173, train/loss_step=0.0288, global_step=27.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  41%|████▏     | 33/80 [03:41<05:06,  6.52s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.000173, train/loss_step=0.0288, global_step=27.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  41%|████▏     | 33/80 [03:41<05:06,  6.52s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000154, train/loss_step=0.0355, global_step=28.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  42%|████▎     | 34/80 [03:42<04:52,  6.35s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000154, train/loss_step=0.0355, global_step=28.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  42%|████▎     | 34/80 [03:42<04:52,  6.35s/it, loss=0.0327, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000433, train/loss_step=0.0545, global_step=28.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.0327, v_num=0, train/loss_simple_step=0.0545, train/loss_vlb_step=0.000433, train/loss_step=0.0545, global_step=28.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.0337, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000371, train/loss_step=0.0576, global_step=28.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  45%|████▌     | 36/80 [03:43<04:25,  6.03s/it, loss=0.0337, v_num=0, train/loss_simple_step=0.0576, train/loss_vlb_step=0.000371, train/loss_step=0.0576, global_step=28.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  45%|████▌     | 36/80 [03:43<04:25,  6.03s/it, loss=0.0326, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000104, train/loss_step=0.029, global_step=28.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]  Epoch 1:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.0326, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.000104, train/loss_step=0.029, global_step=28.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.033, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000207, train/loss_step=0.0365, global_step=29.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.033, v_num=0, train/loss_simple_step=0.0365, train/loss_vlb_step=0.000207, train/loss_step=0.0365, global_step=29.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.0324, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=5.33e-5, train/loss_step=0.0155, global_step=29.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.0324, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=5.33e-5, train/loss_step=0.0155, global_step=29.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.0332, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.00015, train/loss_step=0.0331, global_step=29.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  50%|█████     | 40/80 [04:24<04:17,  6.45s/it, loss=0.0332, v_num=0, train/loss_simple_step=0.0331, train/loss_vlb_step=0.00015, train/loss_step=0.0331, global_step=29.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  50%|█████     | 40/80 [04:24<04:17,  6.45s/it, loss=0.0337, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000692, train/loss_step=0.0438, global_step=29.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  51%|█████▏    | 41/80 [04:25<04:06,  6.31s/it, loss=0.0337, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.000692, train/loss_step=0.0438, global_step=29.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  51%|█████▏    | 41/80 [04:25<04:06,  6.31s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.00012, train/loss_step=0.0241, global_step=30.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.00012, train/loss_step=0.0241, global_step=30.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.0344, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000193, train/loss_step=0.026, global_step=30.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.0344, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000193, train/loss_step=0.026, global_step=30.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.0328, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.00018, train/loss_step=0.0409, global_step=30.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  55%|█████▌    | 44/80 [04:26<03:33,  5.92s/it, loss=0.0328, v_num=0, train/loss_simple_step=0.0409, train/loss_vlb_step=0.00018, train/loss_step=0.0409, global_step=30.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  55%|█████▌    | 44/80 [04:26<03:33,  5.92s/it, loss=0.0329, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=0.000179, train/loss_step=0.0226, global_step=30.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  56%|█████▋    | 45/80 [04:27<03:23,  5.81s/it, loss=0.0329, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=0.000179, train/loss_step=0.0226, global_step=30.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  56%|█████▋    | 45/80 [04:27<03:23,  5.81s/it, loss=0.0336, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000978, train/loss_step=0.0291, global_step=31.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  57%|█████▊    | 46/80 [04:27<03:13,  5.69s/it, loss=0.0336, v_num=0, train/loss_simple_step=0.0291, train/loss_vlb_step=0.000978, train/loss_step=0.0291, global_step=31.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  57%|█████▊    | 46/80 [04:27<03:13,  5.69s/it, loss=0.0332, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.00023, train/loss_step=0.0268, global_step=31.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.0332, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.00023, train/loss_step=0.0268, global_step=31.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.0337, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000441, train/loss_step=0.0374, global_step=31.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  60%|██████    | 48/80 [05:06<03:20,  6.26s/it, loss=0.0337, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.000441, train/loss_step=0.0374, global_step=31.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  60%|██████    | 48/80 [05:06<03:20,  6.26s/it, loss=0.0352, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000368, train/loss_step=0.0558, global_step=31.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.0352, v_num=0, train/loss_simple_step=0.0558, train/loss_vlb_step=0.000368, train/loss_step=0.0558, global_step=31.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.0343, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.65e-5, train/loss_step=0.0103, global_step=32.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  62%|██████▎   | 50/80 [05:07<03:01,  6.04s/it, loss=0.0343, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.65e-5, train/loss_step=0.0103, global_step=32.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  62%|██████▎   | 50/80 [05:07<03:01,  6.04s/it, loss=0.0344, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.00156, train/loss_step=0.0441, global_step=32.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  64%|██████▍   | 51/80 [05:08<02:52,  5.94s/it, loss=0.0344, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.00156, train/loss_step=0.0441, global_step=32.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  64%|██████▍   | 51/80 [05:08<02:52,  5.94s/it, loss=0.0339, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000133, train/loss_step=0.0267, global_step=32.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  65%|██████▌   | 52/80 [05:09<02:43,  5.84s/it, loss=0.0339, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000133, train/loss_step=0.0267, global_step=32.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  65%|██████▌   | 52/80 [05:09<02:43,  5.84s/it, loss=0.0341, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000126, train/loss_step=0.0318, global_step=32.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  66%|██████▋   | 53/80 [05:09<02:34,  5.74s/it, loss=0.0341, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.000126, train/loss_step=0.0318, global_step=32.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  66%|██████▋   | 53/80 [05:09<02:34,  5.74s/it, loss=0.0331, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=5.94e-5, train/loss_step=0.0166, global_step=33.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.0331, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=5.94e-5, train/loss_step=0.0166, global_step=33.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.0327, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000625, train/loss_step=0.0461, global_step=33.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.0327, v_num=0, train/loss_simple_step=0.0461, train/loss_vlb_step=0.000625, train/loss_step=0.0461, global_step=33.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.0309, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.83e-5, train/loss_step=0.022, global_step=33.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]   Epoch 1:  70%|███████   | 56/80 [05:50<02:27,  6.14s/it, loss=0.0309, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=9.83e-5, train/loss_step=0.022, global_step=33.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  70%|███████   | 56/80 [05:50<02:27,  6.14s/it, loss=0.0316, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000281, train/loss_step=0.0422, global_step=33.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  71%|███████▏  | 57/80 [05:50<02:19,  6.05s/it, loss=0.0316, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000281, train/loss_step=0.0422, global_step=33.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  71%|███████▏  | 57/80 [05:50<02:19,  6.05s/it, loss=0.0308, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=9.16e-5, train/loss_step=0.0216, global_step=34.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  72%|███████▎  | 58/80 [05:51<02:10,  5.95s/it, loss=0.0308, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=9.16e-5, train/loss_step=0.0216, global_step=34.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  72%|███████▎  | 58/80 [05:51<02:10,  5.95s/it, loss=0.0311, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=0.000128, train/loss_step=0.0219, global_step=34.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.0311, v_num=0, train/loss_simple_step=0.0219, train/loss_vlb_step=0.000128, train/loss_step=0.0219, global_step=34.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.0321, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.00114, train/loss_step=0.0526, global_step=34.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  75%|███████▌  | 60/80 [06:00<01:58,  5.92s/it, loss=0.0321, v_num=0, train/loss_simple_step=0.0526, train/loss_vlb_step=0.00114, train/loss_step=0.0526, global_step=34.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  75%|███████▌  | 60/80 [06:00<01:58,  5.92s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000194, train/loss_step=0.0355, global_step=34.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  76%|███████▋  | 61/80 [06:01<01:50,  5.83s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000194, train/loss_step=0.0355, global_step=34.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  76%|███████▋  | 61/80 [06:01<01:50,  5.83s/it, loss=0.0315, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.33e-5, train/loss_step=0.0202, global_step=35.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  78%|███████▊  | 62/80 [06:01<01:43,  5.74s/it, loss=0.0315, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=8.33e-5, train/loss_step=0.0202, global_step=35.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  78%|███████▊  | 62/80 [06:01<01:43,  5.74s/it, loss=0.0314, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000126, train/loss_step=0.0242, global_step=35.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  79%|███████▉  | 63/80 [06:02<01:36,  5.66s/it, loss=0.0314, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000126, train/loss_step=0.0242, global_step=35.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  79%|███████▉  | 63/80 [06:02<01:36,  5.66s/it, loss=0.0311, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000131, train/loss_step=0.0338, global_step=35.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  80%|████████  | 64/80 [06:25<01:34,  5.93s/it, loss=0.0311, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000131, train/loss_step=0.0338, global_step=35.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  80%|████████  | 64/80 [06:25<01:34,  5.93s/it, loss=0.0312, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000158, train/loss_step=0.026, global_step=35.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]  Epoch 1:  81%|████████▏ | 65/80 [06:26<01:27,  5.85s/it, loss=0.0312, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000158, train/loss_step=0.026, global_step=35.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  81%|████████▏ | 65/80 [06:26<01:27,  5.85s/it, loss=0.0312, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000118, train/loss_step=0.0281, global_step=36.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  82%|████████▎ | 66/80 [06:26<01:20,  5.77s/it, loss=0.0312, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000118, train/loss_step=0.0281, global_step=36.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  82%|████████▎ | 66/80 [06:26<01:20,  5.77s/it, loss=0.0314, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000195, train/loss_step=0.0317, global_step=36.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  84%|████████▍ | 67/80 [06:49<01:18,  6.02s/it, loss=0.0314, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.000195, train/loss_step=0.0317, global_step=36.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  84%|████████▍ | 67/80 [06:49<01:18,  6.02s/it, loss=0.031, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.00013, train/loss_step=0.0283, global_step=36.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]  Epoch 1:  85%|████████▌ | 68/80 [06:49<01:11,  5.94s/it, loss=0.031, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.00013, train/loss_step=0.0283, global_step=36.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  85%|████████▌ | 68/80 [06:49<01:11,  5.94s/it, loss=0.0294, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=0.000127, train/loss_step=0.0236, global_step=36.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  86%|████████▋ | 69/80 [06:50<01:04,  5.86s/it, loss=0.0294, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=0.000127, train/loss_step=0.0236, global_step=36.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  86%|████████▋ | 69/80 [06:50<01:04,  5.86s/it, loss=0.032, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000908, train/loss_step=0.0623, global_step=37.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  88%|████████▊ | 70/80 [06:50<00:57,  5.79s/it, loss=0.032, v_num=0, train/loss_simple_step=0.0623, train/loss_vlb_step=0.000908, train/loss_step=0.0623, global_step=37.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  88%|████████▊ | 70/80 [06:50<00:57,  5.79s/it, loss=0.0319, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000524, train/loss_step=0.0422, global_step=37.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  89%|████████▉ | 71/80 [06:51<00:51,  5.71s/it, loss=0.0319, v_num=0, train/loss_simple_step=0.0422, train/loss_vlb_step=0.000524, train/loss_step=0.0422, global_step=37.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  89%|████████▉ | 71/80 [06:51<00:51,  5.71s/it, loss=0.0314, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.22e-5, train/loss_step=0.0169, global_step=37.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  90%|█████████ | 72/80 [06:56<00:45,  5.71s/it, loss=0.0314, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.22e-5, train/loss_step=0.0169, global_step=37.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  90%|█████████ | 72/80 [06:56<00:45,  5.71s/it, loss=0.0316, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000422, train/loss_step=0.0355, global_step=37.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.0316, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.000422, train/loss_step=0.0355, global_step=37.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.24e-5, train/loss_step=0.0193, global_step=38.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=7.24e-5, train/loss_step=0.0193, global_step=38.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000231, train/loss_step=0.046, global_step=38.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  94%|█████████▍| 75/80 [07:16<00:28,  5.75s/it, loss=0.0317, v_num=0, train/loss_simple_step=0.046, train/loss_vlb_step=0.000231, train/loss_step=0.046, global_step=38.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  94%|█████████▍| 75/80 [07:16<00:28,  5.75s/it, loss=0.0319, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.76e-5, train/loss_step=0.0258, global_step=38.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  95%|█████████▌| 76/80 [07:17<00:22,  5.68s/it, loss=0.0319, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=9.76e-5, train/loss_step=0.0258, global_step=38.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  95%|███████���█▌| 76/80 [07:17<00:22,  5.68s/it, loss=0.031, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000151, train/loss_step=0.0254, global_step=38.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  96%|█████████▋| 77/80 [07:17<00:16,  5.61s/it, loss=0.031, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000151, train/loss_step=0.0254, global_step=38.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  96%|█████████▋| 77/80 [07:17<00:16,  5.61s/it, loss=0.0312, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000225, train/loss_step=0.0246, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.0312, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000225, train/loss_step=0.0246, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.032, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000227, train/loss_step=0.0376, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1:  99%|█████████▉| 79/80 [07:18<00:05,  5.48s/it, loss=0.032, v_num=0, train/loss_simple_step=0.0376, train/loss_vlb_step=0.000227, train/loss_step=0.0376, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1:  99%|█████████▉| 79/80 [07:18<00:05,  5.48s/it, loss=0.0316, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000389, train/loss_step=0.045, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422] Epoch 1: 100%|██████████| 80/80 [07:19<00:00,  5.42s/it, loss=0.0316, v_num=0, train/loss_simple_step=0.045, train/loss_vlb_step=0.000389, train/loss_step=0.045, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 1: 100%|██████████| 80/80 [07:19<00:00,  5.42s/it, loss=0.0323, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000195, train/loss_step=0.0486, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Average Epoch time: 439.26 seconds
+Average Peak memory 29570.46MiB
+Epoch 1:   0%|          | 0/80 [00:00<00:00, 6875.91it/s, loss=0.0323, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000195, train/loss_step=0.0486, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 2:   0%|          | 0/80 [00:00<00:00, 2589.08it/s, loss=0.0323, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000195, train/loss_step=0.0486, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]Epoch 2:   1%|▏         | 1/80 [00:38<25:13, 19.16s/it, loss=0.0323, v_num=0, train/loss_simple_step=0.0486, train/loss_vlb_step=0.000195, train/loss_step=0.0486, global_step=39.00, lr_abs=0.0001, train/loss_simple_epoch=0.0422, train/loss_vlb_epoch=0.000933, train/loss_epoch=0.0422]  Epoch 2:   1%|▏         | 1/80 [00:38<25:13, 19.16s/it, loss=0.0326, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000108, train/loss_step=0.0271, global_step=40.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   2%|▎         | 2/80 [00:38<16:48, 12.93s/it, loss=0.0326, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000108, train/loss_step=0.0271, global_step=40.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   2%|▎         | 2/80 [00:38<16:48, 12.93s/it, loss=0.0333, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.00022, train/loss_step=0.0387, global_step=40.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:   4%|▍         | 3/80 [00:39<12:36,  9.82s/it, loss=0.0333, v_num=0, train/loss_simple_step=0.0387, train/loss_vlb_step=0.00022, train/loss_step=0.0387, global_step=40.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   4%|▍         | 3/80 [00:39<12:36,  9.82s/it, loss=0.0341, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.00122, train/loss_step=0.050, global_step=40.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]  Epoch 2:   5%|▌         | 4/80 [00:41<10:29,  8.28s/it, loss=0.0341, v_num=0, train/loss_simple_step=0.050, train/loss_vlb_step=0.00122, train/loss_step=0.050, global_step=40.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   5%|▌         | 4/80 [00:41<10:29,  8.28s/it, loss=0.0346, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00275, train/loss_step=0.0357, global_step=40.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   6%|▋         | 5/80 [00:41<08:43,  6.99s/it, loss=0.0346, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00275, train/loss_step=0.0357, global_step=40.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   6%|▋         | 5/80 [00:41<08:43,  6.99s/it, loss=0.0352, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000299, train/loss_step=0.0392, global_step=41.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   8%|▊         | 6/80 [00:42<07:28,  6.06s/it, loss=0.0352, v_num=0, train/loss_simple_step=0.0392, train/loss_vlb_step=0.000299, train/loss_step=0.0392, global_step=41.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   8%|▊         | 6/80 [00:42<07:28,  6.06s/it, loss=0.0349, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000112, train/loss_step=0.0263, global_step=41.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   9%|▉         | 7/80 [00:50<07:44,  6.37s/it, loss=0.0349, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000112, train/loss_step=0.0263, global_step=41.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:   9%|▉         | 7/80 [00:50<07:44,  6.37s/it, loss=0.0356, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.0003, train/loss_step=0.0413, global_step=41.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]  Epoch 2:  10%|█         | 8/80 [01:18<10:26,  8.70s/it, loss=0.0356, v_num=0, train/loss_simple_step=0.0413, train/loss_vlb_step=0.0003, train/loss_step=0.0413, global_step=41.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  10%|█         | 8/80 [01:18<10:26,  8.70s/it, loss=0.0356, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.94e-5, train/loss_step=0.0238, global_step=41.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  11%|█▏        | 9/80 [01:21<09:40,  8.18s/it, loss=0.0356, v_num=0, train/loss_simple_step=0.0238, train/loss_vlb_step=9.94e-5, train/loss_step=0.0238, global_step=41.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  11%|█▏        | 9/80 [01:21<09:40,  8.18s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=9.01e-5, train/loss_step=0.0188, global_step=42.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  12%|█▎        | 10/80 [01:22<08:43,  7.48s/it, loss=0.0334, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=9.01e-5, train/loss_step=0.0188, global_step=42.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  12%|█▎        | 10/80 [01:22<08:43,  7.48s/it, loss=0.0323, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.74e-5, train/loss_step=0.0208, global_step=42.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  14%|█▍        | 11/80 [01:22<07:55,  6.90s/it, loss=0.0323, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=8.74e-5, train/loss_step=0.0208, global_step=42.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  14%|█▍        | 11/80 [01:22<07:55,  6.90s/it, loss=0.0333, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000319, train/loss_step=0.0356, global_step=42.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  15%|█▌        | 12/80 [01:23<07:16,  6.42s/it, loss=0.0333, v_num=0, train/loss_simple_step=0.0356, train/loss_vlb_step=0.000319, train/loss_step=0.0356, global_step=42.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  15%|█▌        | 12/80 [01:23<07:16,  6.42s/it, loss=0.033, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000201, train/loss_step=0.0303, global_step=42.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  16%|█▋        | 13/80 [01:23<06:41,  6.00s/it, loss=0.033, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000201, train/loss_step=0.0303, global_step=42.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  16%|█▋        | 13/80 [01:23<06:41,  6.00s/it, loss=0.034, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000424, train/loss_step=0.0399, global_step=43.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  18%|█▊        | 14/80 [01:24<06:11,  5.63s/it, loss=0.034, v_num=0, train/loss_simple_step=0.0399, train/loss_vlb_step=0.000424, train/loss_step=0.0399, global_step=43.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  18%|█▊        | 14/80 [01:24<06:11,  5.63s/it, loss=0.0329, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000103, train/loss_step=0.0224, global_step=43.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  19%|█▉        | 15/80 [01:35<06:26,  5.95s/it, loss=0.0329, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000103, train/loss_step=0.0224, global_step=43.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  19%|█▉        | 15/80 [01:35<06:26,  5.95s/it, loss=0.0329, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000203, train/loss_step=0.0267, global_step=43.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  20%|██        | 16/80 [01:55<07:16,  6.82s/it, loss=0.0329, v_num=0, train/loss_simple_step=0.0267, train/loss_vlb_step=0.000203, train/loss_step=0.0267, global_step=43.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  20%|██        | 16/80 [01:55<07:16,  6.82s/it, loss=0.0327, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=7.57e-5, train/loss_step=0.0206, global_step=43.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  21%|██▏       | 17/80 [02:05<07:17,  6.95s/it, loss=0.0327, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=7.57e-5, train/loss_step=0.0206, global_step=43.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  21%|██▏       | 17/80 [02:05<07:18,  6.95s/it, loss=0.0336, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.0015, train/loss_step=0.0438, global_step=44.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  22%|██▎       | 18/80 [02:05<06:49,  6.61s/it, loss=0.0336, v_num=0, train/loss_simple_step=0.0438, train/loss_vlb_step=0.0015, train/loss_step=0.0438, global_step=44.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  22%|██▎       | 18/80 [02:05<06:49,  6.61s/it, loss=0.0337, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000801, train/loss_step=0.0383, global_step=44.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  24%|██▍       | 19/80 [02:06<06:24,  6.31s/it, loss=0.0337, v_num=0, train/loss_simple_step=0.0383, train/loss_vlb_step=0.000801, train/loss_step=0.0383, global_step=44.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  24%|██▍       | 19/80 [02:06<06:24,  6.31s/it, loss=0.0326, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000152, train/loss_step=0.0244, global_step=44.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  25%|██▌       | 20/80 [02:06<06:02,  6.03s/it, loss=0.0326, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000152, train/loss_step=0.0244, global_step=44.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  25%|██▌       | 20/80 [02:06<06:02,  6.03s/it, loss=0.031, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=5.48e-5, train/loss_step=0.0158, global_step=44.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]  Epoch 2:  26%|██▋       | 21/80 [02:07<05:41,  5.78s/it, loss=0.031, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=5.48e-5, train/loss_step=0.0158, global_step=44.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  26%|██▋       | 21/80 [02:07<05:41,  5.78s/it, loss=0.0306, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=9.2e-5, train/loss_step=0.0187, global_step=45.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  28%|██▊       | 22/80 [02:07<05:22,  5.55s/it, loss=0.0306, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=9.2e-5, train/loss_step=0.0187, global_step=45.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  28%|██▊       | 22/80 [02:07<05:22,  5.55s/it, loss=0.0302, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000208, train/loss_step=0.0309, global_step=45.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  29%|██▉       | 23/80 [02:10<05:10,  5.46s/it, loss=0.0302, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.000208, train/loss_step=0.0309, global_step=45.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  29%|██▉       | 23/80 [02:10<05:10,  5.46s/it, loss=0.03, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.00137, train/loss_step=0.0467, global_step=45.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]   Epoch 2:  30%|███       | 24/80 [02:39<05:57,  6.38s/it, loss=0.03, v_num=0, train/loss_simple_step=0.0467, train/loss_vlb_step=0.00137, train/loss_step=0.0467, global_step=45.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  30%|███       | 24/80 [02:39<05:57,  6.38s/it, loss=0.0295, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.00067, train/loss_step=0.0259, global_step=45.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  31%|███▏      | 25/80 [02:57<06:14,  6.81s/it, loss=0.0295, v_num=0, train/loss_simple_step=0.0259, train/loss_vlb_step=0.00067, train/loss_step=0.0259, global_step=45.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  31%|███▏      | 25/80 [02:57<06:14,  6.81s/it, loss=0.0295, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000205, train/loss_step=0.0384, global_step=46.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  32%|███▎      | 26/80 [02:57<05:55,  6.57s/it, loss=0.0295, v_num=0, train/loss_simple_step=0.0384, train/loss_vlb_step=0.000205, train/loss_step=0.0384, global_step=46.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  32%|███▎      | 26/80 [02:57<05:55,  6.57s/it, loss=0.0292, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.41e-5, train/loss_step=0.020, global_step=46.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]   Epoch 2:  34%|███▍      | 27/80 [02:57<05:36,  6.36s/it, loss=0.0292, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=7.41e-5, train/loss_step=0.020, global_step=46.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  34%|███▍      | 27/80 [02:57<05:36,  6.36s/it, loss=0.0288, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000156, train/loss_step=0.0346, global_step=46.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  35%|███▌      | 28/80 [02:58<05:20,  6.16s/it, loss=0.0288, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.000156, train/loss_step=0.0346, global_step=46.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  35%|███▌      | 28/80 [02:58<05:20,  6.16s/it, loss=0.0283, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=4.67e-5, train/loss_step=0.0138, global_step=46.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  36%|███▋      | 29/80 [02:59<05:04,  5.97s/it, loss=0.0283, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=4.67e-5, train/loss_step=0.0138, global_step=46.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  36%|███▋      | 29/80 [02:59<05:04,  5.97s/it, loss=0.0286, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000106, train/loss_step=0.0253, global_step=47.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  38%|███▊      | 30/80 [02:59<04:49,  5.79s/it, loss=0.0286, v_num=0, train/loss_simple_step=0.0253, train/loss_vlb_step=0.000106, train/loss_step=0.0253, global_step=47.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  38%|███���      | 30/80 [02:59<04:49,  5.79s/it, loss=0.0289, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000114, train/loss_step=0.0265, global_step=47.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  39%|███▉      | 31/80 [03:00<04:35,  5.63s/it, loss=0.0289, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.000114, train/loss_step=0.0265, global_step=47.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  39%|███▉      | 31/80 [03:00<04:35,  5.63s/it, loss=0.0283, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=0.000174, train/loss_step=0.0227, global_step=47.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  40%|████      | 32/80 [03:19<04:50,  6.04s/it, loss=0.0283, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=0.000174, train/loss_step=0.0227, global_step=47.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  40%|████      | 32/80 [03:19<04:50,  6.04s/it, loss=0.0272, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=2.91e-5, train/loss_step=0.00825, global_step=47.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  41%|████▏     | 33/80 [03:34<04:56,  6.31s/it, loss=0.0272, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=2.91e-5, train/loss_step=0.00825, global_step=47.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  41%|████▏     | 33/80 [03:34<04:56,  6.31s/it, loss=0.0257, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.03e-5, train/loss_step=0.0108, global_step=48.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]  Epoch 2:  42%|████▎     | 34/80 [03:35<04:42,  6.14s/it, loss=0.0257, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.03e-5, train/loss_step=0.0108, global_step=48.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  42%|████▎     | 34/80 [03:35<04:42,  6.14s/it, loss=0.0263, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000177, train/loss_step=0.0342, global_step=48.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  44%|████▍     | 35/80 [03:35<04:29,  5.99s/it, loss=0.0263, v_num=0, train/loss_simple_step=0.0342, train/loss_vlb_step=0.000177, train/loss_step=0.0342, global_step=48.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  44%|████▍     | 35/80 [03:35<04:29,  5.99s/it, loss=0.0263, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=9.94e-5, train/loss_step=0.0264, global_step=48.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  45%|████▌     | 36/80 [03:36<04:17,  5.84s/it, loss=0.0263, v_num=0, train/loss_simple_step=0.0264, train/loss_vlb_step=9.94e-5, train/loss_step=0.0264, global_step=48.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  45%|████▌     | 36/80 [03:36<04:17,  5.84s/it, loss=0.0262, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.8e-5, train/loss_step=0.0195, global_step=48.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  46%|████▋     | 37/80 [03:36<04:05,  5.70s/it, loss=0.0262, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=8.8e-5, train/loss_step=0.0195, global_step=48.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  46%|████▋     | 37/80 [03:36<04:05,  5.70s/it, loss=0.0255, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.00011, train/loss_step=0.0284, global_step=49.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  48%|████▊     | 38/80 [03:37<03:53,  5.57s/it, loss=0.0255, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.00011, train/loss_step=0.0284, global_step=49.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  48%|████▊     | 38/80 [03:37<03:53,  5.57s/it, loss=0.0248, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=8.22e-5, train/loss_step=0.024, global_step=49.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]  Epoch 2:  49%|████▉     | 39/80 [03:37<03:43,  5.44s/it, loss=0.0248, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=8.22e-5, train/loss_step=0.024, global_step=49.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  49%|████▉     | 39/80 [03:37<03:43,  5.44s/it, loss=0.0246, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.000282, train/loss_step=0.0217, global_step=49.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  50%|█████     | 40/80 [03:56<03:50,  5.76s/it, loss=0.0246, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.000282, train/loss_step=0.0217, global_step=49.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  50%|█████     | 40/80 [03:56<03:50,  5.76s/it, loss=0.0248, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=7.64e-5, train/loss_step=0.0204, global_step=49.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  51%|█████▏    | 41/80 [04:13<03:55,  6.03s/it, loss=0.0248, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=7.64e-5, train/loss_step=0.0204, global_step=49.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  51%|█████▏    | 41/80 [04:13<03:55,  6.03s/it, loss=0.0255, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000313, train/loss_step=0.0322, global_step=50.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  52%|█████▎    | 42/80 [04:13<03:44,  5.90s/it, loss=0.0255, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.000313, train/loss_step=0.0322, global_step=50.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  52%|█████▎    | 42/80 [04:13<03:44,  5.90s/it, loss=0.0249, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=0.00011, train/loss_step=0.019, global_step=50.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]   Epoch 2:  54%|█████▍    | 43/80 [04:14<03:33,  5.78s/it, loss=0.0249, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=0.00011, train/loss_step=0.019, global_step=50.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  54%|█████▍    | 43/80 [04:14<03:33,  5.78s/it, loss=0.0242, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000118, train/loss_step=0.0325, global_step=50.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  55%|█████▌    | 44/80 [04:14<03:23,  5.66s/it, loss=0.0242, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000118, train/loss_step=0.0325, global_step=50.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  55%|█████▌    | 44/80 [04:14<03:23,  5.66s/it, loss=0.0263, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.0136, train/loss_step=0.0671, global_step=50.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]  Epoch 2:  56%|█████▋    | 45/80 [04:16<03:15,  5.57s/it, loss=0.0263, v_num=0, train/loss_simple_step=0.0671, train/loss_vlb_step=0.0136, train/loss_step=0.0671, global_step=50.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  56%|█████▋    | 45/80 [04:16<03:15,  5.57s/it, loss=0.026, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.0011, train/loss_step=0.0318, global_step=51.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  57%|█████▊    | 46/80 [04:16<03:05,  5.46s/it, loss=0.026, v_num=0, train/loss_simple_step=0.0318, train/loss_vlb_step=0.0011, train/loss_step=0.0318, global_step=51.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  57%|█████▊    | 46/80 [04:16<03:05,  5.46s/it, loss=0.0262, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.000115, train/loss_step=0.0245, global_step=51.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  59%|█████▉    | 47/80 [04:17<02:56,  5.36s/it, loss=0.0262, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.000115, train/loss_step=0.0245, global_step=51.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  59%|█████▉    | 47/80 [04:17<02:56,  5.36s/it, loss=0.0253, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=0.000202, train/loss_step=0.0171, global_step=51.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  60%|██████    | 48/80 [04:42<03:04,  5.77s/it, loss=0.0253, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=0.000202, train/loss_step=0.0171, global_step=51.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  60%|██████    | 48/80 [04:42<03:04,  5.77s/it, loss=0.0258, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=8.18e-5, train/loss_step=0.0231, global_step=51.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  61%|██████▏   | 49/80 [04:52<03:01,  5.86s/it, loss=0.0258, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=8.18e-5, train/loss_step=0.0231, global_step=51.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  61%|██████▏   | 49/80 [04:52<03:01,  5.86s/it, loss=0.0257, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000187, train/loss_step=0.0249, global_step=52.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  62%|██████▎   | 50/80 [04:53<02:52,  5.75s/it, loss=0.0257, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000187, train/loss_step=0.0249, global_step=52.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  62%|██████▎   | 50/80 [04:53<02:52,  5.75s/it, loss=0.0249, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=3.39e-5, train/loss_step=0.00872, global_step=52.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  64%|██████▍   | 51/80 [04:53<02:43,  5.65s/it, loss=0.0249, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=3.39e-5, train/loss_step=0.00872, global_step=52.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  64%|██████▍   | 51/80 [04:53<02:43,  5.65s/it, loss=0.0261, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000338, train/loss_step=0.0485, global_step=52.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  65%|██████▌   | 52/80 [04:54<02:35,  5.56s/it, loss=0.0261, v_num=0, train/loss_simple_step=0.0485, train/loss_vlb_step=0.000338, train/loss_step=0.0485, global_step=52.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  65%|██████▌   | 52/80 [04:54<02:35,  5.56s/it, loss=0.0277, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000255, train/loss_step=0.0385, global_step=52.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  66%|██████▋   | 53/80 [04:55<02:27,  5.47s/it, loss=0.0277, v_num=0, train/loss_simple_step=0.0385, train/loss_vlb_step=0.000255, train/loss_step=0.0385, global_step=52.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  66%|██████▋   | 53/80 [04:55<02:27,  5.47s/it, loss=0.0288, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000857, train/loss_step=0.0339, global_step=53.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  68%|██████▊   | 54/80 [04:55<02:19,  5.38s/it, loss=0.0288, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.000857, train/loss_step=0.0339, global_step=53.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  68%|██████▊   | 54/80 [04:55<02:19,  5.38s/it, loss=0.0282, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.000109, train/loss_step=0.0229, global_step=53.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  69%|██████▉   | 55/80 [04:56<02:12,  5.29s/it, loss=0.0282, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.000109, train/loss_step=0.0229, global_step=53.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  69%|██████▉   | 55/80 [04:56<02:12,  5.29s/it, loss=0.0281, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.45e-5, train/loss_step=0.0226, global_step=53.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  70%|███████   | 56/80 [05:31<02:19,  5.82s/it, loss=0.0281, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=9.45e-5, train/loss_step=0.0226, global_step=53.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  70%|███████   | 56/80 [05:31<02:19,  5.82s/it, loss=0.0282, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.000185, train/loss_step=0.0229, global_step=53.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  71%|███████▏  | 57/80 [05:35<02:13,  5.79s/it, loss=0.0282, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.000185, train/loss_step=0.0229, global_step=53.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  71%|███████▏  | 57/80 [05:35<02:13,  5.79s/it, loss=0.0276, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.87e-5, train/loss_step=0.0162, global_step=54.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  72%|███████▎  | 58/80 [05:36<02:05,  5.70s/it, loss=0.0276, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=6.87e-5, train/loss_step=0.0162, global_step=54.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  72%|███████▎  | 58/80 [05:36<02:05,  5.70s/it, loss=0.0274, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=7.69e-5, train/loss_step=0.0201, global_step=54.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  74%|███████▍  | 59/80 [05:36<01:57,  5.62s/it, loss=0.0274, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=7.69e-5, train/loss_step=0.0201, global_step=54.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  74%|███████▍  | 59/80 [05:36<01:57,  5.62s/it, loss=0.0285, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000336, train/loss_step=0.0439, global_step=54.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  75%|███████▌  | 60/80 [05:37<01:50,  5.54s/it, loss=0.0285, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.000336, train/loss_step=0.0439, global_step=54.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  75%|███████▌  | 60/80 [05:37<01:50,  5.54s/it, loss=0.0298, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.00206, train/loss_step=0.0457, global_step=54.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  76%|███████▋  | 61/80 [05:38<01:43,  5.46s/it, loss=0.0298, v_num=0, train/loss_simple_step=0.0457, train/loss_vlb_step=0.00206, train/loss_step=0.0457, global_step=54.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  76%|███████▋  | 61/80 [05:38<01:43,  5.46s/it, loss=0.0291, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=0.00011, train/loss_step=0.0181, global_step=55.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  78%|███████▊  | 62/80 [05:39<01:36,  5.38s/it, loss=0.0291, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=0.00011, train/loss_step=0.0181, global_step=55.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  78%|███████▊  | 62/80 [05:39<01:36,  5.38s/it, loss=0.0304, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000416, train/loss_step=0.0446, global_step=55.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  79%|███████▉  | 63/80 [05:39<01:30,  5.31s/it, loss=0.0304, v_num=0, train/loss_simple_step=0.0446, train/loss_vlb_step=0.000416, train/loss_step=0.0446, global_step=55.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  79%|███████▉  | 63/80 [05:39<01:30,  5.31s/it, loss=0.0299, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.000114, train/loss_step=0.0237, global_step=55.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  80%|████████  | 64/80 [06:25<01:34,  5.92s/it, loss=0.0299, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.000114, train/loss_step=0.0237, global_step=55.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  80%|████████  | 64/80 [06:25<01:34,  5.92s/it, loss=0.0273, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=5.22e-5, train/loss_step=0.0144, global_step=55.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  81%|████████▏ | 65/80 [06:25<01:27,  5.84s/it, loss=0.0273, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=5.22e-5, train/loss_step=0.0144, global_step=55.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  81%|████████▏ | 65/80 [06:25<01:27,  5.84s/it, loss=0.0278, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000177, train/loss_step=0.0411, global_step=56.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  82%|████████▎ | 66/80 [06:26<01:20,  5.76s/it, loss=0.0278, v_num=0, train/loss_simple_step=0.0411, train/loss_vlb_step=0.000177, train/loss_step=0.0411, global_step=56.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  82%|████████▎ | 66/80 [06:26<01:20,  5.76s/it, loss=0.0276, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=9.46e-5, train/loss_step=0.0208, global_step=56.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  84%|████████▍ | 67/80 [06:26<01:13,  5.68s/it, loss=0.0276, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=9.46e-5, train/loss_step=0.0208, global_step=56.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  84%|████████▍ | 67/80 [06:26<01:13,  5.68s/it, loss=0.029, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.00032, train/loss_step=0.0453, global_step=56.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  85%|████████▌ | 68/80 [06:27<01:07,  5.61s/it, loss=0.029, v_num=0, train/loss_simple_step=0.0453, train/loss_vlb_step=0.00032, train/loss_step=0.0453, global_step=56.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  85%|████████▌ | 68/80 [06:27<01:07,  5.61s/it, loss=0.0295, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000169, train/loss_step=0.0338, global_step=56.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.0295, v_num=0, train/loss_simple_step=0.0338, train/loss_vlb_step=0.000169, train/loss_step=0.0338, global_step=56.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.0296, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.00012, train/loss_step=0.0268, global_step=57.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.0296, v_num=0, train/loss_simple_step=0.0268, train/loss_vlb_step=0.00012, train/loss_step=0.0268, global_step=57.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.0304, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000123, train/loss_step=0.0252, global_step=57.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.0304, v_num=0, train/loss_simple_step=0.0252, train/loss_vlb_step=0.000123, train/loss_step=0.0252, global_step=57.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.0289, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000177, train/loss_step=0.0185, global_step=57.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.0289, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000177, train/loss_step=0.0185, global_step=57.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.0279, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=0.000113, train/loss_step=0.0177, global_step=57.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  91%|█████████▏| 73/80 [07:00<00:39,  5.69s/it, loss=0.0279, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=0.000113, train/loss_step=0.0177, global_step=57.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  91%|█████████▏| 73/80 [07:00<00:39,  5.69s/it, loss=0.027, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=5.7e-5, train/loss_step=0.0161, global_step=58.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]   Epoch 2:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.027, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=5.7e-5, train/loss_step=0.0161, global_step=58.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.0266, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=4.76e-5, train/loss_step=0.0139, global_step=58.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  94%|█████████▍| 75/80 [07:01<00:27,  5.55s/it, loss=0.0266, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=4.76e-5, train/loss_step=0.0139, global_step=58.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  94%|█████████▍| 75/80 [07:01<00:27,  5.55s/it, loss=0.0262, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.07e-5, train/loss_step=0.0146, global_step=58.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.0262, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=6.07e-5, train/loss_step=0.0146, global_step=58.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.0266, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000426, train/loss_step=0.031, global_step=58.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  96%|█████████▋| 77/80 [07:02<00:16,  5.42s/it, loss=0.0266, v_num=0, train/loss_simple_step=0.031, train/loss_vlb_step=0.000426, train/loss_step=0.031, global_step=58.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  96%|█████████▋| 77/80 [07:02<00:16,  5.42s/it, loss=0.0276, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000762, train/loss_step=0.0372, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.0276, v_num=0, train/loss_simple_step=0.0372, train/loss_vlb_step=0.000762, train/loss_step=0.0372, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.0273, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=4.72e-5, train/loss_step=0.0136, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Epoch 2:  99%|█████████▉| 79/80 [07:03<00:05,  5.30s/it, loss=0.0273, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=4.72e-5, train/loss_step=0.0136, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2:  99%|█████████▉| 79/80 [07:03<00:05,  5.30s/it, loss=0.0267, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000269, train/loss_step=0.0321, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.0267, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.000269, train/loss_step=0.0321, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 2: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.0278, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.00147, train/loss_step=0.0672, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341] Average Epoch time: 424.32 seconds
+Average Peak memory 29567.49MiB
+Epoch 2:   0%|          | 0/80 [00:00<00:00, 6123.07it/s, loss=0.0278, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.00147, train/loss_step=0.0672, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 3:   0%|          | 0/80 [00:00<00:00, 2420.26it/s, loss=0.0278, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.00147, train/loss_step=0.0672, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]Epoch 3:   1%|▏         | 1/80 [00:34<22:39, 17.21s/it, loss=0.0278, v_num=0, train/loss_simple_step=0.0672, train/loss_vlb_step=0.00147, train/loss_step=0.0672, global_step=59.00, lr_abs=0.0001, train/loss_simple_epoch=0.0341, train/loss_vlb_epoch=0.000634, train/loss_epoch=0.0341]  Epoch 3:   1%|▏         | 1/80 [00:34<22:39, 17.21s/it, loss=0.0288, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000357, train/loss_step=0.0373, global_step=60.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   2%|▎         | 2/80 [00:52<22:55, 17.64s/it, loss=0.0288, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000357, train/loss_step=0.0373, global_step=60.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   2%|▎         | 2/80 [00:52<22:55, 17.64s/it, loss=0.027, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=2.99e-5, train/loss_step=0.0087, global_step=60.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:   4%|▍         | 3/80 [00:53<17:08, 13.35s/it, loss=0.027, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=2.99e-5, train/loss_step=0.0087, global_step=60.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   4%|▍         | 3/80 [00:53<17:08, 13.35s/it, loss=0.0282, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000729, train/loss_step=0.0494, global_step=60.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   5%|▌         | 4/80 [00:53<13:39, 10.79s/it, loss=0.0282, v_num=0, train/loss_simple_step=0.0494, train/loss_vlb_step=0.000729, train/loss_step=0.0494, global_step=60.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   5%|▌         | 4/80 [00:53<13:39, 10.79s/it, loss=0.0287, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.000329, train/loss_step=0.0241, global_step=60.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   6%|▋         | 5/80 [00:54<11:20,  9.07s/it, loss=0.0287, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.000329, train/loss_step=0.0241, global_step=60.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   6%|▋         | 5/80 [00:54<11:20,  9.07s/it, loss=0.0291, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000488, train/loss_step=0.048, global_step=61.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:   8%|▊         | 6/80 [00:54<09:40,  7.85s/it, loss=0.0291, v_num=0, train/loss_simple_step=0.048, train/loss_vlb_step=0.000488, train/loss_step=0.048, global_step=61.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   8%|▊         | 6/80 [00:54<09:40,  7.85s/it, loss=0.0286, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.38e-5, train/loss_step=0.0121, global_step=61.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   9%|▉         | 7/80 [00:55<08:25,  6.93s/it, loss=0.0286, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.38e-5, train/loss_step=0.0121, global_step=61.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:   9%|▉         | 7/80 [00:55<08:25,  6.93s/it, loss=0.0282, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00018, train/loss_step=0.0357, global_step=61.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  10%|█         | 8/80 [01:04<08:37,  7.19s/it, loss=0.0282, v_num=0, train/loss_simple_step=0.0357, train/loss_vlb_step=0.00018, train/loss_step=0.0357, global_step=61.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  10%|█         | 8/80 [01:04<08:37,  7.19s/it, loss=0.0279, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.00018, train/loss_step=0.0278, global_step=61.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  11%|█▏        | 9/80 [01:17<09:10,  7.75s/it, loss=0.0279, v_num=0, train/loss_simple_step=0.0278, train/loss_vlb_step=0.00018, train/loss_step=0.0278, global_step=61.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  11%|█▏        | 9/80 [01:17<09:10,  7.75s/it, loss=0.0274, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.34e-5, train/loss_step=0.0182, global_step=62.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  12%|█▎        | 10/80 [01:27<09:14,  7.92s/it, loss=0.0274, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=7.34e-5, train/loss_step=0.0182, global_step=62.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  12%|█▎        | 10/80 [01:27<09:14,  7.92s/it, loss=0.0263, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.1e-5, train/loss_step=0.00304, global_step=62.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  14%|█▍        | 11/80 [01:27<08:23,  7.30s/it, loss=0.0263, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.1e-5, train/loss_step=0.00304, global_step=62.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  14%|█▍        | 11/80 [01:27<08:23,  7.30s/it, loss=0.0275, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.00144, train/loss_step=0.0418, global_step=62.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  15%|█▌        | 12/80 [01:28<07:40,  6.78s/it, loss=0.0275, v_num=0, train/loss_simple_step=0.0418, train/loss_vlb_step=0.00144, train/loss_step=0.0418, global_step=62.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  15%|█▌        | 12/80 [01:28<07:40,  6.78s/it, loss=0.028, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000132, train/loss_step=0.0271, global_step=62.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  16%|█▋        | 13/80 [01:28<07:04,  6.33s/it, loss=0.028, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000132, train/loss_step=0.0271, global_step=62.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  16%|█▋        | 13/80 [01:28<07:04,  6.33s/it, loss=0.0291, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000355, train/loss_step=0.0389, global_step=63.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  18%|█▊        | 14/80 [01:29<06:32,  5.95s/it, loss=0.0291, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.000355, train/loss_step=0.0389, global_step=63.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  18%|█▊        | 14/80 [01:29<06:32,  5.95s/it, loss=0.0289, v_num=0, train/loss_simple_step=0.00984, train/loss_vlb_step=3.55e-5, train/loss_step=0.00984, global_step=63.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  19%|█▉        | 15/80 [01:32<06:15,  5.78s/it, loss=0.0289, v_num=0, train/loss_simple_step=0.00984, train/loss_vlb_step=3.55e-5, train/loss_step=0.00984, global_step=63.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  19%|█▉        | 15/80 [01:32<06:15,  5.78s/it, loss=0.0294, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000164, train/loss_step=0.0248, global_step=63.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  20%|██        | 16/80 [01:53<07:08,  6.70s/it, loss=0.0294, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000164, train/loss_step=0.0248, global_step=63.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  20%|██        | 16/80 [01:53<07:08,  6.70s/it, loss=0.0286, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=4.85e-5, train/loss_step=0.0145, global_step=63.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  21%|██▏       | 17/80 [01:54<06:40,  6.35s/it, loss=0.0286, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=4.85e-5, train/loss_step=0.0145, global_step=63.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  21%|██▏       | 17/80 [01:54<06:40,  6.35s/it, loss=0.0281, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000187, train/loss_step=0.0283, global_step=64.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  22%|██▎       | 18/80 [02:06<06:52,  6.65s/it, loss=0.0281, v_num=0, train/loss_simple_step=0.0283, train/loss_vlb_step=0.000187, train/loss_step=0.0283, global_step=64.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  22%|██▎       | 18/80 [02:06<06:52,  6.65s/it, loss=0.0277, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.13e-5, train/loss_step=0.00548, global_step=64.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  24%|██▍       | 19/80 [02:06<06:27,  6.35s/it, loss=0.0277, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.13e-5, train/loss_step=0.00548, global_step=64.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  24%|██▍       | 19/80 [02:06<06:27,  6.35s/it, loss=0.027, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=8.07e-5, train/loss_step=0.0169, global_step=64.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]   Epoch 3:  25%|██▌       | 20/80 [02:07<06:04,  6.07s/it, loss=0.027, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=8.07e-5, train/loss_step=0.0169, global_step=64.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  25%|██▌       | 20/80 [02:07<06:04,  6.07s/it, loss=0.0246, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=7.73e-5, train/loss_step=0.0205, global_step=64.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  26%|██▋       | 21/80 [02:11<05:52,  5.98s/it, loss=0.0246, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=7.73e-5, train/loss_step=0.0205, global_step=64.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  26%|██▋       | 21/80 [02:11<05:52,  5.98s/it, loss=0.0244, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000283, train/loss_step=0.0336, global_step=65.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  28%|██▊       | 22/80 [02:16<05:45,  5.95s/it, loss=0.0244, v_num=0, train/loss_simple_step=0.0336, train/loss_vlb_step=0.000283, train/loss_step=0.0336, global_step=65.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  28%|██▊       | 22/80 [02:16<05:45,  5.95s/it, loss=0.0245, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=3.43e-5, train/loss_step=0.010, global_step=65.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]   Epoch 3:  29%|██▉       | 23/80 [02:17<05:26,  5.73s/it, loss=0.0245, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=3.43e-5, train/loss_step=0.010, global_step=65.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  29%|██▉       | 23/80 [02:17<05:26,  5.73s/it, loss=0.0229, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.83e-5, train/loss_step=0.0172, global_step=65.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  30%|███       | 24/80 [02:40<06:00,  6.44s/it, loss=0.0229, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.83e-5, train/loss_step=0.0172, global_step=65.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  30%|███       | 24/80 [02:40<06:00,  6.44s/it, loss=0.0225, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.91e-5, train/loss_step=0.0158, global_step=65.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  31%|███▏      | 25/80 [02:41<05:41,  6.21s/it, loss=0.0225, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.91e-5, train/loss_step=0.0158, global_step=65.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  31%|███▏      | 25/80 [02:41<05:41,  6.21s/it, loss=0.0203, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=1.42e-5, train/loss_step=0.00376, global_step=66.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  32%|███▎      | 26/80 [02:52<05:44,  6.39s/it, loss=0.0203, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=1.42e-5, train/loss_step=0.00376, global_step=66.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  32%|███▎      | 26/80 [02:52<05:44,  6.39s/it, loss=0.0211, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000184, train/loss_step=0.0295, global_step=66.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  34%|███▍      | 27/80 [02:52<05:27,  6.18s/it, loss=0.0211, v_num=0, train/loss_simple_step=0.0295, train/loss_vlb_step=0.000184, train/loss_step=0.0295, global_step=66.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  34%|███▍      | 27/80 [02:52<05:27,  6.18s/it, loss=0.0209, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.0123, train/loss_step=0.0302, global_step=66.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:  35%|███▌      | 28/80 [02:53<05:11,  5.98s/it, loss=0.0209, v_num=0, train/loss_simple_step=0.0302, train/loss_vlb_step=0.0123, train/loss_step=0.0302, global_step=66.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  35%|███▌      | 28/80 [02:53<05:11,  5.98s/it, loss=0.0211, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.0139, train/loss_step=0.0334, global_step=66.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  36%|███▋      | 29/80 [02:56<05:00,  5.89s/it, loss=0.0211, v_num=0, train/loss_simple_step=0.0334, train/loss_vlb_step=0.0139, train/loss_step=0.0334, global_step=66.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  36%|███▋      | 29/80 [02:56<05:00,  5.89s/it, loss=0.0215, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000168, train/loss_step=0.0257, global_step=67.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  38%|███▊      | 30/80 [03:10<05:06,  6.13s/it, loss=0.0215, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000168, train/loss_step=0.0257, global_step=67.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  38%|███▊      | 30/80 [03:10<05:06,  6.13s/it, loss=0.0225, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=0.000128, train/loss_step=0.0226, global_step=67.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  39%|███▉      | 31/80 [03:10<04:51,  5.96s/it, loss=0.0225, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=0.000128, train/loss_step=0.0226, global_step=67.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  39%|███▉      | 31/80 [03:10<04:51,  5.96s/it, loss=0.0215, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=0.000162, train/loss_step=0.0223, global_step=67.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  40%|████      | 32/80 [03:16<04:45,  5.95s/it, loss=0.0215, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=0.000162, train/loss_step=0.0223, global_step=67.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  40%|████      | 32/80 [03:16<04:45,  5.95s/it, loss=0.0213, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=0.000135, train/loss_step=0.0234, global_step=67.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  41%|████▏     | 33/80 [03:16<04:32,  5.79s/it, loss=0.0213, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=0.000135, train/loss_step=0.0234, global_step=67.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  41%|████▏     | 33/80 [03:16<04:32,  5.79s/it, loss=0.0202, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=0.000128, train/loss_step=0.0172, global_step=68.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  42%|████▎     | 34/80 [03:38<04:47,  6.25s/it, loss=0.0202, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=0.000128, train/loss_step=0.0172, global_step=68.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  42%|████▎     | 34/80 [03:38<04:47,  6.25s/it, loss=0.0205, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.12e-5, train/loss_step=0.0153, global_step=68.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  44%|████▍     | 35/80 [03:39<04:34,  6.09s/it, loss=0.0205, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=6.12e-5, train/loss_step=0.0153, global_step=68.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  44%|████▍     | 35/80 [03:39<04:34,  6.09s/it, loss=0.0207, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000162, train/loss_step=0.0285, global_step=68.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  45%|████▌     | 36/80 [03:39<04:21,  5.94s/it, loss=0.0207, v_num=0, train/loss_simple_step=0.0285, train/loss_vlb_step=0.000162, train/loss_step=0.0285, global_step=68.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  45%|████▌     | 36/80 [03:39<04:21,  5.94s/it, loss=0.0204, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=2.78e-5, train/loss_step=0.00799, global_step=68.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  46%|████▋     | 37/80 [03:47<04:16,  5.98s/it, loss=0.0204, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=2.78e-5, train/loss_step=0.00799, global_step=68.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  46%|████▋     | 37/80 [03:47<04:16,  5.98s/it, loss=0.0198, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.47e-5, train/loss_step=0.0158, global_step=69.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:  48%|████▊     | 38/80 [03:47<04:05,  5.83s/it, loss=0.0198, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=6.47e-5, train/loss_step=0.0158, global_step=69.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  48%|████▊     | 38/80 [03:47<04:05,  5.83s/it, loss=0.0203, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000703, train/loss_step=0.0159, global_step=69.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  49%|████▉     | 39/80 [03:48<03:53,  5.70s/it, loss=0.0203, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000703, train/loss_step=0.0159, global_step=69.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  49%|████▉     | 39/80 [03:48<03:53,  5.70s/it, loss=0.02, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=3.7e-5, train/loss_step=0.0105, global_step=69.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]    Epoch 3:  50%|█████     | 40/80 [03:57<03:51,  5.78s/it, loss=0.02, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=3.7e-5, train/loss_step=0.0105, global_step=69.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  50%|█████     | 40/80 [03:57<03:51,  5.78s/it, loss=0.0197, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000127, train/loss_step=0.0145, global_step=69.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  51%|█████▏    | 41/80 [03:58<03:41,  5.67s/it, loss=0.0197, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000127, train/loss_step=0.0145, global_step=69.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  51%|█████▏    | 41/80 [03:58<03:41,  5.67s/it, loss=0.019, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=9.48e-5, train/loss_step=0.0197, global_step=70.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:  52%|█████▎    | 42/80 [04:22<03:52,  6.12s/it, loss=0.019, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=9.48e-5, train/loss_step=0.0197, global_step=70.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  52%|█████▎    | 42/80 [04:22<03:52,  6.12s/it, loss=0.0192, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=8.45e-5, train/loss_step=0.014, global_step=70.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  54%|█████▍    | 43/80 [04:23<03:41,  5.99s/it, loss=0.0192, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=8.45e-5, train/loss_step=0.014, global_step=70.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  54%|█████▍    | 43/80 [04:23<03:41,  5.99s/it, loss=0.0188, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.18e-5, train/loss_step=0.00955, global_step=70.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  55%|█████▌    | 44/80 [04:24<03:31,  5.88s/it, loss=0.0188, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=4.18e-5, train/loss_step=0.00955, global_step=70.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  55%|█████▌    | 44/80 [04:24<03:31,  5.88s/it, loss=0.0196, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000206, train/loss_step=0.0327, global_step=70.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  56%|█████▋    | 45/80 [04:26<03:22,  5.80s/it, loss=0.0196, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.000206, train/loss_step=0.0327, global_step=70.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  56%|█████▋    | 45/80 [04:26<03:22,  5.80s/it, loss=0.0199, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.55e-5, train/loss_step=0.00891, global_step=71.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.0199, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=4.55e-5, train/loss_step=0.00891, global_step=71.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.0193, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.91e-5, train/loss_step=0.0178, global_step=71.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:  59%|█████▉    | 47/80 [04:34<03:08,  5.71s/it, loss=0.0193, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.91e-5, train/loss_step=0.0178, global_step=71.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  59%|█████▉    | 47/80 [04:34<03:08,  5.71s/it, loss=0.0188, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=9.86e-5, train/loss_step=0.0203, global_step=71.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  60%|██████    | 48/80 [04:41<03:03,  5.75s/it, loss=0.0188, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=9.86e-5, train/loss_step=0.0203, global_step=71.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  60%|██████    | 48/80 [04:41<03:03,  5.75s/it, loss=0.0176, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.86e-5, train/loss_step=0.00982, global_step=71.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  61%|██████▏   | 49/80 [04:42<02:54,  5.64s/it, loss=0.0176, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=4.86e-5, train/loss_step=0.00982, global_step=71.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  61%|██████▏   | 49/80 [04:42<02:54,  5.64s/it, loss=0.0175, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=0.000295, train/loss_step=0.0243, global_step=72.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  62%|██████▎   | 50/80 [05:06<03:00,  6.02s/it, loss=0.0175, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=0.000295, train/loss_step=0.0243, global_step=72.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  62%|██████▎   | 50/80 [05:06<03:00,  6.02s/it, loss=0.0182, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000597, train/loss_step=0.035, global_step=72.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.0182, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.000597, train/loss_step=0.035, global_step=72.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.0177, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.49e-5, train/loss_step=0.0126, global_step=72.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  65%|██████▌   | 52/80 [05:07<02:42,  5.81s/it, loss=0.0177, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=5.49e-5, train/loss_step=0.0126, global_step=72.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  65%|██████▌   | 52/80 [05:07<02:42,  5.81s/it, loss=0.0176, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=0.000206, train/loss_step=0.0218, global_step=72.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  66%|█��████▋   | 53/80 [05:08<02:34,  5.71s/it, loss=0.0176, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=0.000206, train/loss_step=0.0218, global_step=72.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  66%|██████▋   | 53/80 [05:08<02:34,  5.71s/it, loss=0.017, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=2.1e-5, train/loss_step=0.00595, global_step=73.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  68%|██████▊   | 54/80 [05:17<02:30,  5.78s/it, loss=0.017, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=2.1e-5, train/loss_step=0.00595, global_step=73.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  68%|██████▊   | 54/80 [05:17<02:30,  5.78s/it, loss=0.0164, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=9.21e-6, train/loss_step=0.00215, global_step=73.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  69%|██████▉   | 55/80 [05:18<02:22,  5.69s/it, loss=0.0164, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=9.21e-6, train/loss_step=0.00215, global_step=73.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  69%|██████▉   | 55/80 [05:18<02:22,  5.69s/it, loss=0.0156, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000473, train/loss_step=0.0124, global_step=73.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  70%|███████   | 56/80 [05:18<02:14,  5.59s/it, loss=0.0156, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000473, train/loss_step=0.0124, global_step=73.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  70%|███████   | 56/80 [05:18<02:14,  5.59s/it, loss=0.0162, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.000144, train/loss_step=0.0197, global_step=73.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  71%|███████▏  | 57/80 [05:19<02:06,  5.51s/it, loss=0.0162, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.000144, train/loss_step=0.0197, global_step=73.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  71%|███████▏  | 57/80 [05:19<02:06,  5.51s/it, loss=0.0164, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=9.99e-5, train/loss_step=0.0198, global_step=74.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  72%|███████▎  | 58/80 [05:45<02:08,  5.85s/it, loss=0.0164, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=9.99e-5, train/loss_step=0.0198, global_step=74.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  72%|███████▎  | 58/80 [05:45<02:08,  5.85s/it, loss=0.0156, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=7.12e-6, train/loss_step=0.00173, global_step=74.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  74%|███████▍  | 59/80 [05:45<02:01,  5.76s/it, loss=0.0156, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=7.12e-6, train/loss_step=0.00173, global_step=74.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  74%|███████▍  | 59/80 [05:45<02:01,  5.76s/it, loss=0.0155, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=2.88e-5, train/loss_step=0.00795, global_step=74.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  75%|███████▌  | 60/80 [05:46<01:53,  5.68s/it, loss=0.0155, v_num=0, train/loss_simple_step=0.00795, train/loss_vlb_step=2.88e-5, train/loss_step=0.00795, global_step=74.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  75%|███████▌  | 60/80 [05:46<01:53,  5.68s/it, loss=0.0157, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.88e-5, train/loss_step=0.0187, global_step=74.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:  76%|███████▋  | 61/80 [05:49<01:47,  5.63s/it, loss=0.0157, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=8.88e-5, train/loss_step=0.0187, global_step=74.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  76%|��██████▋  | 61/80 [05:49<01:47,  5.63s/it, loss=0.016, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000509, train/loss_step=0.025, global_step=75.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:  78%|███████▊  | 62/80 [06:09<01:45,  5.86s/it, loss=0.016, v_num=0, train/loss_simple_step=0.025, train/loss_vlb_step=0.000509, train/loss_step=0.025, global_step=75.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  78%|███████▊  | 62/80 [06:09<01:45,  5.86s/it, loss=0.0165, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000109, train/loss_step=0.0242, global_step=75.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  79%|███████▉  | 63/80 [06:09<01:38,  5.78s/it, loss=0.0165, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000109, train/loss_step=0.0242, global_step=75.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  79%|███████▉  | 63/80 [06:09<01:38,  5.78s/it, loss=0.0171, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=0.000116, train/loss_step=0.021, global_step=75.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:  80%|████████  | 64/80 [06:10<01:31,  5.70s/it, loss=0.0171, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=0.000116, train/loss_step=0.021, global_step=75.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  80%|████████  | 64/80 [06:10<01:31,  5.70s/it, loss=0.0167, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000134, train/loss_step=0.0251, global_step=75.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.0167, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000134, train/loss_step=0.0251, global_step=75.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.0166, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=2.88e-5, train/loss_step=0.00729, global_step=76.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  82%|████████▎ | 66/80 [06:27<01:21,  5.79s/it, loss=0.0166, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=2.88e-5, train/loss_step=0.00729, global_step=76.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  82%|████████▎ | 66/80 [06:27<01:21,  5.79s/it, loss=0.0168, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=0.000207, train/loss_step=0.021, global_step=76.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]   Epoch 3:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.0168, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=0.000207, train/loss_step=0.021, global_step=76.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.0163, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.12e-5, train/loss_step=0.00996, global_step=76.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.0163, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=4.12e-5, train/loss_step=0.00996, global_step=76.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.0163, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.5e-5, train/loss_step=0.0114, global_step=76.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]   Epoch 3:  86%|████████▋ | 69/80 [06:29<01:01,  5.56s/it, loss=0.0163, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.5e-5, train/loss_step=0.0114, global_step=76.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  86%|████████▋ | 69/80 [06:29<01:01,  5.56s/it, loss=0.0158, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=4.75e-5, train/loss_step=0.0124, global_step=77.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  88%|████████▊ | 70/80 [06:44<00:56,  5.70s/it, loss=0.0158, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=4.75e-5, train/loss_step=0.0124, global_step=77.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  88%|████████▊ | 70/80 [06:44<00:56,  5.70s/it, loss=0.0149, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=0.000115, train/loss_step=0.0174, global_step=77.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  89%|████████▉ | 71/80 [06:45<00:50,  5.63s/it, loss=0.0149, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=0.000115, train/loss_step=0.0174, global_step=77.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  89%|████████▉ | 71/80 [06:45<00:50,  5.63s/it, loss=0.0157, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.00105, train/loss_step=0.0282, global_step=77.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  90%|█████████ | 72/80 [06:45<00:44,  5.56s/it, loss=0.0157, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.00105, train/loss_step=0.0282, global_step=77.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  90%|█████████ | 72/80 [06:45<00:44,  5.56s/it, loss=0.0164, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000256, train/loss_step=0.0362, global_step=77.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  91%|█████████▏| 73/80 [06:46<00:38,  5.49s/it, loss=0.0164, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.000256, train/loss_step=0.0362, global_step=77.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  91%|█████████▏| 73/80 [06:46<00:38,  5.49s/it, loss=0.0171, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000472, train/loss_step=0.0205, global_step=78.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  92%|█████████▎| 74/80 [07:03<00:33,  5.65s/it, loss=0.0171, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000472, train/loss_step=0.0205, global_step=78.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  92%|█████████▎| 74/80 [07:03<00:33,  5.65s/it, loss=0.0189, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.00102, train/loss_step=0.0389, global_step=78.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3:  94%|█████████▍| 75/80 [07:04<00:27,  5.58s/it, loss=0.0189, v_num=0, train/loss_simple_step=0.0389, train/loss_vlb_step=0.00102, train/loss_step=0.0389, global_step=78.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  94%|█████████▍| 75/80 [07:04<00:27,  5.58s/it, loss=0.0185, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.03e-5, train/loss_step=0.00291, global_step=78.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  95%|█████████▌| 76/80 [07:05<00:22,  5.52s/it, loss=0.0185, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.03e-5, train/loss_step=0.00291, global_step=78.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  95%|█████████▌| 76/80 [07:05<00:22,  5.52s/it, loss=0.0177, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.61e-5, train/loss_step=0.00364, global_step=78.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  96%|█████████▋| 77/80 [07:08<00:16,  5.50s/it, loss=0.0177, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.61e-5, train/loss_step=0.00364, global_step=78.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  96%|█████████▋| 77/80 [07:08<00:16,  5.50s/it, loss=0.017, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=2.8e-5, train/loss_step=0.00625, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 3:  98%|█████████▊| 78/80 [07:13<00:10,  5.49s/it, loss=0.017, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=2.8e-5, train/loss_step=0.00625, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  98%|█████████▊| 78/80 [07:13<00:10,  5.49s/it, loss=0.0172, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.19e-5, train/loss_step=0.00605, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.0172, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=3.19e-5, train/loss_step=0.00605, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.0182, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000814, train/loss_step=0.0269, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298] Epoch 3: 100%|██████████| 80/80 [07:14<00:00,  5.37s/it, loss=0.0182, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.000814, train/loss_step=0.0269, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 3: 100%|██████████| 80/80 [07:14<00:00,  5.37s/it, loss=0.0173, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=5.42e-6, train/loss_step=0.00129, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Average Epoch time: 434.89 seconds
+Average Peak memory 29563.10MiB
+Epoch 3:   0%|          | 0/80 [00:00<00:00, 6842.26it/s, loss=0.0173, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=5.42e-6, train/loss_step=0.00129, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 4:   0%|          | 0/80 [00:00<00:00, 2734.23it/s, loss=0.0173, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=5.42e-6, train/loss_step=0.00129, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]Epoch 4:   1%|▏         | 1/80 [00:45<29:47, 22.62s/it, loss=0.0173, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=5.42e-6, train/loss_step=0.00129, global_step=79.00, lr_abs=0.0001, train/loss_simple_epoch=0.0298, train/loss_vlb_epoch=0.000725, train/loss_epoch=0.0298]  Epoch 4:   1%|▏         | 1/80 [00:45<29:47, 22.62s/it, loss=0.0166, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.19e-5, train/loss_step=0.0115, global_step=80.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]  Epoch 4:   2%|▎         | 2/80 [00:51<22:27, 17.27s/it, loss=0.0166, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.19e-5, train/loss_step=0.0115, global_step=80.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:   2%|▎         | 2/80 [00:51<22:27, 17.27s/it, loss=0.0158, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=2.48e-5, train/loss_step=0.00734, global_step=80.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:   4%|▍         | 3/80 [00:52<16:46, 13.08s/it, loss=0.0158, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=2.48e-5, train/loss_step=0.00734, global_step=80.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:   4%|▍         | 3/80 [00:52<16:46, 13.08s/it, loss=0.0152, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.49e-5, train/loss_step=0.0103, global_step=80.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]  Epoch 4:   5%|▌         | 4/80 [00:52<13:22, 10.57s/it, loss=0.0152, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.49e-5, train/loss_step=0.0103, global_step=80.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:   5%|▌         | 4/80 [00:52<13:22, 10.57s/it, loss=0.0147, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=8.63e-5, train/loss_step=0.0153, global_step=80.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:   6%|▋         | 5/80 [00:53<11:06,  8.89s/it, loss=0.0147, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=8.63e-5, train/loss_step=0.0153, global_step=80.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:   6%|▋         | 5/80 [00:53<11:06,  8.89s/it, loss=0.0157, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000873, train/loss_step=0.0263, global_step=81.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:   8%|▊         | 6/80 [00:53<09:28,  7.69s/it, loss=0.0157, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000873, train/loss_step=0.0263, global_step=81.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:   8%|▊         | 6/80 [00:53<09:28,  7.69s/it, loss=0.0154, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.00011, train/loss_step=0.015, global_step=81.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]   Epoch 4:   9%|▉         | 7/80 [00:54<08:15,  6.79s/it, loss=0.0154, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.00011, train/loss_step=0.015, global_step=81.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:   9%|▉         | 7/80 [00:54<08:15,  6.79s/it, loss=0.016, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=0.000205, train/loss_step=0.023, global_step=81.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  10%|█         | 8/80 [01:21<10:50,  9.04s/it, loss=0.016, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=0.000205, train/loss_step=0.023, global_step=81.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  10%|█         | 8/80 [01:21<10:50,  9.04s/it, loss=0.0158, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.84e-5, train/loss_step=0.006, global_step=81.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  11%|█▏        | 9/80 [01:31<10:52,  9.20s/it, loss=0.0158, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.84e-5, train/loss_step=0.006, global_step=81.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  11%|█▏        | 9/80 [01:31<10:52,  9.20s/it, loss=0.0154, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.98e-5, train/loss_step=0.00533, global_step=82.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  12%|█▎        | 10/80 [01:48<11:28,  9.83s/it, loss=0.0154, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=2.98e-5, train/loss_step=0.00533, global_step=82.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  12%|█▎        | 10/80 [01:48<11:28,  9.83s/it, loss=0.0155, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.000106, train/loss_step=0.0191, global_step=82.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  14%|█▍        | 11/80 [01:48<10:24,  9.05s/it, loss=0.0155, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.000106, train/loss_step=0.0191, global_step=82.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  14%|█▍        | 11/80 [01:48<10:24,  9.06s/it, loss=0.0142, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=6.28e-6, train/loss_step=0.00167, global_step=82.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  15%|█▌        | 12/80 [01:49<09:31,  8.40s/it, loss=0.0142, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=6.28e-6, train/loss_step=0.00167, global_step=82.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  15%|█▌        | 12/80 [01:49<09:31,  8.40s/it, loss=0.013, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.68e-5, train/loss_step=0.0133, global_step=82.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]   Epoch 4:  16%|█▋        | 13/80 [01:49<08:44,  7.83s/it, loss=0.013, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=6.68e-5, train/loss_step=0.0133, global_step=82.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  16%|█▋        | 13/80 [01:49<08:44,  7.83s/it, loss=0.0128, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000166, train/loss_step=0.0165, global_step=83.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  18%|█▊        | 14/80 [01:50<08:04,  7.34s/it, loss=0.0128, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000166, train/loss_step=0.0165, global_step=83.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  18%|█▊        | 14/80 [01:50<08:04,  7.34s/it, loss=0.012, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.000175, train/loss_step=0.0232, global_step=83.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  19%|█▉        | 15/80 [01:50<07:29,  6.92s/it, loss=0.012, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.000175, train/loss_step=0.0232, global_step=83.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  19%|█▉        | 15/80 [01:50<07:29,  6.92s/it, loss=0.0125, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=6.98e-5, train/loss_step=0.0114, global_step=83.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  20%|██        | 16/80 [02:02<07:40,  7.20s/it, loss=0.0125, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=6.98e-5, train/loss_step=0.0114, global_step=83.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  20%|██        | 16/80 [02:02<07:40,  7.20s/it, loss=0.0135, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.000162, train/loss_step=0.0245, global_step=83.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  21%|██▏       | 17/80 [02:16<07:58,  7.60s/it, loss=0.0135, v_num=0, train/loss_simple_step=0.0245, train/loss_vlb_step=0.000162, train/loss_step=0.0245, global_step=83.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  21%|██▏       | 17/80 [02:16<07:58,  7.60s/it, loss=0.014, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=8.57e-5, train/loss_step=0.0154, global_step=84.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]  Epoch 4:  22%|██▎       | 18/80 [02:21<07:42,  7.46s/it, loss=0.014, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=8.57e-5, train/loss_step=0.0154, global_step=84.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  22%|██▎       | 18/80 [02:21<07:42,  7.46s/it, loss=0.014, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=2.79e-5, train/loss_step=0.00679, global_step=84.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  24%|██▍       | 19/80 [02:22<07:13,  7.11s/it, loss=0.014, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=2.79e-5, train/loss_step=0.00679, global_step=84.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  24%|██▍       | 19/80 [02:22<07:13,  7.11s/it, loss=0.0134, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=7e-5, train/loss_step=0.0155, global_step=84.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]    Epoch 4:  25%|██▌       | 20/80 [02:22<06:47,  6.80s/it, loss=0.0134, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=7e-5, train/loss_step=0.0155, global_step=84.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  25%|██▌       | 20/80 [02:22<06:47,  6.80s/it, loss=0.0135, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.17e-5, train/loss_step=0.00292, global_step=84.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  26%|██▋       | 21/80 [02:23<06:24,  6.52s/it, loss=0.0135, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.17e-5, train/loss_step=0.00292, global_step=84.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  26%|██▋       | 21/80 [02:23<06:24,  6.52s/it, loss=0.0141, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=0.000346, train/loss_step=0.0234, global_step=85.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  28%|██▊       | 22/80 [02:23<06:02,  6.26s/it, loss=0.0141, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=0.000346, train/loss_step=0.0234, global_step=85.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  28%|██▊       | 22/80 [02:23<06:02,  6.26s/it, loss=0.0146, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=0.000445, train/loss_step=0.0177, global_step=85.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  29%|██▉       | 23/80 [02:24<05:42,  6.02s/it, loss=0.0146, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=0.000445, train/loss_step=0.0177, global_step=85.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  29%|██▉       | 23/80 [02:24<05:42,  6.02s/it, loss=0.0147, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=0.000235, train/loss_step=0.0108, global_step=85.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  30%|███       | 24/80 [02:42<06:03,  6.49s/it, loss=0.0147, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=0.000235, train/loss_step=0.0108, global_step=85.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  30%|███       | 24/80 [02:42<06:03,  6.49s/it, loss=0.0156, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000386, train/loss_step=0.0333, global_step=85.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  31%|███▏      | 25/80 [02:56<06:12,  6.77s/it, loss=0.0156, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.000386, train/loss_step=0.0333, global_step=85.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  31%|███▏      | 25/80 [02:56<06:12,  6.77s/it, loss=0.0145, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.21e-5, train/loss_step=0.00609, global_step=86.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  32%|███▎      | 26/80 [03:00<06:01,  6.70s/it, loss=0.0145, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.21e-5, train/loss_step=0.00609, global_step=86.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  32%|███▎      | 26/80 [03:00<06:01,  6.70s/it, loss=0.0141, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=2.37e-5, train/loss_step=0.00644, global_step=86.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  34%|███▍      | 27/80 [03:02<05:44,  6.50s/it, loss=0.0141, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=2.37e-5, train/loss_step=0.00644, global_step=86.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  34%|███▍      | 27/80 [03:02<05:44,  6.50s/it, loss=0.0145, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000387, train/loss_step=0.0299, global_step=86.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.0145, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.000387, train/loss_step=0.0299, global_step=86.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.0143, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=9.52e-6, train/loss_step=0.00284, global_step=86.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.0143, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=9.52e-6, train/loss_step=0.00284, global_step=86.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.0143, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.64e-5, train/loss_step=0.00561, global_step=87.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  38%|███▊      | 30/80 [03:03<04:56,  5.92s/it, loss=0.0143, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.64e-5, train/loss_step=0.00561, global_step=87.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  38%|███▊      | 30/80 [03:03<04:56,  5.92s/it, loss=0.0137, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=2.18e-5, train/loss_step=0.00648, global_step=87.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.0137, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=2.18e-5, train/loss_step=0.00648, global_step=87.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.0142, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.00011, train/loss_step=0.0124, global_step=87.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]  Epoch 4:  40%|████      | 32/80 [03:15<04:44,  5.92s/it, loss=0.0142, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.00011, train/loss_step=0.0124, global_step=87.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  40%|████      | 32/80 [03:15<04:44,  5.92s/it, loss=0.0149, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.00107, train/loss_step=0.026, global_step=87.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]  Epoch 4:  41%|████▏     | 33/80 [03:42<05:07,  6.55s/it, loss=0.0149, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.00107, train/loss_step=0.026, global_step=87.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  41%|████▏     | 33/80 [03:42<05:07,  6.55s/it, loss=0.0148, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000239, train/loss_step=0.0149, global_step=88.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  42%|████▎     | 34/80 [03:53<05:07,  6.68s/it, loss=0.0148, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000239, train/loss_step=0.0149, global_step=88.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  42%|████▎     | 34/80 [03:53<05:07,  6.68s/it, loss=0.0146, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.000521, train/loss_step=0.0197, global_step=88.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  44%|████▍     | 35/80 [03:54<04:52,  6.51s/it, loss=0.0146, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.000521, train/loss_step=0.0197, global_step=88.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  44%|████▍     | 35/80 [03:54<04:52,  6.51s/it, loss=0.0144, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=4.7e-5, train/loss_step=0.00749, global_step=88.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  45%|████▌     | 36/80 [03:54<04:39,  6.35s/it, loss=0.0144, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=4.7e-5, train/loss_step=0.00749, global_step=88.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  45%|████▌     | 36/80 [03:54<04:39,  6.35s/it, loss=0.0134, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.58e-5, train/loss_step=0.00534, global_step=88.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  46%|████▋     | 37/80 [03:55<04:26,  6.19s/it, loss=0.0134, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.58e-5, train/loss_step=0.00534, global_step=88.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  46%|████▋     | 37/80 [03:55<04:26,  6.19s/it, loss=0.013, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=4.45e-5, train/loss_step=0.00703, global_step=89.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  48%|████▊     | 38/80 [03:55<04:13,  6.05s/it, loss=0.013, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=4.45e-5, train/loss_step=0.00703, global_step=89.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  48%|████▊     | 38/80 [03:55<04:13,  6.05s/it, loss=0.0132, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.49e-5, train/loss_step=0.0107, global_step=89.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  49%|████▉     | 39/80 [03:56<04:02,  5.91s/it, loss=0.0132, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.49e-5, train/loss_step=0.0107, global_step=89.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  49%|████▉     | 39/80 [03:56<04:02,  5.91s/it, loss=0.0126, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.33e-5, train/loss_step=0.00359, global_step=89.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  50%|█████     | 40/80 [04:05<03:59,  5.98s/it, loss=0.0126, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.33e-5, train/loss_step=0.00359, global_step=89.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  50%|█████     | 40/80 [04:05<03:59,  5.98s/it, loss=0.0126, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.4e-5, train/loss_step=0.00333, global_step=89.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  51%|█████▏    | 41/80 [04:21<04:02,  6.22s/it, loss=0.0126, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.4e-5, train/loss_step=0.00333, global_step=89.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  51%|█████▏    | 41/80 [04:21<04:02,  6.22s/it, loss=0.0117, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=1.95e-5, train/loss_step=0.0042, global_step=90.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  52%|█████▎    | 42/80 [04:38<04:06,  6.48s/it, loss=0.0117, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=1.95e-5, train/loss_step=0.0042, global_step=90.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  52%|█████▎    | 42/80 [04:38<04:06,  6.48s/it, loss=0.0119, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=0.00067, train/loss_step=0.0214, global_step=90.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  54%|█████▍    | 43/80 [04:39<03:54,  6.34s/it, loss=0.0119, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=0.00067, train/loss_step=0.0214, global_step=90.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  54%|█████▍    | 43/80 [04:39<03:54,  6.34s/it, loss=0.0115, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.13e-5, train/loss_step=0.00251, global_step=90.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.0115, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.13e-5, train/loss_step=0.00251, global_step=90.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.8e-5, train/loss_step=0.00706, global_step=90.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.8e-5, train/loss_step=0.00706, global_step=90.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.00171, train/loss_step=0.0273, global_step=91.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  57%|█████▊    | 46/80 [04:40<03:22,  5.97s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.00171, train/loss_step=0.0273, global_step=91.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  57%|█████▊    | 46/80 [04:40<03:22,  5.97s/it, loss=0.0117, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=0.000183, train/loss_step=0.0162, global_step=91.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  59%|█████▉    | 47/80 [04:41<03:13,  5.86s/it, loss=0.0117, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=0.000183, train/loss_step=0.0162, global_step=91.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  59%|█████▉    | 47/80 [04:41<03:13,  5.86s/it, loss=0.0106, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=6.46e-5, train/loss_step=0.00843, global_step=91.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  60%|██████    | 48/80 [04:46<03:07,  5.85s/it, loss=0.0106, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=6.46e-5, train/loss_step=0.00843, global_step=91.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  60%|██████    | 48/80 [04:46<03:07,  5.85s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.12e-5, train/loss_step=0.0225, global_step=91.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]  Epoch 4:  61%|██████▏   | 49/80 [04:59<03:05,  5.98s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=8.12e-5, train/loss_step=0.0225, global_step=91.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  61%|██████▏   | 49/80 [04:59<03:05,  5.98s/it, loss=0.0118, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=3.43e-5, train/loss_step=0.00958, global_step=92.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  62%|██████▎   | 50/80 [05:21<03:09,  6.30s/it, loss=0.0118, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=3.43e-5, train/loss_step=0.00958, global_step=92.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  62%|██████▎   | 50/80 [05:21<03:09,  6.30s/it, loss=0.0117, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=2.06e-5, train/loss_step=0.00353, global_step=92.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  64%|██████▍   | 51/80 [05:21<02:59,  6.19s/it, loss=0.0117, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=2.06e-5, train/loss_step=0.00353, global_step=92.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  64%|██████▍   | 51/80 [05:21<02:59,  6.19s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=8.33e-5, train/loss_step=0.0117, global_step=92.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]  Epoch 4:  65%|██████▌   | 52/80 [05:22<02:50,  6.08s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=8.33e-5, train/loss_step=0.0117, global_step=92.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  65%|██████▌   | 52/80 [05:22<02:50,  6.08s/it, loss=0.0111, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=0.00108, train/loss_step=0.0156, global_step=92.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  66%|██████▋   | 53/80 [05:22<02:41,  5.98s/it, loss=0.0111, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=0.00108, train/loss_step=0.0156, global_step=92.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  66%|██████▋   | 53/80 [05:22<02:41,  5.98s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=0.000236, train/loss_step=0.0101, global_step=93.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  68%|██████▊   | 54/80 [05:23<02:32,  5.88s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=0.000236, train/loss_step=0.0101, global_step=93.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  68%|██████▊   | 54/80 [05:23<02:32,  5.88s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.84e-5, train/loss_step=0.00433, global_step=93.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  69%|██████▉   | 55/80 [05:23<02:24,  5.78s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.84e-5, train/loss_step=0.00433, global_step=93.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  69%|██████▉   | 55/80 [05:23<02:24,  5.78s/it, loss=0.0104, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000104, train/loss_step=0.0138, global_step=93.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  70%|███████   | 56/80 [05:28<02:18,  5.75s/it, loss=0.0104, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000104, train/loss_step=0.0138, global_step=93.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  70%|███████   | 56/80 [05:28<02:18,  5.75s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=4.32e-5, train/loss_step=0.00633, global_step=93.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  71%|███████▏  | 57/80 [05:53<02:20,  6.09s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00633, train/loss_vlb_step=4.32e-5, train/loss_step=0.00633, global_step=93.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  71%|███████▏  | 57/80 [05:53<02:20,  6.09s/it, loss=0.0108, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000195, train/loss_step=0.0145, global_step=94.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  72%|███████▎  | 58/80 [05:56<02:12,  6.04s/it, loss=0.0108, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000195, train/loss_step=0.0145, global_step=94.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  72%|███████▎  | 58/80 [05:56<02:12,  6.04s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=1.39e-5, train/loss_step=0.00382, global_step=94.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  74%|███████▍  | 59/80 [06:07<02:08,  6.13s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=1.39e-5, train/loss_step=0.00382, global_step=94.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  74%|███████▍  | 59/80 [06:07<02:08,  6.13s/it, loss=0.0107, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=5.69e-5, train/loss_step=0.00756, global_step=94.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  75%|███████▌  | 60/80 [06:08<02:00,  6.04s/it, loss=0.0107, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=5.69e-5, train/loss_step=0.00756, global_step=94.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  75%|███████▌  | 60/80 [06:08<02:00,  6.04s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.48e-5, train/loss_step=0.00712, global_step=94.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  76%|███████▋  | 61/80 [06:08<01:53,  5.95s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.48e-5, train/loss_step=0.00712, global_step=94.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  76%|███████▋  | 61/80 [06:08<01:53,  5.95s/it, loss=0.0115, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=0.000757, train/loss_step=0.0164, global_step=95.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  78%|███████▊  | 62/80 [06:09<01:45,  5.86s/it, loss=0.0115, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=0.000757, train/loss_step=0.0164, global_step=95.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  78%|███████▊  | 62/80 [06:09<01:45,  5.86s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=9.43e-6, train/loss_step=0.00252, global_step=95.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  79%|███████▉  | 63/80 [06:09<01:38,  5.78s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=9.43e-6, train/loss_step=0.00252, global_step=95.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  79%|███████▉  | 63/80 [06:09<01:38,  5.78s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=9.42e-5, train/loss_step=0.0159, global_step=95.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]  Epoch 4:  80%|████████  | 64/80 [06:12<01:31,  5.73s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=9.42e-5, train/loss_step=0.0159, global_step=95.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  80%|████████  | 64/80 [06:12<01:31,  5.73s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000187, train/loss_step=0.0158, global_step=95.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  81%|████████▏ | 65/80 [06:30<01:28,  5.92s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000187, train/loss_step=0.0158, global_step=95.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  81%|████████▏ | 65/80 [06:30<01:28,  5.92s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000202, train/loss_step=0.0178, global_step=96.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  82%|████████▎ | 66/80 [06:31<01:21,  5.85s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000202, train/loss_step=0.0178, global_step=96.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  82%|████���███▎ | 66/80 [06:31<01:21,  5.85s/it, loss=0.0106, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=1.77e-5, train/loss_step=0.00397, global_step=96.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  84%|████████▍ | 67/80 [06:57<01:19,  6.14s/it, loss=0.0106, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=1.77e-5, train/loss_step=0.00397, global_step=96.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  84%|████████▍ | 67/80 [06:57<01:19,  6.14s/it, loss=0.0103, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.65e-5, train/loss_step=0.00395, global_step=96.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  85%|████████▌ | 68/80 [06:57<01:12,  6.06s/it, loss=0.0103, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.65e-5, train/loss_step=0.00395, global_step=96.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  85%|████████▌ | 68/80 [06:57<01:12,  6.06s/it, loss=0.00961, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=5.39e-5, train/loss_step=0.00808, global_step=96.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  86%|████████▋ | 69/80 [06:58<01:05,  5.98s/it, loss=0.00961, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=5.39e-5, train/loss_step=0.00808, global_step=96.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  86%|████████▋ | 69/80 [06:58<01:05,  5.98s/it, loss=0.00945, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=5.67e-5, train/loss_step=0.00628, global_step=97.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  88%|████████▊ | 70/80 [06:58<00:58,  5.90s/it, loss=0.00945, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=5.67e-5, train/loss_step=0.00628, global_step=97.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  88%|████████▊ | 70/80 [06:58<00:58,  5.90s/it, loss=0.00964, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=5.46e-5, train/loss_step=0.00747, global_step=97.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  89%|████████▉ | 71/80 [06:59<00:52,  5.82s/it, loss=0.00964, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=5.46e-5, train/loss_step=0.00747, global_step=97.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  89%|████████▉ | 71/80 [06:59<00:52,  5.82s/it, loss=0.00943, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=5e-5, train/loss_step=0.00735, global_step=97.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]   Epoch 4:  90%|█████████ | 72/80 [06:59<00:46,  5.75s/it, loss=0.00943, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=5e-5, train/loss_step=0.00735, global_step=97.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  90%|█████████ | 72/80 [06:59<00:46,  5.75s/it, loss=0.00894, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=3e-5, train/loss_step=0.00584, global_step=97.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  91%|█████████▏| 73/80 [07:16<00:41,  5.90s/it, loss=0.00894, v_num=0, train/loss_simple_step=0.00584, train/loss_vlb_step=3e-5, train/loss_step=0.00584, global_step=97.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  91%|█████████▏| 73/80 [07:16<00:41,  5.90s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=1.8e-5, train/loss_step=0.00518, global_step=98.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  92%|█████████▎| 74/80 [07:16<00:34,  5.82s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=1.8e-5, train/loss_step=0.00518, global_step=98.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  92%|█████████▎| 74/80 [07:16<00:34,  5.82s/it, loss=0.00942, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.00115, train/loss_step=0.0188, global_step=98.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  94%|█████████▍| 75/80 [07:28<00:29,  5.90s/it, loss=0.00942, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.00115, train/loss_step=0.0188, global_step=98.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  94%|█████████▍| 75/80 [07:28<00:29,  5.90s/it, loss=0.00886, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.45e-5, train/loss_step=0.00271, global_step=98.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  95%|█████████▌| 76/80 [07:29<00:23,  5.83s/it, loss=0.00886, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.45e-5, train/loss_step=0.00271, global_step=98.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  95%|█████████▌| 76/80 [07:29<00:23,  5.83s/it, loss=0.00878, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.8e-5, train/loss_step=0.00462, global_step=98.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4:  96%|█████████▋| 77/80 [07:29<00:17,  5.76s/it, loss=0.00878, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=2.8e-5, train/loss_step=0.00462, global_step=98.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  96%|█████████▋| 77/80 [07:29<00:17,  5.76s/it, loss=0.00824, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.03e-5, train/loss_step=0.00374, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  98%|█████████▊| 78/80 [07:30<00:11,  5.70s/it, loss=0.00824, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.03e-5, train/loss_step=0.00374, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  98%|█████████▊| 78/80 [07:30<00:11,  5.70s/it, loss=0.00838, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=2.49e-5, train/loss_step=0.00656, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  99%|█████████▉| 79/80 [07:30<00:05,  5.63s/it, loss=0.00838, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=2.49e-5, train/loss_step=0.00656, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4:  99%|█████████▉| 79/80 [07:30<00:05,  5.63s/it, loss=0.00836, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=5.7e-5, train/loss_step=0.00724, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205] Epoch 4: 100%|██████████| 80/80 [07:31<00:00,  5.57s/it, loss=0.00836, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=5.7e-5, train/loss_step=0.00724, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 4: 100%|██████████| 80/80 [07:31<00:00,  5.57s/it, loss=0.00897, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.000117, train/loss_step=0.0194, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Average Epoch time: 451.19 seconds
+Average Peak memory 29567.38MiB
+Epoch 4:   0%|          | 0/80 [00:00<00:00, 7013.89it/s, loss=0.00897, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.000117, train/loss_step=0.0194, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 5:   0%|          | 0/80 [00:00<00:00, 2763.05it/s, loss=0.00897, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.000117, train/loss_step=0.0194, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]Epoch 5:   1%|▏         | 1/80 [00:37<24:34, 18.67s/it, loss=0.00897, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.000117, train/loss_step=0.0194, global_step=99.00, lr_abs=0.0001, train/loss_simple_epoch=0.0205, train/loss_vlb_epoch=0.000533, train/loss_epoch=0.0205]  Epoch 5:   1%|▏         | 1/80 [00:37<24:34, 18.67s/it, loss=0.00852, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=6.5e-5, train/loss_step=0.00736, global_step=100.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:   2%|▎         | 2/80 [00:39<17:06, 13.15s/it, loss=0.00852, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=6.5e-5, train/loss_step=0.00736, global_step=100.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:   2%|▎         | 2/80 [00:39<17:06, 13.15s/it, loss=0.00924, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.00166, train/loss_step=0.0169, global_step=100.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:   4%|▍         | 3/80 [00:42<13:28, 10.51s/it, loss=0.00924, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.00166, train/loss_step=0.0169, global_step=100.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:   4%|▍         | 3/80 [00:42<13:28, 10.51s/it, loss=0.00869, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=3.93e-5, train/loss_step=0.00488, global_step=100.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:   5%|▌         | 4/80 [00:42<10:46,  8.51s/it, loss=0.00869, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=3.93e-5, train/loss_step=0.00488, global_step=100.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:   5%|▌         | 4/80 [00:42<10:46,  8.51s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000767, train/loss_step=0.0458, global_step=100.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]  Epoch 5:   6%|▋         | 5/80 [00:43<08:58,  7.18s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.0458, train/loss_vlb_step=0.000767, train/loss_step=0.0458, global_step=100.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:   6%|▋         | 5/80 [00:43<08:58,  7.18s/it, loss=0.00965, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=0.000119, train/loss_step=0.00685, global_step=101.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:   8%|▊         | 6/80 [00:43<07:40,  6.22s/it, loss=0.00965, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=0.000119, train/loss_step=0.00685, global_step=101.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:   8%|▊         | 6/80 [00:43<07:40,  6.22s/it, loss=0.0103, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=0.00012, train/loss_step=0.0166, global_step=101.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]    Epoch 5:   9%|▉         | 7/80 [00:44<06:41,  5.51s/it, loss=0.0103, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=0.00012, train/loss_step=0.0166, global_step=101.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:   9%|▉         | 7/80 [00:44<06:41,  5.51s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=5.49e-5, train/loss_step=0.00764, global_step=101.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  10%|█         | 8/80 [01:13<09:44,  8.11s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=5.49e-5, train/loss_step=0.00764, global_step=101.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  10%|█         | 8/80 [01:13<09:44,  8.11s/it, loss=0.0103, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.08e-5, train/loss_step=0.0042, global_step=101.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]  Epoch 5:  11%|█▏        | 9/80 [01:16<09:02,  7.65s/it, loss=0.0103, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.08e-5, train/loss_step=0.0042, global_step=101.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  11%|█▏        | 9/80 [01:16<09:02,  7.65s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.94e-5, train/loss_step=0.00459, global_step=102.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  12%|█▎        | 10/80 [01:16<08:09,  7.00s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.94e-5, train/loss_step=0.00459, global_step=102.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  12%|█▎        | 10/80 [01:16<08:09,  7.00s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.0004, train/loss_step=0.0269, global_step=102.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]   Epoch 5:  14%|█▍        | 11/80 [01:25<08:14,  7.16s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0269, train/loss_vlb_step=0.0004, train/loss_step=0.0269, global_step=102.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  14%|█▍        | 11/80 [01:25<08:14,  7.16s/it, loss=0.0111, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.12e-5, train/loss_step=0.00532, global_step=102.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  15%|█▌        | 12/80 [01:26<07:32,  6.65s/it, loss=0.0111, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.12e-5, train/loss_step=0.00532, global_step=102.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  15%|█▌        | 12/80 [01:26<07:32,  6.65s/it, loss=0.0111, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=2.77e-5, train/loss_step=0.00602, global_step=102.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  16%|█▋        | 13/80 [01:26<06:56,  6.21s/it, loss=0.0111, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=2.77e-5, train/loss_step=0.00602, global_step=102.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  16%|█▋        | 13/80 [01:26<06:56,  6.21s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000806, train/loss_step=0.0158, global_step=103.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  18%|█▊        | 14/80 [01:27<06:24,  5.83s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000806, train/loss_step=0.0158, global_step=103.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  18%|█▊        | 14/80 [01:27<06:24,  5.83s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.78e-5, train/loss_step=0.00431, global_step=103.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  19%|█▉        | 15/80 [01:27<05:57,  5.50s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.78e-5, train/loss_step=0.00431, global_step=103.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  19%|█▉        | 15/80 [01:27<05:57,  5.50s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.02e-5, train/loss_step=0.00253, global_step=103.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  20%|██        | 16/80 [01:50<06:57,  6.52s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.02e-5, train/loss_step=0.00253, global_step=103.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  20%|██        | 16/80 [01:50<06:57,  6.52s/it, loss=0.0107, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=8.03e-6, train/loss_step=0.00217, global_step=103.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  21%|██▏       | 17/80 [02:00<07:02,  6.70s/it, loss=0.0107, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=8.03e-6, train/loss_step=0.00217, global_step=103.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  21%|██▏       | 17/80 [02:00<07:02,  6.70s/it, loss=0.0114, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=9.55e-5, train/loss_step=0.0159, global_step=104.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]  Epoch 5:  22%|██▎       | 18/80 [02:01<06:35,  6.38s/it, loss=0.0114, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=9.55e-5, train/loss_step=0.0159, global_step=104.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  22%|██▎       | 18/80 [02:01<06:35,  6.38s/it, loss=0.0113, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.94e-5, train/loss_step=0.00534, global_step=104.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  24%|██▍       | 19/80 [02:10<06:38,  6.53s/it, loss=0.0113, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.94e-5, train/loss_step=0.00534, global_step=104.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  24%|██▍       | 19/80 [02:10<06:38,  6.53s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.67e-5, train/loss_step=0.0131, global_step=104.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]  Epoch 5:  25%|██▌       | 20/80 [02:11<06:14,  6.24s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.67e-5, train/loss_step=0.0131, global_step=104.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  25%|██▌       | 20/80 [02:11<06:14,  6.24s/it, loss=0.011, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.99e-5, train/loss_step=0.00855, global_step=104.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  26%|██▋       | 21/80 [02:13<05:57,  6.07s/it, loss=0.011, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=4.99e-5, train/loss_step=0.00855, global_step=104.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  26%|██▋       | 21/80 [02:13<05:57,  6.07s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=6.82e-5, train/loss_step=0.0182, global_step=105.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  28%|██▊       | 22/80 [02:13<05:37,  5.82s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=6.82e-5, train/loss_step=0.0182, global_step=105.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  28%|██▊       | 22/80 [02:13<05:37,  5.82s/it, loss=0.0118, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=0.00028, train/loss_step=0.0215, global_step=105.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  29%|██▉       | 23/80 [02:14<05:19,  5.60s/it, loss=0.0118, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=0.00028, train/loss_step=0.0215, global_step=105.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  29%|██▉       | 23/80 [02:14<05:19,  5.60s/it, loss=0.0122, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.25e-5, train/loss_step=0.0131, global_step=105.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  30%|███       | 24/80 [02:50<06:22,  6.83s/it, loss=0.0122, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.25e-5, train/loss_step=0.0131, global_step=105.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  30%|███       | 24/80 [02:50<06:22,  6.83s/it, loss=0.0107, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.00011, train/loss_step=0.0143, global_step=105.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  31%|███▏      | 25/80 [02:51<06:02,  6.59s/it, loss=0.0107, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.00011, train/loss_step=0.0143, global_step=105.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  31%|███▏      | 25/80 [02:51<06:02,  6.59s/it, loss=0.0104, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.17e-5, train/loss_step=0.0026, global_step=106.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  32%|███▎      | 26/80 [02:51<05:43,  6.36s/it, loss=0.0104, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.17e-5, train/loss_step=0.0026, global_step=106.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  32%|███▎      | 26/80 [02:51<05:43,  6.36s/it, loss=0.00984, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=3.72e-5, train/loss_step=0.00467, global_step=106.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  34%|███▍      | 27/80 [02:55<05:32,  6.27s/it, loss=0.00984, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=3.72e-5, train/loss_step=0.00467, global_step=106.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  34%|███▍      | 27/80 [02:55<05:32,  6.27s/it, loss=0.00953, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=6.51e-6, train/loss_step=0.00139, global_step=106.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  35%|███▌      | 28/80 [02:56<05:15,  6.07s/it, loss=0.00953, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=6.51e-6, train/loss_step=0.00139, global_step=106.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  35%|███▌      | 28/80 [02:56<05:15,  6.07s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000113, train/loss_step=0.0152, global_step=106.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]  Epoch 5:  36%|███▋      | 29/80 [02:57<05:02,  5.93s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000113, train/loss_step=0.0152, global_step=106.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  36%|███▋      | 29/80 [02:57<05:02,  5.93s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=8.13e-5, train/loss_step=0.00635, global_step=107.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  38%|███▊      | 30/80 [02:58<04:47,  5.75s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=8.13e-5, train/loss_step=0.00635, global_step=107.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  38%|███▊      | 30/80 [02:58<04:47,  5.75s/it, loss=0.00943, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.62e-5, train/loss_step=0.0121, global_step=107.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  39%|███▉      | 31/80 [02:58<04:33,  5.59s/it, loss=0.00943, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.62e-5, train/loss_step=0.0121, global_step=107.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  39%|███▉      | 31/80 [02:58<04:33,  5.59s/it, loss=0.00947, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=4.5e-5, train/loss_step=0.00609, global_step=107.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  40%|████      | 32/80 [03:30<05:06,  6.39s/it, loss=0.00947, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=4.5e-5, train/loss_step=0.00609, global_step=107.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  40%|████      | 32/80 [03:30<05:06,  6.39s/it, loss=0.00929, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.39e-5, train/loss_step=0.00256, global_step=107.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  41%|████▏     | 33/80 [03:31<04:52,  6.22s/it, loss=0.00929, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.39e-5, train/loss_step=0.00256, global_step=107.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  41%|████▏     | 33/80 [03:31<04:52,  6.22s/it, loss=0.00941, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000408, train/loss_step=0.0182, global_step=108.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  42%|████▎     | 34/80 [03:31<04:38,  6.05s/it, loss=0.00941, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000408, train/loss_step=0.0182, global_step=108.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  42%|████▎     | 34/80 [03:31<04:38,  6.05s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=0.000161, train/loss_step=0.0173, global_step=108.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  44%|████▍     | 35/80 [03:32<04:25,  5.90s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=0.000161, train/loss_step=0.0173, global_step=108.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  44%|████▍     | 35/80 [03:32<04:25,  5.90s/it, loss=0.0108, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=0.000108, train/loss_step=0.0167, global_step=108.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  45%|████▌     | 36/80 [03:32<04:13,  5.75s/it, loss=0.0108, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=0.000108, train/loss_step=0.0167, global_step=108.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  45%|████▌     | 36/80 [03:32<04:13,  5.75s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.14e-5, train/loss_step=0.0103, global_step=108.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  46%|████▋     | 37/80 [03:47<04:16,  5.97s/it, loss=0.0112, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.14e-5, train/loss_step=0.0103, global_step=108.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  46%|████▋     | 37/80 [03:47<04:16,  5.97s/it, loss=0.0111, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=0.000226, train/loss_step=0.0147, global_step=109.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  48%|████▊     | 38/80 [03:47<04:05,  5.83s/it, loss=0.0111, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=0.000226, train/loss_step=0.0147, global_step=109.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  48%|████▊     | 38/80 [03:47<04:05,  5.83s/it, loss=0.0115, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.69e-5, train/loss_step=0.0139, global_step=109.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  49%|████▉     | 39/80 [03:48<03:53,  5.70s/it, loss=0.0115, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.69e-5, train/loss_step=0.0139, global_step=109.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  49%|████▉     | 39/80 [03:48<03:53,  5.70s/it, loss=0.0117, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=0.00314, train/loss_step=0.0163, global_step=109.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  50%|█████     | 40/80 [04:20<04:14,  6.35s/it, loss=0.0117, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=0.00314, train/loss_step=0.0163, global_step=109.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  50%|█████     | 40/80 [04:20<04:14,  6.35s/it, loss=0.0121, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=0.000337, train/loss_step=0.0171, global_step=109.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  51%|█████▏    | 41/80 [04:21<04:02,  6.22s/it, loss=0.0121, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=0.000337, train/loss_step=0.0171, global_step=109.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  51%|█████▏    | 41/80 [04:21<04:02,  6.22s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=5.67e-5, train/loss_step=0.00726, global_step=110.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  52%|█████▎    | 42/80 [04:21<03:51,  6.08s/it, loss=0.0116, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=5.67e-5, train/loss_step=0.00726, global_step=110.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  52%|█████▎    | 42/80 [04:21<03:51,  6.08s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=2.72e-5, train/loss_step=0.00775, global_step=110.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  54%|█████▍    | 43/80 [04:22<03:40,  5.96s/it, loss=0.0109, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=2.72e-5, train/loss_step=0.00775, global_step=110.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  54%|█████▍    | 43/80 [04:22<03:40,  5.96s/it, loss=0.0106, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=2.39e-5, train/loss_step=0.00711, global_step=110.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  55%|█████▌    | 44/80 [04:22<03:30,  5.84s/it, loss=0.0106, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=2.39e-5, train/loss_step=0.00711, global_step=110.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  55%|█████▌    | 44/80 [04:22<03:30,  5.84s/it, loss=0.00996, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.06e-6, train/loss_step=0.00167, global_step=110.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  56%|█████▋    | 45/80 [04:28<03:24,  5.84s/it, loss=0.00996, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.06e-6, train/loss_step=0.00167, global_step=110.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  56%|█████▋    | 45/80 [04:28<03:24,  5.84s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=2.88e-5, train/loss_step=0.00791, global_step=111.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  57%|█████▊    | 46/80 [04:29<03:14,  5.72s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=2.88e-5, train/loss_step=0.00791, global_step=111.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  57%|█████▊    | 46/80 [04:29<03:14,  5.72s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=3.13e-5, train/loss_step=0.00446, global_step=111.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  59%|█████▉    | 47/80 [04:29<03:05,  5.61s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=3.13e-5, train/loss_step=0.00446, global_step=111.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  59%|█████▉    | 47/80 [04:29<03:05,  5.61s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.06e-5, train/loss_step=0.00605, global_step=111.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  60%|██████    | 48/80 [04:58<03:15,  6.10s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.06e-5, train/loss_step=0.00605, global_step=111.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  60%|██████    | 48/80 [04:58<03:15,  6.10s/it, loss=0.00985, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.47e-5, train/loss_step=0.00312, global_step=111.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  61%|██████▏   | 49/80 [04:59<03:05,  6.00s/it, loss=0.00985, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.47e-5, train/loss_step=0.00312, global_step=111.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  61%|██████▏   | 49/80 [04:59<03:05,  6.00s/it, loss=0.01, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=6.29e-5, train/loss_step=0.0103, global_step=112.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]     Epoch 5:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.01, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=6.29e-5, train/loss_step=0.0103, global_step=112.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.00958, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.11e-5, train/loss_step=0.00279, global_step=112.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  64%|██████▍   | 51/80 [05:00<02:47,  5.78s/it, loss=0.00958, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.11e-5, train/loss_step=0.00279, global_step=112.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  64%|██████▍   | 51/80 [05:00<02:47,  5.78s/it, loss=0.00991, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000479, train/loss_step=0.0127, global_step=112.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  65%|██████▌   | 52/80 [05:01<02:39,  5.69s/it, loss=0.00991, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000479, train/loss_step=0.0127, global_step=112.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  65%|██████▌   | 52/80 [05:01<02:39,  5.69s/it, loss=0.00999, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.22e-5, train/loss_step=0.00423, global_step=112.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  66%|██████▋   | 53/80 [05:07<02:33,  5.69s/it, loss=0.00999, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=2.22e-5, train/loss_step=0.00423, global_step=112.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  66%|██████▋   | 53/80 [05:07<02:33,  5.69s/it, loss=0.00921, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.83e-5, train/loss_step=0.00262, global_step=113.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  68%|██████▊   | 54/80 [05:07<02:25,  5.59s/it, loss=0.00921, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.83e-5, train/loss_step=0.00262, global_step=113.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  68%|██████▊   | 54/80 [05:07<02:25,  5.59s/it, loss=0.00906, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000141, train/loss_step=0.0143, global_step=113.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  69%|██████▉   | 55/80 [05:08<02:17,  5.50s/it, loss=0.00906, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000141, train/loss_step=0.0143, global_step=113.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  69%|██████▉   | 55/80 [05:08<02:17,  5.50s/it, loss=0.00872, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=5.84e-5, train/loss_step=0.00983, global_step=113.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  70%|███████   | 56/80 [05:31<02:19,  5.82s/it, loss=0.00872, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=5.84e-5, train/loss_step=0.00983, global_step=113.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  70%|███████   | 56/80 [05:31<02:19,  5.82s/it, loss=0.0083, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=7.74e-6, train/loss_step=0.00179, global_step=113.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  71%|███████▏  | 57/80 [05:32<02:11,  5.73s/it, loss=0.0083, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=7.74e-6, train/loss_step=0.00179, global_step=113.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  71%|███████▏  | 57/80 [05:32<02:11,  5.73s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.27e-6, train/loss_step=0.00154, global_step=114.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  72%|███████▎  | 58/80 [05:40<02:07,  5.77s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.27e-6, train/loss_step=0.00154, global_step=114.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  72%|███████▎  | 58/80 [05:40<02:07,  5.77s/it, loss=0.00716, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=4.32e-5, train/loss_step=0.00446, global_step=114.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  74%|███████▍  | 59/80 [05:41<01:59,  5.69s/it, loss=0.00716, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=4.32e-5, train/loss_step=0.00446, global_step=114.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  74%|███████▍  | 59/80 [05:41<01:59,  5.69s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=8.01e-6, train/loss_step=0.00187, global_step=114.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  75%|███████▌  | 60/80 [05:41<01:52,  5.60s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=8.01e-6, train/loss_step=0.00187, global_step=114.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  75%|███████▌  | 60/80 [05:41<01:52,  5.60s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.18e-5, train/loss_step=0.00237, global_step=114.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  76%|███████▋  | 61/80 [05:44<01:45,  5.55s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.18e-5, train/loss_step=0.00237, global_step=114.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  76%|███████▋  | 61/80 [05:44<01:45,  5.55s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=0.000157, train/loss_step=0.0111, global_step=115.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  78%|███████▊  | 62/80 [05:44<01:38,  5.47s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=0.000157, train/loss_step=0.0111, global_step=115.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  78%|███████▊  | 62/80 [05:44<01:38,  5.47s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.2e-5, train/loss_step=0.00277, global_step=115.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  79%|███████▉  | 63/80 [05:45<01:31,  5.39s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.2e-5, train/loss_step=0.00277, global_step=115.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  79%|███████▉  | 63/80 [05:45<01:31,  5.39s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=7.8e-6, train/loss_step=0.00172, global_step=115.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  80%|████████  | 64/80 [06:15<01:32,  5.78s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=7.8e-6, train/loss_step=0.00172, global_step=115.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  80%|████████  | 64/80 [06:15<01:32,  5.78s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=0.000126, train/loss_step=0.0072, global_step=115.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  81%|████████▏ | 65/80 [06:16<01:25,  5.70s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=0.000126, train/loss_step=0.0072, global_step=115.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  81%|████████▏ | 65/80 [06:16<01:25,  5.70s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=7.34e-6, train/loss_step=0.00189, global_step=116.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=7.34e-6, train/loss_step=0.00189, global_step=116.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.000297, train/loss_step=0.022, global_step=116.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]   Epoch 5:  84%|████████▍ | 67/80 [06:31<01:14,  5.75s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.000297, train/loss_step=0.022, global_step=116.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  84%|████████▍ | 67/80 [06:31<01:14,  5.75s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=7.28e-5, train/loss_step=0.0101, global_step=116.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  85%|████████▌ | 68/80 [06:31<01:08,  5.68s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=7.28e-5, train/loss_step=0.0101, global_step=116.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  85%|████████▌ | 68/80 [06:31<01:08,  5.68s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.16e-5, train/loss_step=0.00289, global_step=116.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  86%|████████▋ | 69/80 [06:32<01:01,  5.60s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.16e-5, train/loss_step=0.00289, global_step=116.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  86%|████████▋ | 69/80 [06:32<01:01,  5.60s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=5.15e-6, train/loss_step=0.0012, global_step=117.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]  Epoch 5:  88%|████████▊ | 70/80 [06:32<00:55,  5.53s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=5.15e-6, train/loss_step=0.0012, global_step=117.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  88%|████████▊ | 70/80 [06:32<00:55,  5.53s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=4.17e-5, train/loss_step=0.0051, global_step=117.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  89%|████████▉ | 71/80 [06:33<00:49,  5.46s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=4.17e-5, train/loss_step=0.0051, global_step=117.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  89%|██���█████▉ | 71/80 [06:33<00:49,  5.46s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.05e-5, train/loss_step=0.00206, global_step=117.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  90%|█████████ | 72/80 [06:45<00:44,  5.56s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.05e-5, train/loss_step=0.00206, global_step=117.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  90%|█████████ | 72/80 [06:45<00:44,  5.56s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=5.42e-6, train/loss_step=0.00151, global_step=117.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  91%|█████████▏| 73/80 [06:46<00:38,  5.49s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=5.42e-6, train/loss_step=0.00151, global_step=117.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  91%|█████████▏| 73/80 [06:46<00:38,  5.49s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=5.02e-6, train/loss_step=0.00139, global_step=118.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  92%|█████████▎| 74/80 [07:00<00:33,  5.61s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=5.02e-6, train/loss_step=0.00139, global_step=118.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  92%|█████████▎| 74/80 [07:00<00:33,  5.61s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=5.45e-5, train/loss_step=0.00963, global_step=118.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  94%|█████████▍| 75/80 [07:06<00:28,  5.61s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00963, train/loss_vlb_step=5.45e-5, train/loss_step=0.00963, global_step=118.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  94%|█████████▍| 75/80 [07:06<00:28,  5.61s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=2.93e-5, train/loss_step=0.00837, global_step=118.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  95%|█████████▌| 76/80 [07:06<00:22,  5.54s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=2.93e-5, train/loss_step=0.00837, global_step=118.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  95%|█████████▌| 76/80 [07:06<00:22,  5.54s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.17e-5, train/loss_step=0.00264, global_step=118.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  96%|█████████▋| 77/80 [07:07<00:16,  5.48s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.17e-5, train/loss_step=0.00264, global_step=118.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  96%|█████████▋| 77/80 [07:07<00:16,  5.48s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=0.000914, train/loss_step=0.00845, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  98%|█████████▊| 78/80 [07:07<00:10,  5.41s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=0.000914, train/loss_step=0.00845, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  98%|█████████▊| 78/80 [07:07<00:10,  5.41s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=6.09e-5, train/loss_step=0.00554, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Epoch 5:  99%|█████████▉| 79/80 [07:08<00:05,  5.35s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=6.09e-5, train/loss_step=0.00554, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5:  99%|█████████▉| 79/80 [07:08<00:05,  5.35s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.01e-5, train/loss_step=0.00728, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5: 100%|██████████| 80/80 [07:08<00:00,  5.29s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=3.01e-5, train/loss_step=0.00728, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 5: 100%|██████████| 80/80 [07:08<00:00,  5.29s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.000101, train/loss_step=0.0237, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126] Average Epoch time: 428.65 seconds
+Average Peak memory 29568.51MiB
+Epoch 5:   0%|          | 0/80 [00:00<00:00, 3644.05it/s, loss=0.00683, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.000101, train/loss_step=0.0237, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 6:   0%|          | 0/80 [00:00<00:00, 1640.96it/s, loss=0.00683, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.000101, train/loss_step=0.0237, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]Epoch 6:   1%|▏         | 1/80 [00:43<28:54, 21.96s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.000101, train/loss_step=0.0237, global_step=119.0, lr_abs=0.0001, train/loss_simple_epoch=0.0126, train/loss_vlb_epoch=0.00038, train/loss_epoch=0.0126]  Epoch 6:   1%|▏         | 1/80 [00:43<28:54, 21.96s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=3.67e-5, train/loss_step=0.0086, global_step=120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   2%|▎         | 2/80 [00:44<19:14, 14.80s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=3.67e-5, train/loss_step=0.0086, global_step=120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   2%|▎         | 2/80 [00:44<19:14, 14.80s/it, loss=0.00735, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.00012, train/loss_step=0.0157, global_step=120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   4%|▍         | 3/80 [00:44<14:24, 11.22s/it, loss=0.00735, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.00012, train/loss_step=0.0157, global_step=120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   4%|▍         | 3/80 [00:44<14:24, 11.22s/it, loss=0.00751, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=1.93e-5, train/loss_step=0.00491, global_step=120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   5%|▌         | 4/80 [00:45<11:30,  9.08s/it, loss=0.00751, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=1.93e-5, train/loss_step=0.00491, global_step=120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   5%|▌         | 4/80 [00:45<11:30,  9.08s/it, loss=0.00725, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.03e-5, train/loss_step=0.00212, global_step=120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   6%|▋         | 5/80 [00:47<09:50,  7.87s/it, loss=0.00725, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.03e-5, train/loss_step=0.00212, global_step=120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   6%|▋         | 5/80 [00:47<09:50,  7.87s/it, loss=0.0079, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=0.00206, train/loss_step=0.0148, global_step=121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]   Epoch 6:   8%|▊         | 6/80 [00:47<08:24,  6.82s/it, loss=0.0079, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=0.00206, train/loss_step=0.0148, global_step=121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   8%|▊         | 6/80 [00:47<08:24,  6.82s/it, loss=0.00685, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=4.74e-6, train/loss_step=0.00117, global_step=121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   9%|▉         | 7/80 [00:48<07:20,  6.03s/it, loss=0.00685, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=4.74e-6, train/loss_step=0.00117, global_step=121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:   9%|▉         | 7/80 [00:48<07:20,  6.03s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=0.000131, train/loss_step=0.00644, global_step=121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  10%|█         | 8/80 [01:27<11:40,  9.73s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=0.000131, train/loss_step=0.00644, global_step=121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  10%|█         | 8/80 [01:27<11:40,  9.73s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.51e-5, train/loss_step=0.0149, global_step=121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]   Epoch 6:  11%|█▏        | 9/80 [01:28<10:25,  8.81s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.51e-5, train/loss_step=0.0149, global_step=121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  11%|█▏        | 9/80 [01:28<10:25,  8.81s/it, loss=0.00765, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=0.000302, train/loss_step=0.0087, global_step=122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  12%|█▎        | 10/80 [01:28<09:23,  8.05s/it, loss=0.00765, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=0.000302, train/loss_step=0.0087, global_step=122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  12%|█▎        | 10/80 [01:28<09:23,  8.05s/it, loss=0.00746, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=4.88e-6, train/loss_step=0.00131, global_step=122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  14%|█▍        | 11/80 [01:29<08:32,  7.42s/it, loss=0.00746, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=4.88e-6, train/loss_step=0.00131, global_step=122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  14%|█▍        | 11/80 [01:29<08:32,  7.42s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=7.59e-5, train/loss_step=0.00568, global_step=122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  15%|█▌        | 12/80 [01:29<07:48,  6.89s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=7.59e-5, train/loss_step=0.00568, global_step=122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  15%|█▌        | 12/80 [01:29<07:48,  6.89s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=0.000119, train/loss_step=0.00749, global_step=122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  16%|█▋        | 13/80 [01:30<07:11,  6.44s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=0.000119, train/loss_step=0.00749, global_step=122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  16%|█▋        | 13/80 [01:30<07:11,  6.44s/it, loss=0.0081, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=5.04e-5, train/loss_step=0.00471, global_step=123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 6:  18%|█▊        | 14/80 [01:30<06:38,  6.04s/it, loss=0.0081, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=5.04e-5, train/loss_step=0.00471, global_step=123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  18%|█▊        | 14/80 [01:30<06:38,  6.04s/it, loss=0.00839, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000105, train/loss_step=0.0153, global_step=123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  19%|█▉        | 15/80 [01:31<06:10,  5.69s/it, loss=0.00839, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000105, train/loss_step=0.0153, global_step=123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  19%|█▉        | 15/80 [01:31<06:10,  5.69s/it, loss=0.00812, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.19e-5, train/loss_step=0.00306, global_step=123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  20%|██        | 16/80 [02:10<08:10,  7.66s/it, loss=0.00812, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.19e-5, train/loss_step=0.00306, global_step=123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  20%|██        | 16/80 [02:10<08:10,  7.66s/it, loss=0.00839, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3.34e-5, train/loss_step=0.00791, global_step=123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  21%|██▏       | 17/80 [02:10<07:37,  7.27s/it, loss=0.00839, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3.34e-5, train/loss_step=0.00791, global_step=123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  21%|██▏       | 17/80 [02:10<07:37,  7.27s/it, loss=0.00871, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.06e-5, train/loss_step=0.0149, global_step=124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 6:  22%|██▎       | 18/80 [02:11<07:08,  6.91s/it, loss=0.00871, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.06e-5, train/loss_step=0.0149, global_step=124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  22%|██▎       | 18/80 [02:11<07:08,  6.91s/it, loss=0.00862, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.55e-5, train/loss_step=0.00369, global_step=124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  24%|██▍       | 19/80 [02:11<06:41,  6.59s/it, loss=0.00862, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.55e-5, train/loss_step=0.00369, global_step=124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  24%|██▍       | 19/80 [02:11<06:41,  6.59s/it, loss=0.00856, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=2.99e-5, train/loss_step=0.00612, global_step=124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  25%|██▌       | 20/80 [02:12<06:18,  6.30s/it, loss=0.00856, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=2.99e-5, train/loss_step=0.00612, global_step=124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  25%|██▌       | 20/80 [02:12<06:18,  6.30s/it, loss=0.0075, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.04e-5, train/loss_step=0.00246, global_step=124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893] Epoch 6:  26%|██▋       | 21/80 [02:12<05:56,  6.04s/it, loss=0.0075, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.04e-5, train/loss_step=0.00246, global_step=124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  26%|██▋       | 21/80 [02:12<05:56,  6.04s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.64e-5, train/loss_step=0.00326, global_step=125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  28%|██▊       | 22/80 [02:13<05:36,  5.80s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.64e-5, train/loss_step=0.00326, global_step=125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  28%|██▊       | 22/80 [02:13<05:36,  5.80s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000123, train/loss_step=0.0154, global_step=125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893] Epoch 6:  29%|██▉       | 23/80 [02:14<05:18,  5.59s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000123, train/loss_step=0.0154, global_step=125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  29%|██▉       | 23/80 [02:14<05:18,  5.59s/it, loss=0.00733, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=0.000177, train/loss_step=0.0073, global_step=125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  30%|███       | 24/80 [02:46<06:13,  6.67s/it, loss=0.00733, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=0.000177, train/loss_step=0.0073, global_step=125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  30%|███       | 24/80 [02:46<06:13,  6.67s/it, loss=0.00804, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=0.00069, train/loss_step=0.0162, global_step=125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893] Epoch 6:  31%|███▏      | 25/80 [02:54<06:08,  6.70s/it, loss=0.00804, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=0.00069, train/loss_step=0.0162, global_step=125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  31%|███▏      | 25/80 [02:54<06:08,  6.70s/it, loss=0.00763, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=8.05e-5, train/loss_step=0.00663, global_step=126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  32%|███▎      | 26/80 [02:54<05:49,  6.47s/it, loss=0.00763, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=8.05e-5, train/loss_step=0.00663, global_step=126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  32%|███▎      | 26/80 [02:54<05:49,  6.47s/it, loss=0.00771, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.35e-5, train/loss_step=0.00267, global_step=126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  34%|███▍      | 27/80 [02:55<05:31,  6.26s/it, loss=0.00771, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.35e-5, train/loss_step=0.00267, global_step=126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  34%|███▍      | 27/80 [02:55<05:31,  6.26s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.08e-5, train/loss_step=0.00507, global_step=126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  35%|███▌      | 28/80 [02:55<05:15,  6.07s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.08e-5, train/loss_step=0.00507, global_step=126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  35%|███▌      | 28/80 [02:55<05:15,  6.07s/it, loss=0.00734, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=3.98e-5, train/loss_step=0.00889, global_step=126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  36%|███▋      | 29/80 [02:56<04:59,  5.88s/it, loss=0.00734, v_num=0, train/loss_simple_step=0.00889, train/loss_vlb_step=3.98e-5, train/loss_step=0.00889, global_step=126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  36%|███▋      | 29/80 [02:56<04:59,  5.88s/it, loss=0.00747, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.77e-5, train/loss_step=0.0114, global_step=127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 6:  38%|███▊      | 30/80 [02:56<04:45,  5.71s/it, loss=0.00747, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.77e-5, train/loss_step=0.0114, global_step=127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  38%|███▊      | 30/80 [02:56<04:45,  5.71s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.98e-5, train/loss_step=0.00332, global_step=127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  39%|███▉      | 31/80 [03:01<04:37,  5.67s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.98e-5, train/loss_step=0.00332, global_step=127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  39%|███▉      | 31/80 [03:01<04:37,  5.67s/it, loss=0.00782, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.18e-5, train/loss_step=0.0105, global_step=127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 6:  40%|████      | 32/80 [03:31<05:07,  6.41s/it, loss=0.00782, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.18e-5, train/loss_step=0.0105, global_step=127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  40%|████      | 32/80 [03:31<05:07,  6.41s/it, loss=0.00785, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=0.000269, train/loss_step=0.0082, global_step=127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  41%|████▏     | 33/80 [03:37<05:00,  6.39s/it, loss=0.00785, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=0.000269, train/loss_step=0.0082, global_step=127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  41%|████▏     | 33/80 [03:37<05:00,  6.39s/it, loss=0.0104, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.0172, train/loss_step=0.0552, global_step=128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]   Epoch 6:  42%|████▎     | 34/80 [03:37<04:45,  6.22s/it, loss=0.0104, v_num=0, train/loss_simple_step=0.0552, train/loss_vlb_step=0.0172, train/loss_step=0.0552, global_step=128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  42%|████▎     | 34/80 [03:37<04:45,  6.22s/it, loss=0.00968, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6e-6, train/loss_step=0.00151, global_step=128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  44%|████▍     | 35/80 [03:38<04:32,  6.06s/it, loss=0.00968, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6e-6, train/loss_step=0.00151, global_step=128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  44%|████▍     | 35/80 [03:38<04:32,  6.06s/it, loss=0.0108, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000265, train/loss_step=0.0251, global_step=128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  45%|████▌     | 36/80 [03:38<04:20,  5.91s/it, loss=0.0108, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000265, train/loss_step=0.0251, global_step=128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  45%|████▌     | 36/80 [03:38<04:20,  5.91s/it, loss=0.0113, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=8.63e-5, train/loss_step=0.0173, global_step=128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893] Epoch 6:  46%|████▋     | 37/80 [03:39<04:08,  5.77s/it, loss=0.0113, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=8.63e-5, train/loss_step=0.0173, global_step=128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  46%|████▋     | 37/80 [03:39<04:08,  5.77s/it, loss=0.0106, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=8.08e-6, train/loss_step=0.00201, global_step=129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  48%|████▊     | 38/80 [03:39<03:56,  5.64s/it, loss=0.0106, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=8.08e-6, train/loss_step=0.00201, global_step=129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  48%|████▊     | 38/80 [03:39<03:56,  5.64s/it, loss=0.0119, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.00165, train/loss_step=0.0297, global_step=129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 6:  49%|████▉     | 39/80 [03:47<03:52,  5.68s/it, loss=0.0119, v_num=0, train/loss_simple_step=0.0297, train/loss_vlb_step=0.00165, train/loss_step=0.0297, global_step=129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  49%|████▉     | 39/80 [03:47<03:52,  5.68s/it, loss=0.012, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.99e-5, train/loss_step=0.0075, global_step=129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893] Epoch 6:  50%|█████     | 40/80 [04:20<04:14,  6.36s/it, loss=0.012, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=3.99e-5, train/loss_step=0.0075, global_step=129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  50%|█████     | 40/80 [04:20<04:14,  6.36s/it, loss=0.0121, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.28e-5, train/loss_step=0.00518, global_step=129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  51%|█████▏    | 41/80 [04:21<04:02,  6.22s/it, loss=0.0121, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.28e-5, train/loss_step=0.00518, global_step=129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  51%|█████▏    | 41/80 [04:21<04:02,  6.22s/it, loss=0.0121, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=2.94e-5, train/loss_step=0.00233, global_step=130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  52%|█████▎    | 42/80 [04:22<03:51,  6.09s/it, loss=0.0121, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=2.94e-5, train/loss_step=0.00233, global_step=130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  52%|█████▎    | 42/80 [04:22<03:51,  6.09s/it, loss=0.0128, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.00038, train/loss_step=0.0298, global_step=130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 6:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.0128, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.00038, train/loss_step=0.0298, global_step=130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.0125, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=7.84e-6, train/loss_step=0.00192, global_step=130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.0125, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=7.84e-6, train/loss_step=0.00192, global_step=130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.0119, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=3.09e-5, train/loss_step=0.00393, global_step=130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  56%|█████▋    | 45/80 [04:23<03:20,  5.73s/it, loss=0.0119, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=3.09e-5, train/loss_step=0.00393, global_step=130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  56%|█████▋    | 45/80 [04:23<03:20,  5.73s/it, loss=0.0118, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=5.93e-5, train/loss_step=0.00473, global_step=131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  57%|█████▊    | 46/80 [04:24<03:11,  5.62s/it, loss=0.0118, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=5.93e-5, train/loss_step=0.00473, global_step=131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  57%|█████▊    | 46/80 [04:24<03:11,  5.62s/it, loss=0.0118, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.1e-5, train/loss_step=0.0017, global_step=131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]   Epoch 6:  59%|█████▉    | 47/80 [04:28<03:04,  5.60s/it, loss=0.0118, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=1.1e-5, train/loss_step=0.0017, global_step=131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  59%|█████▉    | 47/80 [04:28<03:04,  5.60s/it, loss=0.0124, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000149, train/loss_step=0.0183, global_step=131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  60%|██████    | 48/80 [04:56<03:13,  6.05s/it, loss=0.0124, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000149, train/loss_step=0.0183, global_step=131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  60%|██████    | 48/80 [04:56<03:13,  6.05s/it, loss=0.0121, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.01e-5, train/loss_step=0.00224, global_step=131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  61%|██████▏   | 49/80 [05:11<03:12,  6.22s/it, loss=0.0121, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=1.01e-5, train/loss_step=0.00224, global_step=131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  61%|██████▏   | 49/80 [05:11<03:12,  6.22s/it, loss=0.0123, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000164, train/loss_step=0.0149, global_step=132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893] Epoch 6:  62%|██████▎   | 50/80 [05:11<03:03,  6.11s/it, loss=0.0123, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000164, train/loss_step=0.0149, global_step=132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  62%|██████▎   | 50/80 [05:11<03:03,  6.11s/it, loss=0.0123, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.31e-5, train/loss_step=0.00299, global_step=132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  64%|██████▍   | 51/80 [05:12<02:54,  6.00s/it, loss=0.0123, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.31e-5, train/loss_step=0.00299, global_step=132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  64%|██████▍   | 51/80 [05:12<02:54,  6.00s/it, loss=0.0119, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=3.56e-5, train/loss_step=0.00433, global_step=132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  65%|██████▌   | 52/80 [05:12<02:45,  5.90s/it, loss=0.0119, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=3.56e-5, train/loss_step=0.00433, global_step=132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  65%|██████▌   | 52/80 [05:12<02:45,  5.90s/it, loss=0.0127, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.00533, train/loss_step=0.0241, global_step=132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 6:  66%|██████▋   | 53/80 [05:13<02:36,  5.80s/it, loss=0.0127, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.00533, train/loss_step=0.0241, global_step=132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  66%|██████▋   | 53/80 [05:13<02:36,  5.80s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.74e-5, train/loss_step=0.00273, global_step=133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  68%|██████▊   | 54/80 [05:13<02:28,  5.70s/it, loss=0.0101, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.74e-5, train/loss_step=0.00273, global_step=133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  68%|██████▊   | 54/80 [05:13<02:28,  5.70s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.6e-5, train/loss_step=0.00274, global_step=133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893] Epoch 6:  69%|██████▉   | 55/80 [05:14<02:20,  5.61s/it, loss=0.0102, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.6e-5, train/loss_step=0.00274, global_step=133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  69%|██████▉   | 55/80 [05:14<02:20,  5.61s/it, loss=0.00905, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.37e-5, train/loss_step=0.0025, global_step=133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  70%|███████   | 56/80 [05:50<02:27,  6.16s/it, loss=0.00905, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.37e-5, train/loss_step=0.0025, global_step=133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  70%|███████   | 56/80 [05:50<02:27,  6.16s/it, loss=0.00894, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000301, train/loss_step=0.0152, global_step=133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  71%|███████▏  | 57/80 [06:00<02:22,  6.21s/it, loss=0.00894, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000301, train/loss_step=0.0152, global_step=133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  71%|███████▏  | 57/80 [06:00<02:22,  6.21s/it, loss=0.00928, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=0.000341, train/loss_step=0.00883, global_step=134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  72%|███████▎  | 58/80 [06:00<02:14,  6.12s/it, loss=0.00928, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=0.000341, train/loss_step=0.00883, global_step=134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  72%|███████▎  | 58/80 [06:00<02:14,  6.12s/it, loss=0.00786, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=6.06e-6, train/loss_step=0.00129, global_step=134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893] Epoch 6:  74%|██████��▍  | 59/80 [06:01<02:06,  6.02s/it, loss=0.00786, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=6.06e-6, train/loss_step=0.00129, global_step=134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  74%|███████▍  | 59/80 [06:01<02:06,  6.02s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=7.26e-6, train/loss_step=0.00166, global_step=134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  75%|███████▌  | 60/80 [06:01<01:58,  5.93s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=7.26e-6, train/loss_step=0.00166, global_step=134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  75%|███████▌  | 60/80 [06:01<01:58,  5.93s/it, loss=0.00786, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=6.09e-5, train/loss_step=0.011, global_step=134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]    Epoch 6:  76%|███████▋  | 61/80 [06:02<01:51,  5.85s/it, loss=0.00786, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=6.09e-5, train/loss_step=0.011, global_step=134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  76%|███████▋  | 61/80 [06:02<01:51,  5.85s/it, loss=0.00867, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000555, train/loss_step=0.0185, global_step=135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  78%|███████▊  | 62/80 [06:02<01:43,  5.76s/it, loss=0.00867, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000555, train/loss_step=0.0185, global_step=135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  78%|███████▊  | 62/80 [06:02<01:43,  5.76s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=3.37e-5, train/loss_step=0.00426, global_step=135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  79%|███████▉  | 63/80 [06:03<01:36,  5.68s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=3.37e-5, train/loss_step=0.00426, global_step=135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  79%|███████▉  | 63/80 [06:03<01:36,  5.68s/it, loss=0.00732, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=2.01e-6, train/loss_step=0.000487, global_step=135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  80%|████████  | 64/80 [06:24<01:34,  5.91s/it, loss=0.00732, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=2.01e-6, train/loss_step=0.000487, global_step=135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  80%|████████  | 64/80 [06:24<01:34,  5.91s/it, loss=0.00834, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000672, train/loss_step=0.0242, global_step=135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]   Epoch 6:  81%|████████▏ | 65/80 [06:40<01:31,  6.07s/it, loss=0.00834, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000672, train/loss_step=0.0242, global_step=135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  81%|████████▏ | 65/80 [06:40<01:31,  6.07s/it, loss=0.00842, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=2.54e-5, train/loss_step=0.00625, global_step=136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  82%|████████▎ | 66/80 [06:40<01:23,  5.98s/it, loss=0.00842, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=2.54e-5, train/loss_step=0.00625, global_step=136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  82%|████████▎ | 66/80 [06:40<01:23,  5.98s/it, loss=0.00852, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.9e-5, train/loss_step=0.00373, global_step=136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893] Epoch 6:  84%|████████▍ | 67/80 [06:41<01:16,  5.91s/it, loss=0.00852, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.9e-5, train/loss_step=0.00373, global_step=136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  84%|████████▍ | 67/80 [06:41<01:16,  5.91s/it, loss=0.00786, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.07e-5, train/loss_step=0.00514, global_step=136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  85%|████████▌ | 68/80 [06:42<01:09,  5.83s/it, loss=0.00786, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.07e-5, train/loss_step=0.00514, global_step=136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  85%|████████▌ | 68/80 [06:42<01:09,  5.83s/it, loss=0.00799, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=6.26e-5, train/loss_step=0.0049, global_step=136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 6:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.00799, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=6.26e-5, train/loss_step=0.0049, global_step=136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.00743, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=8.4e-5, train/loss_step=0.00372, global_step=137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  88%|████████▊ | 70/80 [06:43<00:56,  5.68s/it, loss=0.00743, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=8.4e-5, train/loss_step=0.00372, global_step=137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  88%|████████▊ | 70/80 [06:43<00:56,  5.68s/it, loss=0.00746, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=2.17e-5, train/loss_step=0.00348, global_step=137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  89%|████████▉ | 71/80 [06:43<00:50,  5.61s/it, loss=0.00746, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=2.17e-5, train/loss_step=0.00348, global_step=137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  89%|████████▉ | 71/80 [06:43<00:50,  5.61s/it, loss=0.00733, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=6.91e-6, train/loss_step=0.00175, global_step=137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  90%|█████████ | 72/80 [07:06<00:46,  5.84s/it, loss=0.00733, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=6.91e-6, train/loss_step=0.00175, global_step=137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  90%|█████████ | 72/80 [07:06<00:46,  5.84s/it, loss=0.0072, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=0.00131, train/loss_step=0.0215, global_step=137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]   Epoch 6:  91%|█████████▏| 73/80 [07:14<00:41,  5.87s/it, loss=0.0072, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=0.00131, train/loss_step=0.0215, global_step=137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  91%|█████████▏| 73/80 [07:14<00:41,  5.87s/it, loss=0.00717, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.65e-5, train/loss_step=0.00223, global_step=138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  92%|█████████▎| 74/80 [07:14<00:34,  5.79s/it, loss=0.00717, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=1.65e-5, train/loss_step=0.00223, global_step=138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  92%|█████████▎| 74/80 [07:14<00:34,  5.79s/it, loss=0.0075, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=0.000133, train/loss_step=0.00927, global_step=138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  94%|█████████▍| 75/80 [07:15<00:28,  5.72s/it, loss=0.0075, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=0.000133, train/loss_step=0.00927, global_step=138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  94%|█████████▍| 75/80 [07:15<00:28,  5.72s/it, loss=0.00774, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=0.000139, train/loss_step=0.00736, global_step=138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  95%|█████████▌| 76/80 [07:15<00:22,  5.66s/it, loss=0.00774, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=0.000139, train/loss_step=0.00736, global_step=138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  95%|█████████▌| 76/80 [07:15<00:22,  5.66s/it, loss=0.00755, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=0.000541, train/loss_step=0.0114, global_step=138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 6:  96%|█████████▋| 77/80 [07:16<00:16,  5.59s/it, loss=0.00755, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=0.000541, train/loss_step=0.0114, global_step=138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  96%|█████████▋| 77/80 [07:16<00:16,  5.59s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.4e-5, train/loss_step=0.00308, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  98%|█████████▊| 78/80 [07:16<00:11,  5.53s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.4e-5, train/loss_step=0.00308, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  98%|█████████▊| 78/80 [07:16<00:11,  5.53s/it, loss=0.00788, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000113, train/loss_step=0.0136, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  99%|█████████▉| 79/80 [07:17<00:05,  5.46s/it, loss=0.00788, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000113, train/loss_step=0.0136, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6:  99%|█████████▉| 79/80 [07:17<00:05,  5.46s/it, loss=0.00817, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=2.55e-5, train/loss_step=0.00736, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6: 100%|██████████| 80/80 [07:17<00:00,  5.40s/it, loss=0.00817, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=2.55e-5, train/loss_step=0.00736, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 6: 100%|██████████| 80/80 [07:17<00:00,  5.40s/it, loss=0.00767, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=3.83e-6, train/loss_step=0.000999, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Average Epoch time: 437.50 seconds
+Average Peak memory 29566.50MiB
+Epoch 6:   0%|          | 0/80 [00:00<00:00, 3916.25it/s, loss=0.00767, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=3.83e-6, train/loss_step=0.000999, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 7:   0%|          | 0/80 [00:00<00:00, 1728.18it/s, loss=0.00767, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=3.83e-6, train/loss_step=0.000999, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]Epoch 7:   1%|▏         | 1/80 [00:38<25:19, 19.23s/it, loss=0.00767, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=3.83e-6, train/loss_step=0.000999, global_step=139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00893, train/loss_vlb_epoch=0.000316, train/loss_epoch=0.00893]  Epoch 7:   1%|▏         | 1/80 [00:38<25:19, 19.23s/it, loss=0.00686, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.09e-5, train/loss_step=0.00248, global_step=140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:   2%|▎         | 2/80 [00:39<17:10, 13.21s/it, loss=0.00686, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.09e-5, train/loss_step=0.00248, global_step=140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:   2%|▎         | 2/80 [00:39<17:10, 13.21s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.0127, train/loss_step=0.0265, global_step=140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]   Epoch 7:   4%|▍         | 3/80 [00:40<13:00, 10.14s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.0265, train/loss_vlb_step=0.0127, train/loss_step=0.0265, global_step=140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:   4%|▍         | 3/80 [00:40<13:00, 10.14s/it, loss=0.00842, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=0.000278, train/loss_step=0.00931, global_step=140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:   5%|▌         | 4/80 [00:41<10:24,  8.21s/it, loss=0.00842, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=0.000278, train/loss_step=0.00931, global_step=140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:   5%|▌         | 4/80 [00:41<10:24,  8.21s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=7.85e-6, train/loss_step=0.00164, global_step=140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759] Epoch 7:   6%|▋         | 5/80 [00:41<08:39,  6.93s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=7.85e-6, train/loss_step=0.00164, global_step=140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:   6%|▋         | 5/80 [00:41<08:39,  6.93s/it, loss=0.00718, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=3.9e-5, train/loss_step=0.00401, global_step=141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759] Epoch 7:   8%|▊         | 6/80 [00:48<08:30,  6.89s/it, loss=0.00718, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=3.9e-5, train/loss_step=0.00401, global_step=141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:   8%|▊         | 6/80 [00:48<08:30,  6.89s/it, loss=0.0071, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=9.95e-6, train/loss_step=0.00224, global_step=141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:   9%|▉         | 7/80 [00:48<07:25,  6.10s/it, loss=0.0071, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=9.95e-6, train/loss_step=0.00224, global_step=141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:   9%|▉         | 7/80 [00:48<07:25,  6.10s/it, loss=0.00709, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=1.74e-5, train/loss_step=0.00487, global_step=141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  10%|█         | 8/80 [01:21<10:50,  9.04s/it, loss=0.00709, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=1.74e-5, train/loss_step=0.00487, global_step=141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  10%|█         | 8/80 [01:21<10:50,  9.04s/it, loss=0.00707, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=3.69e-5, train/loss_step=0.00444, global_step=141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  11%|█▏        | 9/80 [01:21<09:41,  8.19s/it, loss=0.00707, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=3.69e-5, train/loss_step=0.00444, global_step=141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  11%|█▏        | 9/80 [01:21<09:41,  8.19s/it, loss=0.00755, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=7.71e-5, train/loss_step=0.0134, global_step=142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  12%|█▎        | 10/80 [01:28<09:25,  8.08s/it, loss=0.00755, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=7.71e-5, train/loss_step=0.0134, global_step=142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  12%|█▎        | 10/80 [01:28<09:25,  8.08s/it, loss=0.00756, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=3.45e-5, train/loss_step=0.00356, global_step=142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  14%|█▍        | 11/80 [01:29<08:34,  7.45s/it, loss=0.00756, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=3.45e-5, train/loss_step=0.00356, global_step=142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  14%|█▍        | 11/80 [01:29<08:34,  7.45s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=2.89e-5, train/loss_step=0.0034, global_step=142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  15%|█▌        | 12/80 [01:29<07:50,  6.92s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=2.89e-5, train/loss_step=0.0034, global_step=142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  15%|█▌        | 12/80 [01:29<07:50,  6.92s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=3.32e-5, train/loss_step=0.00966, global_step=142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=3.32e-5, train/loss_step=0.00966, global_step=142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.00748, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.89e-5, train/loss_step=0.0109, global_step=143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  18%|█▊        | 14/80 [01:30<06:40,  6.06s/it, loss=0.00748, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.89e-5, train/loss_step=0.0109, global_step=143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  18%|█▊        | 14/80 [01:30<06:40,  6.06s/it, loss=0.00714, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=2.09e-5, train/loss_step=0.00244, global_step=143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  19%|█▉        | 15/80 [01:31<06:11,  5.71s/it, loss=0.00714, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=2.09e-5, train/loss_step=0.00244, global_step=143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  19%|█▉        | 15/80 [01:31<06:11,  5.71s/it, loss=0.00779, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.000475, train/loss_step=0.0203, global_step=143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759] Epoch 7:  20%|██        | 16/80 [02:01<07:38,  7.16s/it, loss=0.00779, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.000475, train/loss_step=0.0203, global_step=143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  20%|██        | 16/80 [02:01<07:38,  7.16s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=6.86e-6, train/loss_step=0.00159, global_step=143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  21%|██▏       | 17/80 [02:02<07:07,  6.79s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=6.86e-6, train/loss_step=0.00159, global_step=143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  21%|██▏       | 17/80 [02:02<07:07,  6.79s/it, loss=0.00749, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.29e-5, train/loss_step=0.00705, global_step=144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  22%|██▎       | 18/80 [02:16<07:24,  7.17s/it, loss=0.00749, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=3.29e-5, train/loss_step=0.00705, global_step=144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  22%|██▎       | 18/80 [02:16<07:24,  7.17s/it, loss=0.00693, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=9.49e-6, train/loss_step=0.00226, global_step=144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  24%|██▍       | 19/80 [02:16<06:57,  6.84s/it, loss=0.00693, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=9.49e-6, train/loss_step=0.00226, global_step=144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  24%|██▍       | 19/80 [02:16<06:57,  6.84s/it, loss=0.00842, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.00829, train/loss_step=0.0374, global_step=144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  25%|██▌       | 20/80 [02:17<06:32,  6.54s/it, loss=0.00842, v_num=0, train/loss_simple_step=0.0374, train/loss_vlb_step=0.00829, train/loss_step=0.0374, global_step=144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  25%|██▌       | 20/80 [02:17<06:32,  6.54s/it, loss=0.00858, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.46e-5, train/loss_step=0.00402, global_step=144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  26%|██▋       | 21/80 [02:17<06:09,  6.27s/it, loss=0.00858, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.46e-5, train/loss_step=0.00402, global_step=144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  26%|██▋       | 21/80 [02:17<06:09,  6.27s/it, loss=0.00854, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=9.35e-6, train/loss_step=0.00175, global_step=145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  28%|██▊       | 22/80 [02:18<05:48,  6.01s/it, loss=0.00854, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=9.35e-6, train/loss_step=0.00175, global_step=145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  28%|██▊       | 22/80 [02:18<05:48,  6.01s/it, loss=0.00735, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=3.27e-5, train/loss_step=0.0028, global_step=145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  29%|██▉       | 23/80 [02:18<05:29,  5.79s/it, loss=0.00735, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=3.27e-5, train/loss_step=0.0028, global_step=145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  29%|██▉       | 23/80 [02:18<05:29,  5.79s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=1.89e-5, train/loss_step=0.00519, global_step=145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  30%|███       | 24/80 [02:50<06:22,  6.83s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=1.89e-5, train/loss_step=0.00519, global_step=145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  30%|███       | 24/80 [02:50<06:22,  6.83s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.96e-5, train/loss_step=0.00359, global_step=145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  31%|███▏      | 25/80 [02:51<06:02,  6.58s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=2.96e-5, train/loss_step=0.00359, global_step=145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  31%|███▏      | 25/80 [02:51<06:02,  6.58s/it, loss=0.00754, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=3.73e-5, train/loss_step=0.00995, global_step=146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  32%|███▎      | 26/80 [03:07<06:15,  6.95s/it, loss=0.00754, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=3.73e-5, train/loss_step=0.00995, global_step=146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  32%|███▎      | 26/80 [03:07<06:15,  6.95s/it, loss=0.00753, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=9.27e-6, train/loss_step=0.0021, global_step=146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  34%|███▍      | 27/80 [03:08<05:55,  6.72s/it, loss=0.00753, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=9.27e-6, train/loss_step=0.0021, global_step=146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  34%|███▍      | 27/80 [03:08<05:55,  6.72s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.43e-5, train/loss_step=0.00217, global_step=146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  35%|███▌      | 28/80 [03:08<05:38,  6.50s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=1.43e-5, train/loss_step=0.00217, global_step=146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  35%|███▌      | 28/80 [03:08<05:38,  6.50s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3e-5, train/loss_step=0.00791, global_step=146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  36%|███▋      | 29/80 [03:09<05:21,  6.30s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=3e-5, train/loss_step=0.00791, global_step=146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  36%|███▋      | 29/80 [03:09<05:21,  6.30s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.35e-6, train/loss_step=0.00102, global_step=147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  38%|███▊      | 30/80 [03:09<05:05,  6.11s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.35e-6, train/loss_step=0.00102, global_step=147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  38%|███▊      | 30/80 [03:09<05:05,  6.11s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=2.27e-5, train/loss_step=0.00289, global_step=147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  39%|███▉      | 31/80 [03:10<04:50,  5.94s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=2.27e-5, train/loss_step=0.00289, global_step=147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  39%|███▉      | 31/80 [03:10<04:50,  5.94s/it, loss=0.00688, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.22e-5, train/loss_step=0.00254, global_step=147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  40%|████      | 32/80 [03:34<05:12,  6.51s/it, loss=0.00688, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.22e-5, train/loss_step=0.00254, global_step=147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  40%|████      | 32/80 [03:34<05:12,  6.51s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.38e-6, train/loss_step=0.00133, global_step=147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.38e-6, train/loss_step=0.00133, global_step=147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.84e-5, train/loss_step=0.00243, global_step=148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  42%|████▎     | 34/80 [04:01<05:17,  6.89s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.84e-5, train/loss_step=0.00243, global_step=148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  42%|████▎     | 34/80 [04:01<05:17,  6.89s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=0.000121, train/loss_step=0.00957, global_step=148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  44%|████▍     | 35/80 [04:01<05:02,  6.72s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=0.000121, train/loss_step=0.00957, global_step=148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  44%|████▍     | 35/80 [04:01<05:02,  6.72s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=8.31e-6, train/loss_step=0.00128, global_step=148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759] Epoch 7:  45%|████▌     | 36/80 [04:02<04:48,  6.55s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=8.31e-6, train/loss_step=0.00128, global_step=148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  45%|████▌     | 36/80 [04:02<04:48,  6.55s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=1.85e-5, train/loss_step=0.00541, global_step=148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  46%|████▋     | 37/80 [04:02<04:34,  6.39s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=1.85e-5, train/loss_step=0.00541, global_step=148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  46%|████▋     | 37/80 [04:02<04:34,  6.39s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=0.00209, train/loss_step=0.012, global_step=149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]    Epoch 7:  48%|████▊     | 38/80 [04:03<04:22,  6.24s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=0.00209, train/loss_step=0.012, global_step=149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  48%|████▊     | 38/80 [04:03<04:22,  6.24s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.37e-5, train/loss_step=0.00477, global_step=149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  49%|████▉     | 39/80 [04:03<04:09,  6.09s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=2.37e-5, train/loss_step=0.00477, global_step=149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  49%|████▉     | 39/80 [04:03<04:09,  6.09s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=5.21e-5, train/loss_step=0.00388, global_step=149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  50%|█████     | 40/80 [04:08<04:02,  6.06s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=5.21e-5, train/loss_step=0.00388, global_step=149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  50%|█████     | 40/80 [04:08<04:02,  6.06s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.59e-5, train/loss_step=0.019, global_step=149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]    Epoch 7:  51%|█████▏    | 41/80 [04:09<03:51,  5.94s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=8.59e-5, train/loss_step=0.019, global_step=149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  51%|█████▏    | 41/80 [04:09<03:51,  5.94s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=1.85e-5, train/loss_step=0.00441, global_step=150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  52%|█████▎    | 42/80 [04:27<03:56,  6.23s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=1.85e-5, train/loss_step=0.00441, global_step=150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  52%|█████▎    | 42/80 [04:27<03:56,  6.23s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.86e-5, train/loss_step=0.00957, global_step=150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00957, train/loss_vlb_step=4.86e-5, train/loss_step=0.00957, global_step=150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.7e-5, train/loss_step=0.00424, global_step=150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  55%|█████▌    | 44/80 [04:28<03:35,  5.97s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.7e-5, train/loss_step=0.00424, global_step=150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  55%|█████▌    | 44/80 [04:28<03:35,  5.97s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=0.00062, train/loss_step=0.00625, global_step=150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  56%|█████▋    | 45/80 [04:29<03:24,  5.86s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=0.00062, train/loss_step=0.00625, global_step=150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  56%|█████▋    | 45/80 [04:29<03:24,  5.86s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.91e-5, train/loss_step=0.0093, global_step=151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]   Epoch 7:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4.91e-5, train/loss_step=0.0093, global_step=151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=4.08e-5, train/loss_step=0.00697, global_step=151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=4.08e-5, train/loss_step=0.00697, global_step=151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=5.21e-5, train/loss_step=0.00729, global_step=151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759] Epoch 7:  60%|██████    | 48/80 [04:47<03:08,  5.88s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=5.21e-5, train/loss_step=0.00729, global_step=151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  60%|██████    | 48/80 [04:47<03:08,  5.88s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.52e-5, train/loss_step=0.00255, global_step=151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  61%|██████▏   | 49/80 [04:48<02:58,  5.77s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.52e-5, train/loss_step=0.00255, global_step=151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  61%|██████▏   | 49/80 [04:48<02:58,  5.77s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=7.34e-6, train/loss_step=0.0015, global_step=152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  62%|██████▎   | 50/80 [05:22<03:09,  6.32s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=7.34e-6, train/loss_step=0.0015, global_step=152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  62%|██████▎   | 50/80 [05:22<03:09,  6.32s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=4.51e-5, train/loss_step=0.0128, global_step=152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  64%|██████▍   | 51/80 [05:22<02:59,  6.21s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=4.51e-5, train/loss_step=0.0128, global_step=152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  64%|██████▍   | 51/80 [05:22<02:59,  6.21s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.25e-5, train/loss_step=0.00306, global_step=152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  65%|██████▌   | 52/80 [05:23<02:50,  6.10s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=1.25e-5, train/loss_step=0.00306, global_step=152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  65%|██████▌   | 52/80 [05:23<02:50,  6.10s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=3.53e-5, train/loss_step=0.00545, global_step=152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  66%|██████▋   | 53/80 [05:23<02:41,  6.00s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=3.53e-5, train/loss_step=0.00545, global_step=152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  66%|██████▋   | 53/80 [05:23<02:41,  6.00s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=6.35e-5, train/loss_step=0.00545, global_step=153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  68%|██████▊   | 54/80 [05:24<02:33,  5.90s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=6.35e-5, train/loss_step=0.00545, global_step=153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  68%|██████▊   | 54/80 [05:24<02:33,  5.90s/it, loss=0.00633, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=8.11e-6, train/loss_step=0.00144, global_step=153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  69%|██████▉   | 55/80 [05:24<02:24,  5.80s/it, loss=0.00633, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=8.11e-6, train/loss_step=0.00144, global_step=153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  69%|██████▉   | 55/80 [05:24<02:24,  5.80s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=5.42e-5, train/loss_step=0.00916, global_step=153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  70%|███████   | 56/80 [05:31<02:19,  5.82s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=5.42e-5, train/loss_step=0.00916, global_step=153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  70%|███████   | 56/80 [05:31<02:19,  5.82s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.72e-5, train/loss_step=0.00484, global_step=153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.72e-5, train/loss_step=0.00484, global_step=153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.000972, train/loss_vlb_step=4.07e-6, train/loss_step=0.000972, global_step=154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  72%|███████▎  | 58/80 [06:00<02:14,  6.11s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.000972, train/loss_vlb_step=4.07e-6, train/loss_step=0.000972, global_step=154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  72%|███████▎  | 58/80 [06:00<02:14,  6.11s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=8.21e-5, train/loss_step=0.00948, global_step=154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=8.21e-5, train/loss_step=0.00948, global_step=154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.86e-6, train/loss_step=0.000599, global_step=154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  75%|███████▌  | 60/80 [06:01<01:58,  5.92s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.86e-6, train/loss_step=0.000599, global_step=154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  75%|███████▌  | 60/80 [06:01<01:58,  5.92s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=7.34e-6, train/loss_step=0.0013, global_step=154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]    Epoch 7:  76%|███████▋  | 61/80 [06:01<01:50,  5.84s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=7.34e-6, train/loss_step=0.0013, global_step=154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  76%|███████▋  | 61/80 [06:01<01:50,  5.84s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.32e-5, train/loss_step=0.00361, global_step=155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  78%|███████▊  | 62/80 [06:02<01:43,  5.75s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.32e-5, train/loss_step=0.00361, global_step=155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  78%|███████▊  | 62/80 [06:02<01:43,  5.75s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=2.62e-5, train/loss_step=0.00184, global_step=155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759] Epoch 7:  79%|████���██▉  | 63/80 [06:02<01:36,  5.67s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=2.62e-5, train/loss_step=0.00184, global_step=155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  79%|███████▉  | 63/80 [06:02<01:36,  5.67s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=8.53e-5, train/loss_step=0.00357, global_step=155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  80%|████████  | 64/80 [06:11<01:31,  5.72s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=8.53e-5, train/loss_step=0.00357, global_step=155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  80%|████████  | 64/80 [06:11<01:31,  5.72s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=2.06e-5, train/loss_step=0.00229, global_step=155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  81%|████████▏ | 65/80 [06:12<01:24,  5.64s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=2.06e-5, train/loss_step=0.00229, global_step=155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  81%|████████▏ | 65/80 [06:12<01:24,  5.64s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.33e-5, train/loss_step=0.00604, global_step=156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  82%|████████▎ | 66/80 [06:37<01:22,  5.93s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.33e-5, train/loss_step=0.00604, global_step=156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  82%|████████▎ | 66/80 [06:37<01:22,  5.93s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.72e-5, train/loss_step=0.00341, global_step=156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  84%|████████▍ | 67/80 [06:37<01:15,  5.85s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.72e-5, train/loss_step=0.00341, global_step=156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  84%|████████▍ | 67/80 [06:37<01:15,  5.85s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.000161, train/loss_step=0.022, global_step=156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]   Epoch 7:  85%|████████▌ | 68/80 [06:38<01:09,  5.77s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.000161, train/loss_step=0.022, global_step=156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  85%|████████▌ | 68/80 [06:38<01:09,  5.77s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=0.000331, train/loss_step=0.00903, global_step=156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  86%|████████▋ | 69/80 [06:38<01:02,  5.69s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=0.000331, train/loss_step=0.00903, global_step=156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  86%|████████▋ | 69/80 [06:38<01:02,  5.69s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=2.35e-5, train/loss_step=0.00628, global_step=157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759] Epoch 7:  88%|████████▊ | 70/80 [06:39<00:56,  5.62s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=2.35e-5, train/loss_step=0.00628, global_step=157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  88%|████████▊ | 70/80 [06:39<00:56,  5.62s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.65e-6, train/loss_step=0.00107, global_step=157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  89%|████████▉ | 71/80 [06:39<00:49,  5.55s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.65e-6, train/loss_step=0.00107, global_step=157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  89%|████████▉ | 71/80 [06:39<00:49,  5.55s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=0.000776, train/loss_step=0.00706, global_step=157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  90%|█████████ | 72/80 [06:44<00:44,  5.54s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=0.000776, train/loss_step=0.00706, global_step=157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  90%|█████████ | 72/80 [06:44<00:44,  5.54s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=8.55e-5, train/loss_step=0.013, global_step=157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]     Epoch 7:  91%|█████████▏| 73/80 [06:49<00:38,  5.53s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=8.55e-5, train/loss_step=0.013, global_step=157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  91%|█████████▏| 73/80 [06:49<00:38,  5.53s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=3.92e-5, train/loss_step=0.010, global_step=158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  92%|█████████▎| 74/80 [07:20<00:35,  5.87s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=3.92e-5, train/loss_step=0.010, global_step=158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  92%|█████████▎| 74/80 [07:20<00:35,  5.87s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.51e-5, train/loss_step=0.00209, global_step=158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  94%|█████████▍| 75/80 [07:21<00:29,  5.80s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=1.51e-5, train/loss_step=0.00209, global_step=158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  94%|█████████▍| 75/80 [07:21<00:29,  5.80s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=2.97e-5, train/loss_step=0.00707, global_step=158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  95%|█████████▌| 76/80 [07:21<00:22,  5.73s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=2.97e-5, train/loss_step=0.00707, global_step=158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  95%|█████████▌| 76/80 [07:21<00:22,  5.73s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=0.000162, train/loss_step=0.0045, global_step=158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759] Epoch 7:  96%|█████████▋| 77/80 [07:22<00:17,  5.67s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=0.000162, train/loss_step=0.0045, global_step=158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  96%|█████████▋| 77/80 [07:22<00:17,  5.67s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=0.000357, train/loss_step=0.0193, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  98%|█████████▊| 78/80 [07:22<00:11,  5.60s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.0193, train/loss_vlb_step=0.000357, train/loss_step=0.0193, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  98%|█████████▊| 78/80 [07:22<00:11,  5.60s/it, loss=0.0071, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.00566, train/loss_step=0.0178, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 7:  99%|█████████▉| 79/80 [07:22<00:05,  5.54s/it, loss=0.0071, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.00566, train/loss_step=0.0178, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7:  99%|█████████▉| 79/80 [07:22<00:05,  5.54s/it, loss=0.00751, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=3.19e-5, train/loss_step=0.00891, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7: 100%|██████████| 80/80 [07:23<00:00,  5.47s/it, loss=0.00751, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=3.19e-5, train/loss_step=0.00891, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 7: 100%|██████████| 80/80 [07:23<00:00,  5.47s/it, loss=0.00748, v_num=0, train/loss_simple_step=0.000581, train/loss_vlb_step=2.1e-6, train/loss_step=0.000581, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Average Epoch time: 443.48 seconds
+Average Peak memory 29565.02MiB
+Epoch 7:   0%|          | 0/80 [00:00<00:00, 4279.90it/s, loss=0.00748, v_num=0, train/loss_simple_step=0.000581, train/loss_vlb_step=2.1e-6, train/loss_step=0.000581, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 8:   0%|          | 0/80 [00:00<00:00, 1965.47it/s, loss=0.00748, v_num=0, train/loss_simple_step=0.000581, train/loss_vlb_step=2.1e-6, train/loss_step=0.000581, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]Epoch 8:   1%|▏         | 1/80 [00:47<31:35, 24.00s/it, loss=0.00748, v_num=0, train/loss_simple_step=0.000581, train/loss_vlb_step=2.1e-6, train/loss_step=0.000581, global_step=159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00759, train/loss_vlb_epoch=0.000424, train/loss_epoch=0.00759]  Epoch 8:   1%|▏         | 1/80 [00:47<31:35, 24.00s/it, loss=0.00741, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.12e-5, train/loss_step=0.00222, global_step=160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:   2%|▎         | 2/80 [00:48<21:00, 16.16s/it, loss=0.00741, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.12e-5, train/loss_step=0.00222, global_step=160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:   2%|▎         | 2/80 [00:48<21:00, 16.16s/it, loss=0.00761, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=2.05e-5, train/loss_step=0.00589, global_step=160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:   4%|▍         | 3/80 [00:48<15:42, 12.24s/it, loss=0.00761, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=2.05e-5, train/loss_step=0.00589, global_step=160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:   4%|▍         | 3/80 [00:48<15:42, 12.24s/it, loss=0.00777, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=2.88e-5, train/loss_step=0.00674, global_step=160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:   5%|▌         | 4/80 [00:49<12:32,  9.90s/it, loss=0.00777, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=2.88e-5, train/loss_step=0.00674, global_step=160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:   5%|▌         | 4/80 [00:49<12:32,  9.90s/it, loss=0.0079, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=3.72e-5, train/loss_step=0.005, global_step=160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]     Epoch 8:   6%|▋         | 5/80 [00:50<10:25,  8.34s/it, loss=0.0079, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=3.72e-5, train/loss_step=0.005, global_step=160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:   6%|▋         | 5/80 [00:50<10:25,  8.34s/it, loss=0.00864, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=0.000318, train/loss_step=0.0209, global_step=161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:   8%|▊         | 6/80 [00:50<08:53,  7.21s/it, loss=0.00864, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=0.000318, train/loss_step=0.0209, global_step=161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:   8%|▊         | 6/80 [00:50<08:53,  7.21s/it, loss=0.00889, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=3e-5, train/loss_step=0.00833, global_step=161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:   9%|▉         | 7/80 [00:50<07:45,  6.37s/it, loss=0.00889, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=3e-5, train/loss_step=0.00833, global_step=161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:   9%|▉         | 7/80 [00:50<07:45,  6.37s/it, loss=0.00831, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.95e-5, train/loss_step=0.0103, global_step=161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  10%|█         | 8/80 [01:29<11:53,  9.91s/it, loss=0.00831, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.95e-5, train/loss_step=0.0103, global_step=161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  10%|█         | 8/80 [01:29<11:53,  9.91s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.93e-6, train/loss_step=0.00166, global_step=161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  11%|█▏        | 9/80 [01:29<10:36,  8.97s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.93e-6, train/loss_step=0.00166, global_step=161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  11%|█▏        | 9/80 [01:29<10:36,  8.97s/it, loss=0.0077, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=1.38e-5, train/loss_step=0.00147, global_step=162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  12%|█▎        | 10/80 [01:30<09:33,  8.20s/it, loss=0.0077, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=1.38e-5, train/loss_step=0.00147, global_step=162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  12%|█▎        | 10/80 [01:30<09:33,  8.20s/it, loss=0.00779, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.76e-5, train/loss_step=0.00294, global_step=162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  14%|█▍        | 11/80 [01:30<08:41,  7.55s/it, loss=0.00779, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.76e-5, train/loss_step=0.00294, global_step=162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  14%|█▍        | 11/80 [01:30<08:41,  7.55s/it, loss=0.00776, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=2.44e-5, train/loss_step=0.00647, global_step=162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  15%|█▌        | 12/80 [01:31<07:57,  7.02s/it, loss=0.00776, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=2.44e-5, train/loss_step=0.00647, global_step=162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  15%|█▌        | 12/80 [01:31<07:57,  7.02s/it, loss=0.0076, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=5.41e-5, train/loss_step=0.00974, global_step=162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  16%|█▋        | 13/80 [01:31<07:19,  6.55s/it, loss=0.0076, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=5.41e-5, train/loss_step=0.00974, global_step=162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  16%|█▋        | 13/80 [01:31<07:19,  6.55s/it, loss=0.00759, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=5.09e-5, train/loss_step=0.00996, global_step=163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  18%|█▊        | 14/80 [01:32<06:45,  6.15s/it, loss=0.00759, v_num=0, train/loss_simple_step=0.00996, train/loss_vlb_step=5.09e-5, train/loss_step=0.00996, global_step=163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  18%|█▊        | 14/80 [01:32<06:45,  6.15s/it, loss=0.0082, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=8.84e-5, train/loss_step=0.0141, global_step=163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]   Epoch 8:  19%|█▉        | 15/80 [01:32<06:16,  5.80s/it, loss=0.0082, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=8.84e-5, train/loss_step=0.0141, global_step=163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  19%|█▉        | 15/80 [01:32<06:16,  5.80s/it, loss=0.00892, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=0.000552, train/loss_step=0.0216, global_step=163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  20%|██        | 16/80 [02:09<08:07,  7.62s/it, loss=0.00892, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=0.000552, train/loss_step=0.0216, global_step=163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  20%|██        | 16/80 [02:09<08:07,  7.62s/it, loss=0.00877, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=1.35e-5, train/loss_step=0.00143, global_step=163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  21%|██▏       | 17/80 [02:09<07:34,  7.22s/it, loss=0.00877, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=1.35e-5, train/loss_step=0.00143, global_step=163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  21%|██▏       | 17/80 [02:09<07:34,  7.22s/it, loss=0.00788, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=1.34e-5, train/loss_step=0.00147, global_step=164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  22%|██▎       | 18/80 [02:12<07:13,  7.00s/it, loss=0.00788, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=1.34e-5, train/loss_step=0.00147, global_step=164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  22%|██▎       | 18/80 [02:12<07:13,  7.00s/it, loss=0.00706, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.56e-6, train/loss_step=0.00138, global_step=164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  24%|██▍       | 19/80 [02:13<06:47,  6.67s/it, loss=0.00706, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.56e-6, train/loss_step=0.00138, global_step=164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  24%|██▍       | 19/80 [02:13<06:47,  6.67s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.14e-5, train/loss_step=0.0107, global_step=164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  25%|██▌       | 20/80 [02:13<06:22,  6.38s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.14e-5, train/loss_step=0.0107, global_step=164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  25%|██▌       | 20/80 [02:13<06:22,  6.38s/it, loss=0.00736, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=0.00031, train/loss_step=0.00474, global_step=164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.00736, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=0.00031, train/loss_step=0.00474, global_step=164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.000821, train/loss_vlb_step=3.24e-6, train/loss_step=0.000821, global_step=165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  28%|██▊       | 22/80 [02:15<05:40,  5.87s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.000821, train/loss_vlb_step=3.24e-6, train/loss_step=0.000821, global_step=165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  28%|██▊       | 22/80 [02:15<05:40,  5.87s/it, loss=0.00735, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.75e-5, train/loss_step=0.00719, global_step=165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  29%|██▉       | 23/80 [02:15<05:21,  5.65s/it, loss=0.00735, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=3.75e-5, train/loss_step=0.00719, global_step=165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  29%|██▉       | 23/80 [02:15<05:21,  5.65s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000372, train/loss_step=0.0185, global_step=165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  30%|███       | 24/80 [02:48<06:16,  6.72s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000372, train/loss_step=0.0185, global_step=165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  30%|███       | 24/80 [02:48<06:16,  6.72s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=4.98e-5, train/loss_step=0.00512, global_step=165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  31%|███▏      | 25/80 [02:48<05:56,  6.49s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=4.98e-5, train/loss_step=0.00512, global_step=165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  31%|███▏      | 25/80 [02:48<05:56,  6.49s/it, loss=0.00707, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=3.91e-5, train/loss_step=0.00351, global_step=166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  32%|███▎      | 26/80 [02:50<05:40,  6.31s/it, loss=0.00707, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=3.91e-5, train/loss_step=0.00351, global_step=166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  32%|███▎      | 26/80 [02:50<05:40,  6.31s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=0.000115, train/loss_step=0.0112, global_step=166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  34%|███▍      | 27/80 [02:52<05:27,  6.18s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=0.000115, train/loss_step=0.0112, global_step=166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  34%|███▍      | 27/80 [02:52<05:27,  6.18s/it, loss=0.00677, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=1.19e-5, train/loss_step=0.00145, global_step=166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  35%|███▌      | 28/80 [02:53<05:11,  5.98s/it, loss=0.00677, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=1.19e-5, train/loss_step=0.00145, global_step=166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  35%|███▌      | 28/80 [02:53<05:11,  5.98s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=2.9e-6, train/loss_step=0.000737, global_step=166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  36%|███▋      | 29/80 [02:53<04:55,  5.80s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=2.9e-6, train/loss_step=0.000737, global_step=166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  36%|███▋      | 29/80 [02:53<04:55,  5.80s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=0.000205, train/loss_step=0.0115, global_step=167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  38%|███▊      | 30/80 [02:54<04:41,  5.63s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=0.000205, train/loss_step=0.0115, global_step=167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  38%|███▊      | 30/80 [02:54<04:41,  5.63s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.2e-5, train/loss_step=0.00266, global_step=167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  39%|███▉      | 31/80 [02:54<04:27,  5.47s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.2e-5, train/loss_step=0.00266, global_step=167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  39%|███▉      | 31/80 [02:54<04:27,  5.47s/it, loss=0.00774, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000149, train/loss_step=0.017, global_step=167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  40%|████      | 32/80 [03:27<05:02,  6.29s/it, loss=0.00774, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000149, train/loss_step=0.017, global_step=167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  40%|████      | 32/80 [03:27<05:02,  6.29s/it, loss=0.00768, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=3.22e-5, train/loss_step=0.00848, global_step=167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  41%|████▏     | 33/80 [03:28<04:48,  6.13s/it, loss=0.00768, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=3.22e-5, train/loss_step=0.00848, global_step=167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  41%|████▏     | 33/80 [03:28<04:48,  6.13s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=4.68e-6, train/loss_step=0.00104, global_step=168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  42%|████▎     | 34/80 [03:28<04:34,  5.97s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=4.68e-6, train/loss_step=0.00104, global_step=168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  42%|████▎     | 34/80 [03:28<04:34,  5.97s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=3.18e-5, train/loss_step=0.00836, global_step=168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=3.18e-5, train/loss_step=0.00836, global_step=168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=2.16e-6, train/loss_step=0.000506, global_step=168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  45%|████▌     | 36/80 [03:40<04:22,  5.97s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=2.16e-6, train/loss_step=0.000506, global_step=168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  45%|████▌     | 36/80 [03:40<04:22,  5.97s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=0.000457, train/loss_step=0.0118, global_step=168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]    Epoch 8:  46%|████▋     | 37/80 [03:41<04:10,  5.82s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=0.000457, train/loss_step=0.0118, global_step=168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  46%|████▋     | 37/80 [03:41<04:10,  5.82s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=6.57e-5, train/loss_step=0.00343, global_step=169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  48%|████▊     | 38/80 [03:41<03:58,  5.69s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=6.57e-5, train/loss_step=0.00343, global_step=169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  48%|████▊     | 38/80 [03:41<03:58,  5.69s/it, loss=0.00726, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=0.000913, train/loss_step=0.0166, global_step=169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  49%|████▉     | 39/80 [03:42<03:47,  5.56s/it, loss=0.00726, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=0.000913, train/loss_step=0.0166, global_step=169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  49%|████▉     | 39/80 [03:42<03:47,  5.56s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.21e-5, train/loss_step=0.00662, global_step=169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  50%|█████     | 40/80 [04:28<04:21,  6.55s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=3.21e-5, train/loss_step=0.00662, global_step=169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  50%|█████     | 40/80 [04:28<04:21,  6.55s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.79e-5, train/loss_step=0.00278, global_step=169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  51%|█████▏    | 41/80 [04:28<04:09,  6.40s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.79e-5, train/loss_step=0.00278, global_step=169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  51%|█████▏    | 41/80 [04:28<04:09,  6.40s/it, loss=0.00699, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.66e-5, train/loss_step=0.00151, global_step=170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  52%|█████▎    | 42/80 [04:29<03:58,  6.27s/it, loss=0.00699, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.66e-5, train/loss_step=0.00151, global_step=170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  52%|█████▎    | 42/80 [04:29<03:58,  6.27s/it, loss=0.00686, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.68e-5, train/loss_step=0.0046, global_step=170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  54%|█████▍    | 43/80 [04:29<03:47,  6.14s/it, loss=0.00686, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.68e-5, train/loss_step=0.0046, global_step=170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  54%|█████▍    | 43/80 [04:29<03:47,  6.14s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=7.31e-6, train/loss_step=0.0015, global_step=170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  55%|█████▌    | 44/80 [04:30<03:36,  6.01s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=7.31e-6, train/loss_step=0.0015, global_step=170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  55%|█████▌    | 44/80 [04:30<03:36,  6.01s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.000503, train/loss_vlb_step=2.16e-6, train/loss_step=0.000503, global_step=170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  56%|█████▋    | 45/80 [04:31<03:26,  5.89s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.000503, train/loss_vlb_step=2.16e-6, train/loss_step=0.000503, global_step=170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  56%|█████▋    | 45/80 [04:31<03:26,  5.89s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=2.83e-5, train/loss_step=0.00761, global_step=171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  57%|█████▊    | 46/80 [04:31<03:16,  5.78s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=2.83e-5, train/loss_step=0.00761, global_step=171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  57%|█████▊    | 46/80 [04:31<03:16,  5.78s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=0.000101, train/loss_step=0.00752, global_step=171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  59%|█████▉    | 47/80 [04:32<03:07,  5.67s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=0.000101, train/loss_step=0.00752, global_step=171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  59%|█████▉    | 47/80 [04:32<03:07,  5.67s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=5.92e-6, train/loss_step=0.00139, global_step=171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  60%|██████    | 48/80 [05:19<03:28,  6.53s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=5.92e-6, train/loss_step=0.00139, global_step=171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  60%|██████    | 48/80 [05:19<03:28,  6.53s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.00976, train/loss_vlb_step=4.23e-5, train/loss_step=0.00976, global_step=171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  61%|██████▏   | 49/80 [05:20<03:18,  6.41s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.00976, train/loss_vlb_step=4.23e-5, train/loss_step=0.00976, global_step=171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  61%|██████▏   | 49/80 [05:20<03:18,  6.41s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=7.99e-5, train/loss_step=0.0108, global_step=172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  62%|██████▎   | 50/80 [05:20<03:08,  6.29s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=7.99e-5, train/loss_step=0.0108, global_step=172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  62%|██████▎   | 50/80 [05:20<03:08,  6.29s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=1.65e-5, train/loss_step=0.00462, global_step=172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  64%|██████▍   | 51/80 [05:21<02:59,  6.18s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=1.65e-5, train/loss_step=0.00462, global_step=172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  64%|██████▍   | 51/80 [05:21<02:59,  6.18s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=2.99e-5, train/loss_step=0.00763, global_step=172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  65%|██████▌   | 52/80 [05:21<02:50,  6.08s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=2.99e-5, train/loss_step=0.00763, global_step=172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  65%|██████▌   | 52/80 [05:21<02:50,  6.08s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=4.13e-5, train/loss_step=0.00818, global_step=172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  66%|██████▋   | 53/80 [05:22<02:41,  5.97s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=4.13e-5, train/loss_step=0.00818, global_step=172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  66%|██████▋   | 53/80 [05:22<02:41,  5.97s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=0.000407, train/loss_step=0.0128, global_step=173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  68%|██████▊   | 54/80 [05:22<02:32,  5.87s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=0.000407, train/loss_step=0.0128, global_step=173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  68%|██████▊   | 54/80 [05:22<02:32,  5.87s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.55e-5, train/loss_step=0.00408, global_step=173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  69%|██████▉   | 55/80 [05:23<02:24,  5.78s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.55e-5, train/loss_step=0.00408, global_step=173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  69%|██████▉   | 55/80 [05:23<02:24,  5.78s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.35e-5, train/loss_step=0.0109, global_step=173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  70%|███████   | 56/80 [06:09<02:35,  6.48s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.35e-5, train/loss_step=0.0109, global_step=173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  70%|███████   | 56/80 [06:09<02:35,  6.48s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=9.75e-6, train/loss_step=0.00224, global_step=173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  71%|███████▏  | 57/80 [06:09<02:26,  6.37s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=9.75e-6, train/loss_step=0.00224, global_step=173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  71%|███████▏  | 57/80 [06:09<02:26,  6.37s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.000475, train/loss_vlb_step=1.94e-6, train/loss_step=0.000475, global_step=174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  72%|███████▎  | 58/80 [06:10<02:18,  6.27s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.000475, train/loss_vlb_step=1.94e-6, train/loss_step=0.000475, global_step=174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  72%|███████▎  | 58/80 [06:10<02:18,  6.27s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=3.35e-5, train/loss_step=0.00212, global_step=174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  74%|███████▍  | 59/80 [06:10<02:09,  6.18s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=3.35e-5, train/loss_step=0.00212, global_step=174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  74%|███████▍  | 59/80 [06:10<02:09,  6.18s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=3.77e-6, train/loss_step=0.000934, global_step=174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  75%|███████▌  | 60/80 [06:11<02:01,  6.09s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=3.77e-6, train/loss_step=0.000934, global_step=174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  75%|███████▌  | 60/80 [06:11<02:01,  6.09s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=3.89e-5, train/loss_step=0.00955, global_step=174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  76%|███████▋  | 61/80 [06:11<01:53,  6.00s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=3.89e-5, train/loss_step=0.00955, global_step=174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  76%|███████▋  | 61/80 [06:11<01:53,  6.00s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.42e-6, train/loss_step=0.0011, global_step=175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  78%|███████▊  | 62/80 [06:12<01:46,  5.91s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.42e-6, train/loss_step=0.0011, global_step=175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  78%|███████▊  | 62/80 [06:12<01:46,  5.91s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=2.34e-5, train/loss_step=0.0024, global_step=175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  79%|███████▉  | 63/80 [06:12<01:38,  5.82s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=2.34e-5, train/loss_step=0.0024, global_step=175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  79%|███████▉  | 63/80 [06:12<01:38,  5.82s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=6.16e-5, train/loss_step=0.0109, global_step=175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  80%|████████  | 64/80 [06:50<01:41,  6.31s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=6.16e-5, train/loss_step=0.0109, global_step=175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  80%|████████  | 64/80 [06:50<01:41,  6.31s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.85e-5, train/loss_step=0.00177, global_step=175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  81%|████████▏ | 65/80 [06:51<01:33,  6.23s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.85e-5, train/loss_step=0.00177, global_step=175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  81%|████████▏ | 65/80 [06:51<01:33,  6.23s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=3.55e-5, train/loss_step=0.00348, global_step=176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  82%|████████▎ | 66/80 [06:51<01:26,  6.15s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=3.55e-5, train/loss_step=0.00348, global_step=176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  82%|████████▎ | 66/80 [06:51<01:26,  6.15s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.25e-5, train/loss_step=0.0113, global_step=176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  84%|████████▍ | 67/80 [06:52<01:18,  6.06s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.25e-5, train/loss_step=0.0113, global_step=176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  84%|████████▍ | 67/80 [06:52<01:18,  6.06s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.6e-6, train/loss_step=0.00132, global_step=176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  85%|████████▌ | 68/80 [06:52<01:11,  5.98s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.6e-6, train/loss_step=0.00132, global_step=176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  85%|████████▌ | 68/80 [06:52<01:11,  5.98s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.12e-6, train/loss_step=0.001, global_step=176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]   Epoch 8:  86%|████████▋ | 69/80 [06:53<01:04,  5.90s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.12e-6, train/loss_step=0.001, global_step=176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  86%|████████▋ | 69/80 [06:53<01:04,  5.90s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000926, train/loss_vlb_step=4.77e-6, train/loss_step=0.000926, global_step=177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  88%|████████▊ | 70/80 [06:53<00:58,  5.83s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000926, train/loss_vlb_step=4.77e-6, train/loss_step=0.000926, global_step=177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  88%|████████▊ | 70/80 [06:53<00:58,  5.83s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=8.97e-6, train/loss_step=0.00162, global_step=177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  89%|████████▉ | 71/80 [06:54<00:51,  5.75s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=8.97e-6, train/loss_step=0.00162, global_step=177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  89%|████████▉ | 71/80 [06:54<00:51,  5.75s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=4.66e-6, train/loss_step=0.00118, global_step=177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  90%|█████████ | 72/80 [07:22<00:48,  6.06s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=4.66e-6, train/loss_step=0.00118, global_step=177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  90%|█████████ | 72/80 [07:22<00:48,  6.06s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.3e-5, train/loss_step=0.00166, global_step=177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  91%|█████████▏| 73/80 [07:22<00:41,  5.98s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.3e-5, train/loss_step=0.00166, global_step=177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  91%|█████████▏| 73/80 [07:22<00:41,  5.98s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=8.94e-5, train/loss_step=0.0166, global_step=178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653] Epoch 8:  92%|█████████▎| 74/80 [07:23<00:35,  5.91s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=8.94e-5, train/loss_step=0.0166, global_step=178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  92%|█████████▎| 74/80 [07:23<00:35,  5.91s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=1.61e-5, train/loss_step=0.00479, global_step=178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  94%|█████████▍| 75/80 [07:23<00:29,  5.84s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=1.61e-5, train/loss_step=0.00479, global_step=178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  94%|█████████▍| 75/80 [07:23<00:29,  5.84s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.17e-6, train/loss_step=0.000317, global_step=178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  95%|█████████▌| 76/80 [07:24<00:23,  5.77s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.17e-6, train/loss_step=0.000317, global_step=178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  95%|█████████▌| 76/80 [07:24<00:23,  5.77s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=0.000105, train/loss_step=0.0221, global_step=178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]   Epoch 8:  96%|█████████▋| 77/80 [07:24<00:17,  5.70s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=0.000105, train/loss_step=0.0221, global_step=178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  96%|█████████▋| 77/80 [07:24<00:17,  5.70s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.08e-5, train/loss_step=0.00951, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  98%|█████████▊| 78/80 [07:25<00:11,  5.64s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=4.08e-5, train/loss_step=0.00951, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  98%|█████████▊| 78/80 [07:25<00:11,  5.64s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=8.33e-6, train/loss_step=0.0021, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 8:  99%|█████████▉| 79/80 [07:25<00:05,  5.57s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=8.33e-6, train/loss_step=0.0021, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8:  99%|█████████▉| 79/80 [07:25<00:05,  5.57s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=0.000137, train/loss_step=0.00966, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8: 100%|██████████| 80/80 [07:26<00:00,  5.51s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=0.000137, train/loss_step=0.00966, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 8: 100%|██████████| 80/80 [07:26<00:00,  5.51s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=2.89e-6, train/loss_step=0.000728, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Average Epoch time: 446.28 seconds
+Average Peak memory 29565.70MiB
+Epoch 8:   0%|          | 0/80 [00:00<00:00, 7371.36it/s, loss=0.00522, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=2.89e-6, train/loss_step=0.000728, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 9:   0%|          | 0/80 [00:00<00:00, 2585.88it/s, loss=0.00522, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=2.89e-6, train/loss_step=0.000728, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]Epoch 9:   1%|▏         | 1/80 [00:39<26:05, 19.82s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=2.89e-6, train/loss_step=0.000728, global_step=179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00653, train/loss_vlb_epoch=0.000248, train/loss_epoch=0.00653]  Epoch 9:   1%|▏         | 1/80 [00:39<26:05, 19.82s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=2.58e-5, train/loss_step=0.0074, global_step=180.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]      Epoch 9:   2%|▎         | 2/80 [00:40<17:23, 13.38s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=2.58e-5, train/loss_step=0.0074, global_step=180.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:   2%|▎         | 2/80 [00:40<17:23, 13.38s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.000892, train/loss_vlb_step=4.34e-6, train/loss_step=0.000892, global_step=180.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:   4%|▍         | 3/80 [00:40<13:01, 10.15s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.000892, train/loss_vlb_step=4.34e-6, train/loss_step=0.000892, global_step=180.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:   4%|▍         | 3/80 [00:40<13:01, 10.15s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=5.77e-6, train/loss_step=0.00108, global_step=180.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:   5%|▌         | 4/80 [00:42<10:52,  8.58s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=5.77e-6, train/loss_step=0.00108, global_step=180.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:   5%|▌         | 4/80 [00:42<10:52,  8.58s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=7.91e-5, train/loss_step=0.0123, global_step=180.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]   Epoch 9:   6%|▋         | 5/80 [00:43<09:08,  7.31s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=7.91e-5, train/loss_step=0.0123, global_step=180.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:   6%|▋         | 5/80 [00:43<09:08,  7.31s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=7.5e-6, train/loss_step=0.00146, global_step=181.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:   8%|▊         | 6/80 [00:44<07:48,  6.33s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=7.5e-6, train/loss_step=0.00146, global_step=181.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:   8%|▊         | 6/80 [00:44<07:48,  6.33s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.31e-5, train/loss_step=0.00809, global_step=181.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:   9%|▉         | 7/80 [00:44<06:49,  5.60s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.31e-5, train/loss_step=0.00809, global_step=181.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:   9%|▉         | 7/80 [00:44<06:49,  5.60s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=2.67e-5, train/loss_step=0.00719, global_step=181.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  10%|█         | 8/80 [01:21<10:55,  9.10s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=2.67e-5, train/loss_step=0.00719, global_step=181.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  10%|█         | 8/80 [01:21<10:55,  9.10s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=1.87e-5, train/loss_step=0.00537, global_step=181.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  11%|█▏        | 9/80 [01:22<09:45,  8.25s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=1.87e-5, train/loss_step=0.00537, global_step=181.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  11%|█▏        | 9/80 [01:22<09:45,  8.25s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=8.06e-6, train/loss_step=0.00213, global_step=182.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  12%|█▎        | 10/80 [01:29<09:32,  8.18s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=8.06e-6, train/loss_step=0.00213, global_step=182.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  12%|█▎        | 10/80 [01:29<09:32,  8.18s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.44e-5, train/loss_step=0.00276, global_step=182.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  14%|█▍        | 11/80 [01:30<08:40,  7.54s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.44e-5, train/loss_step=0.00276, global_step=182.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  14%|█▍        | 11/80 [01:30<08:40,  7.54s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000942, train/loss_vlb_step=4.56e-6, train/loss_step=0.000942, global_step=182.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  15%|█▌        | 12/80 [01:30<07:55,  7.00s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000942, train/loss_vlb_step=4.56e-6, train/loss_step=0.000942, global_step=182.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  15%|█▌        | 12/80 [01:30<07:55,  7.00s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.97e-5, train/loss_step=0.0031, global_step=182.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]    Epoch 9:  16%|█▋        | 13/80 [01:31<07:17,  6.53s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.97e-5, train/loss_step=0.0031, global_step=182.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  16%|█▋        | 13/80 [01:31<07:17,  6.53s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=0.00373, train/loss_step=0.0106, global_step=183.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  18%|█▊        | 14/80 [01:31<06:44,  6.13s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=0.00373, train/loss_step=0.0106, global_step=183.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  18%|█▊        | 14/80 [01:31<06:44,  6.13s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=0.000201, train/loss_step=0.00518, global_step=183.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  19%|█▉        | 15/80 [01:32<06:15,  5.78s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=0.000201, train/loss_step=0.00518, global_step=183.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  19%|█▉        | 15/80 [01:32<06:15,  5.78s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=0.000308, train/loss_step=0.00373, global_step=183.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  20%|██        | 16/80 [02:01<07:35,  7.12s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=0.000308, train/loss_step=0.00373, global_step=183.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  20%|██        | 16/80 [02:01<07:35,  7.12s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000813, train/loss_vlb_step=3.19e-6, train/loss_step=0.000813, global_step=183.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  21%|██▏       | 17/80 [02:01<07:05,  6.76s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000813, train/loss_vlb_step=3.19e-6, train/loss_step=0.000813, global_step=183.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  21%|██▏       | 17/80 [02:01<07:05,  6.76s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.73e-5, train/loss_step=0.00702, global_step=184.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:  22%|██▎       | 18/80 [02:14<07:18,  7.08s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=3.73e-5, train/loss_step=0.00702, global_step=184.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  22%|██▎       | 18/80 [02:14<07:18,  7.08s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000117, train/loss_step=0.0138, global_step=184.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  24%|██▍       | 19/80 [02:14<06:51,  6.75s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000117, train/loss_step=0.0138, global_step=184.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  24%|██▍       | 19/80 [02:14<06:51,  6.75s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=1.14e-5, train/loss_step=0.00135, global_step=184.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  25%|██▌       | 20/80 [02:15<06:27,  6.45s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=1.14e-5, train/loss_step=0.00135, global_step=184.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  25%|██▌       | 20/80 [02:15<06:27,  6.45s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=2.1e-5, train/loss_step=0.00612, global_step=184.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  26%|██▋       | 21/80 [02:16<06:04,  6.19s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=2.1e-5, train/loss_step=0.00612, global_step=184.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  26%|██▋       | 21/80 [02:16<06:04,  6.19s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=0.000104, train/loss_step=0.0122, global_step=185.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  28%|██▊       | 22/80 [02:16<05:44,  5.94s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=0.000104, train/loss_step=0.0122, global_step=185.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  28%|██▊       | 22/80 [02:16<05:44,  5.94s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.94e-5, train/loss_step=0.0141, global_step=185.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  29%|██▉       | 23/80 [02:17<05:25,  5.71s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.94e-5, train/loss_step=0.0141, global_step=185.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  29%|██▉       | 23/80 [02:17<05:25,  5.71s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=8.78e-5, train/loss_step=0.0174, global_step=185.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  30%|███       | 24/80 [02:47<06:15,  6.70s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=8.78e-5, train/loss_step=0.0174, global_step=185.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  30%|███       | 24/80 [02:47<06:15,  6.70s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=0.000408, train/loss_step=0.0221, global_step=185.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  31%|███▏      | 25/80 [02:48<05:55,  6.47s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=0.000408, train/loss_step=0.0221, global_step=185.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  31%|███▏      | 25/80 [02:48<05:55,  6.47s/it, loss=0.00726, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=5.47e-6, train/loss_step=0.00134, global_step=186.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  32%|███▎      | 26/80 [03:01<06:03,  6.73s/it, loss=0.00726, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=5.47e-6, train/loss_step=0.00134, global_step=186.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  32%|███▎      | 26/80 [03:01<06:03,  6.73s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=2.58e-5, train/loss_step=0.00762, global_step=186.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  34%|███▍      | 27/80 [03:02<05:45,  6.51s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=2.58e-5, train/loss_step=0.00762, global_step=186.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  34%|███▍      | 27/80 [03:02<05:45,  6.51s/it, loss=0.00689, v_num=0, train/loss_simple_step=0.000257, train/loss_vlb_step=9.8e-7, train/loss_step=0.000257, global_step=186.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.00689, v_num=0, train/loss_simple_step=0.000257, train/loss_vlb_step=9.8e-7, train/loss_step=0.000257, global_step=186.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.00679, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.11e-5, train/loss_step=0.00335, global_step=186.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.00679, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.11e-5, train/loss_step=0.00335, global_step=186.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.00688, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.48e-5, train/loss_step=0.00394, global_step=187.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00688, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.48e-5, train/loss_step=0.00394, global_step=187.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00693, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=3.75e-5, train/loss_step=0.00367, global_step=187.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00693, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=3.75e-5, train/loss_step=0.00367, global_step=187.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00751, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.00459, train/loss_step=0.0125, global_step=187.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:  40%|████      | 32/80 [03:27<05:02,  6.29s/it, loss=0.00751, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.00459, train/loss_step=0.0125, global_step=187.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  40%|████      | 32/80 [03:27<05:02,  6.29s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=1.52e-5, train/loss_step=0.00441, global_step=187.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  41%|████▏     | 33/80 [03:28<04:47,  6.12s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=1.52e-5, train/loss_step=0.00441, global_step=187.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  41%|████▏     | 33/80 [03:28<04:47,  6.12s/it, loss=0.0071, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=5.26e-6, train/loss_step=0.00113, global_step=188.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  42%|████▎     | 34/80 [03:47<04:58,  6.50s/it, loss=0.0071, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=5.26e-6, train/loss_step=0.00113, global_step=188.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  42%|████▎     | 34/80 [03:47<04:58,  6.50s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=7.15e-5, train/loss_step=0.0112, global_step=188.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:  44%|████▍     | 35/80 [03:47<04:44,  6.33s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=7.15e-5, train/loss_step=0.0112, global_step=188.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  44%|████▍     | 35/80 [03:47<04:44,  6.33s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=2.71e-6, train/loss_step=0.000645, global_step=188.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  45%|████▌     | 36/80 [03:48<04:31,  6.17s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=2.71e-6, train/loss_step=0.000645, global_step=188.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  45%|████▌     | 36/80 [03:48<04:31,  6.17s/it, loss=0.00733, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=2.13e-5, train/loss_step=0.00243, global_step=188.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:  46%|████▋     | 37/80 [03:48<04:19,  6.03s/it, loss=0.00733, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=2.13e-5, train/loss_step=0.00243, global_step=188.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  46%|████▋     | 37/80 [03:48<04:19,  6.03s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=7.97e-6, train/loss_step=0.00157, global_step=189.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  48%|████▊     | 38/80 [03:49<04:07,  5.88s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=7.97e-6, train/loss_step=0.00157, global_step=189.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  48%|████▊     | 38/80 [03:49<04:07,  5.88s/it, loss=0.00689, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.52e-5, train/loss_step=0.0106, global_step=189.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:  49%|████▉     | 39/80 [03:49<03:55,  5.75s/it, loss=0.00689, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.52e-5, train/loss_step=0.0106, global_step=189.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  49%|████▉     | 39/80 [03:49<03:55,  5.75s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=8.69e-6, train/loss_step=0.00194, global_step=189.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  50%|█████     | 40/80 [04:02<03:56,  5.91s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=8.69e-6, train/loss_step=0.00194, global_step=189.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  50%|█████     | 40/80 [04:02<03:56,  5.91s/it, loss=0.00665, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=2.69e-6, train/loss_step=0.000678, global_step=189.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  51%|█████▏    | 41/80 [04:03<03:45,  5.79s/it, loss=0.00665, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=2.69e-6, train/loss_step=0.000678, global_step=189.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  51%|█████▏    | 41/80 [04:03<03:45,  5.79s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=0.000388, train/loss_step=0.00436, global_step=190.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  52%|█████▎    | 42/80 [04:33<04:02,  6.37s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=0.000388, train/loss_step=0.00436, global_step=190.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  52%|█████▎    | 42/80 [04:33<04:02,  6.37s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=2.79e-6, train/loss_step=0.000735, global_step=190.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  54%|█████▍    | 43/80 [04:34<03:50,  6.24s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=2.79e-6, train/loss_step=0.000735, global_step=190.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  54%|█████▍    | 43/80 [04:34<03:50,  6.24s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=0.000399, train/loss_step=0.00491, global_step=190.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  55%|█████▌    | 44/80 [04:34<03:39,  6.11s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=0.000399, train/loss_step=0.00491, global_step=190.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  55%|█████▌    | 44/80 [04:34<03:39,  6.11s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.12e-5, train/loss_step=0.00886, global_step=190.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  56%|█████▋    | 45/80 [04:35<03:29,  5.99s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=4.12e-5, train/loss_step=0.00886, global_step=190.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  56%|█████▋    | 45/80 [04:35<03:29,  5.99s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=8.17e-6, train/loss_step=0.00201, global_step=191.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  57%|█████▊    | 46/80 [04:35<03:19,  5.87s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=8.17e-6, train/loss_step=0.00201, global_step=191.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  57%|█████▊    | 46/80 [04:35<03:19,  5.87s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.22e-6, train/loss_step=0.0015, global_step=191.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:  59%|█████▉    | 47/80 [04:36<03:10,  5.76s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.22e-6, train/loss_step=0.0015, global_step=191.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  59%|█████▉    | 47/80 [04:36<03:10,  5.76s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.29e-5, train/loss_step=0.00428, global_step=191.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  60%|██████    | 48/80 [04:55<03:13,  6.04s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=2.29e-5, train/loss_step=0.00428, global_step=191.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  60%|██████    | 48/80 [04:55<03:13,  6.04s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=8.1e-6, train/loss_step=0.00187, global_step=191.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  61%|██████▏   | 49/80 [04:56<03:03,  5.93s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=8.1e-6, train/loss_step=0.00187, global_step=191.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  61%|██████▏   | 49/80 [04:56<03:03,  5.93s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=6.05e-6, train/loss_step=0.00139, global_step=192.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  62%|██████▎   | 50/80 [05:21<03:08,  6.30s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=6.05e-6, train/loss_step=0.00139, global_step=192.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  62%|██████▎   | 50/80 [05:21<03:08,  6.30s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.91e-5, train/loss_step=0.00676, global_step=192.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  64%|██████▍   | 51/80 [05:21<02:59,  6.18s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.91e-5, train/loss_step=0.00676, global_step=192.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  64%|██████▍   | 51/80 [05:21<02:59,  6.18s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=0.000678, train/loss_step=0.00582, global_step=192.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  65%|██████▌   | 52/80 [05:22<02:50,  6.08s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=0.000678, train/loss_step=0.00582, global_step=192.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  65%|██████▌   | 52/80 [05:22<02:50,  6.08s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.06e-5, train/loss_step=0.0041, global_step=192.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]   Epoch 9:  66%|██████▋   | 53/80 [05:22<02:41,  5.98s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=2.06e-5, train/loss_step=0.0041, global_step=192.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  66%|██████▋   | 53/80 [05:22<02:41,  5.98s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000568, train/loss_vlb_step=2.22e-6, train/loss_step=0.000568, global_step=193.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  68%|██████▊   | 54/80 [05:23<02:32,  5.88s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000568, train/loss_vlb_step=2.22e-6, train/loss_step=0.000568, global_step=193.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  68%|███��██▊   | 54/80 [05:23<02:32,  5.88s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=8.17e-5, train/loss_step=0.00663, global_step=193.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:  69%|██████▉   | 55/80 [05:23<02:24,  5.78s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=8.17e-5, train/loss_step=0.00663, global_step=193.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  69%|██████▉   | 55/80 [05:23<02:24,  5.78s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=9.44e-5, train/loss_step=0.0142, global_step=193.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:  70%|███████   | 56/80 [05:34<02:20,  5.86s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=9.44e-5, train/loss_step=0.0142, global_step=193.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  70%|███████   | 56/80 [05:34<02:20,  5.86s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=5.48e-5, train/loss_step=0.00502, global_step=193.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  71%|███████▏  | 57/80 [05:38<02:14,  5.83s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=5.48e-5, train/loss_step=0.00502, global_step=193.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  71%|███████▏  | 57/80 [05:38<02:14,  5.83s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.16e-5, train/loss_step=0.00208, global_step=194.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  72%|███████▎  | 58/80 [05:57<02:13,  6.05s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.16e-5, train/loss_step=0.00208, global_step=194.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  72%|███████▎  | 58/80 [05:57<02:13,  6.05s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000103, train/loss_step=0.0144, global_step=194.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  74%|███████▍  | 59/80 [05:57<02:05,  5.96s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000103, train/loss_step=0.0144, global_step=194.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  74%|███████▍  | 59/80 [05:57<02:05,  5.96s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=6.61e-6, train/loss_step=0.00113, global_step=194.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  75%|███████▌  | 60/80 [05:58<01:57,  5.87s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=6.61e-6, train/loss_step=0.00113, global_step=194.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  75%|███████▌  | 60/80 [05:58<01:57,  5.87s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=2.62e-5, train/loss_step=0.00714, global_step=194.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  76%|███████▋  | 61/80 [05:58<01:49,  5.79s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=2.62e-5, train/loss_step=0.00714, global_step=194.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  76%|███████▋  | 61/80 [05:58<01:49,  5.79s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000731, train/loss_vlb_step=4.37e-6, train/loss_step=0.000731, global_step=195.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  78%|███████▊  | 62/80 [05:59<01:42,  5.70s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000731, train/loss_vlb_step=4.37e-6, train/loss_step=0.000731, global_step=195.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  78%|███████▊  | 62/80 [05:59<01:42,  5.70s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=6.91e-6, train/loss_step=0.00139, global_step=195.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 9:  79%|███████▉  | 63/80 [05:59<01:35,  5.62s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=6.91e-6, train/loss_step=0.00139, global_step=195.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  79%|███████▉  | 63/80 [05:59<01:35,  5.62s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=2.73e-5, train/loss_step=0.00757, global_step=195.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  80%|████████  | 64/80 [06:19<01:33,  5.84s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=2.73e-5, train/loss_step=0.00757, global_step=195.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  80%|████████  | 64/80 [06:19<01:33,  5.84s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=2.09e-5, train/loss_step=0.00226, global_step=195.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  81%|████████▏ | 65/80 [06:27<01:27,  5.86s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=2.09e-5, train/loss_step=0.00226, global_step=195.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  81%|████████▏ | 65/80 [06:27<01:27,  5.86s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.84e-6, train/loss_step=0.00136, global_step=196.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  82%|████████▎ | 66/80 [06:38<01:23,  5.95s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.84e-6, train/loss_step=0.00136, global_step=196.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  82%|████████▎ | 66/80 [06:38<01:23,  5.95s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=0.00114, train/loss_step=0.00746, global_step=196.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  84%|████████▍ | 67/80 [06:39<01:16,  5.87s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=0.00114, train/loss_step=0.00746, global_step=196.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  84%|████████▍ | 67/80 [06:39<01:16,  5.87s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.72e-5, train/loss_step=0.00818, global_step=196.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  85%|████████▌ | 68/80 [06:39<01:09,  5.79s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00818, train/loss_vlb_step=3.72e-5, train/loss_step=0.00818, global_step=196.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  85%|████████▌ | 68/80 [06:39<01:09,  5.79s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=7.8e-6, train/loss_step=0.00126, global_step=196.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  86%|████████▋ | 69/80 [06:40<01:02,  5.72s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=7.8e-6, train/loss_step=0.00126, global_step=196.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  86%|████████▋ | 69/80 [06:40<01:02,  5.72s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=0.000139, train/loss_step=0.00292, global_step=197.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  88%|████████▊ | 70/80 [06:41<00:56,  5.65s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=0.000139, train/loss_step=0.00292, global_step=197.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  88%|████████▊ | 70/80 [06:41<00:56,  5.65s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=6.53e-6, train/loss_step=0.00143, global_step=197.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  89%|████████▉ | 71/80 [06:41<00:50,  5.58s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=6.53e-6, train/loss_step=0.00143, global_step=197.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  89%|████████▉ | 71/80 [06:41<00:50,  5.58s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.14e-6, train/loss_step=0.00149, global_step=197.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  90%|█████████ | 72/80 [06:55<00:45,  5.69s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.14e-6, train/loss_step=0.00149, global_step=197.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  90%|█████████ | 72/80 [06:55<00:45,  5.69s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00087, train/loss_vlb_step=3.48e-6, train/loss_step=0.00087, global_step=197.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00087, train/loss_vlb_step=3.48e-6, train/loss_step=0.00087, global_step=197.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=1.04e-5, train/loss_step=0.00119, global_step=198.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  92%|█████████▎| 74/80 [07:15<00:34,  5.80s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=1.04e-5, train/loss_step=0.00119, global_step=198.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  92%|█████████▎| 74/80 [07:15<00:34,  5.80s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=0.000379, train/loss_step=0.0042, global_step=198.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9:  94%|█████████▍| 75/80 [07:15<00:28,  5.73s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=0.000379, train/loss_step=0.0042, global_step=198.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  94%|█████████▍| 75/80 [07:15<00:28,  5.73s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=2.13e-5, train/loss_step=0.00248, global_step=198.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=2.13e-5, train/loss_step=0.00248, global_step=198.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.99e-5, train/loss_step=0.00312, global_step=198.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.99e-5, train/loss_step=0.00312, global_step=198.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.22e-5, train/loss_step=0.00571, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.22e-5, train/loss_step=0.00571, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=2.04e-5, train/loss_step=0.00259, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=2.04e-5, train/loss_step=0.00259, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=1.71e-5, train/loss_step=0.00456, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056] Epoch 9: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=1.71e-5, train/loss_step=0.00456, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 9: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=4.8e-5, train/loss_step=0.00405, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Average Epoch time: 438.19 seconds
+Average Peak memory 29566.65MiB
+Epoch 9:   0%|          | 0/80 [00:00<00:00, 8112.77it/s, loss=0.00324, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=4.8e-5, train/loss_step=0.00405, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 10:   0%|          | 0/80 [00:00<00:00, 2870.84it/s, loss=0.00324, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=4.8e-5, train/loss_step=0.00405, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]Epoch 10:   1%|▏         | 1/80 [00:43<28:44, 21.83s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=4.8e-5, train/loss_step=0.00405, global_step=199.0, lr_abs=0.0001, train/loss_simple_epoch=0.0056, train/loss_vlb_epoch=0.000146, train/loss_epoch=0.0056]  Epoch 10:   1%|▏         | 1/80 [00:43<28:44, 21.83s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=9.84e-6, train/loss_step=0.00189, global_step=200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   2%|▎         | 2/80 [00:44<19:07, 14.71s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=9.84e-6, train/loss_step=0.00189, global_step=200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   2%|▎         | 2/80 [00:44<19:07, 14.72s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.05e-5, train/loss_step=0.00184, global_step=200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   4%|▍         | 3/80 [00:44<14:19, 11.16s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.05e-5, train/loss_step=0.00184, global_step=200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   4%|▍         | 3/80 [00:44<14:19, 11.16s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=7.01e-6, train/loss_step=0.00118, global_step=200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:   5%|▌         | 4/80 [00:45<11:26,  9.03s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=7.01e-6, train/loss_step=0.00118, global_step=200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   5%|▌         | 4/80 [00:45<11:26,  9.03s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=4.5e-6, train/loss_step=0.00104, global_step=200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   6%|▋         | 5/80 [00:45<09:30,  7.61s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=4.5e-6, train/loss_step=0.00104, global_step=200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   6%|▋         | 5/80 [00:45<09:30,  7.61s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.89e-6, train/loss_step=0.00157, global_step=201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   8%|▊         | 6/80 [00:46<08:08,  6.60s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=9.89e-6, train/loss_step=0.00157, global_step=201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   8%|▊         | 6/80 [00:46<08:08,  6.60s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=3.02e-5, train/loss_step=0.0039, global_step=201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:   9%|▉         | 7/80 [00:46<07:05,  5.83s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=3.02e-5, train/loss_step=0.0039, global_step=201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:   9%|▉         | 7/80 [00:46<07:05,  5.83s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=2.65e-6, train/loss_step=0.000678, global_step=201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  10%|█         | 8/80 [01:27<11:42,  9.75s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=2.65e-6, train/loss_step=0.000678, global_step=201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  10%|█         | 8/80 [01:27<11:42,  9.75s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=1.49e-5, train/loss_step=0.00137, global_step=201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  11%|█▏        | 9/80 [01:28<10:26,  8.83s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=1.49e-5, train/loss_step=0.00137, global_step=201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  11%|█▏        | 9/80 [01:28<10:26,  8.83s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=2.96e-6, train/loss_step=0.000635, global_step=202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  12%|█▎        | 10/80 [01:28<09:24,  8.07s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=2.96e-6, train/loss_step=0.000635, global_step=202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  12%|█▎        | 10/80 [01:28<09:24,  8.07s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=0.00022, train/loss_step=0.00467, global_step=202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  14%|█▍        | 11/80 [01:29<08:33,  7.44s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=0.00022, train/loss_step=0.00467, global_step=202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  14%|█▍        | 11/80 [01:29<08:33,  7.44s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=1.52e-5, train/loss_step=0.00136, global_step=202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  15%|█▌        | 12/80 [01:29<07:50,  6.92s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=1.52e-5, train/loss_step=0.00136, global_step=202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  15%|█▌        | 12/80 [01:29<07:50,  6.92s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=0.000529, train/loss_step=0.00762, global_step=202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=0.000529, train/loss_step=0.00762, global_step=202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.76e-6, train/loss_step=0.00108, global_step=203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  18%|█▊        | 14/80 [01:30<06:40,  6.06s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.76e-6, train/loss_step=0.00108, global_step=203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  18%|█▊        | 14/80 [01:30<06:40,  6.06s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=0.00081, train/loss_step=0.00825, global_step=203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  19%|█▉        | 15/80 [01:31<06:11,  5.71s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=0.00081, train/loss_step=0.00825, global_step=203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  19%|█▉        | 15/80 [01:31<06:11,  5.71s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.04e-5, train/loss_step=0.00237, global_step=203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  20%|██        | 16/80 [02:11<08:13,  7.71s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.04e-5, train/loss_step=0.00237, global_step=203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  20%|██        | 16/80 [02:11<08:13,  7.71s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=6.55e-5, train/loss_step=0.00487, global_step=203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  21%|██▏       | 17/80 [02:12<07:43,  7.35s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=6.55e-5, train/loss_step=0.00487, global_step=203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  21%|██▏       | 17/80 [02:12<07:43,  7.35s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.00048, train/loss_step=0.0301, global_step=204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  22%|██▎       | 18/80 [02:12<07:13,  6.99s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.00048, train/loss_step=0.0301, global_step=204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  22%|██▎       | 18/80 [02:12<07:13,  6.99s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.28e-5, train/loss_step=0.00259, global_step=204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  24%|██▍       | 19/80 [02:13<06:46,  6.67s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.28e-5, train/loss_step=0.00259, global_step=204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  24%|██▍       | 19/80 [02:13<06:46,  6.67s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000282, train/loss_step=0.014, global_step=204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]   Epoch 10:  25%|██▌       | 20/80 [02:14<06:22,  6.38s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000282, train/loss_step=0.014, global_step=204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  25%|██▌       | 20/80 [02:14<06:22,  6.38s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.06e-5, train/loss_step=0.00215, global_step=204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.06e-5, train/loss_step=0.00215, global_step=204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=3.69e-5, train/loss_step=0.00227, global_step=205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  28%|██▊       | 22/80 [02:15<05:40,  5.87s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=3.69e-5, train/loss_step=0.00227, global_step=205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  28%|██▊       | 22/80 [02:15<05:40,  5.87s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=3.12e-5, train/loss_step=0.00543, global_step=205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  29%|██▉       | 23/80 [02:15<05:21,  5.65s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=3.12e-5, train/loss_step=0.00543, global_step=205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  29%|██▉       | 23/80 [02:15<05:21,  5.65s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000116, train/loss_step=0.017, global_step=205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]   Epoch 10:  30%|███       | 24/80 [02:46<06:13,  6.66s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000116, train/loss_step=0.017, global_step=205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  30%|███       | 24/80 [02:46<06:13,  6.66s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.31e-5, train/loss_step=0.00422, global_step=205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  31%|███▏      | 25/80 [02:50<05:59,  6.54s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=2.31e-5, train/loss_step=0.00422, global_step=205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  31%|███▏      | 25/80 [02:50<05:59,  6.54s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=0.000324, train/loss_step=0.00541, global_step=206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  32%|███▎      | 26/80 [02:50<05:41,  6.32s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=0.000324, train/loss_step=0.00541, global_step=206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  32%|███▎      | 26/80 [02:50<05:41,  6.32s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=1.01e-5, train/loss_step=0.00152, global_step=206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  34%|███▍      | 27/80 [02:51<05:23,  6.11s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=1.01e-5, train/loss_step=0.00152, global_step=206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  34%|███▍      | 27/80 [02:51<05:23,  6.11s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.41e-5, train/loss_step=0.0103, global_step=206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  35%|███▌      | 28/80 [02:51<05:07,  5.92s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.41e-5, train/loss_step=0.0103, global_step=206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  35%|███▌      | 28/80 [02:51<05:07,  5.92s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=0.000217, train/loss_step=0.00311, global_step=206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  36%|███▋      | 29/80 [02:52<04:52,  5.74s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=0.000217, train/loss_step=0.00311, global_step=206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  36%|███▋      | 29/80 [02:52<04:52,  5.74s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.99e-5, train/loss_step=0.0106, global_step=207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]   Epoch 10:  38%|███▊      | 30/80 [02:52<04:38,  5.57s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.99e-5, train/loss_step=0.0106, global_step=207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  38%|███▊      | 30/80 [02:52<04:38,  5.57s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=6.84e-6, train/loss_step=0.00133, global_step=207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  39%|███▉      | 31/80 [02:53<04:25,  5.41s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=6.84e-6, train/loss_step=0.00133, global_step=207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  39%|███▉      | 31/80 [02:53<04:25,  5.41s/it, loss=0.00681, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.53e-5, train/loss_step=0.00188, global_step=207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  40%|████      | 32/80 [03:24<04:57,  6.21s/it, loss=0.00681, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=1.53e-5, train/loss_step=0.00188, global_step=207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  40%|████      | 32/80 [03:24<04:57,  6.21s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=3.79e-6, train/loss_step=0.000763, global_step=207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=3.79e-6, train/loss_step=0.000763, global_step=207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.07e-5, train/loss_step=0.00175, global_step=208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]   Epoch 10:  42%|████▎     | 34/80 [03:35<04:43,  6.17s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.07e-5, train/loss_step=0.00175, global_step=208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  42%|████▎     | 34/80 [03:35<04:43,  6.17s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=0.000252, train/loss_step=0.0225, global_step=208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  44%|████▍     | 35/80 [03:36<04:30,  6.01s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=0.000252, train/loss_step=0.0225, global_step=208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  44%|████▍     | 35/80 [03:36<04:30,  6.01s/it, loss=0.00719, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.86e-5, train/loss_step=0.00204, global_step=208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  45%|████▌     | 36/80 [03:37<04:18,  5.87s/it, loss=0.00719, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.86e-5, train/loss_step=0.00204, global_step=208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  45%|████▌     | 36/80 [03:37<04:18,  5.87s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=9.64e-6, train/loss_step=0.00201, global_step=208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  46%|████▋     | 37/80 [03:37<04:06,  5.73s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=9.64e-6, train/loss_step=0.00201, global_step=208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  46%|████▋     | 37/80 [03:37<04:06,  5.73s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=7.57e-5, train/loss_step=0.0133, global_step=209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  48%|████▊     | 38/80 [03:38<03:54,  5.59s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=7.57e-5, train/loss_step=0.0133, global_step=209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  48%|████▊     | 38/80 [03:38<03:54,  5.59s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=2.91e-6, train/loss_step=0.000802, global_step=209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  49%|████▉     | 39/80 [03:38<03:44,  5.46s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=2.91e-6, train/loss_step=0.000802, global_step=209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  49%|████▉     | 39/80 [03:38<03:44,  5.46s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.03e-5, train/loss_step=0.00235, global_step=209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  50%|█████     | 40/80 [04:03<03:58,  5.95s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.03e-5, train/loss_step=0.00235, global_step=209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  50%|█████     | 40/80 [04:03<03:58,  5.95s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=0.0031, train/loss_step=0.00662, global_step=209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  51%|█████▏    | 41/80 [04:17<03:59,  6.14s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=0.0031, train/loss_step=0.00662, global_step=209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  51%|█████▏    | 41/80 [04:17<03:59,  6.14s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=2.01e-5, train/loss_step=0.0034, global_step=210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  52%|█████▎    | 42/80 [04:18<03:48,  6.01s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=2.01e-5, train/loss_step=0.0034, global_step=210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  52%|█████▎    | 42/80 [04:18<03:48,  6.01s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=1.51e-5, train/loss_step=0.00418, global_step=210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  54%|█████▍    | 43/80 [04:18<03:37,  5.88s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=1.51e-5, train/loss_step=0.00418, global_step=210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  54%|█████▍    | 43/80 [04:18<03:37,  5.88s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.4e-6, train/loss_step=0.00144, global_step=210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  55%|█████▌    | 44/80 [04:20<03:28,  5.79s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.4e-6, train/loss_step=0.00144, global_step=210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  55%|█████▌    | 44/80 [04:20<03:28,  5.79s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.84e-6, train/loss_step=0.00118, global_step=210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  56%|█████▋    | 45/80 [04:20<03:18,  5.67s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.84e-6, train/loss_step=0.00118, global_step=210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  56%|█████▋    | 45/80 [04:20<03:18,  5.67s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000856, train/loss_vlb_step=3.79e-6, train/loss_step=0.000856, global_step=211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  57%|█████▊    | 46/80 [04:21<03:09,  5.56s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000856, train/loss_vlb_step=3.79e-6, train/loss_step=0.000856, global_step=211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  57%|█████▊    | 46/80 [04:21<03:09,  5.56s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.5e-5, train/loss_step=0.00821, global_step=211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  59%|█████▉    | 47/80 [04:21<03:00,  5.46s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.5e-5, train/loss_step=0.00821, global_step=211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  59%|█████▉    | 47/80 [04:21<03:00,  5.46s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.00749, train/loss_step=0.0403, global_step=211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  60%|██████    | 48/80 [04:47<03:07,  5.86s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.0403, train/loss_vlb_step=0.00749, train/loss_step=0.0403, global_step=211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  60%|██████    | 48/80 [04:47<03:07,  5.86s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000175, train/loss_step=0.0155, global_step=211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  61%|██████▏   | 49/80 [05:07<03:10,  6.16s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000175, train/loss_step=0.0155, global_step=211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  61%|██████▏   | 49/80 [05:07<03:10,  6.16s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=2.32e-5, train/loss_step=0.00647, global_step=212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  62%|██████▎   | 50/80 [05:08<03:01,  6.04s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=2.32e-5, train/loss_step=0.00647, global_step=212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  62%|██████▎   | 50/80 [05:08<03:01,  6.04s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=6.36e-6, train/loss_step=0.0013, global_step=212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  64%|██████▍   | 51/80 [05:08<02:52,  5.94s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=6.36e-6, train/loss_step=0.0013, global_step=212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  64%|██████▍   | 51/80 [05:08<02:52,  5.94s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.91e-5, train/loss_step=0.00409, global_step=212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  65%|██████▌   | 52/80 [05:09<02:43,  5.84s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.91e-5, train/loss_step=0.00409, global_step=212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  65%|██████▌   | 52/80 [05:09<02:43,  5.84s/it, loss=0.00744, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=0.000133, train/loss_step=0.0106, global_step=212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  66%|██████▋   | 53/80 [05:10<02:35,  5.74s/it, loss=0.00744, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=0.000133, train/loss_step=0.0106, global_step=212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  66%|██████▋   | 53/80 [05:10<02:35,  5.74s/it, loss=0.00825, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000174, train/loss_step=0.018, global_step=213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  68%|██████▊   | 54/80 [05:10<02:26,  5.65s/it, loss=0.00825, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000174, train/loss_step=0.018, global_step=213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  68%|██████▊   | 54/80 [05:10<02:26,  5.65s/it, loss=0.0079, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000291, train/loss_step=0.0153, global_step=213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  69%|██████▉   | 55/80 [05:11<02:18,  5.55s/it, loss=0.0079, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000291, train/loss_step=0.0153, global_step=213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  69%|██████▉   | 55/80 [05:11<02:18,  5.55s/it, loss=0.00783, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=2.95e-6, train/loss_step=0.000696, global_step=213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  70%|███████   | 56/80 [05:34<02:20,  5.86s/it, loss=0.00783, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=2.95e-6, train/loss_step=0.000696, global_step=213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  70%|███████   | 56/80 [05:34<02:20,  5.86s/it, loss=0.00824, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=5.57e-5, train/loss_step=0.0102, global_step=213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]    Epoch 10:  71%|███████▏  | 57/80 [05:45<02:17,  5.96s/it, loss=0.00824, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=5.57e-5, train/loss_step=0.0102, global_step=213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  71%|███████▏  | 57/80 [05:45<02:17,  5.96s/it, loss=0.00762, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=3.71e-6, train/loss_step=0.00102, global_step=214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  72%|███████▎  | 58/80 [05:46<02:09,  5.87s/it, loss=0.00762, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=3.71e-6, train/loss_step=0.00102, global_step=214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  72%|███████▎  | 58/80 [05:46<02:09,  5.87s/it, loss=0.00823, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=6.78e-5, train/loss_step=0.0129, global_step=214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  74%|███████▍  | 59/80 [05:46<02:01,  5.78s/it, loss=0.00823, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=6.78e-5, train/loss_step=0.0129, global_step=214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  74%|███████▍  | 59/80 [05:46<02:01,  5.78s/it, loss=0.00884, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000113, train/loss_step=0.0146, global_step=214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  75%|███████▌  | 60/80 [05:47<01:53,  5.69s/it, loss=0.00884, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000113, train/loss_step=0.0146, global_step=214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  75%|███████▌  | 60/80 [05:47<01:53,  5.69s/it, loss=0.00853, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.39e-6, train/loss_step=0.000387, global_step=214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  76%|███████▋  | 61/80 [05:47<01:46,  5.61s/it, loss=0.00853, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.39e-6, train/loss_step=0.000387, global_step=214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  76%|███████▋  | 61/80 [05:47<01:46,  5.61s/it, loss=0.0089, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=6.28e-5, train/loss_step=0.0108, global_step=215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]     Epoch 10:  78%|███████▊  | 62/80 [05:48<01:39,  5.53s/it, loss=0.0089, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=6.28e-5, train/loss_step=0.0108, global_step=215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  78%|███████▊  | 62/80 [05:48<01:39,  5.53s/it, loss=0.00905, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.66e-5, train/loss_step=0.00706, global_step=215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  79%|███████▉  | 63/80 [05:48<01:32,  5.45s/it, loss=0.00905, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.66e-5, train/loss_step=0.00706, global_step=215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  79%|███████▉  | 63/80 [05:48<01:32,  5.45s/it, loss=0.00935, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=2.87e-5, train/loss_step=0.00748, global_step=215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  80%|████████  | 64/80 [06:18<01:33,  5.83s/it, loss=0.00935, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=2.87e-5, train/loss_step=0.00748, global_step=215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  80%|████████  | 64/80 [06:18<01:33,  5.83s/it, loss=0.00969, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.15e-5, train/loss_step=0.00806, global_step=215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  81%|████████▏ | 65/80 [06:22<01:26,  5.79s/it, loss=0.00969, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.15e-5, train/loss_step=0.00806, global_step=215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  81%|████████▏ | 65/80 [06:22<01:26,  5.79s/it, loss=0.00996, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.1e-5, train/loss_step=0.00615, global_step=216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.00996, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.1e-5, train/loss_step=0.00615, global_step=216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=0.000102, train/loss_step=0.0196, global_step=216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  84%|████████▍ | 67/80 [06:23<01:13,  5.64s/it, loss=0.0105, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=0.000102, train/loss_step=0.0196, global_step=216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  84%|████████▍ | 67/80 [06:23<01:13,  5.64s/it, loss=0.00888, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=0.000196, train/loss_step=0.00738, global_step=216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  85%|████████▌ | 68/80 [06:24<01:06,  5.57s/it, loss=0.00888, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=0.000196, train/loss_step=0.00738, global_step=216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  85%|████████▌ | 68/80 [06:24<01:06,  5.57s/it, loss=0.00913, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000167, train/loss_step=0.0205, global_step=216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  86%|████████▋ | 69/80 [06:25<01:00,  5.50s/it, loss=0.00913, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000167, train/loss_step=0.0205, global_step=216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  86%|████████▋ | 69/80 [06:25<01:00,  5.50s/it, loss=0.00887, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=6.45e-6, train/loss_step=0.00134, global_step=217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  88%|████████▊ | 70/80 [06:25<00:54,  5.43s/it, loss=0.00887, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=6.45e-6, train/loss_step=0.00134, global_step=217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  88%|████████▊ | 70/80 [06:25<00:54,  5.43s/it, loss=0.00884, v_num=0, train/loss_simple_step=0.000652, train/loss_vlb_step=3.6e-6, train/loss_step=0.000652, global_step=217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  89%|████████▉ | 71/80 [06:26<00:48,  5.36s/it, loss=0.00884, v_num=0, train/loss_simple_step=0.000652, train/loss_vlb_step=3.6e-6, train/loss_step=0.000652, global_step=217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  89%|████████▉ | 71/80 [06:26<00:48,  5.36s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=9.57e-6, train/loss_step=0.00133, global_step=217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 10:  90%|█████████ | 72/80 [06:49<00:44,  5.60s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=9.57e-6, train/loss_step=0.00133, global_step=217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  90%|█████████ | 72/80 [06:49<00:44,  5.60s/it, loss=0.00828, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=8.34e-6, train/loss_step=0.00215, global_step=217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00828, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=8.34e-6, train/loss_step=0.00215, global_step=217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00746, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=8.37e-6, train/loss_step=0.00164, global_step=218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00746, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=8.37e-6, train/loss_step=0.00164, global_step=218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=0.000137, train/loss_step=0.0052, global_step=218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10:  94%|█████████▍| 75/80 [06:58<00:27,  5.50s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=0.000137, train/loss_step=0.0052, global_step=218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  94%|█████████▍| 75/80 [06:58<00:27,  5.50s/it, loss=0.00708, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=2.87e-5, train/loss_step=0.00324, global_step=218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  95%|█████████▌| 76/80 [07:01<00:21,  5.48s/it, loss=0.00708, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=2.87e-5, train/loss_step=0.00324, global_step=218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  95%|█████████▌| 76/80 [07:01<00:21,  5.48s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=0.000228, train/loss_step=0.00398, global_step=218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  96%|█████████▋| 77/80 [07:03<00:16,  5.42s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=0.000228, train/loss_step=0.00398, global_step=218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  96%|█████████▋| 77/80 [07:03<00:16,  5.42s/it, loss=0.00712, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.87e-5, train/loss_step=0.0079, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]   Epoch 10:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.00712, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.87e-5, train/loss_step=0.0079, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=4.54e-5, train/loss_step=0.00249, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  99%|█████████▉| 79/80 [07:04<00:05,  5.30s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=4.54e-5, train/loss_step=0.00249, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10:  99%|█████████▉| 79/80 [07:04<00:05,  5.30s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=0.000131, train/loss_step=0.0106, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532] Epoch 10: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=0.000131, train/loss_step=0.0106, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 10: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.00703, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.44e-5, train/loss_step=0.013, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Average Epoch time: 424.55 seconds
+Average Peak memory 29565.64MiB
+Epoch 10:   0%|          | 0/80 [00:00<00:00, 4415.06it/s, loss=0.00703, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.44e-5, train/loss_step=0.013, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 11:   0%|          | 0/80 [00:00<00:00, 1940.91it/s, loss=0.00703, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.44e-5, train/loss_step=0.013, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]Epoch 11:   1%|▏         | 1/80 [00:39<26:12, 19.91s/it, loss=0.00703, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.44e-5, train/loss_step=0.013, global_step=219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00532, train/loss_vlb_epoch=0.000144, train/loss_epoch=0.00532]  Epoch 11:   1%|▏         | 1/80 [00:39<26:12, 19.91s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.18e-5, train/loss_step=0.00914, global_step=220.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   2%|▎         | 2/80 [00:43<18:47, 14.45s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=4.18e-5, train/loss_step=0.00914, global_step=220.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   2%|▎         | 2/80 [00:43<18:47, 14.45s/it, loss=0.00682, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.78e-5, train/loss_step=0.00471, global_step=220.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   4%|▍         | 3/80 [00:43<14:04, 10.96s/it, loss=0.00682, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.78e-5, train/loss_step=0.00471, global_step=220.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   4%|▍         | 3/80 [00:43<14:04, 10.96s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000202, train/loss_step=0.014, global_step=220.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]   Epoch 11:   5%|▌         | 4/80 [00:44<11:14,  8.87s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000202, train/loss_step=0.014, global_step=220.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   5%|▌         | 4/80 [00:44<11:14,  8.87s/it, loss=0.0069, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=5.99e-5, train/loss_step=0.00312, global_step=220.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   6%|▋         | 5/80 [00:44<09:21,  7.48s/it, loss=0.0069, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=5.99e-5, train/loss_step=0.00312, global_step=220.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   6%|▋         | 5/80 [00:44<09:21,  7.48s/it, loss=0.00701, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=3.19e-5, train/loss_step=0.0083, global_step=221.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:   8%|▊         | 6/80 [00:45<07:59,  6.48s/it, loss=0.00701, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=3.19e-5, train/loss_step=0.0083, global_step=221.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   8%|▊         | 6/80 [00:45<07:59,  6.48s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.21e-5, train/loss_step=0.00359, global_step=221.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   9%|▉         | 7/80 [00:45<06:58,  5.73s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.21e-5, train/loss_step=0.00359, global_step=221.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:   9%|▉         | 7/80 [00:45<06:58,  5.73s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.52e-5, train/loss_step=0.00218, global_step=221.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  10%|█         | 8/80 [01:27<11:39,  9.71s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.52e-5, train/loss_step=0.00218, global_step=221.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  10%|█         | 8/80 [01:27<11:39,  9.71s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=2.46e-5, train/loss_step=0.00704, global_step=221.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  11%|█▏        | 9/80 [01:27<10:24,  8.79s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=2.46e-5, train/loss_step=0.00704, global_step=221.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  11%|█▏        | 9/80 [01:27<10:24,  8.79s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.07e-5, train/loss_step=0.00613, global_step=222.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  12%|█▎        | 10/80 [01:28<09:22,  8.04s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.07e-5, train/loss_step=0.00613, global_step=222.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  12%|█▎        | 10/80 [01:28<09:22,  8.04s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000165, train/loss_step=0.0154, global_step=222.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:  14%|█▍        | 11/80 [01:28<08:31,  7.41s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000165, train/loss_step=0.0154, global_step=222.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  14%|█▍        | 11/80 [01:28<08:31,  7.41s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.49e-5, train/loss_step=0.00786, global_step=222.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  15%|█▌        | 12/80 [01:29<07:47,  6.88s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.49e-5, train/loss_step=0.00786, global_step=222.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  15%|█▌        | 12/80 [01:29<07:47,  6.88s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=1.69e-5, train/loss_step=0.00454, global_step=222.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:  16%|█▋        | 13/80 [01:30<07:15,  6.50s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=1.69e-5, train/loss_step=0.00454, global_step=222.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  16%|█▋        | 13/80 [01:30<07:15,  6.50s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.05e-6, train/loss_step=0.00155, global_step=223.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  18%|█▊        | 14/80 [01:31<06:42,  6.10s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.05e-6, train/loss_step=0.00155, global_step=223.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  18%|█▊        | 14/80 [01:31<06:42,  6.10s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=4.37e-6, train/loss_step=0.000861, global_step=223.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  19%|█▉        | 15/80 [01:31<06:13,  5.75s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=4.37e-6, train/loss_step=0.000861, global_step=223.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  19%|█▉        | 15/80 [01:31<06:13,  5.75s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=4.05e-6, train/loss_step=0.000697, global_step=223.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  20%|██        | 16/80 [02:09<08:07,  7.62s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=4.05e-6, train/loss_step=0.000697, global_step=223.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  20%|██        | 16/80 [02:09<08:07,  7.62s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=1.4e-5, train/loss_step=0.004, global_step=223.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]       Epoch 11:  21%|██▏       | 17/80 [02:10<07:35,  7.23s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=1.4e-5, train/loss_step=0.004, global_step=223.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  21%|██▏       | 17/80 [02:10<07:35,  7.23s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.94e-5, train/loss_step=0.00203, global_step=224.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  22%|██▎       | 18/80 [02:10<07:06,  6.87s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=1.94e-5, train/loss_step=0.00203, global_step=224.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  22%|██▎       | 18/80 [02:10<07:06,  6.87s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=8.89e-5, train/loss_step=0.00226, global_step=224.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  24%|██▍       | 19/80 [02:11<06:39,  6.56s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=8.89e-5, train/loss_step=0.00226, global_step=224.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  24%|██▍       | 19/80 [02:11<06:39,  6.56s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000175, train/loss_step=0.0159, global_step=224.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:  25%|██▌       | 20/80 [02:11<06:16,  6.27s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000175, train/loss_step=0.0159, global_step=224.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  25%|██▌       | 20/80 [02:11<06:16,  6.27s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=9.57e-6, train/loss_step=0.0023, global_step=224.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:  26%|██▋       | 21/80 [02:12<05:54,  6.01s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=9.57e-6, train/loss_step=0.0023, global_step=224.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  26%|██▋       | 21/80 [02:12<05:54,  6.01s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=2.88e-5, train/loss_step=0.0078, global_step=225.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  28%|██▊       | 22/80 [02:12<05:34,  5.77s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=2.88e-5, train/loss_step=0.0078, global_step=225.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  28%|██▊       | 22/80 [02:12<05:34,  5.77s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.52e-5, train/loss_step=0.00348, global_step=225.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  29%|██▉       | 23/80 [02:13<05:16,  5.55s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.52e-5, train/loss_step=0.00348, global_step=225.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  29%|██▉       | 23/80 [02:13<05:16,  5.55s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=5.22e-6, train/loss_step=0.0013, global_step=225.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]  Epoch 11:  30%|███       | 24/80 [02:55<06:32,  7.02s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=5.22e-6, train/loss_step=0.0013, global_step=225.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  30%|███       | 24/80 [02:55<06:32,  7.02s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.32e-5, train/loss_step=0.00395, global_step=225.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  31%|███▏      | 25/80 [02:55<06:12,  6.77s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.32e-5, train/loss_step=0.00395, global_step=225.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  31%|███▏      | 25/80 [02:55<06:12,  6.77s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.12e-5, train/loss_step=0.00966, global_step=226.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  32%|███▎      | 26/80 [02:56<05:52,  6.53s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.12e-5, train/loss_step=0.00966, global_step=226.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  32%|███▎      | 26/80 [02:56<05:52,  6.53s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=3.68e-5, train/loss_step=0.00296, global_step=226.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:  34%|███▍      | 27/80 [02:56<05:34,  6.32s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=3.68e-5, train/loss_step=0.00296, global_step=226.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  34%|███▍      | 27/80 [02:56<05:34,  6.32s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000804, train/loss_vlb_step=5.45e-6, train/loss_step=0.000804, global_step=226.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  35%|███▌      | 28/80 [02:57<05:18,  6.12s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000804, train/loss_vlb_step=5.45e-6, train/loss_step=0.000804, global_step=226.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  35%|███▌      | 28/80 [02:57<05:18,  6.12s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=1.61e-5, train/loss_step=0.0044, global_step=226.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]     Epoch 11:  36%|███▋      | 29/80 [02:58<05:02,  5.94s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=1.61e-5, train/loss_step=0.0044, global_step=226.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  36%|███▋      | 29/80 [02:58<05:02,  5.94s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.56e-5, train/loss_step=0.00272, global_step=227.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  38%|███▊      | 30/80 [03:01<04:52,  5.84s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.56e-5, train/loss_step=0.00272, global_step=227.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  38%|███▊      | 30/80 [03:01<04:52,  5.84s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=6.75e-5, train/loss_step=0.0111, global_step=227.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]  Epoch 11:  39%|███▉      | 31/80 [03:01<04:38,  5.68s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=6.75e-5, train/loss_step=0.0111, global_step=227.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  39%|███▉      | 31/80 [03:01<04:38,  5.68s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.43e-5, train/loss_step=0.00459, global_step=227.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  40%|████      | 32/80 [03:27<05:02,  6.29s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=2.43e-5, train/loss_step=0.00459, global_step=227.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  40%|████      | 32/80 [03:27<05:02,  6.30s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.55e-6, train/loss_step=0.00147, global_step=227.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  41%|████▏     | 33/80 [03:28<04:48,  6.13s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.55e-6, train/loss_step=0.00147, global_step=227.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  41%|████▏     | 33/80 [03:28<04:48,  6.13s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=4e-6, train/loss_step=0.000883, global_step=228.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:  42%|████▎     | 34/80 [03:29<04:34,  5.97s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=4e-6, train/loss_step=0.000883, global_step=228.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  42%|████▎     | 34/80 [03:29<04:34,  5.97s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.57e-5, train/loss_step=0.00156, global_step=228.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  44%|████▍     | 35/80 [03:29<04:21,  5.82s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.57e-5, train/loss_step=0.00156, global_step=228.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  44%|████▍     | 35/80 [03:29<04:21,  5.82s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=1.99e-6, train/loss_step=0.000533, global_step=228.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  45%|████▌     | 36/80 [03:30<04:10,  5.69s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=1.99e-6, train/loss_step=0.000533, global_step=228.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  45%|████▌     | 36/80 [03:30<04:10,  5.69s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000716, train/loss_vlb_step=3.07e-6, train/loss_step=0.000716, global_step=228.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  46%|████▋     | 37/80 [03:34<04:03,  5.66s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000716, train/loss_vlb_step=3.07e-6, train/loss_step=0.000716, global_step=228.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  46%|████▋     | 37/80 [03:34<04:03,  5.66s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=6.7e-5, train/loss_step=0.00246, global_step=229.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]   Epoch 11:  48%|████▊     | 38/80 [03:35<03:52,  5.52s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=6.7e-5, train/loss_step=0.00246, global_step=229.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  48%|████▊     | 38/80 [03:35<03:52,  5.52s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=6.68e-6, train/loss_step=0.00183, global_step=229.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  49%|████▉     | 39/80 [03:35<03:41,  5.40s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=6.68e-6, train/loss_step=0.00183, global_step=229.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  49%|████▉     | 39/80 [03:35<03:41,  5.40s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.02e-5, train/loss_step=0.00929, global_step=229.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  50%|█████     | 40/80 [04:10<04:03,  6.10s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00929, train/loss_vlb_step=4.02e-5, train/loss_step=0.00929, global_step=229.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  50%|█████     | 40/80 [04:10<04:03,  6.10s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.19e-5, train/loss_step=0.00345, global_step=229.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.19e-5, train/loss_step=0.00345, global_step=229.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=2.55e-6, train/loss_step=0.000643, global_step=230.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  52%|█████▎    | 42/80 [04:11<03:41,  5.84s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=2.55e-6, train/loss_step=0.000643, global_step=230.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  52%|█████▎    | 42/80 [04:11<03:41,  5.84s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.43e-6, train/loss_step=0.00133, global_step=230.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]  Epoch 11:  54%|█████▍    | 43/80 [04:11<03:31,  5.72s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.43e-6, train/loss_step=0.00133, global_step=230.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  54%|█████▍    | 43/80 [04:11<03:31,  5.72s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=0.00019, train/loss_step=0.00343, global_step=230.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  55%|█████▌    | 44/80 [04:12<03:21,  5.60s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=0.00019, train/loss_step=0.00343, global_step=230.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  55%|█████▌    | 44/80 [04:12<03:21,  5.60s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=0.000196, train/loss_step=0.0202, global_step=230.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]  Epoch 11:  56%|█████▋    | 45/80 [04:19<03:17,  5.64s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=0.000196, train/loss_step=0.0202, global_step=230.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  56%|█████▋    | 45/80 [04:19<03:17,  5.64s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000316, train/loss_step=0.0248, global_step=231.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  57%|█████▊    | 46/80 [04:19<03:08,  5.53s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000316, train/loss_step=0.0248, global_step=231.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  57%|█████▊    | 46/80 [04:19<03:08,  5.53s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.3e-5, train/loss_step=0.00174, global_step=231.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  59%|█████▉    | 47/80 [04:20<02:59,  5.42s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.3e-5, train/loss_step=0.00174, global_step=231.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  59%|█████▉    | 47/80 [04:20<02:59,  5.42s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000943, train/loss_vlb_step=1.28e-5, train/loss_step=0.000943, global_step=231.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  60%|██████    | 48/80 [04:51<03:10,  5.94s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000943, train/loss_vlb_step=1.28e-5, train/loss_step=0.000943, global_step=231.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  60%|██████    | 48/80 [04:51<03:10,  5.94s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=9.61e-5, train/loss_step=0.0136, global_step=231.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]   Epoch 11:  61%|██████▏   | 49/80 [04:55<03:03,  5.91s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=9.61e-5, train/loss_step=0.0136, global_step=231.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  61%|██████▏   | 49/80 [04:55<03:03,  5.91s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=1.54e-6, train/loss_step=0.000425, global_step=232.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  62%|██████▎   | 50/80 [04:56<02:54,  5.80s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=1.54e-6, train/loss_step=0.000425, global_step=232.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  62%|██████▎   | 50/80 [04:56<02:54,  5.80s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=5.82e-6, train/loss_step=0.00112, global_step=232.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]  Epoch 11:  64%|██████▍   | 51/80 [04:56<02:45,  5.70s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=5.82e-6, train/loss_step=0.00112, global_step=232.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  64%|██████▍   | 51/80 [04:56<02:45,  5.70s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=3.7e-5, train/loss_step=0.00192, global_step=232.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:  65%|██████▌   | 52/80 [04:57<02:37,  5.61s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=3.7e-5, train/loss_step=0.00192, global_step=232.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  65%|██████▌   | 52/80 [04:57<02:37,  5.61s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.23e-5, train/loss_step=0.00186, global_step=232.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  66%|██████▋   | 53/80 [05:05<02:32,  5.65s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.23e-5, train/loss_step=0.00186, global_step=232.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  66%|██████▋   | 53/80 [05:05<02:32,  5.65s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.11e-5, train/loss_step=0.00304, global_step=233.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  68%|██████▊   | 54/80 [05:05<02:24,  5.56s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.11e-5, train/loss_step=0.00304, global_step=233.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  68%|██████▊   | 54/80 [05:05<02:24,  5.56s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.29e-5, train/loss_step=0.00373, global_step=233.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  69%|██████▉   | 55/80 [05:06<02:16,  5.47s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.29e-5, train/loss_step=0.00373, global_step=233.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  69%|██████▉   | 55/80 [05:06<02:16,  5.47s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000986, train/loss_vlb_step=6.77e-6, train/loss_step=0.000986, global_step=233.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  70%|███████   | 56/80 [05:43<02:24,  6.03s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000986, train/loss_vlb_step=6.77e-6, train/loss_step=0.000986, global_step=233.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  70%|███████   | 56/80 [05:43<02:24,  6.03s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=3.44e-6, train/loss_step=0.000735, global_step=233.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  71%|███████▏  | 57/80 [05:44<02:16,  5.94s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=3.44e-6, train/loss_step=0.000735, global_step=233.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  71%|███████▏  | 57/80 [05:44<02:16,  5.94s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=2.16e-5, train/loss_step=0.00194, global_step=234.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]  Epoch 11:  72%|███████▎  | 58/80 [05:44<02:08,  5.84s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=2.16e-5, train/loss_step=0.00194, global_step=234.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  72%|███████▎  | 58/80 [05:44<02:08,  5.84s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=5.14e-5, train/loss_step=0.00221, global_step=234.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  74%|███████▍  | 59/80 [05:45<02:00,  5.75s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=5.14e-5, train/loss_step=0.00221, global_step=234.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  74%|███████▍  | 59/80 [05:45<02:00,  5.75s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000144, train/loss_step=0.0127, global_step=234.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:  75%|███████▌  | 60/80 [05:45<01:53,  5.67s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000144, train/loss_step=0.0127, global_step=234.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  75%|███████▌  | 60/80 [05:45<01:53,  5.67s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000899, train/loss_vlb_step=4.06e-6, train/loss_step=0.000899, global_step=234.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  76%|███████▋  | 61/80 [05:52<01:48,  5.69s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000899, train/loss_vlb_step=4.06e-6, train/loss_step=0.000899, global_step=234.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  76%|███████▋  | 61/80 [05:52<01:48,  5.69s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=7.19e-5, train/loss_step=0.0114, global_step=235.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]    Epoch 11:  78%|███████▊  | 62/80 [05:53<01:40,  5.61s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=7.19e-5, train/loss_step=0.0114, global_step=235.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  78%|███████▊  | 62/80 [05:53<01:40,  5.61s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.53e-5, train/loss_step=0.00433, global_step=235.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  79%|███████▉  | 63/80 [05:53<01:34,  5.53s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.53e-5, train/loss_step=0.00433, global_step=235.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  79%|███████▉  | 63/80 [05:53<01:34,  5.53s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.72e-6, train/loss_step=0.00105, global_step=235.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  80%|████████  | 64/80 [06:22<01:34,  5.89s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.72e-6, train/loss_step=0.00105, global_step=235.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  80%|████████  | 64/80 [06:22<01:34,  5.89s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.45e-5, train/loss_step=0.00716, global_step=235.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.45e-5, train/loss_step=0.00716, global_step=235.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=3.33e-6, train/loss_step=0.000737, global_step=236.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=3.33e-6, train/loss_step=0.000737, global_step=236.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=2.3e-5, train/loss_step=0.00309, global_step=236.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]    Epoch 11:  84%|████████▍ | 67/80 [06:24<01:13,  5.65s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=2.3e-5, train/loss_step=0.00309, global_step=236.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  84%|████████▍ | 67/80 [06:24<01:13,  5.65s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=9.21e-6, train/loss_step=0.00115, global_step=236.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  85%|████████▌ | 68/80 [06:24<01:06,  5.58s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=9.21e-6, train/loss_step=0.00115, global_step=236.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  85%|████████▌ | 68/80 [06:24<01:06,  5.58s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.04e-5, train/loss_step=0.00255, global_step=236.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  86%|████████▋ | 69/80 [06:32<01:01,  5.61s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.04e-5, train/loss_step=0.00255, global_step=236.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  86%|████████▋ | 69/80 [06:32<01:01,  5.61s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=8.03e-6, train/loss_step=0.00074, global_step=237.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=8.03e-6, train/loss_step=0.00074, global_step=237.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.16e-5, train/loss_step=0.00588, global_step=237.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  89%|████████▉ | 71/80 [06:33<00:49,  5.47s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.16e-5, train/loss_step=0.00588, global_step=237.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  89%|████████▉ | 71/80 [06:33<00:49,  5.47s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=0.00357, train/loss_step=0.00786, global_step=237.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  90%|█████████ | 72/80 [06:59<00:45,  5.75s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=0.00357, train/loss_step=0.00786, global_step=237.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  90%|█████████ | 72/80 [06:59<00:45,  5.75s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=2.82e-6, train/loss_step=0.000718, global_step=237.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  91%|█████████▏| 73/80 [06:59<00:39,  5.68s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=2.82e-6, train/loss_step=0.000718, global_step=237.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  91%|█████████▏| 73/80 [06:59<00:39,  5.68s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000117, train/loss_step=0.0134, global_step=238.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]   Epoch 11:  92%|█████████▎| 74/80 [07:00<00:33,  5.61s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000117, train/loss_step=0.0134, global_step=238.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  92%|█████████▎| 74/80 [07:00<00:33,  5.61s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=3.94e-5, train/loss_step=0.0115, global_step=238.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055] Epoch 11:  94%|█████████▍| 75/80 [07:00<00:27,  5.54s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=3.94e-5, train/loss_step=0.0115, global_step=238.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  94%|█████████▍| 75/80 [07:00<00:27,  5.54s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2e-5, train/loss_step=0.00577, global_step=238.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]  Epoch 11:  95%|█████████▌| 76/80 [07:01<00:21,  5.47s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2e-5, train/loss_step=0.00577, global_step=238.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  95%|█████████▌| 76/80 [07:01<00:21,  5.47s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=2.79e-6, train/loss_step=0.000711, global_step=238.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  96%|█████████▋| 77/80 [07:11<00:16,  5.54s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=2.79e-6, train/loss_step=0.000711, global_step=238.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  96%|█████████▋| 77/80 [07:11<00:16,  5.54s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=0.00033, train/loss_step=0.0162, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]    Epoch 11:  98%|█████████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=0.00033, train/loss_step=0.0162, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  98%|█████████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=2.29e-5, train/loss_step=0.00243, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=2.29e-5, train/loss_step=0.00243, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=6.25e-5, train/loss_step=0.0101, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]  Epoch 11: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=6.25e-5, train/loss_step=0.0101, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 11: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000535, train/loss_vlb_step=2.09e-6, train/loss_step=0.000535, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Average Epoch time: 433.21 seconds
+Average Peak memory 29567.95MiB
+Epoch 11:   0%|          | 0/80 [00:00<00:00, 6269.51it/s, loss=0.00537, v_num=0, train/loss_simple_step=0.000535, train/loss_vlb_step=2.09e-6, train/loss_step=0.000535, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 12:   0%|          | 0/80 [00:00<00:00, 2478.90it/s, loss=0.00537, v_num=0, train/loss_simple_step=0.000535, train/loss_vlb_step=2.09e-6, train/loss_step=0.000535, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]Epoch 12:   1%|▏         | 1/80 [00:40<26:30, 20.14s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000535, train/loss_vlb_step=2.09e-6, train/loss_step=0.000535, global_step=239.0, lr_abs=0.0001, train/loss_simple_epoch=0.0055, train/loss_vlb_epoch=0.000206, train/loss_epoch=0.0055]  Epoch 12:   1%|▏         | 1/80 [00:40<26:30, 20.14s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=2.76e-5, train/loss_step=0.00737, global_step=240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:   2%|▎         | 2/80 [00:40<17:39, 13.59s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=2.76e-5, train/loss_step=0.00737, global_step=240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:   2%|▎         | 2/80 [00:40<17:39, 13.59s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.34e-6, train/loss_step=0.00101, global_step=240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:   4%|▍         | 3/80 [00:41<13:14, 10.31s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.34e-6, train/loss_step=0.00101, global_step=240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:   4%|▍         | 3/80 [00:41<13:14, 10.31s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.81e-6, train/loss_step=0.00154, global_step=240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:   5%|▌         | 4/80 [00:41<10:35,  8.36s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.81e-6, train/loss_step=0.00154, global_step=240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:   5%|▌         | 4/80 [00:41<10:35,  8.36s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=0.000241, train/loss_step=0.0128, global_step=240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475] Epoch 12:   6%|▋         | 5/80 [00:44<09:11,  7.35s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=0.000241, train/loss_step=0.0128, global_step=240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:   6%|▋         | 5/80 [00:44<09:11,  7.35s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=1.51e-5, train/loss_step=0.00403, global_step=241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:   8%|▊         | 6/80 [00:44<07:51,  6.37s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=1.51e-5, train/loss_step=0.00403, global_step=241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:   8%|▊         | 6/80 [00:44<07:51,  6.37s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.82e-5, train/loss_step=0.0021, global_step=241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:   9%|▉         | 7/80 [00:51<07:47,  6.41s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.82e-5, train/loss_step=0.0021, global_step=241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:   9%|▉         | 7/80 [00:51<07:47,  6.41s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=6.76e-6, train/loss_step=0.00117, global_step=241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  10%|█         | 8/80 [01:30<12:00, 10.01s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=6.76e-6, train/loss_step=0.00117, global_step=241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  10%|█         | 8/80 [01:30<12:00, 10.01s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=2.39e-5, train/loss_step=0.0031, global_step=241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:  11%|█▏        | 9/80 [01:30<10:42,  9.06s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=2.39e-5, train/loss_step=0.0031, global_step=241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  11%|█▏        | 9/80 [01:30<10:42,  9.06s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.78e-6, train/loss_step=0.000416, global_step=242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  12%|█▎        | 10/80 [01:31<09:39,  8.28s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.78e-6, train/loss_step=0.000416, global_step=242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  12%|█▎        | 10/80 [01:31<09:39,  8.28s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000818, train/loss_vlb_step=3.41e-6, train/loss_step=0.000818, global_step=242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  14%|█▍        | 11/80 [01:31<08:46,  7.63s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000818, train/loss_vlb_step=3.41e-6, train/loss_step=0.000818, global_step=242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  14%|█▍        | 11/80 [01:31<08:46,  7.63s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.28e-5, train/loss_step=0.00193, global_step=242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:  15%|█▌        | 12/80 [01:32<08:01,  7.08s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.28e-5, train/loss_step=0.00193, global_step=242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  15%|█▌        | 12/80 [01:32<08:01,  7.08s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=7.69e-5, train/loss_step=0.00322, global_step=242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  16%|█▋        | 13/80 [01:32<07:23,  6.61s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=7.69e-5, train/loss_step=0.00322, global_step=242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  16%|█▋        | 13/80 [01:32<07:23,  6.61s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=1.89e-5, train/loss_step=0.00547, global_step=243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  18%|█▊        | 14/80 [01:33<06:49,  6.20s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=1.89e-5, train/loss_step=0.00547, global_step=243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  18%|█▊        | 14/80 [01:33<06:49,  6.20s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000871, train/loss_vlb_step=4.51e-6, train/loss_step=0.000871, global_step=243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  19%|█▉        | 15/80 [01:33<06:20,  5.85s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000871, train/loss_vlb_step=4.51e-6, train/loss_step=0.000871, global_step=243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  19%|█▉        | 15/80 [01:33<06:20,  5.85s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=2.9e-5, train/loss_step=0.0072, global_step=243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]     Epoch 12:  20%|██        | 16/80 [02:15<08:31,  7.99s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=2.9e-5, train/loss_step=0.0072, global_step=243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  20%|██        | 16/80 [02:15<08:31,  7.99s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=6.63e-6, train/loss_step=0.00123, global_step=243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  21%|██▏       | 17/80 [02:16<07:57,  7.57s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=6.63e-6, train/loss_step=0.00123, global_step=243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  21%|██▏       | 17/80 [02:16<07:57,  7.57s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000837, train/loss_vlb_step=3.81e-6, train/loss_step=0.000837, global_step=244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  22%|██▎       | 18/80 [02:16<07:26,  7.20s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000837, train/loss_vlb_step=3.81e-6, train/loss_step=0.000837, global_step=244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  22%|██▎       | 18/80 [02:16<07:26,  7.20s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=0.000127, train/loss_step=0.0129, global_step=244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]   Epoch 12:  24%|██▍       | 19/80 [02:17<06:58,  6.87s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=0.000127, train/loss_step=0.0129, global_step=244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  24%|██▍       | 19/80 [02:17<06:58,  6.87s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.24e-5, train/loss_step=0.00294, global_step=244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  25%|██▌       | 20/80 [02:17<06:34,  6.57s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.24e-5, train/loss_step=0.00294, global_step=244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  25%|██▌       | 20/80 [02:17<06:34,  6.57s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=1.37e-5, train/loss_step=0.00136, global_step=244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  26%|██▋       | 21/80 [02:18<06:11,  6.29s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=1.37e-5, train/loss_step=0.00136, global_step=244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  26%|██▋       | 21/80 [02:18<06:11,  6.29s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=0.000212, train/loss_step=0.020, global_step=245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]   Epoch 12:  28%|██▊       | 22/80 [02:18<05:50,  6.04s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=0.000212, train/loss_step=0.020, global_step=245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  28%|██▊       | 22/80 [02:18<05:50,  6.04s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=9.17e-6, train/loss_step=0.0024, global_step=245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  29%|██▉       | 23/80 [02:19<05:31,  5.81s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=9.17e-6, train/loss_step=0.0024, global_step=245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  29%|██▉       | 23/80 [02:19<05:31,  5.81s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=4.24e-5, train/loss_step=0.0125, global_step=245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  30%|███       | 24/80 [02:53<06:27,  6.93s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=4.24e-5, train/loss_step=0.0125, global_step=245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  30%|███       | 24/80 [02:53<06:27,  6.93s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000604, train/loss_step=0.0133, global_step=245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  31%|███▏      | 25/80 [02:56<06:14,  6.80s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000604, train/loss_step=0.0133, global_step=245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  31%|███▏      | 25/80 [02:56<06:14,  6.80s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=2.45e-5, train/loss_step=0.00197, global_step=246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  32%|███▎      | 26/80 [02:57<05:54,  6.57s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=2.45e-5, train/loss_step=0.00197, global_step=246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  32%|███▎      | 26/80 [02:57<05:54,  6.57s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=0.000151, train/loss_step=0.00652, global_step=246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  34%|███▍      | 27/80 [02:57<05:36,  6.35s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=0.000151, train/loss_step=0.00652, global_step=246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  34%|███▍      | 27/80 [02:57<05:36,  6.35s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=2.25e-5, train/loss_step=0.00225, global_step=246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475] Epoch 12:  35%|███▌      | 28/80 [02:58<05:19,  6.15s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=2.25e-5, train/loss_step=0.00225, global_step=246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  35%|███▌      | 28/80 [02:58<05:19,  6.15s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=6.46e-5, train/loss_step=0.00974, global_step=246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  36%|███▋      | 29/80 [02:58<05:04,  5.96s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00974, train/loss_vlb_step=6.46e-5, train/loss_step=0.00974, global_step=246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  36%|███▋      | 29/80 [02:58<05:04,  5.96s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.000936, train/loss_vlb_step=5.07e-6, train/loss_step=0.000936, global_step=247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  38%|███▊      | 30/80 [02:59<04:49,  5.78s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.000936, train/loss_vlb_step=5.07e-6, train/loss_step=0.000936, global_step=247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  38%|███▊      | 30/80 [02:59<04:49,  5.78s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=3.51e-6, train/loss_step=0.000861, global_step=247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  39%|███▉      | 31/80 [02:59<04:35,  5.62s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=3.51e-6, train/loss_step=0.000861, global_step=247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  39%|███▉      | 31/80 [02:59<04:35,  5.62s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=0.000775, train/loss_step=0.0054, global_step=247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]   Epoch 12:  40%|████      | 32/80 [03:37<05:15,  6.58s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=0.000775, train/loss_step=0.0054, global_step=247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  40%|████      | 32/80 [03:37<05:15,  6.58s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.34e-5, train/loss_step=0.00358, global_step=247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  41%|████▏     | 33/80 [03:40<05:05,  6.49s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00358, train/loss_vlb_step=1.34e-5, train/loss_step=0.00358, global_step=247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  41%|████▏     | 33/80 [03:40<05:05,  6.49s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000941, train/loss_vlb_step=7.99e-6, train/loss_step=0.000941, global_step=248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  42%|████▎     | 34/80 [03:41<04:51,  6.34s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000941, train/loss_vlb_step=7.99e-6, train/loss_step=0.000941, global_step=248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  42%|████▎     | 34/80 [03:41<04:51,  6.34s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.03e-5, train/loss_step=0.0028, global_step=248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]    Epoch 12:  44%|████▍     | 35/80 [03:42<04:37,  6.17s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.03e-5, train/loss_step=0.0028, global_step=248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  44%|████▍     | 35/80 [03:42<04:37,  6.17s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=5.04e-6, train/loss_step=0.00107, global_step=248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  45%|████▌     | 36/80 [03:42<04:24,  6.02s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=5.04e-6, train/loss_step=0.00107, global_step=248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  45%|████▌     | 36/80 [03:42<04:24,  6.02s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.69e-5, train/loss_step=0.00499, global_step=248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  46%|████▋     | 37/80 [03:43<04:12,  5.88s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.69e-5, train/loss_step=0.00499, global_step=248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  46%|████▋     | 37/80 [03:43<04:12,  5.88s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=2.58e-5, train/loss_step=0.00168, global_step=249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  48%|████▊     | 38/80 [03:43<04:01,  5.74s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=2.58e-5, train/loss_step=0.00168, global_step=249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  48%|████▊     | 38/80 [03:43<04:01,  5.74s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=6.99e-5, train/loss_step=0.0117, global_step=249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:  49%|████▉     | 39/80 [03:44<03:49,  5.61s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=6.99e-5, train/loss_step=0.0117, global_step=249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  49%|████▉     | 39/80 [03:44<03:49,  5.61s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=7.37e-6, train/loss_step=0.00205, global_step=249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  50%|█████     | 40/80 [04:12<04:06,  6.15s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=7.37e-6, train/loss_step=0.00205, global_step=249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  50%|█████     | 40/80 [04:12<04:06,  6.15s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=6.15e-6, train/loss_step=0.00113, global_step=249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  51%|█████▏    | 41/80 [04:20<04:02,  6.21s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=6.15e-6, train/loss_step=0.00113, global_step=249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  51%|█████▏    | 41/80 [04:20<04:02,  6.21s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.28e-5, train/loss_step=0.00286, global_step=250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  52%|█████▎    | 42/80 [04:31<03:59,  6.31s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.28e-5, train/loss_step=0.00286, global_step=250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  52%|█████▎    | 42/80 [04:31<03:59,  6.31s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000721, train/loss_vlb_step=3.35e-6, train/loss_step=0.000721, global_step=250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  54%|█████▍    | 43/80 [04:31<03:48,  6.18s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000721, train/loss_vlb_step=3.35e-6, train/loss_step=0.000721, global_step=250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  54%|█████▍    | 43/80 [04:31<03:48,  6.18s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=3.47e-5, train/loss_step=0.0033, global_step=250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]    Epoch 12:  55%|█████▌    | 44/80 [04:32<03:37,  6.05s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=3.47e-5, train/loss_step=0.0033, global_step=250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  55%|█████▌    | 44/80 [04:32<03:37,  6.05s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=0.00255, train/loss_step=0.0103, global_step=250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=0.00255, train/loss_step=0.0103, global_step=250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.14e-5, train/loss_step=0.00564, global_step=251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=2.14e-5, train/loss_step=0.00564, global_step=251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=1.34e-6, train/loss_step=0.000301, global_step=251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=1.34e-6, train/loss_step=0.000301, global_step=251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=1.94e-5, train/loss_step=0.00519, global_step=251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:  60%|██████    | 48/80 [04:57<03:14,  6.07s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=1.94e-5, train/loss_step=0.00519, global_step=251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  60%|██████    | 48/80 [04:57<03:14,  6.07s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=4.67e-5, train/loss_step=0.00267, global_step=251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  61%|██████▏   | 49/80 [05:02<03:07,  6.05s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=4.67e-5, train/loss_step=0.00267, global_step=251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  61%|██████▏   | 49/80 [05:02<03:07,  6.05s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=5.7e-5, train/loss_step=0.0154, global_step=252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]   Epoch 12:  62%|██████▎   | 50/80 [05:14<03:05,  6.17s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=5.7e-5, train/loss_step=0.0154, global_step=252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  62%|██████▎   | 50/80 [05:14<03:05,  6.17s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=4.62e-6, train/loss_step=0.000626, global_step=252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  64%|██████▍   | 51/80 [05:15<02:55,  6.06s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=4.62e-6, train/loss_step=0.000626, global_step=252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  64%|██████▍   | 51/80 [05:15<02:55,  6.06s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.26e-5, train/loss_step=0.0105, global_step=252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]    Epoch 12:  65%|██████▌   | 52/80 [05:15<02:46,  5.96s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.26e-5, train/loss_step=0.0105, global_step=252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  65%|██████▌   | 52/80 [05:15<02:46,  5.96s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=7.24e-6, train/loss_step=0.00174, global_step=252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  66%|██████▋   | 53/80 [05:16<02:38,  5.86s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=7.24e-6, train/loss_step=0.00174, global_step=252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  66%|██████▋   | 53/80 [05:16<02:38,  5.86s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=4.02e-6, train/loss_step=0.000861, global_step=253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  68%|██████▊   | 54/80 [05:16<02:29,  5.76s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=4.02e-6, train/loss_step=0.000861, global_step=253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  68%|██████▊   | 54/80 [05:16<02:29,  5.76s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=8.03e-6, train/loss_step=0.00223, global_step=253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=8.03e-6, train/loss_step=0.00223, global_step=253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000986, train/loss_vlb_step=8.44e-6, train/loss_step=0.000986, global_step=253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  70%|███████   | 56/80 [05:32<02:19,  5.83s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000986, train/loss_vlb_step=8.44e-6, train/loss_step=0.000986, global_step=253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  70%|███████   | 56/80 [05:32<02:19,  5.83s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=1.4e-5, train/loss_step=0.00148, global_step=253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]   Epoch 12:  71%|███████▏  | 57/80 [05:41<02:15,  5.89s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=1.4e-5, train/loss_step=0.00148, global_step=253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  71%|███████▏  | 57/80 [05:41<02:15,  5.89s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.87e-6, train/loss_step=0.0015, global_step=254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475] Epoch 12:  72%|███████▎  | 58/80 [05:52<02:11,  5.97s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.87e-6, train/loss_step=0.0015, global_step=254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  72%|███████▎  | 58/80 [05:52<02:11,  5.97s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=3.59e-5, train/loss_step=0.00244, global_step=254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  74%|███████▍  | 59/80 [05:53<02:03,  5.88s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=3.59e-5, train/loss_step=0.00244, global_step=254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  74%|███████▍  | 59/80 [05:53<02:03,  5.88s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=6.23e-5, train/loss_step=0.00958, global_step=254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  75%|███████▌  | 60/80 [05:53<01:55,  5.80s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=6.23e-5, train/loss_step=0.00958, global_step=254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  75%|███████▌  | 60/80 [05:53<01:55,  5.80s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=4.49e-6, train/loss_step=0.00082, global_step=254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  76%|███████▋  | 61/80 [05:54<01:48,  5.71s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=4.49e-6, train/loss_step=0.00082, global_step=254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  76%|███████▋  | 61/80 [05:54<01:48,  5.71s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=7.66e-6, train/loss_step=0.00195, global_step=255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  78%|███████▊  | 62/80 [05:54<01:41,  5.63s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=7.66e-6, train/loss_step=0.00195, global_step=255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  78%|███████▊  | 62/80 [05:54<01:41,  5.63s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=8.74e-6, train/loss_step=0.00205, global_step=255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  79%|███████▉  | 63/80 [05:55<01:34,  5.55s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=8.74e-6, train/loss_step=0.00205, global_step=255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  79%|███████▉  | 63/80 [05:55<01:34,  5.55s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.51e-5, train/loss_step=0.0103, global_step=255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:  80%|████████  | 64/80 [06:23<01:34,  5.90s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.51e-5, train/loss_step=0.0103, global_step=255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  80%|████████  | 64/80 [06:23<01:34,  5.90s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.58e-6, train/loss_step=0.000333, global_step=255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  81%|████████▏ | 65/80 [06:28<01:28,  5.89s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.58e-6, train/loss_step=0.000333, global_step=255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  81%|████████▏ | 65/80 [06:28<01:28,  5.89s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=2.41e-6, train/loss_step=0.000643, global_step=256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  82%|████████▎ | 66/80 [06:36<01:22,  5.91s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=2.41e-6, train/loss_step=0.000643, global_step=256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  82%|████████▎ | 66/80 [06:36<01:22,  5.91s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=1.76e-5, train/loss_step=0.00521, global_step=256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:  84%|████████▍ | 67/80 [06:36<01:15,  5.83s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=1.76e-5, train/loss_step=0.00521, global_step=256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  84%|████████▍ | 67/80 [06:36<01:15,  5.83s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=1.96e-6, train/loss_step=0.000437, global_step=256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=1.96e-6, train/loss_step=0.000437, global_step=256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=0.0039, train/loss_step=0.00849, global_step=256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]   Epoch 12:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=0.0039, train/loss_step=0.00849, global_step=256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.42e-6, train/loss_step=0.00031, global_step=257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.42e-6, train/loss_step=0.00031, global_step=257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000823, train/loss_vlb_step=4.02e-6, train/loss_step=0.000823, global_step=257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  89%|████████▉ | 71/80 [06:38<00:49,  5.54s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000823, train/loss_vlb_step=4.02e-6, train/loss_step=0.000823, global_step=257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  89%|████████▉ | 71/80 [06:38<00:49,  5.54s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=2.98e-5, train/loss_step=0.00755, global_step=257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:  90%|█████████ | 72/80 [06:57<00:45,  5.71s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=2.98e-5, train/loss_step=0.00755, global_step=257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  90%|█████████ | 72/80 [06:57<00:45,  5.71s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.35e-5, train/loss_step=0.00843, global_step=257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  91%|█████████▏| 73/80 [07:06<00:40,  5.76s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=4.35e-5, train/loss_step=0.00843, global_step=257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  91%|█████████▏| 73/80 [07:06<00:40,  5.76s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=6.84e-6, train/loss_step=0.00116, global_step=258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  92%|█████████▎| 74/80 [07:07<00:34,  5.70s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=6.84e-6, train/loss_step=0.00116, global_step=258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  92%|███��█████▎| 74/80 [07:07<00:34,  5.70s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=6.25e-6, train/loss_step=0.00125, global_step=258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  94%|█████████▍| 75/80 [07:08<00:28,  5.63s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=6.25e-6, train/loss_step=0.00125, global_step=258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  94%|█████████▍| 75/80 [07:08<00:28,  5.63s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.15e-5, train/loss_step=0.0112, global_step=258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 12:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.15e-5, train/loss_step=0.0112, global_step=258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=1.37e-5, train/loss_step=0.00133, global_step=258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=1.37e-5, train/loss_step=0.00133, global_step=258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=3.24e-6, train/loss_step=0.000876, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=3.24e-6, train/loss_step=0.000876, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000144, train/loss_step=0.0151, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]   Epoch 12:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000144, train/loss_step=0.0151, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=3.5e-6, train/loss_step=0.000579, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=3.5e-6, train/loss_step=0.000579, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 12: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=8.33e-6, train/loss_step=0.00246, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475] Average Epoch time: 430.63 seconds
+Average Peak memory 29565.77MiB
+Epoch 12:   0%|          | 0/80 [00:00<00:00, 6061.13it/s, loss=0.00402, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=8.33e-6, train/loss_step=0.00246, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 13:   0%|          | 0/80 [00:00<00:00, 2293.22it/s, loss=0.00402, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=8.33e-6, train/loss_step=0.00246, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]Epoch 13:   1%|▏         | 1/80 [00:48<31:59, 24.30s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=8.33e-6, train/loss_step=0.00246, global_step=259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00475, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00475]  Epoch 13:   1%|▏         | 1/80 [00:48<31:59, 24.30s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=0.000137, train/loss_step=0.00707, global_step=260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   2%|▎         | 2/80 [00:49<21:15, 16.36s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=0.000137, train/loss_step=0.00707, global_step=260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   2%|▎         | 2/80 [00:49<21:15, 16.36s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=3.66e-5, train/loss_step=0.0108, global_step=260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]   Epoch 13:   4%|▍         | 3/80 [00:49<15:54, 12.39s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=3.66e-5, train/loss_step=0.0108, global_step=260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   4%|▍         | 3/80 [00:49<15:54, 12.39s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=2.87e-6, train/loss_step=0.000601, global_step=260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   5%|▌         | 4/80 [00:50<12:41, 10.02s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=2.87e-6, train/loss_step=0.000601, global_step=260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   5%|▌         | 4/80 [00:50<12:41, 10.02s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=3.67e-6, train/loss_step=0.000851, global_step=260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   6%|▋         | 5/80 [00:50<10:32,  8.44s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=3.67e-6, train/loss_step=0.000851, global_step=260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   6%|▋         | 5/80 [00:50<10:32,  8.44s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=1.52e-5, train/loss_step=0.0014, global_step=261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]     Epoch 13:   8%|▊         | 6/80 [00:53<09:22,  7.60s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=1.52e-5, train/loss_step=0.0014, global_step=261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   8%|▊         | 6/80 [00:53<09:22,  7.60s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.79e-5, train/loss_step=0.00359, global_step=261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   9%|▉         | 7/80 [00:53<08:10,  6.71s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.79e-5, train/loss_step=0.00359, global_step=261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:   9%|▉         | 7/80 [00:53<08:10,  6.71s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.94e-5, train/loss_step=0.00144, global_step=261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  10%|█         | 8/80 [01:24<11:15,  9.38s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.94e-5, train/loss_step=0.00144, global_step=261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  10%|█         | 8/80 [01:24<11:15,  9.38s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=4.42e-6, train/loss_step=0.000761, global_step=261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  11%|█▏        | 9/80 [01:29<10:38,  8.99s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=4.42e-6, train/loss_step=0.000761, global_step=261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  11%|█▏        | 9/80 [01:29<10:38,  8.99s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000475, train/loss_vlb_step=1.83e-6, train/loss_step=0.000475, global_step=262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  12%|█▎        | 10/80 [01:30<09:35,  8.22s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000475, train/loss_vlb_step=1.83e-6, train/loss_step=0.000475, global_step=262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  12%|█▎        | 10/80 [01:30<09:35,  8.22s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.93e-5, train/loss_step=0.00499, global_step=262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  14%|█▍        | 11/80 [01:30<08:42,  7.58s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.93e-5, train/loss_step=0.00499, global_step=262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  14%|█▍        | 11/80 [01:30<08:42,  7.58s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=0.000164, train/loss_step=0.0122, global_step=262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481] Epoch 13:  15%|█▌        | 12/80 [01:31<07:58,  7.04s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=0.000164, train/loss_step=0.0122, global_step=262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  15%|█▌        | 12/80 [01:31<07:58,  7.04s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.34e-6, train/loss_step=0.000718, global_step=262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  16%|█▋        | 13/80 [01:31<07:20,  6.57s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.34e-6, train/loss_step=0.000718, global_step=262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  16%|█▋        | 13/80 [01:31<07:20,  6.57s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=0.000283, train/loss_step=0.00568, global_step=263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481] Epoch 13:  18%|█▊        | 14/80 [01:32<06:46,  6.17s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=0.000283, train/loss_step=0.00568, global_step=263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  18%|█▊        | 14/80 [01:32<06:46,  6.17s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=2.25e-6, train/loss_step=0.000514, global_step=263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  19%|█▉        | 15/80 [01:32<06:17,  5.81s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=2.25e-6, train/loss_step=0.000514, global_step=263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  19%|█▉        | 15/80 [01:32<06:17,  5.81s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=5.08e-6, train/loss_step=0.000945, global_step=263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  20%|██        | 16/80 [02:02<07:40,  7.19s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=5.08e-6, train/loss_step=0.000945, global_step=263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  20%|██        | 16/80 [02:02<07:40,  7.19s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=4.16e-6, train/loss_step=0.000733, global_step=263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  21%|██▏       | 17/80 [02:24<08:25,  8.02s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=4.16e-6, train/loss_step=0.000733, global_step=263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  21%|██▏       | 17/80 [02:24<08:25,  8.02s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.09e-5, train/loss_step=0.00591, global_step=264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  22%|██▎       | 18/80 [02:24<07:52,  7.63s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.09e-5, train/loss_step=0.00591, global_step=264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  22%|██▎       | 18/80 [02:24<07:52,  7.63s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=0.000266, train/loss_step=0.0214, global_step=264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481] Epoch 13:  24%|██▍       | 19/80 [02:25<07:23,  7.27s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=0.000266, train/loss_step=0.0214, global_step=264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  24%|██▍       | 19/80 [02:25<07:23,  7.27s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=7.97e-5, train/loss_step=0.0137, global_step=264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481] Epoch 13:  25%|██▌       | 20/80 [02:25<06:56,  6.95s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=7.97e-5, train/loss_step=0.0137, global_step=264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  25%|██▌       | 20/80 [02:25<06:56,  6.95s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=9.15e-6, train/loss_step=0.0014, global_step=264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  26%|██▋       | 21/80 [02:26<06:32,  6.66s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=9.15e-6, train/loss_step=0.0014, global_step=264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  26%|██▋       | 21/80 [02:26<06:32,  6.66s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=1.97e-6, train/loss_step=0.000511, global_step=265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  28%|██▊       | 22/80 [02:26<06:10,  6.39s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=1.97e-6, train/loss_step=0.000511, global_step=265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  28%|██▊       | 22/80 [02:26<06:10,  6.39s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=3.49e-5, train/loss_step=0.00941, global_step=265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  29%|██▉       | 23/80 [02:27<05:50,  6.14s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=3.49e-5, train/loss_step=0.00941, global_step=265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  29%|██▉       | 23/80 [02:27<05:50,  6.14s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=2.22e-6, train/loss_step=0.000521, global_step=265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  30%|███       | 24/80 [02:49<06:18,  6.76s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=2.22e-6, train/loss_step=0.000521, global_step=265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  30%|███       | 24/80 [02:49<06:18,  6.76s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=3.81e-6, train/loss_step=0.000747, global_step=265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  31%|███▏      | 25/80 [03:10<06:42,  7.31s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=3.81e-6, train/loss_step=0.000747, global_step=265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  31%|███▏      | 25/80 [03:10<06:42,  7.31s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=5.8e-5, train/loss_step=0.00971, global_step=266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]   Epoch 13:  32%|███▎      | 26/80 [03:10<06:21,  7.06s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=5.8e-5, train/loss_step=0.00971, global_step=266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  32%|███▎      | 26/80 [03:10<06:21,  7.06s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.000603, train/loss_vlb_step=4.92e-6, train/loss_step=0.000603, global_step=266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  34%|███▍      | 27/80 [03:11<06:01,  6.83s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.000603, train/loss_vlb_step=4.92e-6, train/loss_step=0.000603, global_step=266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  34%|███▍      | 27/80 [03:11<06:01,  6.83s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000691, train/loss_vlb_step=3.9e-6, train/loss_step=0.000691, global_step=266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481] Epoch 13:  35%|███▌      | 28/80 [03:11<05:43,  6.61s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000691, train/loss_vlb_step=3.9e-6, train/loss_step=0.000691, global_step=266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  35%|███▌      | 28/80 [03:11<05:43,  6.61s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000835, train/loss_vlb_step=3.96e-6, train/loss_step=0.000835, global_step=266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  36%|███▋      | 29/80 [03:12<05:26,  6.41s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000835, train/loss_vlb_step=3.96e-6, train/loss_step=0.000835, global_step=266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  36%|███▋      | 29/80 [03:12<05:26,  6.41s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.55e-5, train/loss_step=0.00448, global_step=267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  38%|███▊      | 30/80 [03:12<05:10,  6.22s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.55e-5, train/loss_step=0.00448, global_step=267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  38%|███▊      | 30/80 [03:12<05:10,  6.22s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=0.000511, train/loss_step=0.0037, global_step=267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481] Epoch 13:  39%|███▉      | 31/80 [03:13<04:55,  6.04s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=0.000511, train/loss_step=0.0037, global_step=267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  39%|███▉      | 31/80 [03:13<04:55,  6.04s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000543, train/loss_vlb_step=2.51e-6, train/loss_step=0.000543, global_step=267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  40%|████      | 32/80 [03:28<05:03,  6.31s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000543, train/loss_vlb_step=2.51e-6, train/loss_step=0.000543, global_step=267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  40%|████      | 32/80 [03:28<05:03,  6.31s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000906, train/loss_vlb_step=1.68e-5, train/loss_step=0.000906, global_step=267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  41%|████▏     | 33/80 [03:45<05:11,  6.63s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000906, train/loss_vlb_step=1.68e-5, train/loss_step=0.000906, global_step=267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  41%|████▏     | 33/80 [03:45<05:11,  6.63s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=5.48e-6, train/loss_step=0.00122, global_step=268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  42%|████▎     | 34/80 [03:45<04:56,  6.45s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=5.48e-6, train/loss_step=0.00122, global_step=268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  42%|████▎     | 34/80 [03:45<04:56,  6.45s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000914, train/loss_vlb_step=5.12e-6, train/loss_step=0.000914, global_step=268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  44%|████▍     | 35/80 [03:46<04:42,  6.29s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000914, train/loss_vlb_step=5.12e-6, train/loss_step=0.000914, global_step=268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  44%|████▍     | 35/80 [03:46<04:42,  6.29s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.25e-5, train/loss_step=0.00785, global_step=268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  45%|████▌     | 36/80 [03:47<04:30,  6.14s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=3.25e-5, train/loss_step=0.00785, global_step=268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  45%|████▌     | 36/80 [03:47<04:30,  6.14s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=0.000426, train/loss_step=0.00379, global_step=268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  46%|████▋     | 37/80 [03:47<04:17,  5.99s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=0.000426, train/loss_step=0.00379, global_step=268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  46%|████▋     | 37/80 [03:47<04:17,  5.99s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=1.34e-5, train/loss_step=0.0038, global_step=269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]   Epoch 13:  48%|████▊     | 38/80 [03:57<04:16,  6.10s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=1.34e-5, train/loss_step=0.0038, global_step=269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  48%|████▊     | 38/80 [03:57<04:16,  6.10s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=1.53e-6, train/loss_step=0.000374, global_step=269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  49%|████▉     | 39/80 [03:58<04:04,  5.96s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=1.53e-6, train/loss_step=0.000374, global_step=269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  49%|████▉     | 39/80 [03:58<04:04,  5.96s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=2.04e-5, train/loss_step=0.00326, global_step=269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  50%|█████     | 40/80 [04:12<04:06,  6.16s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=2.04e-5, train/loss_step=0.00326, global_step=269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  50%|█████     | 40/80 [04:12<04:06,  6.16s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.03e-5, train/loss_step=0.00284, global_step=269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  51%|█████▏    | 41/80 [04:27<04:08,  6.38s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.03e-5, train/loss_step=0.00284, global_step=269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  51%|█████▏    | 41/80 [04:27<04:08,  6.38s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=1.52e-5, train/loss_step=0.00431, global_step=270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  52%|█████▎    | 42/80 [04:28<03:57,  6.24s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=1.52e-5, train/loss_step=0.00431, global_step=270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  52%|█████▎    | 42/80 [04:28<03:57,  6.24s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000571, train/loss_vlb_step=2.4e-6, train/loss_step=0.000571, global_step=270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  54%|█████▍    | 43/80 [04:28<03:46,  6.11s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000571, train/loss_vlb_step=2.4e-6, train/loss_step=0.000571, global_step=270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  54%|█████▍    | 43/80 [04:28<03:46,  6.11s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=0.00501, train/loss_step=0.0112, global_step=270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]   Epoch 13:  55%|█████▌    | 44/80 [04:29<03:35,  6.00s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=0.00501, train/loss_step=0.0112, global_step=270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  55%|█████▌    | 44/80 [04:29<03:35,  6.00s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=2.82e-5, train/loss_step=0.00677, global_step=270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=2.82e-5, train/loss_step=0.00677, global_step=270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000222, train/loss_step=0.0141, global_step=271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481] Epoch 13:  57%|█████▊    | 46/80 [04:42<03:24,  6.01s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000222, train/loss_step=0.0141, global_step=271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  57%|█████▊    | 46/80 [04:42<03:24,  6.01s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.96e-6, train/loss_step=0.00116, global_step=271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  59%|█████▉    | 47/80 [04:43<03:14,  5.90s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.96e-6, train/loss_step=0.00116, global_step=271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  59%|█████▉    | 47/80 [04:43<03:14,  5.90s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=1.63e-5, train/loss_step=0.00489, global_step=271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  60%|██████    | 48/80 [04:50<03:09,  5.94s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=1.63e-5, train/loss_step=0.00489, global_step=271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  60%|██████    | 48/80 [04:50<03:09,  5.94s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000872, train/loss_vlb_step=6.47e-6, train/loss_step=0.000872, global_step=271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  61%|██████▏   | 49/80 [05:08<03:11,  6.17s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000872, train/loss_vlb_step=6.47e-6, train/loss_step=0.000872, global_step=271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  61%|██████▏   | 49/80 [05:08<03:11,  6.17s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=3.17e-5, train/loss_step=0.00334, global_step=272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  62%|██████▎   | 50/80 [05:08<03:01,  6.05s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=3.17e-5, train/loss_step=0.00334, global_step=272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  62%|██████▎   | 50/80 [05:08<03:01,  6.05s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000864, train/loss_vlb_step=4e-6, train/loss_step=0.000864, global_step=272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481] Epoch 13:  64%|██████▍   | 51/80 [05:09<02:52,  5.95s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000864, train/loss_vlb_step=4e-6, train/loss_step=0.000864, global_step=272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  64%|██████▍   | 51/80 [05:09<02:52,  5.95s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=1.6e-5, train/loss_step=0.00407, global_step=272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  65%|██████▌   | 52/80 [05:10<02:43,  5.86s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=1.6e-5, train/loss_step=0.00407, global_step=272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  65%|██████▌   | 52/80 [05:10<02:43,  5.86s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000665, train/loss_vlb_step=2.37e-6, train/loss_step=0.000665, global_step=272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  66%|██████▋   | 53/80 [05:10<02:35,  5.76s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000665, train/loss_vlb_step=2.37e-6, train/loss_step=0.000665, global_step=272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  66%|██████▋   | 53/80 [05:10<02:35,  5.76s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=2.76e-6, train/loss_step=0.000544, global_step=273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  68%|██████▊   | 54/80 [05:31<02:36,  6.03s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=2.76e-6, train/loss_step=0.000544, global_step=273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  68%|██████▊   | 54/80 [05:31<02:36,  6.03s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=0.0001, train/loss_step=0.0174, global_step=273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]     Epoch 13:  69%|██████▉   | 55/80 [05:32<02:28,  5.93s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=0.0001, train/loss_step=0.0174, global_step=273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  69%|██████▉   | 55/80 [05:32<02:28,  5.93s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=7.4e-6, train/loss_step=0.00145, global_step=273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  70%|███████   | 56/80 [05:44<02:25,  6.05s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=7.4e-6, train/loss_step=0.00145, global_step=273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  70%|███████   | 56/80 [05:44<02:25,  6.05s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.56e-5, train/loss_step=0.0124, global_step=273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481] Epoch 13:  71%|███████▏  | 57/80 [05:59<02:22,  6.20s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.56e-5, train/loss_step=0.0124, global_step=273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  71%|███████▏  | 57/80 [05:59<02:22,  6.20s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.45e-5, train/loss_step=0.00248, global_step=274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  72%|███████▎  | 58/80 [06:00<02:14,  6.11s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.45e-5, train/loss_step=0.00248, global_step=274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  72%|███████▎  | 58/80 [06:00<02:14,  6.11s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.5e-6, train/loss_step=0.000367, global_step=274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.5e-6, train/loss_step=0.000367, global_step=274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=4.14e-5, train/loss_step=0.00779, global_step=274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  75%|███████▌  | 60/80 [06:01<01:58,  5.93s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=4.14e-5, train/loss_step=0.00779, global_step=274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  75%|███████▌  | 60/80 [06:01<01:58,  5.93s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=5.92e-5, train/loss_step=0.00955, global_step=274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  76%|███████▋  | 61/80 [06:02<01:51,  5.84s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=5.92e-5, train/loss_step=0.00955, global_step=274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  76%|███████▋  | 61/80 [06:02<01:51,  5.84s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=2.66e-5, train/loss_step=0.00151, global_step=275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  78%|███████▊  | 62/80 [06:19<01:48,  6.02s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=2.66e-5, train/loss_step=0.00151, global_step=275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  78%|███████▊  | 62/80 [06:19<01:48,  6.02s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=1.97e-6, train/loss_step=0.000406, global_step=275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  79%|███████▉  | 63/80 [06:20<01:40,  5.94s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=1.97e-6, train/loss_step=0.000406, global_step=275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  79%|███████▉  | 63/80 [06:20<01:40,  5.94s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.92e-5, train/loss_step=0.00649, global_step=275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  80%|████████  | 64/80 [06:26<01:35,  5.95s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.92e-5, train/loss_step=0.00649, global_step=275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  80%|████████  | 64/80 [06:26<01:35,  5.95s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.51e-5, train/loss_step=0.0129, global_step=275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  81%|████████▏ | 65/80 [06:41<01:31,  6.08s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=5.51e-5, train/loss_step=0.0129, global_step=275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  81%|████████▏ | 65/80 [06:41<01:31,  6.08s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.48e-5, train/loss_step=0.00319, global_step=276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  82%|████████▎ | 66/80 [06:42<01:24,  6.00s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.48e-5, train/loss_step=0.00319, global_step=276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  82%|████████▎ | 66/80 [06:42<01:24,  6.00s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=4.06e-5, train/loss_step=0.00147, global_step=276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  84%|████████▍ | 67/80 [06:42<01:16,  5.92s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=4.06e-5, train/loss_step=0.00147, global_step=276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  84%|████████▍ | 67/80 [06:42<01:16,  5.92s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.0003, train/loss_step=0.0141, global_step=276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]   Epoch 13:  85%|████████▌ | 68/80 [06:43<01:10,  5.84s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.0003, train/loss_step=0.0141, global_step=276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  85%|████████▌ | 68/80 [06:43<01:10,  5.84s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=2.1e-5, train/loss_step=0.00601, global_step=276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  86%|████████▋ | 69/80 [06:43<01:03,  5.77s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=2.1e-5, train/loss_step=0.00601, global_step=276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  86%|████████▋ | 69/80 [06:43<01:03,  5.77s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=4.79e-5, train/loss_step=0.00563, global_step=277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  88%|████████▊ | 70/80 [06:50<00:57,  5.79s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=4.79e-5, train/loss_step=0.00563, global_step=277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  88%|████████▊ | 70/80 [06:50<00:57,  5.79s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000978, train/loss_vlb_step=6.37e-6, train/loss_step=0.000978, global_step=277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  89%|████████▉ | 71/80 [06:51<00:51,  5.71s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000978, train/loss_vlb_step=6.37e-6, train/loss_step=0.000978, global_step=277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  89%|████████▉ | 71/80 [06:51<00:51,  5.71s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.27e-6, train/loss_step=0.0014, global_step=277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]    Epoch 13:  90%|█████████ | 72/80 [06:57<00:45,  5.72s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.27e-6, train/loss_step=0.0014, global_step=277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  90%|█████████ | 72/80 [06:57<00:45,  5.72s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.01e-5, train/loss_step=0.00278, global_step=277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  91%|█████████▏| 73/80 [07:08<00:40,  5.79s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.01e-5, train/loss_step=0.00278, global_step=277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  91%|█████████▏| 73/80 [07:08<00:40,  5.79s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=7.08e-5, train/loss_step=0.00141, global_step=278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  92%|█████████▎| 74/80 [07:09<00:34,  5.72s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=7.08e-5, train/loss_step=0.00141, global_step=278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  92%|█████████▎| 74/80 [07:09<00:34,  5.72s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.68e-6, train/loss_step=0.00107, global_step=278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  94%|█████████▍| 75/80 [07:09<00:28,  5.65s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.68e-6, train/loss_step=0.00107, global_step=278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  94%|█████████▍| 75/80 [07:09<00:28,  5.65s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.37e-5, train/loss_step=0.00314, global_step=278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  95%|█████████▌| 76/80 [07:10<00:22,  5.59s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.37e-5, train/loss_step=0.00314, global_step=278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  95%|█████████▌| 76/80 [07:10<00:22,  5.59s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000953, train/loss_vlb_step=5.36e-6, train/loss_step=0.000953, global_step=278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000953, train/loss_vlb_step=5.36e-6, train/loss_step=0.000953, global_step=278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000682, train/loss_vlb_step=3.25e-6, train/loss_step=0.000682, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  98%|█████████▊| 78/80 [07:27<00:11,  5.66s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000682, train/loss_vlb_step=3.25e-6, train/loss_step=0.000682, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  98%|█████████▊| 78/80 [07:27<00:11,  5.66s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.18e-5, train/loss_step=0.00591, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 13:  99%|█████████▉| 79/80 [07:27<00:05,  5.60s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.18e-5, train/loss_step=0.00591, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13:  99%|█████████▉| 79/80 [07:27<00:05,  5.60s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000655, train/loss_vlb_step=2.57e-6, train/loss_step=0.000655, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13: 100%|██████████| 80/80 [07:28<00:00,  5.54s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000655, train/loss_vlb_step=2.57e-6, train/loss_step=0.000655, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 13: 100%|██████████| 80/80 [07:28<00:00,  5.54s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000698, train/loss_vlb_step=2.83e-6, train/loss_step=0.000698, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Average Epoch time: 448.45 seconds
+Average Peak memory 29564.72MiB
+Epoch 13:   0%|          | 0/80 [00:00<00:00, 4707.41it/s, loss=0.00357, v_num=0, train/loss_simple_step=0.000698, train/loss_vlb_step=2.83e-6, train/loss_step=0.000698, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 14:   0%|          | 0/80 [00:00<00:00, 1880.01it/s, loss=0.00357, v_num=0, train/loss_simple_step=0.000698, train/loss_vlb_step=2.83e-6, train/loss_step=0.000698, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]Epoch 14:   1%|▏         | 1/80 [00:36<24:14, 18.41s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000698, train/loss_vlb_step=2.83e-6, train/loss_step=0.000698, global_step=279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00481, train/loss_vlb_epoch=0.000147, train/loss_epoch=0.00481]  Epoch 14:   1%|▏         | 1/80 [00:36<24:14, 18.41s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=1.58e-6, train/loss_step=0.000412, global_step=280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:   2%|▎         | 2/80 [00:40<17:45, 13.66s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=1.58e-6, train/loss_step=0.000412, global_step=280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:   2%|▎         | 2/80 [00:40<17:45, 13.66s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000731, train/loss_vlb_step=4.09e-6, train/loss_step=0.000731, global_step=280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:   4%|▍         | 3/80 [00:44<14:10, 11.04s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000731, train/loss_vlb_step=4.09e-6, train/loss_step=0.000731, global_step=280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:   4%|▍         | 3/80 [00:44<14:10, 11.04s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.15e-5, train/loss_step=0.0098, global_step=280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]    Epoch 14:   5%|▌         | 4/80 [00:44<11:19,  8.94s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.15e-5, train/loss_step=0.0098, global_step=280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:   5%|▌         | 4/80 [00:44<11:19,  8.94s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=2.79e-5, train/loss_step=0.00799, global_step=280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:   6%|▋         | 5/80 [00:45<09:25,  7.53s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=2.79e-5, train/loss_step=0.00799, global_step=280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:   6%|▋         | 5/80 [00:45<09:25,  7.53s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.4e-5, train/loss_step=0.004, global_step=281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]     Epoch 14:   8%|▊         | 6/80 [00:45<08:02,  6.53s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.4e-5, train/loss_step=0.004, global_step=281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:   8%|▊         | 6/80 [00:45<08:02,  6.53s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=9.33e-5, train/loss_step=0.0143, global_step=281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:   9%|▉         | 7/80 [00:46<07:01,  5.77s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=9.33e-5, train/loss_step=0.0143, global_step=281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:   9%|▉         | 7/80 [00:46<07:01,  5.77s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=0.00357, train/loss_step=0.0163, global_step=281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  10%|█         | 8/80 [01:21<10:54,  9.08s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=0.00357, train/loss_step=0.0163, global_step=281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  10%|█         | 8/80 [01:21<10:54,  9.08s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.47e-5, train/loss_step=0.0181, global_step=281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  11%|█▏        | 9/80 [01:22<09:44,  8.23s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.47e-5, train/loss_step=0.0181, global_step=281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  11%|█▏        | 9/80 [01:22<09:44,  8.23s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000943, train/loss_vlb_step=6.26e-6, train/loss_step=0.000943, global_step=282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  12%|█▎        | 10/80 [01:22<08:46,  7.52s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000943, train/loss_vlb_step=6.26e-6, train/loss_step=0.000943, global_step=282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  12%|█▎        | 10/80 [01:22<08:46,  7.52s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000651, train/loss_vlb_step=2.84e-6, train/loss_step=0.000651, global_step=282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  14%|█▍        | 11/80 [01:33<09:00,  7.83s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000651, train/loss_vlb_step=2.84e-6, train/loss_step=0.000651, global_step=282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  14%|█▍        | 11/80 [01:33<09:00,  7.83s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=2.11e-6, train/loss_step=0.00043, global_step=282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  15%|█▌        | 12/80 [01:34<08:14,  7.27s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=2.11e-6, train/loss_step=0.00043, global_step=282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  15%|█▌        | 12/80 [01:34<08:14,  7.27s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000517, train/loss_vlb_step=2.23e-6, train/loss_step=0.000517, global_step=282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  16%|█▋        | 13/80 [01:35<07:34,  6.79s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000517, train/loss_vlb_step=2.23e-6, train/loss_step=0.000517, global_step=282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  16%|█▋        | 13/80 [01:35<07:34,  6.79s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000853, train/loss_vlb_step=3.79e-6, train/loss_step=0.000853, global_step=283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  18%|█▊        | 14/80 [01:40<07:20,  6.67s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000853, train/loss_vlb_step=3.79e-6, train/loss_step=0.000853, global_step=283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  18%|█▊        | 14/80 [01:40<07:20,  6.67s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=3.57e-5, train/loss_step=0.00367, global_step=283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  19%|█▉        | 15/80 [01:40<06:48,  6.28s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=3.57e-5, train/loss_step=0.00367, global_step=283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  19%|█▉        | 15/80 [01:40<06:48,  6.28s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000281, train/loss_step=0.0258, global_step=283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  20%|██        | 16/80 [02:08<08:02,  7.54s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.0258, train/loss_vlb_step=0.000281, train/loss_step=0.0258, global_step=283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  20%|██        | 16/80 [02:08<08:02,  7.54s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=5.19e-6, train/loss_step=0.00101, global_step=283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  21%|██▏       | 17/80 [02:08<07:30,  7.15s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=5.19e-6, train/loss_step=0.00101, global_step=283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  21%|██▏       | 17/80 [02:08<07:30,  7.15s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=2.71e-6, train/loss_step=0.000711, global_step=284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  22%|██▎       | 18/80 [02:09<07:01,  6.80s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=2.71e-6, train/loss_step=0.000711, global_step=284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  22%|██▎       | 18/80 [02:09<07:01,  6.80s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=5.25e-5, train/loss_step=0.0084, global_step=284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]     Epoch 14:  24%|██▍       | 19/80 [02:17<06:58,  6.86s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=5.25e-5, train/loss_step=0.0084, global_step=284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  24%|██▍       | 19/80 [02:17<06:58,  6.86s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.83e-5, train/loss_step=0.0148, global_step=284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  25%|██▌       | 20/80 [02:17<06:33,  6.56s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.83e-5, train/loss_step=0.0148, global_step=284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  25%|██▌       | 20/80 [02:17<06:33,  6.56s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.53e-5, train/loss_step=0.00295, global_step=284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  26%|██▋       | 21/80 [02:18<06:11,  6.29s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.53e-5, train/loss_step=0.00295, global_step=284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  26%|██▋       | 21/80 [02:18<06:11,  6.29s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=0.000809, train/loss_step=0.0161, global_step=285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  28%|██▊       | 22/80 [02:21<05:57,  6.16s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=0.000809, train/loss_step=0.0161, global_step=285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  28%|██▊       | 22/80 [02:21<05:57,  6.16s/it, loss=0.00739, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=2.15e-6, train/loss_step=0.000437, global_step=285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  29%|██▉       | 23/80 [02:22<05:37,  5.93s/it, loss=0.00739, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=2.15e-6, train/loss_step=0.000437, global_step=285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  29%|██▉       | 23/80 [02:22<05:37,  5.93s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=9.25e-6, train/loss_step=0.00134, global_step=285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  30%|███       | 24/80 [02:54<06:30,  6.97s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=9.25e-6, train/loss_step=0.00134, global_step=285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  30%|███       | 24/80 [02:54<06:30,  6.97s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=4.35e-6, train/loss_step=0.000934, global_step=285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  31%|███▏      | 25/80 [02:54<06:09,  6.72s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=4.35e-6, train/loss_step=0.000934, global_step=285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  31%|███▏      | 25/80 [02:54<06:09,  6.72s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=1.04e-5, train/loss_step=0.000987, global_step=286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  32%|███▎      | 26/80 [02:55<05:50,  6.49s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=1.04e-5, train/loss_step=0.000987, global_step=286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  32%|███▎      | 26/80 [02:55<05:50,  6.49s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=2.35e-5, train/loss_step=0.0015, global_step=286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]    Epoch 14:  34%|███▍      | 27/80 [03:01<05:43,  6.47s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=2.35e-5, train/loss_step=0.0015, global_step=286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  34%|███▍      | 27/80 [03:01<05:43,  6.47s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=4.98e-5, train/loss_step=0.00175, global_step=286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  35%|███▌      | 28/80 [03:04<05:31,  6.38s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=4.98e-5, train/loss_step=0.00175, global_step=286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  35%|███▌      | 28/80 [03:04<05:31,  6.38s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.14e-5, train/loss_step=0.00155, global_step=286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  36%|███▋      | 29/80 [03:05<05:15,  6.18s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.14e-5, train/loss_step=0.00155, global_step=286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  36%|███▋      | 29/80 [03:05<05:15,  6.18s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=2.69e-5, train/loss_step=0.00736, global_step=287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  38%|███▊      | 30/80 [03:14<05:13,  6.26s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=2.69e-5, train/loss_step=0.00736, global_step=287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  38%|███▊      | 30/80 [03:14<05:13,  6.26s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.54e-5, train/loss_step=0.00296, global_step=287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  39%|███▉      | 31/80 [03:14<04:58,  6.08s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.54e-5, train/loss_step=0.00296, global_step=287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  39%|███▉      | 31/80 [03:14<04:58,  6.08s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.12e-5, train/loss_step=0.00288, global_step=287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  40%|████      | 32/80 [03:39<05:19,  6.66s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.12e-5, train/loss_step=0.00288, global_step=287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  40%|████      | 32/80 [03:39<05:19,  6.66s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=3.37e-6, train/loss_step=0.000712, global_step=287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  41%|████▏     | 33/80 [03:40<05:04,  6.48s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=3.37e-6, train/loss_step=0.000712, global_step=287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  41%|████▏     | 33/80 [03:40<05:04,  6.48s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.73e-6, train/loss_step=0.00112, global_step=288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  42%|████▎     | 34/80 [03:40<04:50,  6.31s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.73e-6, train/loss_step=0.00112, global_step=288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  42%|████▎     | 34/80 [03:40<04:50,  6.31s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=2.8e-6, train/loss_step=0.000735, global_step=288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  44%|████▍     | 35/80 [03:49<04:47,  6.38s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=2.8e-6, train/loss_step=0.000735, global_step=288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  44%|████▍     | 35/80 [03:49<04:47,  6.38s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000917, train/loss_vlb_step=3.34e-6, train/loss_step=0.000917, global_step=288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  45%|████▌     | 36/80 [03:50<04:33,  6.22s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000917, train/loss_vlb_step=3.34e-6, train/loss_step=0.000917, global_step=288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  45%|████▌     | 36/80 [03:50<04:33,  6.22s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=2.61e-6, train/loss_step=0.000613, global_step=288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  46%|████▋     | 37/80 [03:50<04:21,  6.07s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=2.61e-6, train/loss_step=0.000613, global_step=288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  46%|████▋     | 37/80 [03:50<04:21,  6.07s/it, loss=0.004, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=8.43e-5, train/loss_step=0.012, global_step=289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]        Epoch 14:  48%|████▊     | 38/80 [03:51<04:08,  5.93s/it, loss=0.004, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=8.43e-5, train/loss_step=0.012, global_step=289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  48%|████▊     | 38/80 [03:51<04:08,  5.93s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=5.73e-5, train/loss_step=0.00421, global_step=289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  49%|████▉     | 39/80 [03:51<03:57,  5.79s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=5.73e-5, train/loss_step=0.00421, global_step=289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  49%|████▉     | 39/80 [03:51<03:57,  5.79s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.76e-5, train/loss_step=0.00165, global_step=289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  50%|█████     | 40/80 [04:16<04:09,  6.25s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.76e-5, train/loss_step=0.00165, global_step=289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  50%|█████     | 40/80 [04:16<04:09,  6.25s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=1.57e-5, train/loss_step=0.00399, global_step=289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  51%|█████▏    | 41/80 [04:17<03:58,  6.12s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=1.57e-5, train/loss_step=0.00399, global_step=289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  51%|█████▏    | 41/80 [04:17<03:58,  6.12s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=0.000109, train/loss_step=0.00371, global_step=290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  52%|█████▎    | 42/80 [04:17<03:47,  5.99s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=0.000109, train/loss_step=0.00371, global_step=290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  52%|█████▎    | 42/80 [04:17<03:47,  5.99s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.71e-5, train/loss_step=0.00384, global_step=290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  54%|█████▍    | 43/80 [04:39<03:54,  6.34s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.71e-5, train/loss_step=0.00384, global_step=290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  54%|█████▍    | 43/80 [04:39<03:54,  6.34s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=0.000194, train/loss_step=0.0129, global_step=290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=0.000194, train/loss_step=0.0129, global_step=290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=3.02e-5, train/loss_step=0.00191, global_step=290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=3.02e-5, train/loss_step=0.00191, global_step=290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.65e-6, train/loss_step=0.00114, global_step=291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  57%|█████▊    | 46/80 [04:40<03:23,  5.97s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.65e-6, train/loss_step=0.00114, global_step=291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  57%|█████▊    | 46/80 [04:40<03:23,  5.97s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=6.64e-5, train/loss_step=0.0089, global_step=291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  59%|█████▉    | 47/80 [04:41<03:13,  5.86s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=6.64e-5, train/loss_step=0.0089, global_step=291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  59%|█████▉    | 47/80 [04:41<03:13,  5.86s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.81e-5, train/loss_step=0.00667, global_step=291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  60%|██████    | 48/80 [04:54<03:12,  6.02s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=3.81e-5, train/loss_step=0.00667, global_step=291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  60%|██████    | 48/80 [04:54<03:12,  6.02s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=2.36e-5, train/loss_step=0.0064, global_step=291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  61%|██████▏   | 49/80 [04:55<03:03,  5.91s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=2.36e-5, train/loss_step=0.0064, global_step=291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  61%|██████▏   | 49/80 [04:55<03:03,  5.91s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.00135, train/loss_step=0.018, global_step=292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  62%|██████▎   | 50/80 [04:56<02:54,  5.81s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.00135, train/loss_step=0.018, global_step=292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  62%|██████▎   | 50/80 [04:56<02:54,  5.81s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000412, train/loss_step=0.0246, global_step=292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  64%|██████▍   | 51/80 [05:16<02:56,  6.09s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000412, train/loss_step=0.0246, global_step=292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  64%|██████▍   | 51/80 [05:16<02:56,  6.09s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=4.4e-5, train/loss_step=0.00381, global_step=292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  65%|██████▌   | 52/80 [05:17<02:47,  5.98s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=4.4e-5, train/loss_step=0.00381, global_step=292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  65%|██████▌   | 52/80 [05:17<02:47,  5.98s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.68e-5, train/loss_step=0.00172, global_step=292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  66%|██████▋   | 53/80 [05:17<02:38,  5.88s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.68e-5, train/loss_step=0.00172, global_step=292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  66%|██████▋   | 53/80 [05:17<02:38,  5.88s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=4.23e-6, train/loss_step=0.000939, global_step=293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  68%|██████▊   | 54/80 [05:18<02:30,  5.78s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=4.23e-6, train/loss_step=0.000939, global_step=293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  68%|██████▊   | 54/80 [05:18<02:30,  5.78s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.39e-6, train/loss_step=0.00117, global_step=293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  69%|██████▉   | 55/80 [05:18<02:22,  5.69s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.39e-6, train/loss_step=0.00117, global_step=293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  69%|██████▉   | 55/80 [05:18<02:22,  5.69s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=2.84e-5, train/loss_step=0.00754, global_step=293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  70%|███████   | 56/80 [05:35<02:21,  5.89s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=2.84e-5, train/loss_step=0.00754, global_step=293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  70%|███████   | 56/80 [05:35<02:21,  5.89s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=8.08e-5, train/loss_step=0.0159, global_step=293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  71%|███████▏  | 57/80 [05:36<02:13,  5.80s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=8.08e-5, train/loss_step=0.0159, global_step=293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  71%|███████▏  | 57/80 [05:36<02:13,  5.80s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=3.61e-5, train/loss_step=0.00426, global_step=294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=3.61e-5, train/loss_step=0.00426, global_step=294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.00677, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=2.31e-5, train/loss_step=0.00639, global_step=294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  74%|███████▍  | 59/80 [06:01<02:06,  6.02s/it, loss=0.00677, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=2.31e-5, train/loss_step=0.00639, global_step=294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  74%|███████▍  | 59/80 [06:01<02:06,  6.02s/it, loss=0.00674, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=5.33e-6, train/loss_step=0.00106, global_step=294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  75%|███████▌  | 60/80 [06:01<01:58,  5.93s/it, loss=0.00674, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=5.33e-6, train/loss_step=0.00106, global_step=294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  75%|███████▌  | 60/80 [06:01<01:58,  5.93s/it, loss=0.00674, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.36e-5, train/loss_step=0.00395, global_step=294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  76%|███████▋  | 61/80 [06:02<01:51,  5.85s/it, loss=0.00674, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.36e-5, train/loss_step=0.00395, global_step=294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  76%|███████▋  | 61/80 [06:02<01:51,  5.85s/it, loss=0.00718, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000727, train/loss_step=0.0125, global_step=295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  78%|███████▊  | 62/80 [06:02<01:43,  5.76s/it, loss=0.00718, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000727, train/loss_step=0.0125, global_step=295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  78%|███████▊  | 62/80 [06:02<01:43,  5.76s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=8.2e-5, train/loss_step=0.00822, global_step=295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  79%|███████▉  | 63/80 [06:03<01:36,  5.68s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=8.2e-5, train/loss_step=0.00822, global_step=295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  79%|███████▉  | 63/80 [06:03<01:36,  5.68s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.82e-5, train/loss_step=0.0109, global_step=295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  80%|████████  | 64/80 [06:17<01:32,  5.81s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.82e-5, train/loss_step=0.0109, global_step=295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  80%|████████  | 64/80 [06:17<01:32,  5.81s/it, loss=0.00725, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=3.34e-6, train/loss_step=0.000847, global_step=295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  81%|████████▏ | 65/80 [06:18<01:25,  5.73s/it, loss=0.00725, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=3.34e-6, train/loss_step=0.000847, global_step=295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  81%|████████▏ | 65/80 [06:18<01:25,  5.73s/it, loss=0.00773, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000107, train/loss_step=0.0109, global_step=296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]   Epoch 14:  82%|████████▎ | 66/80 [06:18<01:19,  5.65s/it, loss=0.00773, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000107, train/loss_step=0.0109, global_step=296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  82%|████████▎ | 66/80 [06:18<01:19,  5.65s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.38e-6, train/loss_step=0.00036, global_step=296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  84%|████████▍ | 67/80 [06:43<01:17,  5.93s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.38e-6, train/loss_step=0.00036, global_step=296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  84%|████████▍ | 67/80 [06:43<01:17,  5.93s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=1.78e-5, train/loss_step=0.0051, global_step=296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=1.78e-5, train/loss_step=0.0051, global_step=296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.00777, train/loss_vlb_step=3.56e-5, train/loss_step=0.00777, global_step=296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  86%|████████▋ | 69/80 [06:44<01:03,  5.78s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.00777, train/loss_vlb_step=3.56e-5, train/loss_step=0.00777, global_step=296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  86%|████████▋ | 69/80 [06:44<01:03,  5.78s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=3.97e-6, train/loss_step=0.000828, global_step=297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  88%|████████▊ | 70/80 [06:44<00:57,  5.70s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=3.97e-6, train/loss_step=0.000828, global_step=297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  88%|████████▊ | 70/80 [06:44<00:57,  5.70s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000686, train/loss_vlb_step=3.36e-6, train/loss_step=0.000686, global_step=297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  89%|████████▉ | 71/80 [06:45<00:50,  5.63s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000686, train/loss_vlb_step=3.36e-6, train/loss_step=0.000686, global_step=297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  89%|████████▉ | 71/80 [06:45<00:50,  5.63s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.71e-5, train/loss_step=0.00253, global_step=297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  90%|█████████ | 72/80 [06:56<00:45,  5.71s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=1.71e-5, train/loss_step=0.00253, global_step=297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  90%|█████████ | 72/80 [06:56<00:45,  5.71s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=1.95e-5, train/loss_step=0.00528, global_step=297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=1.95e-5, train/loss_step=0.00528, global_step=297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=0.00346, train/loss_step=0.00753, global_step=298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=0.00346, train/loss_step=0.00753, global_step=298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=7.6e-5, train/loss_step=0.0024, global_step=298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]   Epoch 14:  94%|█████████▍| 75/80 [07:14<00:28,  5.71s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=7.6e-5, train/loss_step=0.0024, global_step=298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  94%|█████████▍| 75/80 [07:14<00:28,  5.71s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=1.79e-6, train/loss_step=0.000474, global_step=298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  95%|█████████▌| 76/80 [07:14<00:22,  5.64s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=1.79e-6, train/loss_step=0.000474, global_step=298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  95%|█████████▌| 76/80 [07:14<00:22,  5.64s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=2.95e-5, train/loss_step=0.00303, global_step=298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 14:  96%|█████████▋| 77/80 [07:15<00:16,  5.58s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=2.95e-5, train/loss_step=0.00303, global_step=298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  96%|█████████▋| 77/80 [07:15<00:16,  5.58s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.29e-5, train/loss_step=0.00333, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  98%|█████████▊| 78/80 [07:15<00:11,  5.51s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.29e-5, train/loss_step=0.00333, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  98%|█████████▊| 78/80 [07:15<00:11,  5.51s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=6.41e-5, train/loss_step=0.0046, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455] Epoch 14:  99%|█████████▉| 79/80 [07:16<00:05,  5.45s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=6.41e-5, train/loss_step=0.0046, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14:  99%|█████████▉| 79/80 [07:16<00:05,  5.45s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=5.36e-5, train/loss_step=0.00238, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=5.36e-5, train/loss_step=0.00238, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 14: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=3.09e-6, train/loss_step=0.000538, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Average Epoch time: 436.76 seconds
+Average Peak memory 29564.97MiB
+Epoch 14:   0%|          | 0/80 [00:00<00:00, 5275.85it/s, loss=0.00451, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=3.09e-6, train/loss_step=0.000538, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 15:   0%|          | 0/80 [00:00<00:00, 2023.30it/s, loss=0.00451, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=3.09e-6, train/loss_step=0.000538, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]Epoch 15:   1%|▏         | 1/80 [00:45<29:39, 22.53s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=3.09e-6, train/loss_step=0.000538, global_step=299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00455, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00455]  Epoch 15:   1%|▏         | 1/80 [00:45<29:39, 22.53s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=1.52e-5, train/loss_step=0.00385, global_step=300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496] Epoch 15:   2%|▎         | 2/80 [00:45<19:44, 15.18s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=1.52e-5, train/loss_step=0.00385, global_step=300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:   2%|▎         | 2/80 [00:45<19:44, 15.18s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.62e-6, train/loss_step=0.000393, global_step=300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:   4%|▍         | 3/80 [00:46<14:46, 11.51s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.62e-6, train/loss_step=0.000393, global_step=300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:   4%|▍         | 3/80 [00:46<14:46, 11.51s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=2.46e-5, train/loss_step=0.0065, global_step=300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]    Epoch 15:   5%|▌         | 4/80 [00:46<11:53,  9.39s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=2.46e-5, train/loss_step=0.0065, global_step=300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:   5%|▌         | 4/80 [00:46<11:53,  9.39s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000639, train/loss_vlb_step=3.69e-6, train/loss_step=0.000639, global_step=300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:   6%|▋         | 5/80 [00:47<09:53,  7.91s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000639, train/loss_vlb_step=3.69e-6, train/loss_step=0.000639, global_step=300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:   6%|▋         | 5/80 [00:47<09:53,  7.91s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=2.17e-6, train/loss_step=0.000521, global_step=301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:   8%|▊         | 6/80 [00:47<08:27,  6.85s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=2.17e-6, train/loss_step=0.000521, global_step=301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:   8%|▊         | 6/80 [00:47<08:27,  6.85s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00097, train/loss_vlb_step=8.48e-6, train/loss_step=0.00097, global_step=301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]  Epoch 15:   9%|▉         | 7/80 [00:48<07:22,  6.06s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00097, train/loss_vlb_step=8.48e-6, train/loss_step=0.00097, global_step=301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:   9%|▉         | 7/80 [00:48<07:22,  6.06s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000772, train/loss_vlb_step=3.61e-6, train/loss_step=0.000772, global_step=301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  10%|█         | 8/80 [01:10<09:25,  7.86s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000772, train/loss_vlb_step=3.61e-6, train/loss_step=0.000772, global_step=301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  10%|█         | 8/80 [01:10<09:25,  7.86s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=4.96e-5, train/loss_step=0.0119, global_step=301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]    Epoch 15:  11%|█▏        | 9/80 [01:27<10:23,  8.79s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=4.96e-5, train/loss_step=0.0119, global_step=301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  11%|█▏        | 9/80 [01:27<10:23,  8.79s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.62e-5, train/loss_step=0.00383, global_step=302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  12%|█▎        | 10/80 [01:28<09:22,  8.03s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=2.62e-5, train/loss_step=0.00383, global_step=302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  12%|█▎        | 10/80 [01:28<09:22,  8.03s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.09e-5, train/loss_step=0.00289, global_step=302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  14%|█▍        | 11/80 [01:28<08:30,  7.40s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.09e-5, train/loss_step=0.00289, global_step=302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  14%|█▍        | 11/80 [01:28<08:30,  7.40s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=5.42e-5, train/loss_step=0.00958, global_step=302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  15%|█▌        | 12/80 [01:29<07:47,  6.88s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00958, train/loss_vlb_step=5.42e-5, train/loss_step=0.00958, global_step=302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  15%|█▌        | 12/80 [01:29<07:47,  6.88s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.88e-5, train/loss_step=0.00486, global_step=302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  16%|█▋        | 13/80 [01:29<07:10,  6.42s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.88e-5, train/loss_step=0.00486, global_step=302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  16%|█▋        | 13/80 [01:29<07:10,  6.42s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=2.8e-6, train/loss_step=0.000626, global_step=303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  18%|█▊        | 14/80 [01:30<06:37,  6.03s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=2.8e-6, train/loss_step=0.000626, global_step=303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  18%|█▊        | 14/80 [01:30<06:37,  6.03s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000779, train/loss_vlb_step=5.15e-6, train/loss_step=0.000779, global_step=303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  19%|█▉        | 15/80 [01:30<06:09,  5.68s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000779, train/loss_vlb_step=5.15e-6, train/loss_step=0.000779, global_step=303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  19%|█▉        | 15/80 [01:30<06:09,  5.68s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=8.59e-6, train/loss_step=0.00125, global_step=303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]  Epoch 15:  20%|██        | 16/80 [01:45<06:36,  6.20s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=8.59e-6, train/loss_step=0.00125, global_step=303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  20%|██        | 16/80 [01:45<06:36,  6.20s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=4.7e-5, train/loss_step=0.0123, global_step=303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  21%|██▏       | 17/80 [02:07<07:27,  7.10s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=4.7e-5, train/loss_step=0.0123, global_step=303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  21%|██▏       | 17/80 [02:07<07:27,  7.10s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=1.62e-6, train/loss_step=0.000411, global_step=304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  22%|██▎       | 18/80 [02:08<06:58,  6.75s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=1.62e-6, train/loss_step=0.000411, global_step=304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  22%|██▎       | 18/80 [02:08<06:58,  6.75s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=8.31e-6, train/loss_step=0.00129, global_step=304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]  Epoch 15:  24%|██▍       | 19/80 [02:08<06:32,  6.44s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=8.31e-6, train/loss_step=0.00129, global_step=304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  24%|██▍       | 19/80 [02:08<06:32,  6.44s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=3e-5, train/loss_step=0.00561, global_step=304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  25%|██▌       | 20/80 [02:09<06:11,  6.19s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=3e-5, train/loss_step=0.00561, global_step=304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  25%|██▌       | 20/80 [02:09<06:11,  6.19s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000938, train/loss_vlb_step=5.47e-6, train/loss_step=0.000938, global_step=304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  26%|██▋       | 21/80 [02:10<05:49,  5.93s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000938, train/loss_vlb_step=5.47e-6, train/loss_step=0.000938, global_step=304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  26%|██▋       | 21/80 [02:10<05:49,  5.93s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000965, train/loss_vlb_step=6.38e-6, train/loss_step=0.000965, global_step=305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  28%|██▊       | 22/80 [02:10<05:30,  5.69s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000965, train/loss_vlb_step=6.38e-6, train/loss_step=0.000965, global_step=305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  28%|██▊       | 22/80 [02:10<05:30,  5.69s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=2.4e-5, train/loss_step=0.0025, global_step=305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]     Epoch 15:  29%|██▉       | 23/80 [02:11<05:12,  5.48s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=2.4e-5, train/loss_step=0.0025, global_step=305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  29%|██▉       | 23/80 [02:11<05:12,  5.48s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.24e-5, train/loss_step=0.00327, global_step=305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  30%|███       | 24/80 [02:30<05:36,  6.01s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.24e-5, train/loss_step=0.00327, global_step=305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  30%|███       | 24/80 [02:30<05:36,  6.01s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=1.48e-5, train/loss_step=0.00429, global_step=305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  31%|███▏      | 25/80 [02:39<05:36,  6.13s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=1.48e-5, train/loss_step=0.00429, global_step=305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  31%|███▏      | 25/80 [02:39<05:36,  6.13s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=0.00327, train/loss_step=0.00813, global_step=306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  32%|███▎      | 26/80 [02:51<05:43,  6.36s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=0.00327, train/loss_step=0.00813, global_step=306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  32%|███▎      | 26/80 [02:51<05:43,  6.36s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.41e-6, train/loss_step=0.00187, global_step=306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496] Epoch 15:  34%|███▍      | 27/80 [02:52<05:25,  6.15s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.41e-6, train/loss_step=0.00187, global_step=306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  34%|███▍      | 27/80 [02:52<05:25,  6.15s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.76e-5, train/loss_step=0.0029, global_step=306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496] Epoch 15:  35%|███▌      | 28/80 [02:52<05:09,  5.95s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.76e-5, train/loss_step=0.0029, global_step=306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  35%|███▌      | 28/80 [02:52<05:09,  5.95s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000534, train/loss_vlb_step=2.21e-6, train/loss_step=0.000534, global_step=306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  36%|███▋      | 29/80 [02:53<04:54,  5.77s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000534, train/loss_vlb_step=2.21e-6, train/loss_step=0.000534, global_step=306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  36%|███▋      | 29/80 [02:53<04:54,  5.77s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=0.000117, train/loss_step=0.0113, global_step=307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  38%|███▊      | 30/80 [02:53<04:40,  5.60s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=0.000117, train/loss_step=0.0113, global_step=307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  38%|███▊      | 30/80 [02:53<04:40,  5.60s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00986, train/loss_vlb_step=9.3e-5, train/loss_step=0.00986, global_step=307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  39%|███▉      | 31/80 [02:54<04:26,  5.44s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00986, train/loss_vlb_step=9.3e-5, train/loss_step=0.00986, global_step=307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  39%|███▉      | 31/80 [02:54<04:26,  5.44s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=0.000177, train/loss_step=0.00927, global_step=307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  40%|████      | 32/80 [03:15<04:44,  5.92s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=0.000177, train/loss_step=0.00927, global_step=307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  40%|████      | 32/80 [03:15<04:44,  5.92s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=6.32e-5, train/loss_step=0.00361, global_step=307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496] Epoch 15:  41%|████▏     | 33/80 [03:31<04:51,  6.21s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=6.32e-5, train/loss_step=0.00361, global_step=307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  41%|████▏     | 33/80 [03:31<04:51,  6.21s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=7.3e-6, train/loss_step=0.000735, global_step=308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  42%|████▎     | 34/80 [03:31<04:38,  6.05s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=7.3e-6, train/loss_step=0.000735, global_step=308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  42%|████▎     | 34/80 [03:31<04:38,  6.05s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=6.46e-5, train/loss_step=0.0128, global_step=308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  44%|████▍     | 35/80 [03:32<04:25,  5.89s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=6.46e-5, train/loss_step=0.0128, global_step=308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  44%|████▍     | 35/80 [03:32<04:25,  5.89s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.28e-6, train/loss_step=0.000551, global_step=308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  45%|████▌     | 36/80 [03:32<04:13,  5.75s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.28e-6, train/loss_step=0.000551, global_step=308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  45%|████▌     | 36/80 [03:32<04:13,  5.75s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=0.000508, train/loss_step=0.0226, global_step=308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  46%|████▋     | 37/80 [03:35<04:04,  5.68s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=0.000508, train/loss_step=0.0226, global_step=308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  46%|████▋     | 37/80 [03:35<04:04,  5.68s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=1.48e-5, train/loss_step=0.00108, global_step=309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  48%|████▊     | 38/80 [03:36<03:52,  5.54s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=1.48e-5, train/loss_step=0.00108, global_step=309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  48%|████▊     | 38/80 [03:36<03:52,  5.54s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=7.32e-6, train/loss_step=0.00111, global_step=309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  49%|████▉     | 39/80 [03:36<03:42,  5.42s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=7.32e-6, train/loss_step=0.00111, global_step=309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  49%|████▉     | 39/80 [03:36<03:42,  5.42s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=3.63e-6, train/loss_step=0.000825, global_step=309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  50%|█████     | 40/80 [03:57<03:51,  5.79s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=3.63e-6, train/loss_step=0.000825, global_step=309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  50%|█████     | 40/80 [03:57<03:51,  5.79s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=2.39e-5, train/loss_step=0.00672, global_step=309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]  Epoch 15:  51%|█████▏    | 41/80 [04:07<03:49,  5.89s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=2.39e-5, train/loss_step=0.00672, global_step=309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  51%|█████▏    | 41/80 [04:07<03:49,  5.89s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=3.88e-5, train/loss_step=0.0106, global_step=310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]  Epoch 15:  52%|█████▎    | 42/80 [04:09<03:40,  5.80s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=3.88e-5, train/loss_step=0.0106, global_step=310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  52%|█████▎    | 42/80 [04:09<03:40,  5.80s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=1.09e-5, train/loss_step=0.000831, global_step=310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  54%|█████▍    | 43/80 [04:10<03:30,  5.68s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=1.09e-5, train/loss_step=0.000831, global_step=310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  54%|█████▍    | 43/80 [04:10<03:30,  5.68s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=1.87e-5, train/loss_step=0.00494, global_step=310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]  Epoch 15:  55%|█████▌    | 44/80 [04:10<03:20,  5.57s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=1.87e-5, train/loss_step=0.00494, global_step=310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  55%|█████▌    | 44/80 [04:10<03:20,  5.57s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.88e-5, train/loss_step=0.0109, global_step=310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]  Epoch 15:  56%|█████▋    | 45/80 [04:13<03:13,  5.51s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.88e-5, train/loss_step=0.0109, global_step=310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  56%|█████▋    | 45/80 [04:13<03:13,  5.52s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=1.51e-5, train/loss_step=0.00439, global_step=311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  57%|█████▊    | 46/80 [04:14<03:03,  5.41s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=1.51e-5, train/loss_step=0.00439, global_step=311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  57%|█████▊    | 46/80 [04:14<03:03,  5.41s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=9.28e-6, train/loss_step=0.00228, global_step=311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  59%|█████▉    | 47/80 [04:14<02:55,  5.31s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=9.28e-6, train/loss_step=0.00228, global_step=311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  59%|█████▉    | 47/80 [04:14<02:55,  5.31s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.03e-5, train/loss_step=0.00275, global_step=311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  60%|██████    | 48/80 [04:29<02:55,  5.50s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.03e-5, train/loss_step=0.00275, global_step=311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  60%|██████    | 48/80 [04:29<02:55,  5.50s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.97e-5, train/loss_step=0.00366, global_step=311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  61%|██████▏   | 49/80 [04:49<02:59,  5.79s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.97e-5, train/loss_step=0.00366, global_step=311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  61%|██████▏   | 49/80 [04:49<02:59,  5.79s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=1.89e-5, train/loss_step=0.00514, global_step=312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=1.89e-5, train/loss_step=0.00514, global_step=312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.79e-6, train/loss_step=0.00102, global_step=312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  64%|██████▍   | 51/80 [05:00<02:47,  5.79s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.79e-6, train/loss_step=0.00102, global_step=312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  64%|██████▍   | 51/80 [05:00<02:47,  5.79s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.000847, train/loss_step=0.0217, global_step=312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496] Epoch 15:  65%|██████▌   | 52/80 [05:01<02:39,  5.69s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.000847, train/loss_step=0.0217, global_step=312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  65%|██████▌   | 52/80 [05:01<02:39,  5.69s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.000607, train/loss_vlb_step=3.81e-6, train/loss_step=0.000607, global_step=312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  66%|██████▋   | 53/80 [05:02<02:31,  5.59s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.000607, train/loss_vlb_step=3.81e-6, train/loss_step=0.000607, global_step=312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  66%|██████▋   | 53/80 [05:02<02:31,  5.59s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=0.000765, train/loss_step=0.00798, global_step=313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496] Epoch 15:  68%|██████▊   | 54/80 [05:02<02:23,  5.50s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=0.000765, train/loss_step=0.00798, global_step=313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  68%|██████▊   | 54/80 [05:02<02:23,  5.50s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=8.79e-5, train/loss_step=0.00214, global_step=313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496] Epoch 15:  69%|██████▉   | 55/80 [05:03<02:15,  5.41s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=8.79e-5, train/loss_step=0.00214, global_step=313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  69%|██████▉   | 55/80 [05:03<02:15,  5.41s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.35e-6, train/loss_step=0.00154, global_step=313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  70%|███████   | 56/80 [05:03<02:07,  5.33s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.35e-6, train/loss_step=0.00154, global_step=313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  70%|███████   | 56/80 [05:03<02:07,  5.33s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=2.76e-5, train/loss_step=0.00831, global_step=313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=2.76e-5, train/loss_step=0.00831, global_step=313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.04e-5, train/loss_step=0.00277, global_step=314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.04e-5, train/loss_step=0.00277, global_step=314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=7.6e-6, train/loss_step=0.000939, global_step=314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496] Epoch 15:  74%|███████▍  | 59/80 [05:37<01:58,  5.62s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=7.6e-6, train/loss_step=0.000939, global_step=314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  74%|███████▍  | 59/80 [05:37<01:58,  5.62s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.31e-6, train/loss_step=0.00136, global_step=314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  75%|███████▌  | 60/80 [05:51<01:55,  5.76s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.31e-6, train/loss_step=0.00136, global_step=314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  75%|███████▌  | 60/80 [05:51<01:55,  5.76s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=3.11e-6, train/loss_step=0.000623, global_step=314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  76%|███████▋  | 61/80 [05:51<01:47,  5.67s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=3.11e-6, train/loss_step=0.000623, global_step=314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  76%|███████▋  | 61/80 [05:51<01:47,  5.67s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000902, train/loss_vlb_step=3.97e-6, train/loss_step=0.000902, global_step=315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  78%|███████▊  | 62/80 [05:52<01:40,  5.59s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000902, train/loss_vlb_step=3.97e-6, train/loss_step=0.000902, global_step=315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  78%|███████▊  | 62/80 [05:52<01:40,  5.59s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000266, train/loss_step=0.0154, global_step=315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  79%|███████▉  | 63/80 [05:52<01:33,  5.51s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000266, train/loss_step=0.0154, global_step=315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  79%|███████▉  | 63/80 [05:52<01:33,  5.51s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.000703, train/loss_vlb_step=3.29e-6, train/loss_step=0.000703, global_step=315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  80%|████████  | 64/80 [05:53<01:26,  5.43s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.000703, train/loss_vlb_step=3.29e-6, train/loss_step=0.000703, global_step=315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  80%|████████  | 64/80 [05:53<01:26,  5.43s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=3.38e-5, train/loss_step=0.00176, global_step=315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  81%|████████▏ | 65/80 [06:06<01:23,  5.55s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=3.38e-5, train/loss_step=0.00176, global_step=315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  81%|████████▏ | 65/80 [06:06<01:23,  5.55s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=3.08e-5, train/loss_step=0.00872, global_step=316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  82%|████████▎ | 66/80 [06:18<01:19,  5.64s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=3.08e-5, train/loss_step=0.00872, global_step=316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  82%|████████▎ | 66/80 [06:18<01:19,  5.64s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=5.53e-5, train/loss_step=0.00934, global_step=316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  84%|████████▍ | 67/80 [06:18<01:12,  5.57s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=5.53e-5, train/loss_step=0.00934, global_step=316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  84%|████████▍ | 67/80 [06:18<01:12,  5.57s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=5.54e-5, train/loss_step=0.00274, global_step=316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  85%|████████▌ | 68/80 [06:29<01:07,  5.65s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=5.54e-5, train/loss_step=0.00274, global_step=316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  85%|████████▌ | 68/80 [06:29<01:07,  5.65s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000739, train/loss_vlb_step=5.26e-6, train/loss_step=0.000739, global_step=316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  86%|████████▋ | 69/80 [06:30<01:01,  5.58s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000739, train/loss_vlb_step=5.26e-6, train/loss_step=0.000739, global_step=316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  86%|████████▋ | 69/80 [06:30<01:01,  5.58s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=7.5e-5, train/loss_step=0.00857, global_step=317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  88%|████████▊ | 70/80 [06:30<00:55,  5.51s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=7.5e-5, train/loss_step=0.00857, global_step=317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  88%|████████▊ | 70/80 [06:30<00:55,  5.51s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=5.62e-6, train/loss_step=0.000605, global_step=317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  89%|████████▉ | 71/80 [06:31<00:48,  5.44s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=5.62e-6, train/loss_step=0.000605, global_step=317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  89%|████████▉ | 71/80 [06:31<00:48,  5.44s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=7.38e-6, train/loss_step=0.00197, global_step=317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]  Epoch 15:  90%|█████████ | 72/80 [06:32<00:42,  5.37s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=7.38e-6, train/loss_step=0.00197, global_step=317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  90%|█████████ | 72/80 [06:32<00:42,  5.37s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.26e-5, train/loss_step=0.00671, global_step=317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  91%|█████████▏| 73/80 [06:40<00:37,  5.41s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.26e-5, train/loss_step=0.00671, global_step=317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  91%|█████████▏| 73/80 [06:40<00:37,  5.41s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=4.17e-5, train/loss_step=0.00142, global_step=318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  92%|█████████▎| 74/80 [06:51<00:32,  5.49s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=4.17e-5, train/loss_step=0.00142, global_step=318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  92%|█████████▎| 74/80 [06:51<00:32,  5.49s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=9.79e-6, train/loss_step=0.00271, global_step=318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  94%|█████████▍| 75/80 [06:52<00:27,  5.43s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=9.79e-6, train/loss_step=0.00271, global_step=318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  94%|█████████▍| 75/80 [06:52<00:27,  5.43s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000698, train/loss_vlb_step=4.18e-6, train/loss_step=0.000698, global_step=318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  95%|█████████▌| 76/80 [07:01<00:21,  5.48s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000698, train/loss_vlb_step=4.18e-6, train/loss_step=0.000698, global_step=318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  95%|█████████▌| 76/80 [07:01<00:21,  5.48s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000218, train/loss_step=0.0121, global_step=318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  96%|█████████▋| 77/80 [07:05<00:16,  5.45s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000218, train/loss_step=0.0121, global_step=318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  96%|█████████▋| 77/80 [07:05<00:16,  5.45s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.47e-5, train/loss_step=0.00373, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  98%|█████████▊| 78/80 [07:05<00:10,  5.39s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.47e-5, train/loss_step=0.00373, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  98%|█████████▊| 78/80 [07:05<00:10,  5.39s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.43e-5, train/loss_step=0.0132, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]   Epoch 15:  99%|█████████▉| 79/80 [07:06<00:05,  5.33s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=6.43e-5, train/loss_step=0.0132, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15:  99%|█████████▉| 79/80 [07:06<00:05,  5.33s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.92e-6, train/loss_step=0.000375, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15: 100%|██████████| 80/80 [07:06<00:00,  5.27s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.92e-6, train/loss_step=0.000375, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 15: 100%|██████████| 80/80 [07:06<00:00,  5.27s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=3.43e-6, train/loss_step=0.000658, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Average Epoch time: 426.57 seconds
+Average Peak memory 29563.70MiB
+Epoch 15:   0%|          | 0/80 [00:00<00:00, 5729.92it/s, loss=0.00466, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=3.43e-6, train/loss_step=0.000658, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 16:   0%|          | 0/80 [00:00<00:00, 1961.79it/s, loss=0.00466, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=3.43e-6, train/loss_step=0.000658, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]Epoch 16:   1%|▏         | 1/80 [00:43<28:36, 21.73s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=3.43e-6, train/loss_step=0.000658, global_step=319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00496, train/loss_vlb_epoch=0.000152, train/loss_epoch=0.00496]  Epoch 16:   1%|▏         | 1/80 [00:43<28:36, 21.73s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000989, train/loss_vlb_step=6.72e-6, train/loss_step=0.000989, global_step=320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   2%|▎         | 2/80 [00:43<19:02, 14.65s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000989, train/loss_vlb_step=6.72e-6, train/loss_step=0.000989, global_step=320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   2%|▎         | 2/80 [00:43<19:02, 14.65s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.08e-6, train/loss_step=0.000296, global_step=320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463] Epoch 16:   4%|▍         | 3/80 [00:44<14:15, 11.11s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.08e-6, train/loss_step=0.000296, global_step=320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   4%|▍         | 3/80 [00:44<14:15, 11.11s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=8.42e-5, train/loss_step=0.0018, global_step=320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]   Epoch 16:   5%|▌         | 4/80 [00:57<14:28, 11.42s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=8.42e-5, train/loss_step=0.0018, global_step=320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   5%|▌         | 4/80 [00:57<14:28, 11.42s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.77e-5, train/loss_step=0.00179, global_step=320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   6%|▋         | 5/80 [00:57<12:00,  9.60s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.77e-5, train/loss_step=0.00179, global_step=320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   6%|▋         | 5/80 [00:57<12:00,  9.60s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=4.69e-5, train/loss_step=0.00175, global_step=321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   8%|▊         | 6/80 [00:58<10:14,  8.30s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=4.69e-5, train/loss_step=0.00175, global_step=321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   8%|▊         | 6/80 [00:58<10:14,  8.30s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.79e-6, train/loss_step=0.00132, global_step=321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   9%|▉         | 7/80 [00:58<08:54,  7.32s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.79e-6, train/loss_step=0.00132, global_step=321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:   9%|▉         | 7/80 [00:58<08:54,  7.32s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=8.74e-6, train/loss_step=0.00205, global_step=321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  10%|█         | 8/80 [01:25<11:21,  9.47s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=8.74e-6, train/loss_step=0.00205, global_step=321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  10%|█         | 8/80 [01:25<11:21,  9.47s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00092, train/loss_vlb_step=5.82e-6, train/loss_step=0.00092, global_step=321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  11%|█▏        | 9/80 [01:26<10:16,  8.68s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00092, train/loss_vlb_step=5.82e-6, train/loss_step=0.00092, global_step=321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  11%|█▏        | 9/80 [01:26<10:16,  8.68s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=1.77e-6, train/loss_step=0.000505, global_step=322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  12%|█▎        | 10/80 [01:27<09:15,  7.94s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=1.77e-6, train/loss_step=0.000505, global_step=322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  12%|█▎        | 10/80 [01:27<09:15,  7.94s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.53e-5, train/loss_step=0.00447, global_step=322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  14%|█▍        | 11/80 [01:27<08:25,  7.32s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.53e-5, train/loss_step=0.00447, global_step=322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  14%|█▍        | 11/80 [01:27<08:25,  7.32s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=0.000385, train/loss_step=0.0212, global_step=322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463] Epoch 16:  15%|█▌        | 12/80 [01:41<08:50,  7.80s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=0.000385, train/loss_step=0.0212, global_step=322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  15%|█▌        | 12/80 [01:41<08:50,  7.80s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.66e-5, train/loss_step=0.0112, global_step=322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463] Epoch 16:  16%|█▋        | 13/80 [01:41<08:07,  7.28s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.66e-5, train/loss_step=0.0112, global_step=322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  16%|█▋        | 13/80 [01:41<08:07,  7.28s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.00722, train/loss_step=0.029, global_step=323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  18%|█▊        | 14/80 [01:42<07:30,  6.82s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.00722, train/loss_step=0.029, global_step=323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  18%|█▊        | 14/80 [01:42<07:30,  6.82s/it, loss=0.00634, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=0.000463, train/loss_step=0.0187, global_step=323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  19%|█▉        | 15/80 [01:42<06:57,  6.43s/it, loss=0.00634, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=0.000463, train/loss_step=0.0187, global_step=323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  19%|█▉        | 15/80 [01:42<06:57,  6.43s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.000954, train/loss_vlb_step=6.84e-6, train/loss_step=0.000954, global_step=323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  20%|██        | 16/80 [02:03<07:45,  7.28s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.000954, train/loss_vlb_step=6.84e-6, train/loss_step=0.000954, global_step=323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  20%|██        | 16/80 [02:03<07:45,  7.28s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.65e-5, train/loss_step=0.011, global_step=323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]       Epoch 16:  21%|██▏       | 17/80 [02:04<07:15,  6.91s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.65e-5, train/loss_step=0.011, global_step=323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  21%|██▏       | 17/80 [02:04<07:15,  6.91s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.66e-5, train/loss_step=0.00289, global_step=324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  22%|██▎       | 18/80 [02:08<06:57,  6.74s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.66e-5, train/loss_step=0.00289, global_step=324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  22%|██▎       | 18/80 [02:08<06:57,  6.74s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.25e-5, train/loss_step=0.00247, global_step=324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  24%|██▍       | 19/80 [02:08<06:32,  6.43s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.25e-5, train/loss_step=0.00247, global_step=324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  24%|██▍       | 19/80 [02:08<06:32,  6.43s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=2.91e-5, train/loss_step=0.00696, global_step=324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  25%|██▌       | 20/80 [02:20<06:40,  6.67s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00696, train/loss_vlb_step=2.91e-5, train/loss_step=0.00696, global_step=324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  25%|██▌       | 20/80 [02:20<06:40,  6.67s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2e-5, train/loss_step=0.00506, global_step=324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]   Epoch 16:  26%|██▋       | 21/80 [02:20<06:17,  6.39s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=2e-5, train/loss_step=0.00506, global_step=324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  26%|██▋       | 21/80 [02:20<06:17,  6.39s/it, loss=0.00633, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=8.58e-6, train/loss_step=0.00234, global_step=325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  28%|██▊       | 22/80 [02:21<05:56,  6.14s/it, loss=0.00633, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=8.58e-6, train/loss_step=0.00234, global_step=325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  28%|██▊       | 22/80 [02:21<05:56,  6.14s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=6.35e-5, train/loss_step=0.0103, global_step=325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  29%|██▉       | 23/80 [02:21<05:36,  5.90s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=6.35e-5, train/loss_step=0.0103, global_step=325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  29%|██▉       | 23/80 [02:21<05:36,  5.90s/it, loss=0.00687, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=9.48e-6, train/loss_step=0.00251, global_step=325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  30%|███       | 24/80 [02:38<05:55,  6.34s/it, loss=0.00687, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=9.48e-6, train/loss_step=0.00251, global_step=325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  30%|███       | 24/80 [02:38<05:55,  6.34s/it, loss=0.00758, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=5.38e-5, train/loss_step=0.016, global_step=325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]    Epoch 16:  31%|███▏      | 25/80 [02:39<05:38,  6.15s/it, loss=0.00758, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=5.38e-5, train/loss_step=0.016, global_step=325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  31%|███▏      | 25/80 [02:39<05:38,  6.15s/it, loss=0.008, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.92e-5, train/loss_step=0.0101, global_step=326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.008, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.92e-5, train/loss_step=0.0101, global_step=326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.0086, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000198, train/loss_step=0.0133, global_step=326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  34%|███▍      | 27/80 [02:53<05:28,  6.20s/it, loss=0.0086, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000198, train/loss_step=0.0133, global_step=326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  34%|███▍      | 27/80 [02:53<05:28,  6.20s/it, loss=0.00876, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.17e-5, train/loss_step=0.00531, global_step=326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  35%|███▌      | 28/80 [03:01<05:25,  6.26s/it, loss=0.00876, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=2.17e-5, train/loss_step=0.00531, global_step=326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  35%|███▌      | 28/80 [03:01<05:25,  6.26s/it, loss=0.00885, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.91e-5, train/loss_step=0.00266, global_step=326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  36%|███▋      | 29/80 [03:02<05:09,  6.07s/it, loss=0.00885, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.91e-5, train/loss_step=0.00266, global_step=326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  36%|███▋      | 29/80 [03:02<05:09,  6.07s/it, loss=0.00899, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.27e-5, train/loss_step=0.00349, global_step=327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.00899, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.27e-5, train/loss_step=0.00349, global_step=327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.00881, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=4.5e-6, train/loss_step=0.000803, global_step=327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  39%|███▉      | 31/80 [03:03<04:40,  5.72s/it, loss=0.00881, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=4.5e-6, train/loss_step=0.000803, global_step=327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  39%|███▉      | 31/80 [03:03<04:40,  5.72s/it, loss=0.00781, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.07e-6, train/loss_step=0.00112, global_step=327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463] Epoch 16:  40%|████      | 32/80 [03:15<04:44,  5.92s/it, loss=0.00781, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.07e-6, train/loss_step=0.00112, global_step=327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  40%|████      | 32/80 [03:15<04:44,  5.92s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.18e-6, train/loss_step=0.00114, global_step=327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463] Epoch 16:  41%|████▏     | 33/80 [03:22<04:39,  5.95s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.18e-6, train/loss_step=0.00114, global_step=327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  41%|████▏     | 33/80 [03:22<04:39,  5.95s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000178, train/loss_step=0.0152, global_step=328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  42%|████▎     | 34/80 [03:29<04:34,  5.98s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000178, train/loss_step=0.0152, global_step=328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  42%|████▎     | 34/80 [03:29<04:34,  5.98s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00071, train/loss_vlb_step=3.65e-6, train/loss_step=0.00071, global_step=328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  44%|████▍     | 35/80 [03:29<04:22,  5.83s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00071, train/loss_vlb_step=3.65e-6, train/loss_step=0.00071, global_step=328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  44%|████▍     | 35/80 [03:29<04:22,  5.83s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.31e-6, train/loss_step=0.000339, global_step=328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.31e-6, train/loss_step=0.000339, global_step=328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=5.57e-6, train/loss_step=0.00113, global_step=328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  46%|████▋     | 37/80 [03:44<04:13,  5.90s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=5.57e-6, train/loss_step=0.00113, global_step=328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  46%|████▋     | 37/80 [03:44<04:13,  5.90s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=0.00403, train/loss_step=0.00897, global_step=329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  48%|████▊     | 38/80 [03:44<04:01,  5.76s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=0.00403, train/loss_step=0.00897, global_step=329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  48%|████▊     | 38/80 [03:44<04:01,  5.76s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000741, train/loss_vlb_step=4.13e-6, train/loss_step=0.000741, global_step=329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  49%|████▉     | 39/80 [03:45<03:50,  5.63s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000741, train/loss_vlb_step=4.13e-6, train/loss_step=0.000741, global_step=329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  49%|████▉     | 39/80 [03:45<03:50,  5.63s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=1.73e-5, train/loss_step=0.00463, global_step=329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  50%|█████     | 40/80 [03:56<03:50,  5.77s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=1.73e-5, train/loss_step=0.00463, global_step=329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  50%|█████     | 40/80 [03:56<03:50,  5.77s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=0.000162, train/loss_step=0.00978, global_step=329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=0.000162, train/loss_step=0.00978, global_step=329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=2.37e-6, train/loss_step=0.000619, global_step=330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  52%|█████▎    | 42/80 [04:20<03:50,  6.07s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=2.37e-6, train/loss_step=0.000619, global_step=330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  52%|█████▎    | 42/80 [04:20<03:50,  6.07s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00087, train/loss_vlb_step=4.16e-6, train/loss_step=0.00087, global_step=330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  54%|█████▍    | 43/80 [04:21<03:39,  5.94s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00087, train/loss_vlb_step=4.16e-6, train/loss_step=0.00087, global_step=330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  54%|█████▍    | 43/80 [04:21<03:39,  5.94s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=0.000944, train/loss_step=0.00899, global_step=330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  55%|█████▌    | 44/80 [04:25<03:32,  5.91s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=0.000944, train/loss_step=0.00899, global_step=330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  55%|█████▌    | 44/80 [04:25<03:32,  5.91s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000791, train/loss_vlb_step=3.84e-6, train/loss_step=0.000791, global_step=330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  56%|█████▋    | 45/80 [04:26<03:22,  5.79s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000791, train/loss_vlb_step=3.84e-6, train/loss_step=0.000791, global_step=330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  56%|█████▋    | 45/80 [04:26<03:22,  5.79s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.73e-5, train/loss_step=0.0154, global_step=331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]     Epoch 16:  57%|█████▊    | 46/80 [04:27<03:13,  5.68s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=6.73e-5, train/loss_step=0.0154, global_step=331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  57%|█████▊    | 46/80 [04:27<03:13,  5.68s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=7.14e-6, train/loss_step=0.00161, global_step=331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  59%|█████▉    | 47/80 [04:27<03:03,  5.57s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=7.14e-6, train/loss_step=0.00161, global_step=331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  59%|█████▉    | 47/80 [04:27<03:03,  5.57s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000242, train/loss_step=0.0105, global_step=331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463] Epoch 16:  60%|██████    | 48/80 [04:44<03:06,  5.81s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000242, train/loss_step=0.0105, global_step=331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  60%|██████    | 48/80 [04:44<03:06,  5.81s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000983, train/loss_step=0.0284, global_step=331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  61%|██████▏   | 49/80 [04:54<03:02,  5.90s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.0284, train/loss_vlb_step=0.000983, train/loss_step=0.0284, global_step=331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  61%|██████▏   | 49/80 [04:54<03:02,  5.90s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.07e-5, train/loss_step=0.00289, global_step=332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.07e-5, train/loss_step=0.00289, global_step=332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=2.99e-6, train/loss_step=0.000793, global_step=332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  64%|██████▍   | 51/80 [05:01<02:47,  5.79s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=2.99e-6, train/loss_step=0.000793, global_step=332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  64%|██████▍   | 51/80 [05:01<02:47,  5.79s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=1.23e-5, train/loss_step=0.00125, global_step=332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  65%|██████▌   | 52/80 [05:01<02:39,  5.69s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=1.23e-5, train/loss_step=0.00125, global_step=332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  65%|██████▌   | 52/80 [05:01<02:39,  5.69s/it, loss=0.00641, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=5.01e-5, train/loss_step=0.0146, global_step=332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  66%|██████▋   | 53/80 [05:13<02:36,  5.81s/it, loss=0.00641, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=5.01e-5, train/loss_step=0.0146, global_step=332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  66%|██████▋   | 53/80 [05:13<02:36,  5.81s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=1.61e-6, train/loss_step=0.000359, global_step=333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  68%|██████▊   | 54/80 [05:14<02:28,  5.71s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=1.61e-6, train/loss_step=0.000359, global_step=333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  68%|██████▊   | 54/80 [05:14<02:28,  5.71s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=3.57e-5, train/loss_step=0.00254, global_step=333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  69%|██████▉   | 55/80 [05:14<02:20,  5.62s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=3.57e-5, train/loss_step=0.00254, global_step=333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  69%|██████▉   | 55/80 [05:14<02:20,  5.62s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.78e-5, train/loss_step=0.00344, global_step=333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  70%|███████   | 56/80 [05:27<02:17,  5.74s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.78e-5, train/loss_step=0.00344, global_step=333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  70%|███████   | 56/80 [05:27<02:17,  5.74s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.000913, train/loss_vlb_step=4.98e-6, train/loss_step=0.000913, global_step=333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  71%|███████▏  | 57/80 [05:30<02:11,  5.71s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.000913, train/loss_vlb_step=4.98e-6, train/loss_step=0.000913, global_step=333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  71%|███████▏  | 57/80 [05:30<02:11,  5.71s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=4e-5, train/loss_step=0.00846, global_step=334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]    Epoch 16:  72%|███████▎  | 58/80 [05:41<02:07,  5.79s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=4e-5, train/loss_step=0.00846, global_step=334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  72%|███████▎  | 58/80 [05:41<02:07,  5.79s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=6.27e-5, train/loss_step=0.00356, global_step=334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=6.27e-5, train/loss_step=0.00356, global_step=334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.11e-5, train/loss_step=0.00558, global_step=334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  75%|███████▌  | 60/80 [05:44<01:52,  5.64s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=2.11e-5, train/loss_step=0.00558, global_step=334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  75%|███████▌  | 60/80 [05:44<01:52,  5.64s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=1.46e-6, train/loss_step=0.000378, global_step=334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=1.46e-6, train/loss_step=0.000378, global_step=334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.64e-5, train/loss_step=0.0115, global_step=335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]    Epoch 16:  78%|███████▊  | 62/80 [05:53<01:41,  5.61s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.64e-5, train/loss_step=0.0115, global_step=335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  78%|███████▊  | 62/80 [05:53<01:41,  5.61s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=3.18e-6, train/loss_step=0.000726, global_step=335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  79%|███████▉  | 63/80 [05:54<01:34,  5.53s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=3.18e-6, train/loss_step=0.000726, global_step=335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  79%|███████▉  | 63/80 [05:54<01:34,  5.53s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=3.34e-5, train/loss_step=0.00874, global_step=335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  80%|██████���█  | 64/80 [06:10<01:31,  5.70s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=3.34e-5, train/loss_step=0.00874, global_step=335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  80%|████████  | 64/80 [06:10<01:31,  5.70s/it, loss=0.00671, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000117, train/loss_step=0.0125, global_step=335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463] Epoch 16:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.00671, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000117, train/loss_step=0.0125, global_step=335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=0.000103, train/loss_step=0.0106, global_step=336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  82%|████████▎ | 66/80 [06:23<01:20,  5.72s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=0.000103, train/loss_step=0.0106, global_step=336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  82%|████████▎ | 66/80 [06:23<01:20,  5.72s/it, loss=0.00653, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.1e-5, train/loss_step=0.00284, global_step=336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  84%|████████▍ | 67/80 [06:23<01:13,  5.65s/it, loss=0.00653, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.1e-5, train/loss_step=0.00284, global_step=336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  84%|████████▍ | 67/80 [06:23<01:13,  5.65s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000107, train/loss_step=0.0138, global_step=336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  85%|████████▌ | 68/80 [06:31<01:08,  5.67s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000107, train/loss_step=0.0138, global_step=336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  85%|████████▌ | 68/80 [06:31<01:08,  5.67s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.000364, train/loss_vlb_step=1.43e-6, train/loss_step=0.000364, global_step=336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  86%|████████▋ | 69/80 [06:36<01:02,  5.67s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.000364, train/loss_vlb_step=1.43e-6, train/loss_step=0.000364, global_step=336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  86%|████████▋ | 69/80 [06:36<01:02,  5.67s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.19e-5, train/loss_step=0.00276, global_step=337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  88%|████████▊ | 70/80 [06:37<00:55,  5.59s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.19e-5, train/loss_step=0.00276, global_step=337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  88%|████████▊ | 70/80 [06:37<00:55,  5.59s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000653, train/loss_step=0.0251, global_step=337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  89%|████████▉ | 71/80 [06:37<00:49,  5.52s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000653, train/loss_step=0.0251, global_step=337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  89%|████████▉ | 71/80 [06:37<00:49,  5.52s/it, loss=0.00653, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.83e-5, train/loss_step=0.00185, global_step=337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  90%|█████████ | 72/80 [06:49<00:44,  5.61s/it, loss=0.00653, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.83e-5, train/loss_step=0.00185, global_step=337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  90%|█████████ | 72/80 [06:49<00:44,  5.61s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=1.78e-5, train/loss_step=0.00504, global_step=337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  91%|█████████▏| 73/80 [06:49<00:38,  5.54s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=1.78e-5, train/loss_step=0.00504, global_step=337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  91%|█████████▏| 73/80 [06:49<00:38,  5.54s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=2.91e-6, train/loss_step=0.000662, global_step=338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  92%|█████████▎| 74/80 [07:06<00:34,  5.69s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=2.91e-6, train/loss_step=0.000662, global_step=338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  92%|█████████▎| 74/80 [07:06<00:34,  5.69s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.08e-5, train/loss_step=0.00379, global_step=338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  94%|█████████▍| 75/80 [07:07<00:28,  5.62s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=2.08e-5, train/loss_step=0.00379, global_step=338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  94%|█████████▍| 75/80 [07:07<00:28,  5.62s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=4.63e-6, train/loss_step=0.000787, global_step=338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=4.63e-6, train/loss_step=0.000787, global_step=338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=4.04e-6, train/loss_step=0.000748, global_step=338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  96%|█████████▋| 77/80 [07:10<00:16,  5.52s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=4.04e-6, train/loss_step=0.000748, global_step=338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  96%|█████████▋| 77/80 [07:10<00:16,  5.52s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=9.29e-6, train/loss_step=0.00243, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 16:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=9.29e-6, train/loss_step=0.00243, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=8.74e-6, train/loss_step=0.00142, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  99%|█████████▉| 79/80 [07:11<00:05,  5.40s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=8.74e-6, train/loss_step=0.00142, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16:  99%|█████████▉| 79/80 [07:11<00:05,  5.40s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=8.5e-5, train/loss_step=0.00774, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463] Epoch 16: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00774, train/loss_vlb_step=8.5e-5, train/loss_step=0.00774, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 16: 100%|█████████���| 80/80 [07:12<00:00,  5.34s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=1.88e-5, train/loss_step=0.00477, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Average Epoch time: 432.32 seconds
+Average Peak memory 29568.57MiB
+Epoch 16:   0%|          | 0/80 [00:00<00:00, 7557.30it/s, loss=0.00591, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=1.88e-5, train/loss_step=0.00477, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 17:   0%|          | 0/80 [00:00<00:00, 2716.52it/s, loss=0.00591, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=1.88e-5, train/loss_step=0.00477, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]Epoch 17:   1%|▏         | 1/80 [00:45<30:00, 22.80s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=1.88e-5, train/loss_step=0.00477, global_step=339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00463]  Epoch 17:   1%|▏         | 1/80 [00:45<30:00, 22.80s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=0.000107, train/loss_step=0.0142, global_step=340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:   2%|▎         | 2/80 [00:46<19:57, 15.36s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=0.000107, train/loss_step=0.0142, global_step=340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   2%|▎         | 2/80 [00:46<19:57, 15.36s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=2.55e-5, train/loss_step=0.00711, global_step=340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   4%|▍         | 3/80 [00:46<14:56, 11.64s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=2.55e-5, train/loss_step=0.00711, global_step=340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   4%|▍         | 3/80 [00:46<14:56, 11.64s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.000593, train/loss_vlb_step=3.75e-6, train/loss_step=0.000593, global_step=340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   5%|▌         | 4/80 [00:47<11:55,  9.42s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.000593, train/loss_vlb_step=3.75e-6, train/loss_step=0.000593, global_step=340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   5%|▌         | 4/80 [00:47<11:55,  9.42s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000832, train/loss_vlb_step=3.88e-6, train/loss_step=0.000832, global_step=340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   6%|▋         | 5/80 [00:47<09:54,  7.93s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000832, train/loss_vlb_step=3.88e-6, train/loss_step=0.000832, global_step=340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   6%|▋         | 5/80 [00:47<09:54,  7.93s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.00292, train/loss_step=0.0321, global_step=341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]    Epoch 17:   8%|▊         | 6/80 [00:48<08:28,  6.87s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.0321, train/loss_vlb_step=0.00292, train/loss_step=0.0321, global_step=341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   8%|▊         | 6/80 [00:48<08:28,  6.87s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.12e-5, train/loss_step=0.00317, global_step=341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   9%|▉         | 7/80 [00:48<07:26,  6.11s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.12e-5, train/loss_step=0.00317, global_step=341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:   9%|▉         | 7/80 [00:48<07:26,  6.11s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=2.43e-5, train/loss_step=0.00628, global_step=341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  10%|█         | 8/80 [01:17<10:19,  8.60s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=2.43e-5, train/loss_step=0.00628, global_step=341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  10%|█         | 8/80 [01:17<10:19,  8.60s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=9.03e-6, train/loss_step=0.00235, global_step=341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  11%|█▏        | 9/80 [01:17<09:13,  7.79s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=9.03e-6, train/loss_step=0.00235, global_step=341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  11%|█▏        | 9/80 [01:17<09:13,  7.79s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.21e-5, train/loss_step=0.0147, global_step=342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]  Epoch 17:  12%|█▎        | 10/80 [01:18<08:18,  7.13s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.21e-5, train/loss_step=0.0147, global_step=342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  12%|█▎        | 10/80 [01:18<08:18,  7.13s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=4.75e-6, train/loss_step=0.00075, global_step=342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  14%|█▍        | 11/80 [01:18<07:33,  6.58s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=4.75e-6, train/loss_step=0.00075, global_step=342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  14%|█▍        | 11/80 [01:18<07:33,  6.58s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=6.06e-5, train/loss_step=0.00414, global_step=342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  15%|█▌        | 12/80 [01:25<07:25,  6.55s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00414, train/loss_vlb_step=6.06e-5, train/loss_step=0.00414, global_step=342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  15%|█▌        | 12/80 [01:25<07:25,  6.55s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=5.04e-5, train/loss_step=0.00865, global_step=342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  16%|█▋        | 13/80 [01:25<06:49,  6.12s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=5.04e-5, train/loss_step=0.00865, global_step=342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  16%|█▋        | 13/80 [01:25<06:49,  6.12s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=0.000236, train/loss_step=0.00271, global_step=343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  18%|█▊        | 14/80 [01:26<06:18,  5.74s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=0.000236, train/loss_step=0.00271, global_step=343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  18%|█▊        | 14/80 [01:26<06:18,  5.74s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.16e-5, train/loss_step=0.00593, global_step=343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  19%|█▉        | 15/80 [01:35<06:27,  5.97s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.16e-5, train/loss_step=0.00593, global_step=343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  19%|█▉        | 15/80 [01:35<06:27,  5.97s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.54e-5, train/loss_step=0.00415, global_step=343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  20%|██        | 16/80 [01:51<06:59,  6.56s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=2.54e-5, train/loss_step=0.00415, global_step=343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  20%|██        | 16/80 [01:51<06:59,  6.56s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.32e-6, train/loss_step=0.000345, global_step=343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  21%|██▏       | 17/80 [01:52<06:32,  6.22s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.32e-6, train/loss_step=0.000345, global_step=343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  21%|██▏       | 17/80 [01:52<06:32,  6.22s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=5.7e-5, train/loss_step=0.00931, global_step=344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]   Epoch 17:  22%|██▎       | 18/80 [02:08<06:59,  6.77s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00931, train/loss_vlb_step=5.7e-5, train/loss_step=0.00931, global_step=344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  22%|██▎       | 18/80 [02:08<06:59,  6.77s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=2.1e-5, train/loss_step=0.00582, global_step=344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  24%|██▍       | 19/80 [02:09<06:33,  6.46s/it, loss=0.00678, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=2.1e-5, train/loss_step=0.00582, global_step=344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  24%|██▍       | 19/80 [02:09<06:33,  6.46s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=0.000227, train/loss_step=0.0163, global_step=344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  25%|██▌       | 20/80 [02:09<06:10,  6.17s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=0.000227, train/loss_step=0.0163, global_step=344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  25%|██▌       | 20/80 [02:09<06:10,  6.17s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=5.46e-5, train/loss_step=0.00855, global_step=344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  26%|██▋       | 21/80 [02:10<05:49,  5.92s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=5.46e-5, train/loss_step=0.00855, global_step=344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  26%|██▋       | 21/80 [02:10<05:49,  5.92s/it, loss=0.00779, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.00024, train/loss_step=0.022, global_step=345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]   Epoch 17:  28%|██▊       | 22/80 [02:10<05:29,  5.69s/it, loss=0.00779, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.00024, train/loss_step=0.022, global_step=345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  28%|██▊       | 22/80 [02:10<05:29,  5.69s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=2.7e-5, train/loss_step=0.00272, global_step=345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  29%|██▉       | 23/80 [02:23<05:41,  5.99s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=2.7e-5, train/loss_step=0.00272, global_step=345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  29%|██▉       | 23/80 [02:23<05:41,  5.99s/it, loss=0.00759, v_num=0, train/loss_simple_step=0.000993, train/loss_vlb_step=1.51e-5, train/loss_step=0.000993, global_step=345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  30%|███       | 24/80 [02:42<06:04,  6.51s/it, loss=0.00759, v_num=0, train/loss_simple_step=0.000993, train/loss_vlb_step=1.51e-5, train/loss_step=0.000993, global_step=345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  30%|███       | 24/80 [02:42<06:04,  6.51s/it, loss=0.00758, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=3.16e-6, train/loss_step=0.000747, global_step=345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  31%|███▏      | 25/80 [02:43<05:45,  6.28s/it, loss=0.00758, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=3.16e-6, train/loss_step=0.000747, global_step=345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  31%|███▏      | 25/80 [02:43<05:45,  6.28s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=4.02e-5, train/loss_step=0.00768, global_step=346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]  Epoch 17:  32%|███▎      | 26/80 [02:59<05:58,  6.65s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=4.02e-5, train/loss_step=0.00768, global_step=346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  32%|███▎      | 26/80 [02:59<05:58,  6.65s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.47e-5, train/loss_step=0.00229, global_step=346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  34%|███▍      | 27/80 [02:59<05:40,  6.43s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.47e-5, train/loss_step=0.00229, global_step=346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  34%|███▍      | 27/80 [02:59<05:40,  6.43s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=2.34e-5, train/loss_step=0.00152, global_step=346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  35%|███▌      | 28/80 [03:00<05:23,  6.22s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=2.34e-5, train/loss_step=0.00152, global_step=346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  35%|███▌      | 28/80 [03:00<05:23,  6.22s/it, loss=0.00676, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.73e-5, train/loss_step=0.016, global_step=346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]    Epoch 17:  36%|███▋      | 29/80 [03:01<05:07,  6.03s/it, loss=0.00676, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=6.73e-5, train/loss_step=0.016, global_step=346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  36%|███▋      | 29/80 [03:01<05:07,  6.03s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=0.000196, train/loss_step=0.0202, global_step=347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  38%|███▊      | 30/80 [03:01<04:52,  5.86s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=0.000196, train/loss_step=0.0202, global_step=347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  38%|███▊      | 30/80 [03:01<04:52,  5.86s/it, loss=0.00739, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=2.99e-5, train/loss_step=0.00787, global_step=347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  39%|███▉      | 31/80 [03:02<04:38,  5.69s/it, loss=0.00739, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=2.99e-5, train/loss_step=0.00787, global_step=347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  39%|███▉      | 31/80 [03:02<04:38,  5.69s/it, loss=0.00762, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=3.97e-5, train/loss_step=0.00864, global_step=347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  40%|████      | 32/80 [03:23<04:56,  6.17s/it, loss=0.00762, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=3.97e-5, train/loss_step=0.00864, global_step=347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  40%|████      | 32/80 [03:23<04:56,  6.17s/it, loss=0.00728, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.03e-5, train/loss_step=0.00195, global_step=347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  41%|████▏     | 33/80 [03:24<04:42,  6.01s/it, loss=0.00728, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=1.03e-5, train/loss_step=0.00195, global_step=347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  41%|████▏     | 33/80 [03:24<04:42,  6.01s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=1.87e-5, train/loss_step=0.00127, global_step=348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  42%|███���▎     | 34/80 [03:34<04:41,  6.13s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=1.87e-5, train/loss_step=0.00127, global_step=348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  42%|████▎     | 34/80 [03:34<04:41,  6.13s/it, loss=0.00699, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=3.2e-5, train/loss_step=0.00143, global_step=348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  44%|████▍     | 35/80 [03:34<04:28,  5.97s/it, loss=0.00699, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=3.2e-5, train/loss_step=0.00143, global_step=348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  44%|████▍     | 35/80 [03:34<04:28,  5.97s/it, loss=0.00733, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000829, train/loss_step=0.011, global_step=348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]  Epoch 17:  45%|████▌     | 36/80 [03:37<04:18,  5.88s/it, loss=0.00733, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000829, train/loss_step=0.011, global_step=348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  45%|████▌     | 36/80 [03:37<04:18,  5.88s/it, loss=0.00736, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=5.43e-6, train/loss_step=0.00103, global_step=348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  46%|████▋     | 37/80 [03:44<04:14,  5.92s/it, loss=0.00736, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=5.43e-6, train/loss_step=0.00103, global_step=348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  46%|████▋     | 37/80 [03:44<04:14,  5.92s/it, loss=0.00698, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=7.73e-6, train/loss_step=0.00157, global_step=349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  48%|████▊     | 38/80 [03:45<04:02,  5.78s/it, loss=0.00698, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=7.73e-6, train/loss_step=0.00157, global_step=349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  48%|████▊     | 38/80 [03:45<04:02,  5.78s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=4.13e-6, train/loss_step=0.000831, global_step=349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  49%|████▉     | 39/80 [03:45<03:51,  5.65s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=4.13e-6, train/loss_step=0.000831, global_step=349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  49%|████▉     | 39/80 [03:45<03:51,  5.65s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.000978, train/loss_vlb_step=5.22e-6, train/loss_step=0.000978, global_step=349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  50%|█████     | 40/80 [04:05<03:59,  5.98s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.000978, train/loss_vlb_step=5.22e-6, train/loss_step=0.000978, global_step=349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  50%|█████     | 40/80 [04:05<03:59,  5.98s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=3.15e-5, train/loss_step=0.00733, global_step=349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]   Epoch 17:  51%|█████▏    | 41/80 [04:05<03:48,  5.85s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=3.15e-5, train/loss_step=0.00733, global_step=349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  51%|█████▏    | 41/80 [04:05<03:48,  5.85s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.39e-5, train/loss_step=0.00182, global_step=350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  52%|█████▎    | 42/80 [04:16<03:46,  5.97s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=1.39e-5, train/loss_step=0.00182, global_step=350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  52%|█████▎    | 42/80 [04:16<03:46,  5.97s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=4.11e-6, train/loss_step=0.00104, global_step=350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  54%|█████▍    | 43/80 [04:17<03:36,  5.85s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=4.11e-6, train/loss_step=0.00104, global_step=350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  54%|█████▍    | 43/80 [04:17<03:36,  5.85s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000369, train/loss_vlb_step=1.64e-6, train/loss_step=0.000369, global_step=350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  55%|█████▌    | 44/80 [04:17<03:26,  5.73s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000369, train/loss_vlb_step=1.64e-6, train/loss_step=0.000369, global_step=350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  55%|█████▌    | 44/80 [04:17<03:26,  5.73s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.23e-5, train/loss_step=0.00518, global_step=350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]    Epoch 17:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=2.23e-5, train/loss_step=0.00518, global_step=350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=1.46e-5, train/loss_step=0.00118, global_step=351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=1.46e-5, train/loss_step=0.00118, global_step=351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=6.47e-6, train/loss_step=0.00132, global_step=351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=6.47e-6, train/loss_step=0.00132, global_step=351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.39e-5, train/loss_step=0.00796, global_step=351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  60%|██████    | 48/80 [04:37<03:01,  5.66s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.39e-5, train/loss_step=0.00796, global_step=351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  60%|██████    | 48/80 [04:37<03:01,  5.66s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=4.69e-6, train/loss_step=0.000749, global_step=351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  61%|██████▏   | 49/80 [04:38<02:52,  5.56s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=4.69e-6, train/loss_step=0.000749, global_step=351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  61%|██████▏   | 49/80 [04:38<02:52,  5.56s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.02e-5, train/loss_step=0.00532, global_step=352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]  Epoch 17:  62%|██████▎   | 50/80 [04:58<02:55,  5.85s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=2.02e-5, train/loss_step=0.00532, global_step=352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  62%|██████▎   | 50/80 [04:58<02:55,  5.85s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=9.22e-5, train/loss_step=0.00705, global_step=352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  64%|██████▍   | 51/80 [04:59<02:46,  5.75s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=9.22e-5, train/loss_step=0.00705, global_step=352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  64%|██████▍   | 51/80 [04:59<02:46,  5.75s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.31e-5, train/loss_step=0.00356, global_step=352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  65%|██████▌   | 52/80 [04:59<02:38,  5.65s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=2.31e-5, train/loss_step=0.00356, global_step=352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  65%|██████▌   | 52/80 [04:59<02:38,  5.65s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=0.000167, train/loss_step=0.0177, global_step=352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  66%|██████▋   | 53/80 [05:12<02:36,  5.78s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0177, train/loss_vlb_step=0.000167, train/loss_step=0.0177, global_step=352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  66%|██████▋   | 53/80 [05:12<02:36,  5.78s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=3.08e-5, train/loss_step=0.00771, global_step=353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  68%|██████▊   | 54/80 [05:12<02:27,  5.69s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=3.08e-5, train/loss_step=0.00771, global_step=353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  68%|██████▊   | 54/80 [05:12<02:27,  5.69s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.11e-5, train/loss_step=0.00281, global_step=353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  69%|██████▉   | 55/80 [05:13<02:19,  5.59s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.11e-5, train/loss_step=0.00281, global_step=353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  69%|██████▉   | 55/80 [05:13<02:19,  5.59s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=1.6e-5, train/loss_step=0.00456, global_step=353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]   Epoch 17:  70%|███████   | 56/80 [05:13<02:12,  5.51s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=1.6e-5, train/loss_step=0.00456, global_step=353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  70%|███████   | 56/80 [05:13<02:12,  5.51s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=1.44e-6, train/loss_step=0.000341, global_step=353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  71%|███████▏  | 57/80 [05:14<02:04,  5.42s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=1.44e-6, train/loss_step=0.000341, global_step=353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  71%|███████▏  | 57/80 [05:14<02:04,  5.42s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.77e-5, train/loss_step=0.013, global_step=354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]      Epoch 17:  72%|███████▎  | 58/80 [05:40<02:06,  5.76s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.77e-5, train/loss_step=0.013, global_step=354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  72%|███████▎  | 58/80 [05:40<02:06,  5.76s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=2.2e-6, train/loss_step=0.000591, global_step=354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  74%|███████▍  | 59/80 [05:40<01:59,  5.68s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=2.2e-6, train/loss_step=0.000591, global_step=354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  74%|███████▍  | 59/80 [05:40<01:59,  5.68s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000502, train/loss_vlb_step=2.51e-6, train/loss_step=0.000502, global_step=354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  75%|███████▌  | 60/80 [05:41<01:51,  5.59s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000502, train/loss_vlb_step=2.51e-6, train/loss_step=0.000502, global_step=354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  75%|███████▌  | 60/80 [05:41<01:51,  5.59s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=2.61e-5, train/loss_step=0.00757, global_step=354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  76%|███████▋  | 61/80 [05:56<01:49,  5.74s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=2.61e-5, train/loss_step=0.00757, global_step=354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  76%|███████▋  | 61/80 [05:56<01:49,  5.74s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.71e-6, train/loss_step=0.00106, global_step=355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  78%|███████▊  | 62/80 [05:56<01:41,  5.66s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.71e-6, train/loss_step=0.00106, global_step=355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  78%|███████▊  | 62/80 [05:56<01:41,  5.66s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=3.73e-5, train/loss_step=0.00148, global_step=355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  79%|███████▉  | 63/80 [05:57<01:34,  5.58s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=3.73e-5, train/loss_step=0.00148, global_step=355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  79%|███████▉  | 63/80 [05:57<01:34,  5.58s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=3.24e-6, train/loss_step=0.000623, global_step=355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  80%|████████  | 64/80 [05:57<01:28,  5.50s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=3.24e-6, train/loss_step=0.000623, global_step=355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  80%|████████  | 64/80 [05:57<01:28,  5.50s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.13e-5, train/loss_step=0.00314, global_step=355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]  Epoch 17:  81%|████████▏ | 65/80 [06:04<01:22,  5.52s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.13e-5, train/loss_step=0.00314, global_step=355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  81%|████████▏ | 65/80 [06:04<01:22,  5.52s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000565, train/loss_vlb_step=2e-6, train/loss_step=0.000565, global_step=356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  82%|████████▎ | 66/80 [06:24<01:20,  5.73s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000565, train/loss_vlb_step=2e-6, train/loss_step=0.000565, global_step=356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  82%|████████▎ | 66/80 [06:24<01:20,  5.73s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=6.6e-5, train/loss_step=0.0075, global_step=356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]  Epoch 17:  84%|████████▍ | 67/80 [06:24<01:13,  5.65s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=6.6e-5, train/loss_step=0.0075, global_step=356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  84%|████████▍ | 67/80 [06:24<01:13,  5.65s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000343, train/loss_vlb_step=1.44e-6, train/loss_step=0.000343, global_step=356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  85%|████████▌ | 68/80 [06:25<01:06,  5.58s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000343, train/loss_vlb_step=1.44e-6, train/loss_step=0.000343, global_step=356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  85%|████████▌ | 68/80 [06:25<01:06,  5.58s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000526, train/loss_vlb_step=1.96e-6, train/loss_step=0.000526, global_step=356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  86%|████████▋ | 69/80 [06:35<01:02,  5.64s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000526, train/loss_vlb_step=1.96e-6, train/loss_step=0.000526, global_step=356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  86%|████████▋ | 69/80 [06:35<01:02,  5.64s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.14e-5, train/loss_step=0.00225, global_step=357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  88%|████████▊ | 70/80 [06:35<00:55,  5.57s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.14e-5, train/loss_step=0.00225, global_step=357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  88%|████████▊ | 70/80 [06:35<00:55,  5.57s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.38e-5, train/loss_step=0.00571, global_step=357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  89%|████████▉ | 71/80 [06:35<00:49,  5.50s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=3.38e-5, train/loss_step=0.00571, global_step=357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  89%|████████▉ | 71/80 [06:35<00:49,  5.50s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=8.1e-6, train/loss_step=0.00127, global_step=357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  90%|█████████ | 72/80 [06:36<00:43,  5.43s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=8.1e-6, train/loss_step=0.00127, global_step=357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  90%|█████████ | 72/80 [06:36<00:43,  5.43s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000145, train/loss_step=0.0143, global_step=357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  91%|█████████▏| 73/80 [06:37<00:37,  5.37s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000145, train/loss_step=0.0143, global_step=357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  91%|█████████▏| 73/80 [06:37<00:37,  5.37s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000738, train/loss_vlb_step=2.76e-6, train/loss_step=0.000738, global_step=358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  92%|█████████▎| 74/80 [06:59<00:33,  5.59s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000738, train/loss_vlb_step=2.76e-6, train/loss_step=0.000738, global_step=358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  92%|█████████▎| 74/80 [06:59<00:33,  5.59s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000587, train/loss_vlb_step=2.52e-6, train/loss_step=0.000587, global_step=358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  94%|█████████▍| 75/80 [06:59<00:27,  5.52s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000587, train/loss_vlb_step=2.52e-6, train/loss_step=0.000587, global_step=358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  94%|█████████▍| 75/80 [06:59<00:27,  5.52s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=8.88e-6, train/loss_step=0.00204, global_step=358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]  Epoch 17:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=8.88e-6, train/loss_step=0.00204, global_step=358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=0.000196, train/loss_step=0.0116, global_step=358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487] Epoch 17:  96%|█████████▋| 77/80 [07:02<00:16,  5.42s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=0.000196, train/loss_step=0.0116, global_step=358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  96%|█████████▋| 77/80 [07:02<00:16,  5.42s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=2.76e-6, train/loss_step=0.000642, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  98%|█████████▊| 78/80 [07:02<00:10,  5.35s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=2.76e-6, train/loss_step=0.000642, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  98%|█████████▊| 78/80 [07:02<00:10,  5.35s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=1.83e-6, train/loss_step=0.000436, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  99%|█████████▉| 79/80 [07:03<00:05,  5.29s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=1.83e-6, train/loss_step=0.000436, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17:  99%|█████████▉| 79/80 [07:03<00:05,  5.29s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=3.73e-5, train/loss_step=0.00978, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]  Epoch 17: 100%|██████████| 80/80 [07:03<00:00,  5.23s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=3.73e-5, train/loss_step=0.00978, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 17: 100%|██████████| 80/80 [07:03<00:00,  5.23s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=1.6e-6, train/loss_step=0.000402, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Average Epoch time: 423.96 seconds
+Average Peak memory 29565.67MiB
+Epoch 17:   0%|          | 0/80 [00:00<00:00, 9320.68it/s, loss=0.00325, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=1.6e-6, train/loss_step=0.000402, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 18:   0%|          | 0/80 [00:00<00:00, 3199.32it/s, loss=0.00325, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=1.6e-6, train/loss_step=0.000402, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]Epoch 18:   1%|▏         | 1/80 [00:49<32:30, 24.69s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=1.6e-6, train/loss_step=0.000402, global_step=359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00487, train/loss_vlb_epoch=0.000154, train/loss_epoch=0.00487]  Epoch 18:   1%|▏         | 1/80 [00:49<32:30, 24.69s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=3.54e-5, train/loss_step=0.0084, global_step=360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]    Epoch 18:   2%|▎         | 2/80 [00:49<21:36, 16.62s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=3.54e-5, train/loss_step=0.0084, global_step=360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:   2%|▎         | 2/80 [00:49<21:36, 16.62s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=2.98e-5, train/loss_step=0.00858, global_step=360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:   4%|▍         | 3/80 [00:56<18:01, 14.05s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=2.98e-5, train/loss_step=0.00858, global_step=360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:   4%|▍         | 3/80 [00:56<18:01, 14.05s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=5.03e-5, train/loss_step=0.00452, global_step=360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:   5%|▌         | 4/80 [00:56<14:22, 11.34s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=5.03e-5, train/loss_step=0.00452, global_step=360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:   5%|▌         | 4/80 [00:56<14:22, 11.34s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=4.01e-6, train/loss_step=0.000621, global_step=360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:   6%|▋         | 5/80 [00:57<11:55,  9.54s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=4.01e-6, train/loss_step=0.000621, global_step=360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:   6%|▋         | 5/80 [00:57<11:55,  9.54s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=6.69e-5, train/loss_step=0.00488, global_step=361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]  Epoch 18:   8%|▊         | 6/80 [00:57<10:10,  8.24s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=6.69e-5, train/loss_step=0.00488, global_step=361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:   8%|▊         | 6/80 [00:57<10:10,  8.24s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=0.000107, train/loss_step=0.00243, global_step=361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:   9%|▉         | 7/80 [00:58<08:51,  7.28s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=0.000107, train/loss_step=0.00243, global_step=361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:   9%|▉         | 7/80 [00:58<08:51,  7.28s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=2.63e-5, train/loss_step=0.00252, global_step=361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  10%|█         | 8/80 [01:23<11:05,  9.25s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=2.63e-5, train/loss_step=0.00252, global_step=361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  10%|█         | 8/80 [01:23<11:05,  9.25s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000827, train/loss_vlb_step=5.23e-6, train/loss_step=0.000827, global_step=361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  11%|█▏        | 9/80 [01:33<11:05,  9.37s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000827, train/loss_vlb_step=5.23e-6, train/loss_step=0.000827, global_step=361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  11%|█▏        | 9/80 [01:33<11:05,  9.37s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.61e-5, train/loss_step=0.0045, global_step=362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]    Epoch 18:  12%|█▎        | 10/80 [01:34<09:59,  8.57s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.61e-5, train/loss_step=0.0045, global_step=362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  12%|█▎        | 10/80 [01:34<09:59,  8.57s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.53e-6, train/loss_step=0.00136, global_step=362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  14%|█▍        | 11/80 [01:52<10:45,  9.36s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.53e-6, train/loss_step=0.00136, global_step=362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  14%|█▍        | 11/80 [01:52<10:45,  9.36s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=3.23e-6, train/loss_step=0.000621, global_step=362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  15%|█▌        | 12/80 [01:52<09:50,  8.68s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=3.23e-6, train/loss_step=0.000621, global_step=362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  15%|█▌        | 12/80 [01:52<09:50,  8.68s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.09e-5, train/loss_step=0.00575, global_step=362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]  Epoch 18:  16%|█▋        | 13/80 [01:53<09:02,  8.10s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.09e-5, train/loss_step=0.00575, global_step=362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  16%|█▋        | 13/80 [01:53<09:02,  8.10s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=1.87e-5, train/loss_step=0.00504, global_step=363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  18%|█▊        | 14/80 [01:53<08:21,  7.59s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00504, train/loss_vlb_step=1.87e-5, train/loss_step=0.00504, global_step=363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  18%|█▊        | 14/80 [01:53<08:21,  7.59s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.75e-5, train/loss_step=0.00512, global_step=363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]  Epoch 18:  19%|█▉        | 15/80 [01:54<07:44,  7.15s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.75e-5, train/loss_step=0.00512, global_step=363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  19%|█▉        | 15/80 [01:54<07:44,  7.15s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=3.64e-5, train/loss_step=0.00942, global_step=363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  20%|██        | 16/80 [02:02<07:42,  7.22s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=3.64e-5, train/loss_step=0.00942, global_step=363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  20%|██        | 16/80 [02:02<07:42,  7.22s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=2.44e-5, train/loss_step=0.00702, global_step=363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  21%|██▏       | 17/80 [02:03<07:11,  6.85s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=2.44e-5, train/loss_step=0.00702, global_step=363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  21%|██▏       | 17/80 [02:03<07:11,  6.85s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.03e-5, train/loss_step=0.00565, global_step=364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  22%|██▎       | 18/80 [02:03<06:43,  6.52s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.03e-5, train/loss_step=0.00565, global_step=364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  22%|██▎       | 18/80 [02:03<06:43,  6.52s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=0.000316, train/loss_step=0.00611, global_step=364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  24%|██▍       | 19/80 [02:27<07:28,  7.35s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=0.000316, train/loss_step=0.00611, global_step=364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  24%|██▍       | 19/80 [02:27<07:28,  7.35s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=3.94e-5, train/loss_step=0.0032, global_step=364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]   Epoch 18:  25%|██▌       | 20/80 [02:27<07:01,  7.03s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=3.94e-5, train/loss_step=0.0032, global_step=364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  25%|██▌       | 20/80 [02:27<07:01,  7.03s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.21e-5, train/loss_step=0.0026, global_step=364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  26%|██▋       | 21/80 [02:28<06:37,  6.73s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.21e-5, train/loss_step=0.0026, global_step=364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  26%|██▋       | 21/80 [02:28<06:37,  6.73s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=2.01e-5, train/loss_step=0.0016, global_step=365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  28%|██▊       | 22/80 [02:28<06:14,  6.46s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=2.01e-5, train/loss_step=0.0016, global_step=365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  28%|██▊       | 22/80 [02:28<06:14,  6.46s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000128, train/loss_step=0.0149, global_step=365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  29%|██▉       | 23/80 [02:29<05:54,  6.21s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000128, train/loss_step=0.0149, global_step=365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  29%|██▉       | 23/80 [02:29<05:54,  6.21s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.35e-6, train/loss_step=0.000333, global_step=365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  30%|███       | 24/80 [02:49<06:20,  6.79s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.35e-6, train/loss_step=0.000333, global_step=365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  30%|███       | 24/80 [02:49<06:20,  6.79s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=9.22e-6, train/loss_step=0.00104, global_step=365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]  Epoch 18:  31%|███▏      | 25/80 [02:50<06:00,  6.55s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=9.22e-6, train/loss_step=0.00104, global_step=365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  31%|███▏      | 25/80 [02:50<06:00,  6.55s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.29e-5, train/loss_step=0.00548, global_step=366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  32%|███▎      | 26/80 [02:50<05:41,  6.33s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00548, train/loss_vlb_step=2.29e-5, train/loss_step=0.00548, global_step=366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  32%|███▎      | 26/80 [02:50<05:41,  6.33s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00039, train/loss_vlb_step=1.56e-6, train/loss_step=0.00039, global_step=366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  34%|███▍      | 27/80 [03:03<05:47,  6.56s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00039, train/loss_vlb_step=1.56e-6, train/loss_step=0.00039, global_step=366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  34%|███▍      | 27/80 [03:03<05:47,  6.56s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=3.69e-6, train/loss_step=0.00101, global_step=366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:  35%|███▌      | 28/80 [03:25<06:08,  7.08s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=3.69e-6, train/loss_step=0.00101, global_step=366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  35%|███▌      | 28/80 [03:25<06:08,  7.08s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.2e-5, train/loss_step=0.00511, global_step=366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  36%|███▋      | 29/80 [03:25<05:50,  6.86s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.2e-5, train/loss_step=0.00511, global_step=366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  36%|███▋      | 29/80 [03:25<05:50,  6.86s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000725, train/loss_vlb_step=2.56e-6, train/loss_step=0.000725, global_step=367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  38%|███▊      | 30/80 [03:26<05:32,  6.66s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000725, train/loss_vlb_step=2.56e-6, train/loss_step=0.000725, global_step=367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  38%|███▊      | 30/80 [03:26<05:32,  6.66s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=3.67e-5, train/loss_step=0.00888, global_step=367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]   Epoch 18:  39%|███▉      | 31/80 [03:26<05:16,  6.47s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=3.67e-5, train/loss_step=0.00888, global_step=367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  39%|███▉      | 31/80 [03:26<05:16,  6.47s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00069, train/loss_vlb_step=2.71e-6, train/loss_step=0.00069, global_step=367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  40%|████      | 32/80 [03:28<05:03,  6.31s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00069, train/loss_vlb_step=2.71e-6, train/loss_step=0.00069, global_step=367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  40%|████      | 32/80 [03:28<05:03,  6.31s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.13e-5, train/loss_step=0.00254, global_step=367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  41%|████▏     | 33/80 [03:32<04:54,  6.26s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.13e-5, train/loss_step=0.00254, global_step=367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  41%|████▏     | 33/80 [03:32<04:54,  6.26s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=9.71e-6, train/loss_step=0.00142, global_step=368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  42%|████▎     | 34/80 [03:33<04:40,  6.09s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=9.71e-6, train/loss_step=0.00142, global_step=368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  42%|████▎     | 34/80 [03:33<04:40,  6.09s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=9.07e-6, train/loss_step=0.00131, global_step=368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  44%|████▍     | 35/80 [03:45<04:41,  6.26s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=9.07e-6, train/loss_step=0.00131, global_step=368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  44%|████▍     | 35/80 [03:45<04:41,  6.26s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=5.17e-5, train/loss_step=0.00187, global_step=368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  45%|████▌     | 36/80 [04:07<04:54,  6.70s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=5.17e-5, train/loss_step=0.00187, global_step=368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  45%|████▌     | 36/80 [04:07<04:54,  6.70s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.61e-5, train/loss_step=0.0122, global_step=368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]  Epoch 18:  46%|████▋     | 37/80 [04:08<04:40,  6.53s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.61e-5, train/loss_step=0.0122, global_step=368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  46%|████▋     | 37/80 [04:08<04:40,  6.53s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.00041, train/loss_step=0.0203, global_step=369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  48%|████▊     | 38/80 [04:08<04:27,  6.38s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.00041, train/loss_step=0.0203, global_step=369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  48%|████▊     | 38/80 [04:08<04:27,  6.38s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=8.8e-5, train/loss_step=0.0154, global_step=369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:  49%|████▉     | 39/80 [04:09<04:15,  6.23s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=8.8e-5, train/loss_step=0.0154, global_step=369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  49%|████▉     | 39/80 [04:09<04:15,  6.23s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00894, train/loss_vlb_step=3.66e-5, train/loss_step=0.00894, global_step=369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  50%|█████     | 40/80 [04:09<04:03,  6.09s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00894, train/loss_vlb_step=3.66e-5, train/loss_step=0.00894, global_step=369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  50%|█████     | 40/80 [04:09<04:03,  6.09s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.09e-5, train/loss_step=0.00255, global_step=369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  51%|█████▏    | 41/80 [04:16<03:57,  6.10s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.09e-5, train/loss_step=0.00255, global_step=369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  51%|█████▏    | 41/80 [04:16<03:57,  6.10s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=7.65e-6, train/loss_step=0.00146, global_step=370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  52%|█████▎    | 42/80 [04:16<03:47,  5.97s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=7.65e-6, train/loss_step=0.00146, global_step=370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  52%|█████▎    | 42/80 [04:16<03:47,  5.97s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.61e-5, train/loss_step=0.00799, global_step=370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  54%|█████▍    | 43/80 [04:33<03:49,  6.21s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.61e-5, train/loss_step=0.00799, global_step=370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  54%|█████▍    | 43/80 [04:33<03:49,  6.21s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=6.68e-6, train/loss_step=0.00169, global_step=370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  55%|█████▌    | 44/80 [04:50<03:52,  6.46s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=6.68e-6, train/loss_step=0.00169, global_step=370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  55%|█████▌    | 44/80 [04:50<03:52,  6.46s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.5e-5, train/loss_step=0.00816, global_step=370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:  56%|█████▋    | 45/80 [04:51<03:41,  6.33s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.5e-5, train/loss_step=0.00816, global_step=370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  56%|█████▋    | 45/80 [04:51<03:41,  6.33s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=8.23e-5, train/loss_step=0.00577, global_step=371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  57%|█████▊    | 46/80 [04:51<03:31,  6.21s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=8.23e-5, train/loss_step=0.00577, global_step=371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  57%|█████▊    | 46/80 [04:51<03:31,  6.21s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=2.1e-5, train/loss_step=0.00114, global_step=371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:  59%|█████▉    | 47/80 [04:52<03:20,  6.09s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=2.1e-5, train/loss_step=0.00114, global_step=371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  59%|█████▉    | 47/80 [04:52<03:20,  6.09s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=3.16e-5, train/loss_step=0.00141, global_step=371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  60%|██████    | 48/80 [04:52<03:11,  5.97s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=3.16e-5, train/loss_step=0.00141, global_step=371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  60%|██████    | 48/80 [04:52<03:11,  5.97s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=7.85e-6, train/loss_step=0.00154, global_step=371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:  61%|██████▏   | 49/80 [04:58<03:04,  5.97s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=7.85e-6, train/loss_step=0.00154, global_step=371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  61%|██████▏   | 49/80 [04:58<03:04,  5.97s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=0.000184, train/loss_step=0.0171, global_step=372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  62%|██████▎   | 50/80 [04:58<02:55,  5.86s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=0.000184, train/loss_step=0.0171, global_step=372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  62%|██████▎   | 50/80 [04:58<02:55,  5.86s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.75e-5, train/loss_step=0.00385, global_step=372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  64%|██████▍   | 51/80 [05:19<02:58,  6.14s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.00385, train/loss_vlb_step=2.75e-5, train/loss_step=0.00385, global_step=372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  64%|██████▍   | 51/80 [05:19<02:58,  6.14s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=2.15e-6, train/loss_step=0.000451, global_step=372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  65%|██████▌   | 52/80 [05:39<02:59,  6.40s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=2.15e-6, train/loss_step=0.000451, global_step=372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  65%|██████▌   | 52/80 [05:39<02:59,  6.40s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.000821, train/loss_vlb_step=4.3e-6, train/loss_step=0.000821, global_step=372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:  66%|██████▋   | 53/80 [05:39<02:49,  6.29s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.000821, train/loss_vlb_step=4.3e-6, train/loss_step=0.000821, global_step=372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  66%|██████▋   | 53/80 [05:39<02:49,  6.29s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000796, train/loss_vlb_step=3.4e-6, train/loss_step=0.000796, global_step=373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  68%|██████▊   | 54/80 [05:40<02:40,  6.19s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000796, train/loss_vlb_step=3.4e-6, train/loss_step=0.000796, global_step=373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  68%|██████▊   | 54/80 [05:40<02:40,  6.19s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=2.31e-5, train/loss_step=0.00168, global_step=373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:  69%|██████▉   | 55/80 [05:40<02:32,  6.09s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=2.31e-5, train/loss_step=0.00168, global_step=373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  69%|██████▉   | 55/80 [05:40<02:32,  6.09s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=0.000165, train/loss_step=0.00681, global_step=373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=0.000165, train/loss_step=0.00681, global_step=373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=0.000582, train/loss_step=0.0104, global_step=373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  71%|███████▏  | 57/80 [05:41<02:15,  5.90s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=0.000582, train/loss_step=0.0104, global_step=373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  71%|███████▏  | 57/80 [05:41<02:15,  5.90s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000504, train/loss_step=0.0324, global_step=374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  72%|███████▎  | 58/80 [05:42<02:07,  5.80s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.000504, train/loss_step=0.0324, global_step=374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  72%|███████▎  | 58/80 [05:42<02:07,  5.80s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=2.39e-5, train/loss_step=0.00655, global_step=374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00655, train/loss_vlb_step=2.39e-5, train/loss_step=0.00655, global_step=374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.0122, train/loss_step=0.0262, global_step=374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]   Epoch 18:  75%|███████▌  | 60/80 [06:16<02:03,  6.17s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.0262, train/loss_vlb_step=0.0122, train/loss_step=0.0262, global_step=374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  75%|███████▌  | 60/80 [06:16<02:03,  6.17s/it, loss=0.00687, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=6.91e-6, train/loss_step=0.00115, global_step=374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  76%|███████▋  | 61/80 [06:17<01:55,  6.08s/it, loss=0.00687, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=6.91e-6, train/loss_step=0.00115, global_step=374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  76%|███████▋  | 61/80 [06:17<01:55,  6.08s/it, loss=0.00687, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=5.87e-6, train/loss_step=0.00149, global_step=375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  78%|███████▊  | 62/80 [06:17<01:47,  5.99s/it, loss=0.00687, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=5.87e-6, train/loss_step=0.00149, global_step=375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  78%|███████▊  | 62/80 [06:17<01:47,  5.99s/it, loss=0.00649, v_num=0, train/loss_simple_step=0.000358, train/loss_vlb_step=1.58e-6, train/loss_step=0.000358, global_step=375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  79%|███████▉  | 63/80 [06:18<01:40,  5.91s/it, loss=0.00649, v_num=0, train/loss_simple_step=0.000358, train/loss_vlb_step=1.58e-6, train/loss_step=0.000358, global_step=375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  79%|███████▉  | 63/80 [06:18<01:40,  5.91s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.2e-5, train/loss_step=0.003, global_step=375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]       Epoch 18:  80%|████████  | 64/80 [06:18<01:33,  5.82s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.2e-5, train/loss_step=0.003, global_step=375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  80%|████████  | 64/80 [06:18<01:33,  5.82s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.52e-6, train/loss_step=0.00112, global_step=375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  81%|████████▏ | 65/80 [06:19<01:26,  5.74s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.52e-6, train/loss_step=0.00112, global_step=375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  81%|████████▏ | 65/80 [06:19<01:26,  5.74s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.000238, train/loss_vlb_step=9.37e-7, train/loss_step=0.000238, global_step=376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  82%|████████▎ | 66/80 [06:19<01:19,  5.67s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.000238, train/loss_vlb_step=9.37e-7, train/loss_step=0.000238, global_step=376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  82%|████████▎ | 66/80 [06:19<01:19,  5.67s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=0.000167, train/loss_step=0.0031, global_step=376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]   Epoch 18:  84%|████████▍ | 67/80 [06:40<01:16,  5.89s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=0.000167, train/loss_step=0.0031, global_step=376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  84%|████████▍ | 67/80 [06:40<01:16,  5.89s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=9.41e-6, train/loss_step=0.00104, global_step=376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  85%|████████▌ | 68/80 [06:57<01:12,  6.05s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=9.41e-6, train/loss_step=0.00104, global_step=376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  85%|████████▌ | 68/80 [06:57<01:12,  6.05s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000159, train/loss_step=0.0205, global_step=376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Epoch 18:  86%|████████▋ | 69/80 [06:57<01:05,  5.97s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000159, train/loss_step=0.0205, global_step=376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  86%|████████▋ | 69/80 [06:57<01:05,  5.97s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=3.47e-6, train/loss_step=0.000591, global_step=377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  88%|████████▊ | 70/80 [06:58<00:58,  5.89s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=3.47e-6, train/loss_step=0.000591, global_step=377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  88%|████████▊ | 70/80 [06:58<00:58,  5.89s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.000877, train/loss_vlb_step=5.58e-6, train/loss_step=0.000877, global_step=377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  89%|████████▉ | 71/80 [06:58<00:52,  5.82s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.000877, train/loss_vlb_step=5.58e-6, train/loss_step=0.000877, global_step=377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  89%|████████▉ | 71/80 [06:58<00:52,  5.82s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=6.11e-6, train/loss_step=0.00128, global_step=377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]  Epoch 18:  90%|█████████ | 72/80 [06:59<00:45,  5.74s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=6.11e-6, train/loss_step=0.00128, global_step=377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  90%|█████████ | 72/80 [06:59<00:45,  5.74s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.21e-5, train/loss_step=0.00335, global_step=377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  91%|█████████▏| 73/80 [06:59<00:39,  5.67s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.21e-5, train/loss_step=0.00335, global_step=377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  91%|█████████▏| 73/80 [06:59<00:39,  5.67s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.000954, train/loss_vlb_step=4.08e-6, train/loss_step=0.000954, global_step=378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  92%|█████████▎| 74/80 [07:00<00:33,  5.60s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.000954, train/loss_vlb_step=4.08e-6, train/loss_step=0.000954, global_step=378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  92%|█████████▎| 74/80 [07:00<00:33,  5.60s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=2.81e-5, train/loss_step=0.00806, global_step=378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]  Epoch 18:  94%|█████████▍| 75/80 [07:17<00:28,  5.76s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=2.81e-5, train/loss_step=0.00806, global_step=378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  94%|█████████▍| 75/80 [07:17<00:28,  5.76s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.74e-6, train/loss_step=0.00165, global_step=378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  95%|█████████▌| 76/80 [07:32<00:23,  5.88s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=9.74e-6, train/loss_step=0.00165, global_step=378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  95%|█████████▌| 76/80 [07:32<00:23,  5.88s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000765, train/loss_vlb_step=4.51e-6, train/loss_step=0.000765, global_step=378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  96%|█████████▋| 77/80 [07:33<00:17,  5.81s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000765, train/loss_vlb_step=4.51e-6, train/loss_step=0.000765, global_step=378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  96%|█████████▋| 77/80 [07:33<00:17,  5.81s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=9.17e-6, train/loss_step=0.00103, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]  Epoch 18:  98%|█████████▊| 78/80 [07:33<00:11,  5.75s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=9.17e-6, train/loss_step=0.00103, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  98%|█████████▊| 78/80 [07:33<00:11,  5.75s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=4.16e-5, train/loss_step=0.00798, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  99%|█████████▉| 79/80 [07:34<00:05,  5.68s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=4.16e-5, train/loss_step=0.00798, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18:  99%|█████████▉| 79/80 [07:34<00:05,  5.68s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.53e-5, train/loss_step=0.00362, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18: 100%|██████████| 80/80 [07:34<00:00,  5.62s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.53e-5, train/loss_step=0.00362, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 18: 100%|██████████| 80/80 [07:34<00:00,  5.62s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000267, train/loss_step=0.0381, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435] Average Epoch time: 454.87 seconds
+Average Peak memory 29562.57MiB
+Epoch 18:   0%|          | 0/80 [00:00<00:00, 7281.78it/s, loss=0.00496, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000267, train/loss_step=0.0381, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 19:   0%|          | 0/80 [00:00<00:00, 2659.67it/s, loss=0.00496, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000267, train/loss_step=0.0381, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]Epoch 19:   1%|▏         | 1/80 [00:45<29:44, 22.59s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.0381, train/loss_vlb_step=0.000267, train/loss_step=0.0381, global_step=379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00435, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00435]  Epoch 19:   1%|▏         | 1/80 [00:45<29:44, 22.59s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=7.37e-5, train/loss_step=0.0127, global_step=380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   2%|▎         | 2/80 [00:45<19:46, 15.22s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=7.37e-5, train/loss_step=0.0127, global_step=380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   2%|▎         | 2/80 [00:45<19:46, 15.22s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.57e-6, train/loss_step=0.00101, global_step=380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   4%|▍         | 3/80 [00:46<14:48, 11.54s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.57e-6, train/loss_step=0.00101, global_step=380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   4%|▍         | 3/80 [00:46<14:48, 11.54s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000676, train/loss_vlb_step=3.15e-6, train/loss_step=0.000676, global_step=380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   5%|▌         | 4/80 [00:46<11:49,  9.33s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000676, train/loss_vlb_step=3.15e-6, train/loss_step=0.000676, global_step=380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   5%|▌         | 4/80 [00:46<11:49,  9.33s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=3.74e-6, train/loss_step=0.00102, global_step=380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]  Epoch 19:   6%|▋         | 5/80 [00:48<10:01,  8.02s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=3.74e-6, train/loss_step=0.00102, global_step=380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   6%|▋         | 5/80 [00:48<10:01,  8.02s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=4.21e-5, train/loss_step=0.0123, global_step=381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]  Epoch 19:   8%|▊         | 6/80 [00:48<08:33,  6.94s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=4.21e-5, train/loss_step=0.0123, global_step=381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   8%|▊         | 6/80 [00:48<08:33,  6.94s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000112, train/loss_step=0.0139, global_step=381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   9%|▉         | 7/80 [00:49<07:27,  6.14s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000112, train/loss_step=0.0139, global_step=381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:   9%|▉         | 7/80 [00:49<07:27,  6.14s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=0.000125, train/loss_step=0.00143, global_step=381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  10%|█         | 8/80 [01:36<12:52, 10.74s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=0.000125, train/loss_step=0.00143, global_step=381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  10%|█         | 8/80 [01:36<12:52, 10.74s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=1.86e-6, train/loss_step=0.00045, global_step=381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  11%|█▏        | 9/80 [01:37<11:29,  9.71s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=1.86e-6, train/loss_step=0.00045, global_step=381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  11%|█▏        | 9/80 [01:37<11:29,  9.71s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.38e-5, train/loss_step=0.00149, global_step=382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  12%|█▎        | 10/80 [01:37<10:21,  8.87s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.38e-5, train/loss_step=0.00149, global_step=382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  12%|█▎        | 10/80 [01:37<10:21,  8.87s/it, loss=0.00751, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.0011, train/loss_step=0.0386, global_step=382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]   Epoch 19:  14%|█▍        | 11/80 [01:38<09:24,  8.18s/it, loss=0.00751, v_num=0, train/loss_simple_step=0.0386, train/loss_vlb_step=0.0011, train/loss_step=0.0386, global_step=382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  14%|█▍        | 11/80 [01:38<09:24,  8.18s/it, loss=0.00788, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=3.58e-5, train/loss_step=0.00853, global_step=382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  15%|█▌        | 12/80 [01:38<08:35,  7.59s/it, loss=0.00788, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=3.58e-5, train/loss_step=0.00853, global_step=382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  15%|█▌        | 12/80 [01:38<08:35,  7.59s/it, loss=0.00772, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.13e-6, train/loss_step=0.000278, global_step=382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  16%|█▋        | 13/80 [01:39<07:54,  7.08s/it, loss=0.00772, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.13e-6, train/loss_step=0.000278, global_step=382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  16%|█▋        | 13/80 [01:39<07:54,  7.08s/it, loss=0.00771, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=3.15e-6, train/loss_step=0.000604, global_step=383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  18%|█▊        | 14/80 [01:39<07:18,  6.64s/it, loss=0.00771, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=3.15e-6, train/loss_step=0.000604, global_step=383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  18%|█▊        | 14/80 [01:39<07:18,  6.64s/it, loss=0.0081, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000169, train/loss_step=0.016, global_step=383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]      Epoch 19:  19%|█▉        | 15/80 [01:40<06:46,  6.26s/it, loss=0.0081, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000169, train/loss_step=0.016, global_step=383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  19%|█▉        | 15/80 [01:40<06:46,  6.26s/it, loss=0.00847, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.65e-5, train/loss_step=0.00899, global_step=383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  20%|██        | 16/80 [02:17<08:36,  8.07s/it, loss=0.00847, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=4.65e-5, train/loss_step=0.00899, global_step=383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  20%|██        | 16/80 [02:17<08:36,  8.07s/it, loss=0.00874, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=2.9e-5, train/loss_step=0.00622, global_step=383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  21%|██▏       | 17/80 [02:17<08:01,  7.65s/it, loss=0.00874, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=2.9e-5, train/loss_step=0.00622, global_step=383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  21%|██▏       | 17/80 [02:17<08:01,  7.65s/it, loss=0.00877, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.05e-5, train/loss_step=0.00149, global_step=384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  22%|██▎       | 18/80 [02:18<07:30,  7.27s/it, loss=0.00877, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.05e-5, train/loss_step=0.00149, global_step=384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  22%|██▎       | 18/80 [02:18<07:30,  7.27s/it, loss=0.00841, v_num=0, train/loss_simple_step=0.000935, train/loss_vlb_step=4.28e-6, train/loss_step=0.000935, global_step=384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  24%|██▍       | 19/80 [02:18<07:02,  6.93s/it, loss=0.00841, v_num=0, train/loss_simple_step=0.000935, train/loss_vlb_step=4.28e-6, train/loss_step=0.000935, global_step=384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  24%|██▍       | 19/80 [02:18<07:02,  6.93s/it, loss=0.00901, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000255, train/loss_step=0.0155, global_step=384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]   Epoch 19:  25%|██▌       | 20/80 [02:19<06:37,  6.63s/it, loss=0.00901, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000255, train/loss_step=0.0155, global_step=384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  25%|██▌       | 20/80 [02:19<06:37,  6.63s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=3.94e-5, train/loss_step=0.00336, global_step=384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  26%|██▋       | 21/80 [02:19<06:14,  6.35s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=3.94e-5, train/loss_step=0.00336, global_step=384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  26%|██▋       | 21/80 [02:19<06:14,  6.35s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=1.73e-5, train/loss_step=0.00125, global_step=385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  28%|██▊       | 22/80 [02:20<05:53,  6.10s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=1.73e-5, train/loss_step=0.00125, global_step=385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  28%|██▊       | 22/80 [02:20<05:53,  6.10s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=2.48e-6, train/loss_step=0.000538, global_step=385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  29%|██▉       | 23/80 [02:20<05:34,  5.87s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=2.48e-6, train/loss_step=0.000538, global_step=385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  29%|██▉       | 23/80 [02:20<05:34,  5.87s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000134, train/loss_step=0.0119, global_step=385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]   Epoch 19:  30%|███       | 24/80 [03:09<07:04,  7.58s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000134, train/loss_step=0.0119, global_step=385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  30%|███       | 24/80 [03:09<07:04,  7.58s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.000845, train/loss_vlb_step=4.68e-6, train/loss_step=0.000845, global_step=385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  31%|███▏      | 25/80 [03:10<06:42,  7.31s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.000845, train/loss_vlb_step=4.68e-6, train/loss_step=0.000845, global_step=385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  31%|███▏      | 25/80 [03:10<06:42,  7.31s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.47e-6, train/loss_step=0.00056, global_step=386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]  Epoch 19:  32%|███▎      | 26/80 [03:10<06:21,  7.06s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.47e-6, train/loss_step=0.00056, global_step=386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  32%|███▎      | 26/80 [03:10<06:21,  7.06s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=1.96e-5, train/loss_step=0.00378, global_step=386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  34%|███▍      | 27/80 [03:11<06:01,  6.82s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=1.96e-5, train/loss_step=0.00378, global_step=386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  34%|███▍      | 27/80 [03:11<06:01,  6.82s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=2.19e-5, train/loss_step=0.00627, global_step=386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  35%|███▌      | 28/80 [03:11<05:43,  6.61s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=2.19e-5, train/loss_step=0.00627, global_step=386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  35%|███▌      | 28/80 [03:11<05:43,  6.61s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=7.32e-6, train/loss_step=0.00181, global_step=386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  36%|███▋      | 29/80 [03:12<05:26,  6.40s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=7.32e-6, train/loss_step=0.00181, global_step=386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  36%|███▋      | 29/80 [03:12<05:26,  6.40s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.000572, train/loss_vlb_step=2.38e-6, train/loss_step=0.000572, global_step=387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  38%|███▊      | 30/80 [03:12<05:10,  6.21s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.000572, train/loss_vlb_step=2.38e-6, train/loss_step=0.000572, global_step=387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  38%|███▊      | 30/80 [03:12<05:10,  6.21s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=9.65e-6, train/loss_step=0.00268, global_step=387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  39%|███▉      | 31/80 [03:13<04:55,  6.03s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=9.65e-6, train/loss_step=0.00268, global_step=387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  39%|███▉      | 31/80 [03:13<04:55,  6.03s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000988, train/loss_vlb_step=4.35e-6, train/loss_step=0.000988, global_step=387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  40%|████      | 32/80 [03:47<05:30,  6.88s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000988, train/loss_vlb_step=4.35e-6, train/loss_step=0.000988, global_step=387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  40%|████      | 32/80 [03:47<05:30,  6.88s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.3e-5, train/loss_step=0.00206, global_step=387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]   Epoch 19:  41%|████▏     | 33/80 [03:48<05:15,  6.71s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=1.3e-5, train/loss_step=0.00206, global_step=387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  41%|████▏     | 33/80 [03:48<05:15,  6.71s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=0.000227, train/loss_step=0.00669, global_step=388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  42%|████▎     | 34/80 [03:48<05:00,  6.53s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=0.000227, train/loss_step=0.00669, global_step=388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  42%|████▎     | 34/80 [03:48<05:00,  6.53s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=5.71e-6, train/loss_step=0.00129, global_step=388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  44%|████▍     | 35/80 [03:49<04:46,  6.36s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=5.71e-6, train/loss_step=0.00129, global_step=388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  44%|████▍     | 35/80 [03:49<04:46,  6.36s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000194, train/loss_step=0.0146, global_step=388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  45%|████▌     | 36/80 [03:49<04:33,  6.21s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000194, train/loss_step=0.0146, global_step=388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  45%|████▌     | 36/80 [03:49<04:33,  6.21s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.32e-6, train/loss_step=0.00116, global_step=388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  46%|████▋     | 37/80 [03:50<04:20,  6.06s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.32e-6, train/loss_step=0.00116, global_step=388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  46%|████▋     | 37/80 [03:50<04:20,  6.06s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=2.75e-5, train/loss_step=0.00154, global_step=389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  48%|████▊     | 38/80 [03:50<04:08,  5.92s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=2.75e-5, train/loss_step=0.00154, global_step=389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  48%|████▊     | 38/80 [03:50<04:08,  5.92s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=1.51e-5, train/loss_step=0.00407, global_step=389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  49%|████▉     | 39/80 [03:51<03:57,  5.78s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00407, train/loss_vlb_step=1.51e-5, train/loss_step=0.00407, global_step=389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  49%|████▉     | 39/80 [03:51<03:57,  5.78s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=3.79e-5, train/loss_step=0.00971, global_step=389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  50%|█████     | 40/80 [04:24<04:18,  6.46s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=3.79e-5, train/loss_step=0.00971, global_step=389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  50%|█████     | 40/80 [04:24<04:18,  6.46s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.11e-5, train/loss_step=0.00232, global_step=389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  51%|█████▏    | 41/80 [04:25<04:06,  6.33s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.11e-5, train/loss_step=0.00232, global_step=389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  51%|█████▏    | 41/80 [04:25<04:06,  6.33s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.00049, train/loss_step=0.0351, global_step=390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]  Epoch 19:  52%|█████▎    | 42/80 [04:26<03:55,  6.20s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0351, train/loss_vlb_step=0.00049, train/loss_step=0.0351, global_step=390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  52%|█████▎    | 42/80 [04:26<03:55,  6.20s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.59e-5, train/loss_step=0.00384, global_step=390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  54%|█████▍    | 43/80 [04:26<03:44,  6.07s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.59e-5, train/loss_step=0.00384, global_step=390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  54%|█████▍    | 43/80 [04:26<03:44,  6.07s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.00492, train/loss_step=0.0305, global_step=390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]  Epoch 19:  55%|█████▌    | 44/80 [04:27<03:33,  5.94s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.0305, train/loss_vlb_step=0.00492, train/loss_step=0.0305, global_step=390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  55%|█████▌    | 44/80 [04:27<03:33,  5.94s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=0.000636, train/loss_step=0.00972, global_step=390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  56%|█████▋    | 45/80 [04:27<03:23,  5.83s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.00972, train/loss_vlb_step=0.000636, train/loss_step=0.00972, global_step=390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  56%|█████▋    | 45/80 [04:27<03:23,  5.83s/it, loss=0.007, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=1.46e-5, train/loss_step=0.00138, global_step=391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]   Epoch 19:  57%|█████▊    | 46/80 [04:28<03:14,  5.71s/it, loss=0.007, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=1.46e-5, train/loss_step=0.00138, global_step=391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  57%|█████▊    | 46/80 [04:28<03:14,  5.71s/it, loss=0.00795, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=0.000479, train/loss_step=0.0228, global_step=391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  59%|█████▉    | 47/80 [04:28<03:04,  5.60s/it, loss=0.00795, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=0.000479, train/loss_step=0.0228, global_step=391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  59%|█████▉    | 47/80 [04:28<03:04,  5.60s/it, loss=0.00771, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=5.89e-6, train/loss_step=0.00148, global_step=391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  60%|██████    | 48/80 [05:08<03:21,  6.29s/it, loss=0.00771, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=5.89e-6, train/loss_step=0.00148, global_step=391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  60%|██████    | 48/80 [05:08<03:21,  6.29s/it, loss=0.00767, v_num=0, train/loss_simple_step=0.000866, train/loss_vlb_step=6.94e-6, train/loss_step=0.000866, global_step=391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  61%|██████▏   | 49/80 [05:08<03:11,  6.18s/it, loss=0.00767, v_num=0, train/loss_simple_step=0.000866, train/loss_vlb_step=6.94e-6, train/loss_step=0.000866, global_step=391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  61%|██████▏   | 49/80 [05:08<03:11,  6.18s/it, loss=0.00876, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.00013, train/loss_step=0.0224, global_step=392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]    Epoch 19:  62%|████���█▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00876, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.00013, train/loss_step=0.0224, global_step=392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00872, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=5.18e-5, train/loss_step=0.00192, global_step=392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  64%|██████▍   | 51/80 [05:09<02:52,  5.96s/it, loss=0.00872, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=5.18e-5, train/loss_step=0.00192, global_step=392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  64%|██████▍   | 51/80 [05:09<02:52,  5.96s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.000556, train/loss_vlb_step=2.18e-6, train/loss_step=0.000556, global_step=392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.000556, train/loss_vlb_step=2.18e-6, train/loss_step=0.000556, global_step=392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00878, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.36e-5, train/loss_step=0.00369, global_step=392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00878, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.36e-5, train/loss_step=0.00369, global_step=392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00847, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=2.45e-6, train/loss_step=0.000554, global_step=393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  68%|██████▊   | 54/80 [05:11<02:27,  5.66s/it, loss=0.00847, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=2.45e-6, train/loss_step=0.000554, global_step=393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  68%|██████▊   | 54/80 [05:11<02:27,  5.66s/it, loss=0.00843, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=2.06e-6, train/loss_step=0.000441, global_step=393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  69%|██████▉   | 55/80 [05:12<02:19,  5.57s/it, loss=0.00843, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=2.06e-6, train/loss_step=0.000441, global_step=393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  69%|██████▉   | 55/80 [05:12<02:19,  5.57s/it, loss=0.00827, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.67e-5, train/loss_step=0.0115, global_step=393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]    Epoch 19:  70%|███████   | 56/80 [05:58<02:30,  6.29s/it, loss=0.00827, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.67e-5, train/loss_step=0.0115, global_step=393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  70%|███████   | 56/80 [05:58<02:30,  6.29s/it, loss=0.00824, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=2.27e-6, train/loss_step=0.000531, global_step=393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  71%|███████▏  | 57/80 [05:59<02:22,  6.19s/it, loss=0.00824, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=2.27e-6, train/loss_step=0.000531, global_step=393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  71%|███████▏  | 57/80 [05:59<02:22,  6.19s/it, loss=0.00825, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=2.33e-5, train/loss_step=0.00182, global_step=394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]  Epoch 19:  72%|███████▎  | 58/80 [05:59<02:14,  6.09s/it, loss=0.00825, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=2.33e-5, train/loss_step=0.00182, global_step=394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  72%|███████▎  | 58/80 [05:59<02:14,  6.09s/it, loss=0.00809, v_num=0, train/loss_simple_step=0.000709, train/loss_vlb_step=1e-5, train/loss_step=0.000709, global_step=394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  74%|███████▍  | 59/80 [06:00<02:06,  6.00s/it, loss=0.00809, v_num=0, train/loss_simple_step=0.000709, train/loss_vlb_step=1e-5, train/loss_step=0.000709, global_step=394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  74%|███████▍  | 59/80 [06:00<02:06,  6.00s/it, loss=0.00811, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.27e-5, train/loss_step=0.0101, global_step=394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  75%|███████▌  | 60/80 [06:00<01:58,  5.91s/it, loss=0.00811, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.27e-5, train/loss_step=0.0101, global_step=394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  75%|███████▌  | 60/80 [06:00<01:58,  5.91s/it, loss=0.00821, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.14e-5, train/loss_step=0.00429, global_step=394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  76%|███████▋  | 61/80 [06:01<01:50,  5.82s/it, loss=0.00821, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=2.14e-5, train/loss_step=0.00429, global_step=394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  76%|███████▋  | 61/80 [06:01<01:50,  5.82s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=2.5e-5, train/loss_step=0.00113, global_step=395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  78%|███████▊  | 62/80 [06:01<01:43,  5.74s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=2.5e-5, train/loss_step=0.00113, global_step=395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  78%|███████▊  | 62/80 [06:01<01:43,  5.74s/it, loss=0.00693, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=0.000162, train/loss_step=0.0123, global_step=395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  79%|███████▉  | 63/80 [06:02<01:36,  5.66s/it, loss=0.00693, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=0.000162, train/loss_step=0.0123, global_step=395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  79%|███████▉  | 63/80 [06:02<01:36,  5.66s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.38e-6, train/loss_step=0.00123, global_step=395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  80%|████████  | 64/80 [06:48<01:40,  6.28s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.38e-6, train/loss_step=0.00123, global_step=395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  80%|████████  | 64/80 [06:48<01:40,  6.28s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000306, train/loss_vlb_step=1.14e-6, train/loss_step=0.000306, global_step=395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  81%|████████▏ | 65/80 [06:48<01:32,  6.19s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000306, train/loss_vlb_step=1.14e-6, train/loss_step=0.000306, global_step=395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  81%|████████▏ | 65/80 [06:48<01:32,  6.19s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=5.38e-6, train/loss_step=0.000969, global_step=396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  82%|████████▎ | 66/80 [06:49<01:25,  6.10s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=5.38e-6, train/loss_step=0.000969, global_step=396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  82%|████████▎ | 66/80 [06:49<01:25,  6.10s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.17e-5, train/loss_step=0.00257, global_step=396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]  Epoch 19:  84%|████████▍ | 67/80 [06:49<01:18,  6.02s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.17e-5, train/loss_step=0.00257, global_step=396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  84%|████████▍ | 67/80 [06:49<01:18,  6.02s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.5e-5, train/loss_step=0.00687, global_step=396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  85%|████████▌ | 68/80 [06:50<01:11,  5.94s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.5e-5, train/loss_step=0.00687, global_step=396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  85%|████████▌ | 68/80 [06:50<01:11,  5.94s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000154, train/loss_step=0.0155, global_step=396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  86%|████████▋ | 69/80 [06:50<01:04,  5.86s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000154, train/loss_step=0.0155, global_step=396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  86%|████████▋ | 69/80 [06:50<01:04,  5.86s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.2e-5, train/loss_step=0.00507, global_step=397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  88%|████████▊ | 70/80 [06:51<00:57,  5.79s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.2e-5, train/loss_step=0.00507, global_step=397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  88%|████████▊ | 70/80 [06:51<00:57,  5.79s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=1.94e-5, train/loss_step=0.00566, global_step=397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  89%|████████▉ | 71/80 [06:51<00:51,  5.72s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=1.94e-5, train/loss_step=0.00566, global_step=397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  89%|████████▉ | 71/80 [06:51<00:51,  5.72s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=4.47e-5, train/loss_step=0.00132, global_step=397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  90%|█████████ | 72/80 [07:23<00:48,  6.07s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=4.47e-5, train/loss_step=0.00132, global_step=397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  90%|█████████ | 72/80 [07:23<00:48,  6.07s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000119, train/loss_step=0.011, global_step=397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]   Epoch 19:  91%|█████████▏| 73/80 [07:23<00:41,  6.00s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000119, train/loss_step=0.011, global_step=397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  91%|█████████▏| 73/80 [07:23<00:41,  6.00s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.74e-6, train/loss_step=0.00041, global_step=398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  92%|█████████▎| 74/80 [07:24<00:35,  5.92s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.74e-6, train/loss_step=0.00041, global_step=398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  92%|█████████▎| 74/80 [07:24<00:35,  5.92s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=0.000141, train/loss_step=0.00171, global_step=398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  94%|█████████▍| 75/80 [07:24<00:29,  5.85s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=0.000141, train/loss_step=0.00171, global_step=398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  94%|█████████▍| 75/80 [07:24<00:29,  5.85s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.02e-5, train/loss_step=0.00225, global_step=398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504] Epoch 19:  95%|█████████▌| 76/80 [07:25<00:23,  5.78s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.02e-5, train/loss_step=0.00225, global_step=398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  95%|█████████▌| 76/80 [07:25<00:23,  5.78s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000986, train/loss_vlb_step=4.84e-6, train/loss_step=0.000986, global_step=398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  96%|█████████▋| 77/80 [07:25<00:17,  5.72s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000986, train/loss_vlb_step=4.84e-6, train/loss_step=0.000986, global_step=398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  96%|█████████▋| 77/80 [07:25<00:17,  5.72s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=1.52e-5, train/loss_step=0.00435, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]  Epoch 19:  98%|█████████▊| 78/80 [07:26<00:11,  5.65s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=1.52e-5, train/loss_step=0.00435, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  98%|█████████▊| 78/80 [07:26<00:11,  5.65s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=6.98e-6, train/loss_step=0.00165, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  99%|█████████▉| 79/80 [07:26<00:05,  5.59s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=6.98e-6, train/loss_step=0.00165, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19:  99%|█████████▉| 79/80 [07:26<00:05,  5.59s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00698, train/loss_vlb_step=4.02e-5, train/loss_step=0.00698, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19: 100%|██████████| 80/80 [07:27<00:00,  5.52s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00698, train/loss_vlb_step=4.02e-5, train/loss_step=0.00698, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 19: 100%|██████████| 80/80 [07:27<00:00,  5.52s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=2.27e-5, train/loss_step=0.00661, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Average Epoch time: 447.36 seconds
+Average Peak memory 29563.33MiB
+Epoch 19:   0%|          | 0/80 [00:00<00:00, 7667.83it/s, loss=0.00444, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=2.27e-5, train/loss_step=0.00661, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 20:   0%|          | 0/80 [00:00<00:00, 2783.21it/s, loss=0.00444, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=2.27e-5, train/loss_step=0.00661, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]Epoch 20:   1%|▏         | 1/80 [00:40<26:41, 20.27s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=2.27e-5, train/loss_step=0.00661, global_step=399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00504, train/loss_vlb_epoch=0.000133, train/loss_epoch=0.00504]  Epoch 20:   1%|▏         | 1/80 [00:40<26:41, 20.27s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.63e-5, train/loss_step=0.0083, global_step=400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]    Epoch 20:   2%|▎         | 2/80 [00:41<17:46, 13.67s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.63e-5, train/loss_step=0.0083, global_step=400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   2%|▎         | 2/80 [00:41<17:46, 13.67s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.17e-5, train/loss_step=0.00742, global_step=400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   4%|▍         | 3/80 [00:47<15:07, 11.78s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=3.17e-5, train/loss_step=0.00742, global_step=400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   4%|▍         | 3/80 [00:47<15:07, 11.78s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=0.00327, train/loss_step=0.00836, global_step=400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   5%|▌         | 4/80 [00:47<12:04,  9.53s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=0.00327, train/loss_step=0.00836, global_step=400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   5%|▌         | 4/80 [00:47<12:04,  9.53s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00058, train/loss_vlb_step=3.22e-6, train/loss_step=0.00058, global_step=400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   6%|▋         | 5/80 [00:48<10:03,  8.04s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00058, train/loss_vlb_step=3.22e-6, train/loss_step=0.00058, global_step=400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   6%|▋         | 5/80 [00:48<10:03,  8.04s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=6.75e-6, train/loss_step=0.00113, global_step=401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   8%|▊         | 6/80 [00:48<08:35,  6.96s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=6.75e-6, train/loss_step=0.00113, global_step=401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   8%|▊         | 6/80 [00:48<08:35,  6.96s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000484, train/loss_vlb_step=1.88e-6, train/loss_step=0.000484, global_step=401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   9%|▉         | 7/80 [00:49<07:29,  6.15s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000484, train/loss_vlb_step=1.88e-6, train/loss_step=0.000484, global_step=401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:   9%|▉         | 7/80 [00:49<07:29,  6.15s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=5.17e-6, train/loss_step=0.00111, global_step=401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 20:  10%|█         | 8/80 [01:13<09:46,  8.14s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=5.17e-6, train/loss_step=0.00111, global_step=401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  10%|█         | 8/80 [01:13<09:46,  8.14s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=8.55e-6, train/loss_step=0.00137, global_step=401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  11%|█▏        | 9/80 [01:23<09:56,  8.40s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=8.55e-6, train/loss_step=0.00137, global_step=401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  11%|█▏        | 9/80 [01:23<09:56,  8.40s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=9.84e-7, train/loss_step=0.000284, global_step=402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  12%|█▎        | 10/80 [01:24<08:57,  7.68s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=9.84e-7, train/loss_step=0.000284, global_step=402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  12%|█▎        | 10/80 [01:24<08:57,  7.68s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=3.15e-6, train/loss_step=0.000621, global_step=402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  14%|█▍        | 11/80 [01:24<08:08,  7.08s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=3.15e-6, train/loss_step=0.000621, global_step=402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  14%|█▍        | 11/80 [01:24<08:08,  7.08s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.68e-6, train/loss_step=0.000348, global_step=402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502] Epoch 20:  15%|█▌        | 12/80 [01:25<07:27,  6.58s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.68e-6, train/loss_step=0.000348, global_step=402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  15%|█▌        | 12/80 [01:25<07:27,  6.58s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.37e-6, train/loss_step=0.000351, global_step=402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  16%|█▋        | 13/80 [01:26<06:51,  6.14s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.37e-6, train/loss_step=0.000351, global_step=402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  16%|█▋        | 13/80 [01:26<06:51,  6.14s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=0.000228, train/loss_step=0.0199, global_step=403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]   Epoch 20:  18%|█▊        | 14/80 [01:26<06:20,  5.77s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=0.000228, train/loss_step=0.0199, global_step=403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  18%|█▊        | 14/80 [01:26<06:20,  5.77s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=1.88e-5, train/loss_step=0.00483, global_step=403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  19%|█▉        | 15/80 [01:30<06:06,  5.64s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=1.88e-5, train/loss_step=0.00483, global_step=403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  19%|█▉        | 15/80 [01:30<06:06,  5.64s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=1.33e-5, train/loss_step=0.0038, global_step=403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 20:  20%|██        | 16/80 [01:50<06:57,  6.53s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=1.33e-5, train/loss_step=0.0038, global_step=403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  20%|██        | 16/80 [01:50<06:57,  6.53s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=3.77e-6, train/loss_step=0.000697, global_step=403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  21%|██▏       | 17/80 [02:01<07:05,  6.75s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=3.77e-6, train/loss_step=0.000697, global_step=403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  21%|██▏       | 17/80 [02:01<07:05,  6.75s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000804, train/loss_vlb_step=3.54e-6, train/loss_step=0.000804, global_step=404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  22%|██▎       | 18/80 [02:01<06:37,  6.42s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000804, train/loss_vlb_step=3.54e-6, train/loss_step=0.000804, global_step=404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  22%|██▎       | 18/80 [02:01<06:37,  6.42s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=1.52e-5, train/loss_step=0.00442, global_step=404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 20:  24%|██▍       | 19/80 [02:02<06:13,  6.12s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=1.52e-5, train/loss_step=0.00442, global_step=404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  24%|██▍       | 19/80 [02:02<06:13,  6.12s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.24e-6, train/loss_step=0.00031, global_step=404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  25%|██▌       | 20/80 [02:16<06:30,  6.50s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.24e-6, train/loss_step=0.00031, global_step=404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  25%|██▌       | 20/80 [02:16<06:30,  6.50s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.35e-5, train/loss_step=0.00326, global_step=404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  26%|██▋       | 21/80 [02:17<06:07,  6.23s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.35e-5, train/loss_step=0.00326, global_step=404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  26%|██▋       | 21/80 [02:17<06:07,  6.23s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.81e-6, train/loss_step=0.000444, global_step=405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  28%|██▊       | 22/80 [02:17<05:46,  5.98s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.81e-6, train/loss_step=0.000444, global_step=405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  28%|██▊       | 22/80 [02:17<05:46,  5.98s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000485, train/loss_vlb_step=2.06e-6, train/loss_step=0.000485, global_step=405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  29%|██▉       | 23/80 [02:18<05:27,  5.75s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000485, train/loss_vlb_step=2.06e-6, train/loss_step=0.000485, global_step=405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  29%|██▉       | 23/80 [02:18<05:27,  5.75s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=5.4e-6, train/loss_step=0.000761, global_step=405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 20:  30%|███       | 24/80 [02:29<05:35,  5.99s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=5.4e-6, train/loss_step=0.000761, global_step=405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  30%|███       | 24/80 [02:29<05:35,  5.99s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  31%|███▏      | 25/80 [02:43<05:45,  6.28s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.39e-5, train/loss_step=0.00234, global_step=405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  31%|███▏      | 25/80 [02:43<05:45,  6.28s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000172, train/loss_step=0.0141, global_step=406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502] Epoch 20:  32%|███▎      | 26/80 [02:45<05:30,  6.11s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000172, train/loss_step=0.0141, global_step=406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  32%|███▎      | 26/80 [02:45<05:30,  6.11s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00069, train/loss_vlb_step=2.83e-6, train/loss_step=0.00069, global_step=406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  34%|███▍      | 27/80 [02:45<05:13,  5.91s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00069, train/loss_vlb_step=2.83e-6, train/loss_step=0.00069, global_step=406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  34%|███▍      | 27/80 [02:45<05:13,  5.91s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.46e-5, train/loss_step=0.003, global_step=406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]    Epoch 20:  35%|███▌      | 28/80 [03:01<05:24,  6.25s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.46e-5, train/loss_step=0.003, global_step=406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  35%|███▌      | 28/80 [03:01<05:24,  6.25s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000113, train/loss_step=0.0145, global_step=406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  36%|███▋      | 29/80 [03:01<05:09,  6.06s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000113, train/loss_step=0.0145, global_step=406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  36%|███▋      | 29/80 [03:01<05:09,  6.06s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=7.37e-6, train/loss_step=0.00175, global_step=407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  38%|███▊      | 30/80 [03:02<04:53,  5.88s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=7.37e-6, train/loss_step=0.00175, global_step=407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  38%|███▊      | 30/80 [03:02<04:53,  5.88s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.4e-6, train/loss_step=0.000348, global_step=407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  39%|███▉      | 31/80 [03:02<04:39,  5.71s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.4e-6, train/loss_step=0.000348, global_step=407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  39%|███▉      | 31/80 [03:02<04:39,  5.71s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.61e-5, train/loss_step=0.00184, global_step=407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502] Epoch 20:  40%|████      | 32/80 [03:03<04:26,  5.55s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.61e-5, train/loss_step=0.00184, global_step=407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  40%|████      | 32/80 [03:03<04:26,  5.55s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.82e-6, train/loss_step=0.00116, global_step=407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  41%|████▏     | 33/80 [03:36<04:59,  6.37s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.82e-6, train/loss_step=0.00116, global_step=407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  41%|████▏     | 33/80 [03:36<04:59,  6.37s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=7.57e-5, train/loss_step=0.0104, global_step=408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]   Epoch 20:  42%|████▎     | 34/80 [03:37<04:45,  6.20s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=7.57e-5, train/loss_step=0.0104, global_step=408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  42%|████▎     | 34/80 [03:37<04:45,  6.20s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=2.61e-5, train/loss_step=0.00722, global_step=408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  44%|████▍     | 35/80 [03:37<04:31,  6.04s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00722, train/loss_vlb_step=2.61e-5, train/loss_step=0.00722, global_step=408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  44%|████▍     | 35/80 [03:37<04:31,  6.04s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=6.62e-5, train/loss_step=0.0103, global_step=408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 20:  45%|████▌     | 36/80 [03:43<04:25,  6.03s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=6.62e-5, train/loss_step=0.0103, global_step=408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  45%|████▌     | 36/80 [03:43<04:25,  6.03s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.25e-6, train/loss_step=0.00236, global_step=408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.25e-6, train/loss_step=0.00236, global_step=408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.005, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.00039, train/loss_step=0.0203, global_step=409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]    Epoch 20:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.005, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.00039, train/loss_step=0.0203, global_step=409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=9.69e-5, train/loss_step=0.0171, global_step=409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=9.69e-5, train/loss_step=0.0171, global_step=409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.21e-5, train/loss_step=0.00318, global_step=409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  50%|█████     | 40/80 [03:48<03:43,  5.58s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.21e-5, train/loss_step=0.00318, global_step=409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  50%|█████     | 40/80 [03:48<03:43,  5.58s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=0.000166, train/loss_step=0.0024, global_step=409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502] Epoch 20:  51%|█████▏    | 41/80 [04:19<04:01,  6.18s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=0.000166, train/loss_step=0.0024, global_step=409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  51%|█████▏    | 41/80 [04:19<04:01,  6.18s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=3.76e-6, train/loss_step=0.000748, global_step=410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  52%|█████▎    | 42/80 [04:20<03:49,  6.05s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=3.76e-6, train/loss_step=0.000748, global_step=410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  52%|█████▎    | 42/80 [04:20<03:49,  6.05s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=1.67e-6, train/loss_step=0.000411, global_step=410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  54%|█████▍    | 43/80 [04:20<03:39,  5.92s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=1.67e-6, train/loss_step=0.000411, global_step=410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  54%|█████▍    | 43/80 [04:20<03:39,  5.92s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=5.37e-5, train/loss_step=0.00363, global_step=410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 20:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=5.37e-5, train/loss_step=0.00363, global_step=410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.98e-6, train/loss_step=0.00136, global_step=410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  56%|█████▋    | 45/80 [04:39<03:33,  6.09s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.98e-6, train/loss_step=0.00136, global_step=410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  56%|█████▋    | 45/80 [04:39<03:33,  6.09s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.63e-5, train/loss_step=0.00847, global_step=411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  57%|█████▊    | 46/80 [04:40<03:22,  5.97s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.63e-5, train/loss_step=0.00847, global_step=411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  57%|█████▊    | 46/80 [04:40<03:22,  5.97s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=7.25e-6, train/loss_step=0.00107, global_step=411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  59%|█████▉    | 47/80 [04:40<03:13,  5.85s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=7.25e-6, train/loss_step=0.00107, global_step=411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  59%|█████▉    | 47/80 [04:40<03:13,  5.85s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.31e-6, train/loss_step=0.00132, global_step=411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  60%|██████    | 48/80 [04:41<03:03,  5.75s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.31e-6, train/loss_step=0.00132, global_step=411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  60%|██████    | 48/80 [04:41<03:03,  5.75s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=2.11e-5, train/loss_step=0.00286, global_step=411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  61%|██████▏   | 49/80 [04:56<03:03,  5.93s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=2.11e-5, train/loss_step=0.00286, global_step=411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  61%|██████▏   | 49/80 [04:56<03:03,  5.93s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=2.48e-5, train/loss_step=0.00652, global_step=412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  62%|██████▎   | 50/80 [04:57<02:54,  5.83s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=2.48e-5, train/loss_step=0.00652, global_step=412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  62%|██████▎   | 50/80 [04:57<02:54,  5.83s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=1.42e-6, train/loss_step=0.000366, global_step=412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  64%|██████▍   | 51/80 [04:57<02:45,  5.72s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=1.42e-6, train/loss_step=0.000366, global_step=412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  64%|██████▍   | 51/80 [04:57<02:45,  5.72s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.23e-5, train/loss_step=0.0105, global_step=412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]    Epoch 20:  65%|██████▌   | 52/80 [05:23<02:50,  6.10s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.23e-5, train/loss_step=0.0105, global_step=412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  65%|██████▌   | 52/80 [05:23<02:50,  6.10s/it, loss=0.00649, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.35e-5, train/loss_step=0.0194, global_step=412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  66%|██████▋   | 53/80 [05:23<02:41,  6.00s/it, loss=0.00649, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=8.35e-5, train/loss_step=0.0194, global_step=412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  66%|██████▋   | 53/80 [05:23<02:41,  6.00s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=3.4e-6, train/loss_step=0.00088, global_step=413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  68%|██████▊   | 54/80 [05:24<02:33,  5.90s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=3.4e-6, train/loss_step=0.00088, global_step=413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  68%|██████▊   | 54/80 [05:24<02:33,  5.90s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=3.26e-6, train/loss_step=0.00056, global_step=413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  69%|██████▉   | 55/80 [05:24<02:25,  5.80s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=3.26e-6, train/loss_step=0.00056, global_step=413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  69%|██████▉   | 55/80 [05:24<02:25,  5.80s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=6.45e-5, train/loss_step=0.0094, global_step=413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 20:  70%|███████   | 56/80 [05:25<02:17,  5.71s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=6.45e-5, train/loss_step=0.0094, global_step=413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  70%|███████   | 56/80 [05:25<02:17,  5.71s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.2e-5, train/loss_step=0.0118, global_step=413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502] Epoch 20:  71%|███████▏  | 57/80 [05:40<02:15,  5.87s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.2e-5, train/loss_step=0.0118, global_step=413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  71%|███████▏  | 57/80 [05:40<02:15,  5.87s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=1.9e-5, train/loss_step=0.00563, global_step=414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  72%|███████▎  | 58/80 [05:40<02:07,  5.78s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=1.9e-5, train/loss_step=0.00563, global_step=414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  72%|███████▎  | 58/80 [05:40<02:07,  5.78s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.95e-5, train/loss_step=0.00671, global_step=414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  74%|███████▍  | 59/80 [05:41<01:59,  5.69s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.95e-5, train/loss_step=0.00671, global_step=414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  74%|███████▍  | 59/80 [05:41<01:59,  5.69s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=1.33e-5, train/loss_step=0.00381, global_step=414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  75%|███████▌  | 60/80 [05:52<01:55,  5.78s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=1.33e-5, train/loss_step=0.00381, global_step=414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  75%|███████▌  | 60/80 [05:52<01:55,  5.78s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=7.03e-6, train/loss_step=0.00159, global_step=414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=7.03e-6, train/loss_step=0.00159, global_step=414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=4.89e-5, train/loss_step=0.0016, global_step=415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]   Epoch 20:  78%|███████▊  | 62/80 [05:56<01:41,  5.67s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=4.89e-5, train/loss_step=0.0016, global_step=415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  78%|███████▊  | 62/80 [05:56<01:41,  5.67s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.18e-5, train/loss_step=0.00328, global_step=415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  79%|███████▉  | 63/80 [05:57<01:34,  5.59s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.18e-5, train/loss_step=0.00328, global_step=415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  79%|███████▉  | 63/80 [05:57<01:34,  5.59s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000692, train/loss_vlb_step=5.44e-6, train/loss_step=0.000692, global_step=415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  80%|████████  | 64/80 [05:58<01:28,  5.51s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000692, train/loss_vlb_step=5.44e-6, train/loss_step=0.000692, global_step=415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  80%|████████  | 64/80 [05:58<01:28,  5.51s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=1.78e-6, train/loss_step=0.000412, global_step=415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  81%|████████▏ | 65/80 [06:13<01:24,  5.66s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=1.78e-6, train/loss_step=0.000412, global_step=415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  81%|████████▏ | 65/80 [06:13<01:24,  5.66s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=4.76e-5, train/loss_step=0.00273, global_step=416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 20:  82%|████████▎ | 66/80 [06:14<01:18,  5.58s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=4.76e-5, train/loss_step=0.00273, global_step=416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  82%|████████▎ | 66/80 [06:14<01:18,  5.58s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=7.88e-5, train/loss_step=0.0113, global_step=416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 20:  84%|████████▍ | 67/80 [06:14<01:11,  5.51s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=7.88e-5, train/loss_step=0.0113, global_step=416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  84%|████████▍ | 67/80 [06:14<01:11,  5.51s/it, loss=0.00628, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.00186, train/loss_step=0.0256, global_step=416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  85%|████████▌ | 68/80 [06:36<01:08,  5.74s/it, loss=0.00628, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.00186, train/loss_step=0.0256, global_step=416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  85%|████████▌ | 68/80 [06:36<01:08,  5.74s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.000731, train/loss_vlb_step=3.08e-6, train/loss_step=0.000731, global_step=416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  86%|████████▋ | 69/80 [06:36<01:02,  5.67s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.000731, train/loss_vlb_step=3.08e-6, train/loss_step=0.000731, global_step=416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  86%|████████▋ | 69/80 [06:36<01:02,  5.67s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.4e-5, train/loss_step=0.0104, global_step=417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]     Epoch 20:  88%|████████▊ | 70/80 [06:40<00:56,  5.64s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.4e-5, train/loss_step=0.0104, global_step=417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  88%|██████��█▊ | 70/80 [06:40<00:56,  5.64s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.000795, train/loss_vlb_step=1.02e-5, train/loss_step=0.000795, global_step=417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  89%|████████▉ | 71/80 [06:40<00:50,  5.57s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.000795, train/loss_vlb_step=1.02e-5, train/loss_step=0.000795, global_step=417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  89%|████████▉ | 71/80 [06:40<00:50,  5.57s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.05e-5, train/loss_step=0.0115, global_step=417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]    Epoch 20:  90%|█████████ | 72/80 [06:41<00:43,  5.50s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.05e-5, train/loss_step=0.0115, global_step=417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  90%|█████████ | 72/80 [06:41<00:43,  5.50s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000638, train/loss_vlb_step=3.34e-6, train/loss_step=0.000638, global_step=417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  91%|█████████▏| 73/80 [06:55<00:39,  5.62s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000638, train/loss_vlb_step=3.34e-6, train/loss_step=0.000638, global_step=417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  91%|█████████▏| 73/80 [06:55<00:39,  5.62s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=2.98e-5, train/loss_step=0.00872, global_step=418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]   Epoch 20:  92%|█████████▎| 74/80 [06:56<00:33,  5.55s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=2.98e-5, train/loss_step=0.00872, global_step=418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  92%|█████████▎| 74/80 [06:56<00:33,  5.55s/it, loss=0.00611, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=1.94e-5, train/loss_step=0.0048, global_step=418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502] Epoch 20:  94%|█████████▍| 75/80 [06:56<00:27,  5.48s/it, loss=0.00611, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=1.94e-5, train/loss_step=0.0048, global_step=418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  94%|█████████▍| 75/80 [06:56<00:27,  5.48s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=2.1e-6, train/loss_step=0.00044, global_step=418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  95%|█████████▌| 76/80 [07:04<00:22,  5.52s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=2.1e-6, train/loss_step=0.00044, global_step=418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  95%|█████████▌| 76/80 [07:04<00:22,  5.52s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=5.81e-6, train/loss_step=0.00152, global_step=418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  96%|█████████▋| 77/80 [07:05<00:16,  5.45s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=5.81e-6, train/loss_step=0.00152, global_step=418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  96%|█████████▋| 77/80 [07:05<00:16,  5.45s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.16e-5, train/loss_step=0.00585, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  98%|█████████▊| 78/80 [07:14<00:10,  5.50s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.16e-5, train/loss_step=0.00585, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  98%|█████████▊| 78/80 [07:14<00:10,  5.50s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=1.7e-6, train/loss_step=0.000467, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  99%|█████████▉| 79/80 [07:14<00:05,  5.44s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=1.7e-6, train/loss_step=0.000467, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20:  99%|█████████▉| 79/80 [07:14<00:05,  5.44s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=2.77e-5, train/loss_step=0.00785, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502] Epoch 20: 100%|██████████| 80/80 [07:15<00:00,  5.37s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=2.77e-5, train/loss_step=0.00785, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 20: 100%|██████████| 80/80 [07:15<00:00,  5.37s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000897, train/loss_vlb_step=3.73e-6, train/loss_step=0.000897, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Average Epoch time: 435.37 seconds
+Average Peak memory 29564.11MiB
+Epoch 20:   0%|          | 0/80 [00:00<00:00, 6195.43it/s, loss=0.00501, v_num=0, train/loss_simple_step=0.000897, train/loss_vlb_step=3.73e-6, train/loss_step=0.000897, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 21:   0%|          | 0/80 [00:00<00:00, 2365.65it/s, loss=0.00501, v_num=0, train/loss_simple_step=0.000897, train/loss_vlb_step=3.73e-6, train/loss_step=0.000897, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]Epoch 21:   1%|▏         | 1/80 [00:41<27:37, 20.98s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000897, train/loss_vlb_step=3.73e-6, train/loss_step=0.000897, global_step=419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00502, train/loss_vlb_epoch=0.00011, train/loss_epoch=0.00502]  Epoch 21:   1%|▏         | 1/80 [00:41<27:37, 20.98s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.21e-5, train/loss_step=0.00327, global_step=420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:   2%|▎         | 2/80 [00:42<18:23, 14.15s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.21e-5, train/loss_step=0.00327, global_step=420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   2%|▎         | 2/80 [00:42<18:23, 14.15s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=0.000192, train/loss_step=0.00916, global_step=420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   4%|▍         | 3/80 [00:42<13:46, 10.73s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=0.000192, train/loss_step=0.00916, global_step=420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   4%|▍         | 3/80 [00:42<13:46, 10.73s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.96e-5, train/loss_step=0.0137, global_step=420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]   Epoch 21:   5%|▌         | 4/80 [00:43<11:00,  8.69s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.96e-5, train/loss_step=0.0137, global_step=420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   5%|▌         | 4/80 [00:43<11:00,  8.69s/it, loss=0.00611, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=7.42e-6, train/loss_step=0.00169, global_step=420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   6%|▋         | 5/80 [00:43<09:09,  7.33s/it, loss=0.00611, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=7.42e-6, train/loss_step=0.00169, global_step=420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   6%|▋         | 5/80 [00:43<09:09,  7.33s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=5.57e-6, train/loss_step=0.000561, global_step=421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   8%|▊         | 6/80 [00:44<07:49,  6.35s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=5.57e-6, train/loss_step=0.000561, global_step=421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   8%|▊         | 6/80 [00:44<07:49,  6.35s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=2.99e-5, train/loss_step=0.00766, global_step=421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   9%|▉         | 7/80 [00:44<06:50,  5.62s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=2.99e-5, train/loss_step=0.00766, global_step=421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:   9%|▉         | 7/80 [00:44<06:50,  5.62s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000991, train/loss_vlb_step=4.79e-6, train/loss_step=0.000991, global_step=421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  10%|█         | 8/80 [01:16<10:15,  8.55s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000991, train/loss_vlb_step=4.79e-6, train/loss_step=0.000991, global_step=421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  10%|█         | 8/80 [01:16<10:15,  8.55s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.6e-5, train/loss_step=0.00218, global_step=421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]   Epoch 21:  11%|█▏        | 9/80 [01:18<09:17,  7.85s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.6e-5, train/loss_step=0.00218, global_step=421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  11%|█▏        | 9/80 [01:18<09:17,  7.85s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=3.73e-6, train/loss_step=0.001, global_step=422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]   Epoch 21:  12%|█▎        | 10/80 [01:20<08:32,  7.32s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=3.73e-6, train/loss_step=0.001, global_step=422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  12%|█▎        | 10/80 [01:20<08:32,  7.32s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=9.54e-6, train/loss_step=0.00262, global_step=422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  14%|█▍        | 11/80 [01:23<08:02,  6.99s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=9.54e-6, train/loss_step=0.00262, global_step=422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  14%|█▍        | 11/80 [01:23<08:02,  6.99s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00048, train/loss_vlb_step=1.9e-6, train/loss_step=0.00048, global_step=422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453] Epoch 21:  15%|█▌        | 12/80 [01:24<07:21,  6.49s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00048, train/loss_vlb_step=1.9e-6, train/loss_step=0.00048, global_step=422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  15%|█▌        | 12/80 [01:24<07:21,  6.49s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000639, train/loss_vlb_step=2.71e-6, train/loss_step=0.000639, global_step=422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  16%|█▋        | 13/80 [01:25<06:47,  6.09s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000639, train/loss_vlb_step=2.71e-6, train/loss_step=0.000639, global_step=422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  16%|█▋        | 13/80 [01:25<06:47,  6.09s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=3.26e-5, train/loss_step=0.00838, global_step=423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  18%|█▊        | 14/80 [01:25<06:17,  5.72s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=3.26e-5, train/loss_step=0.00838, global_step=423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  18%|█▊        | 14/80 [01:25<06:17,  5.72s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=9.6e-6, train/loss_step=0.00258, global_step=423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  19%|█▉        | 15/80 [01:30<06:07,  5.65s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=9.6e-6, train/loss_step=0.00258, global_step=423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  19%|█▉        | 15/80 [01:30<06:07,  5.65s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.34e-5, train/loss_step=0.0115, global_step=423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  20%|██        | 16/80 [01:57<07:21,  6.89s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.34e-5, train/loss_step=0.0115, global_step=423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  20%|██        | 16/80 [01:57<07:21,  6.89s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000225, train/loss_step=0.0105, global_step=423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  21%|██▏       | 17/80 [02:00<07:02,  6.70s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000225, train/loss_step=0.0105, global_step=423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  21%|██▏       | 17/80 [02:00<07:02,  6.70s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.47e-5, train/loss_step=0.00384, global_step=424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  22%|██▎       | 18/80 [02:07<06:56,  6.72s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.47e-5, train/loss_step=0.00384, global_step=424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  22%|██▎       | 18/80 [02:07<06:56,  6.72s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=2.48e-5, train/loss_step=0.00736, global_step=424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  24%|██▍       | 19/80 [02:08<06:30,  6.41s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=2.48e-5, train/loss_step=0.00736, global_step=424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  24%|██▍       | 19/80 [02:08<06:30,  6.41s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.06e-5, train/loss_step=0.00144, global_step=424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  25%|██▌       | 20/80 [02:09<06:10,  6.18s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.06e-5, train/loss_step=0.00144, global_step=424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  25%|██▌       | 20/80 [02:09<06:10,  6.18s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.67e-5, train/loss_step=0.0161, global_step=424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  26%|██▋       | 21/80 [02:10<05:49,  5.92s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=6.67e-5, train/loss_step=0.0161, global_step=424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  26%|██▋       | 21/80 [02:10<05:49,  5.92s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=5.74e-5, train/loss_step=0.010, global_step=425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  28%|██▊       | 22/80 [02:11<05:32,  5.73s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=5.74e-5, train/loss_step=0.010, global_step=425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  28%|██▊       | 22/80 [02:11<05:32,  5.73s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=7.36e-5, train/loss_step=0.00756, global_step=425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  29%|██▉       | 23/80 [02:21<05:36,  5.90s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=7.36e-5, train/loss_step=0.00756, global_step=425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  29%|██▉       | 23/80 [02:21<05:36,  5.90s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.33e-6, train/loss_step=0.00135, global_step=425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  30%|███       | 24/80 [02:37<05:53,  6.31s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=8.33e-6, train/loss_step=0.00135, global_step=425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  30%|███       | 24/80 [02:37<05:53,  6.31s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=2.27e-6, train/loss_step=0.000547, global_step=425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  31%|███▏      | 25/80 [02:38<05:34,  6.08s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=2.27e-6, train/loss_step=0.000547, global_step=425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  31%|███▏      | 25/80 [02:38<05:34,  6.08s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000762, train/loss_vlb_step=3.29e-6, train/loss_step=0.000762, global_step=426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000762, train/loss_vlb_step=3.29e-6, train/loss_step=0.000762, global_step=426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=4.3e-6, train/loss_step=0.000696, global_step=426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453] Epoch 21:  34%|███▍      | 27/80 [02:53<05:29,  6.21s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=4.3e-6, train/loss_step=0.000696, global_step=426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  34%|███▍      | 27/80 [02:53<05:29,  6.21s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000611, train/loss_vlb_step=3.7e-6, train/loss_step=0.000611, global_step=426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000611, train/loss_vlb_step=3.7e-6, train/loss_step=0.000611, global_step=426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.65e-6, train/loss_step=0.00108, global_step=426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453] Epoch 21:  36%|███▋      | 29/80 [02:54<04:57,  5.83s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.65e-6, train/loss_step=0.00108, global_step=426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  36%|███▋      | 29/80 [02:54<04:57,  5.83s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.32e-6, train/loss_step=0.00167, global_step=427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.32e-6, train/loss_step=0.00167, global_step=427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=2.96e-5, train/loss_step=0.00708, global_step=427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00708, train/loss_vlb_step=2.96e-5, train/loss_step=0.00708, global_step=427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=2.92e-6, train/loss_step=0.000606, global_step=427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  40%|████      | 32/80 [03:18<04:48,  6.01s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=2.92e-6, train/loss_step=0.000606, global_step=427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  40%|████      | 32/80 [03:18<04:48,  6.01s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=0.00015, train/loss_step=0.0126, global_step=427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]    Epoch 21:  41%|████▏     | 33/80 [03:18<04:34,  5.85s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=0.00015, train/loss_step=0.0126, global_step=427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  41%|████▏     | 33/80 [03:18<04:34,  5.85s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.75e-6, train/loss_step=0.000351, global_step=428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  42%|████▎     | 34/80 [03:39<04:48,  6.27s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.75e-6, train/loss_step=0.000351, global_step=428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  42%|████▎     | 34/80 [03:39<04:48,  6.27s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=4.01e-6, train/loss_step=0.000793, global_step=428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  44%|████▍     | 35/80 [03:39<04:34,  6.11s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=4.01e-6, train/loss_step=0.000793, global_step=428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  44%|████▍     | 35/80 [03:39<04:34,  6.11s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=1.33e-5, train/loss_step=0.00388, global_step=428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  45%|████▌     | 36/80 [03:40<04:22,  5.96s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=1.33e-5, train/loss_step=0.00388, global_step=428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  45%|████▌     | 36/80 [03:40<04:22,  5.96s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.12e-5, train/loss_step=0.00317, global_step=428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.12e-5, train/loss_step=0.00317, global_step=428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=8.29e-5, train/loss_step=0.0137, global_step=429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=8.29e-5, train/loss_step=0.0137, global_step=429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=1.56e-5, train/loss_step=0.00432, global_step=429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  49%|████▉     | 39/80 [03:52<03:58,  5.82s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=1.56e-5, train/loss_step=0.00432, global_step=429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  49%|████▉     | 39/80 [03:52<03:58,  5.82s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.66e-5, train/loss_step=0.00448, global_step=429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  50%|█████     | 40/80 [03:53<03:47,  5.69s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.66e-5, train/loss_step=0.00448, global_step=429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  50%|█████     | 40/80 [03:53<03:47,  5.69s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.38e-6, train/loss_step=0.00136, global_step=429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  51%|█████▏    | 41/80 [04:05<03:47,  5.84s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.38e-6, train/loss_step=0.00136, global_step=429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  51%|█████▏    | 41/80 [04:05<03:47,  5.84s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=7.53e-6, train/loss_step=0.00205, global_step=430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  52%|█████▎    | 42/80 [04:30<03:58,  6.29s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=7.53e-6, train/loss_step=0.00205, global_step=430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  52%|█████▎    | 42/80 [04:30<03:58,  6.29s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000751, train/loss_vlb_step=5.25e-6, train/loss_step=0.000751, global_step=430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  54%|█████▍    | 43/80 [04:30<03:47,  6.16s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000751, train/loss_vlb_step=5.25e-6, train/loss_step=0.000751, global_step=430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  54%|█████▍    | 43/80 [04:30<03:47,  6.16s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=2.02e-6, train/loss_step=0.000424, global_step=430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  55%|█████▌    | 44/80 [04:31<03:37,  6.03s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=2.02e-6, train/loss_step=0.000424, global_step=430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  55%|█████▌    | 44/80 [04:31<03:37,  6.03s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=3.51e-6, train/loss_step=0.000552, global_step=430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  56%|█████▋    | 45/80 [04:31<03:26,  5.91s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=3.51e-6, train/loss_step=0.000552, global_step=430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  56%|█████▋    | 45/80 [04:31<03:26,  5.91s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=3.71e-5, train/loss_step=0.00903, global_step=431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  57%|█████▊    | 46/80 [04:34<03:18,  5.83s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=3.71e-5, train/loss_step=0.00903, global_step=431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  57%|█████▊    | 46/80 [04:34<03:18,  5.83s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000214, train/loss_step=0.015, global_step=431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]   Epoch 21:  59%|█████▉    | 47/80 [04:34<03:08,  5.72s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000214, train/loss_step=0.015, global_step=431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  59%|█████▉    | 47/80 [04:34<03:08,  5.72s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000612, train/loss_vlb_step=2.55e-6, train/loss_step=0.000612, global_step=431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  60%|██████    | 48/80 [04:35<02:59,  5.62s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000612, train/loss_vlb_step=2.55e-6, train/loss_step=0.000612, global_step=431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  60%|██████    | 48/80 [04:35<02:59,  5.62s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=1.45e-5, train/loss_step=0.00128, global_step=431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  61%|██████▏   | 49/80 [04:42<02:55,  5.66s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=1.45e-5, train/loss_step=0.00128, global_step=431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  61%|██████▏   | 49/80 [04:42<02:55,  5.66s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000583, train/loss_vlb_step=2.68e-6, train/loss_step=0.000583, global_step=432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000583, train/loss_vlb_step=2.68e-6, train/loss_step=0.000583, global_step=432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=0.000187, train/loss_step=0.00225, global_step=432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453] Epoch 21:  64%|██████▍   | 51/80 [05:10<02:52,  5.96s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=0.000187, train/loss_step=0.00225, global_step=432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  64%|██████▍   | 51/80 [05:10<02:52,  5.96s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.29e-5, train/loss_step=0.00155, global_step=432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453] Epoch 21:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.29e-5, train/loss_step=0.00155, global_step=432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=5.21e-5, train/loss_step=0.00955, global_step=432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  66%|██████▋   | 53/80 [05:12<02:36,  5.79s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00955, train/loss_vlb_step=5.21e-5, train/loss_step=0.00955, global_step=432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  66%|██████▋   | 53/80 [05:12<02:36,  5.79s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=5.91e-6, train/loss_step=0.000728, global_step=433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  68%|██████▊   | 54/80 [05:13<02:28,  5.69s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=5.91e-6, train/loss_step=0.000728, global_step=433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  68%|██████▊   | 54/80 [05:13<02:28,  5.69s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.12e-5, train/loss_step=0.00255, global_step=433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453] Epoch 21:  69%|██████▉   | 55/80 [05:20<02:23,  5.73s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.12e-5, train/loss_step=0.00255, global_step=433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  69%|██████▉   | 55/80 [05:20<02:23,  5.73s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=0.00016, train/loss_step=0.00526, global_step=433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  70%|███████   | 56/80 [05:21<02:15,  5.64s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=0.00016, train/loss_step=0.00526, global_step=433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  70%|███████   | 56/80 [05:21<02:15,  5.64s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.41e-5, train/loss_step=0.00208, global_step=433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  71%|███████▏  | 57/80 [05:22<02:07,  5.56s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=1.41e-5, train/loss_step=0.00208, global_step=433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  71%|███████▏  | 57/80 [05:22<02:07,  5.56s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.52e-5, train/loss_step=0.0045, global_step=434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  72%|███████▎  | 58/80 [05:50<02:10,  5.94s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.52e-5, train/loss_step=0.0045, global_step=434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  72%|███████▎  | 58/80 [05:50<02:10,  5.94s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=1.37e-5, train/loss_step=0.000834, global_step=434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  74%|███████▍  | 59/80 [05:50<02:02,  5.85s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=1.37e-5, train/loss_step=0.000834, global_step=434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  74%|███████▍  | 59/80 [05:50<02:02,  5.85s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=9.25e-6, train/loss_step=0.002, global_step=434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]      Epoch 21:  75%|███████▌  | 60/80 [05:51<01:55,  5.77s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=9.25e-6, train/loss_step=0.002, global_step=434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  75%|███████▌  | 60/80 [05:51<01:55,  5.77s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.57e-5, train/loss_step=0.00469, global_step=434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  76%|███████▋  | 61/80 [06:00<01:50,  5.82s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.57e-5, train/loss_step=0.00469, global_step=434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  76%|███████▋  | 61/80 [06:00<01:50,  5.82s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=8e-5, train/loss_step=0.0123, global_step=435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]     Epoch 21:  78%|███████▊  | 62/80 [06:01<01:43,  5.73s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=8e-5, train/loss_step=0.0123, global_step=435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  78%|███████▊  | 62/80 [06:01<01:43,  5.73s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.19e-6, train/loss_step=0.000452, global_step=435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  79%|███████▉  | 63/80 [06:09<01:38,  5.78s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.19e-6, train/loss_step=0.000452, global_step=435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  79%|███████▉  | 63/80 [06:09<01:38,  5.78s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000807, train/loss_vlb_step=3.16e-6, train/loss_step=0.000807, global_step=435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  80%|████████  | 64/80 [06:10<01:31,  5.70s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000807, train/loss_vlb_step=3.16e-6, train/loss_step=0.000807, global_step=435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  80%|████████  | 64/80 [06:10<01:31,  5.70s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=2.04e-5, train/loss_step=0.00322, global_step=435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=2.04e-5, train/loss_step=0.00322, global_step=435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=6.38e-6, train/loss_step=0.00153, global_step=436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  82%|████████▎ | 66/80 [06:31<01:21,  5.84s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=6.38e-6, train/loss_step=0.00153, global_step=436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  82%|████████▎ | 66/80 [06:31<01:21,  5.84s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000713, train/loss_vlb_step=3.61e-6, train/loss_step=0.000713, global_step=436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  84%|████████▍ | 67/80 [06:31<01:14,  5.76s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000713, train/loss_vlb_step=3.61e-6, train/loss_step=0.000713, global_step=436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  84%|████████▍ | 67/80 [06:31<01:14,  5.76s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.7e-6, train/loss_step=0.00036, global_step=436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]   Epoch 21:  85%|████████▌ | 68/80 [06:32<01:08,  5.69s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.7e-6, train/loss_step=0.00036, global_step=436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  85%|████████▌ | 68/80 [06:32<01:08,  5.69s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000397, train/loss_vlb_step=1.62e-6, train/loss_step=0.000397, global_step=436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000397, train/loss_vlb_step=1.62e-6, train/loss_step=0.000397, global_step=436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=3.74e-5, train/loss_step=0.00862, global_step=437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=3.74e-5, train/loss_step=0.00862, global_step=437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.18e-6, train/loss_step=0.000464, global_step=437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  89%|████████▉ | 71/80 [06:50<00:51,  5.70s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.18e-6, train/loss_step=0.000464, global_step=437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  89%|████████▉ | 71/80 [06:50<00:51,  5.70s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=9.32e-6, train/loss_step=0.00125, global_step=437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  90%|█████████ | 72/80 [06:51<00:45,  5.63s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=9.32e-6, train/loss_step=0.00125, global_step=437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  90%|█████████ | 72/80 [06:51<00:45,  5.63s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=2.68e-6, train/loss_step=0.000624, global_step=437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  91%|█████████▏| 73/80 [06:52<00:38,  5.57s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=2.68e-6, train/loss_step=0.000624, global_step=437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  91%|█████████▏| 73/80 [06:52<00:38,  5.57s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=9.79e-6, train/loss_step=0.000802, global_step=438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  92%|█████████▎| 74/80 [07:07<00:34,  5.70s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=9.79e-6, train/loss_step=0.000802, global_step=438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  92%|█████████▎| 74/80 [07:07<00:34,  5.70s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=1.74e-5, train/loss_step=0.00506, global_step=438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]   Epoch 21:  94%|█████████▍| 75/80 [07:08<00:28,  5.63s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=1.74e-5, train/loss_step=0.00506, global_step=438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  94%|█████████▍| 75/80 [07:08<00:28,  5.63s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.87e-5, train/loss_step=0.00484, global_step=438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.87e-5, train/loss_step=0.00484, global_step=438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=1.86e-5, train/loss_step=0.0052, global_step=438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 21:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=1.86e-5, train/loss_step=0.0052, global_step=438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000281, train/loss_step=0.0183, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000281, train/loss_step=0.0183, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000872, train/loss_vlb_step=1.3e-5, train/loss_step=0.000872, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000872, train/loss_vlb_step=1.3e-5, train/loss_step=0.000872, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=5.44e-6, train/loss_step=0.000798, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=5.44e-6, train/loss_step=0.000798, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 21: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000162, train/loss_vlb_step=6.43e-7, train/loss_step=0.000162, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Average Epoch time: 430.58 seconds
+Average Peak memory 29567.66MiB
+Epoch 21:   0%|          | 0/80 [00:00<00:00, 5793.24it/s, loss=0.00334, v_num=0, train/loss_simple_step=0.000162, train/loss_vlb_step=6.43e-7, train/loss_step=0.000162, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 22:   0%|          | 0/80 [00:00<00:00, 2193.67it/s, loss=0.00334, v_num=0, train/loss_simple_step=0.000162, train/loss_vlb_step=6.43e-7, train/loss_step=0.000162, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]Epoch 22:   1%|▏         | 1/80 [00:34<22:35, 17.16s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000162, train/loss_vlb_step=6.43e-7, train/loss_step=0.000162, global_step=439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00453, train/loss_vlb_epoch=0.000107, train/loss_epoch=0.00453]  Epoch 22:   1%|▏         | 1/80 [00:34<22:35, 17.16s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.59e-6, train/loss_step=0.0016, global_step=440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]      Epoch 22:   2%|▎         | 2/80 [00:41<17:53, 13.76s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.59e-6, train/loss_step=0.0016, global_step=440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   2%|▎         | 2/80 [00:41<17:53, 13.76s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.75e-5, train/loss_step=0.015, global_step=440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428] Epoch 22:   4%|▍         | 3/80 [00:41<13:24, 10.44s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.75e-5, train/loss_step=0.015, global_step=440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   4%|▍         | 3/80 [00:41<13:24, 10.44s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=3.69e-6, train/loss_step=0.000803, global_step=440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   5%|▌         | 4/80 [00:42<10:42,  8.46s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=3.69e-6, train/loss_step=0.000803, global_step=440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   5%|▌         | 4/80 [00:42<10:42,  8.46s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000807, train/loss_vlb_step=3.07e-6, train/loss_step=0.000807, global_step=440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   6%|▋         | 5/80 [00:42<08:55,  7.13s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000807, train/loss_vlb_step=3.07e-6, train/loss_step=0.000807, global_step=440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   6%|▋         | 5/80 [00:42<08:55,  7.13s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.37e-6, train/loss_step=0.000308, global_step=441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   8%|▊         | 6/80 [00:43<07:37,  6.19s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.37e-6, train/loss_step=0.000308, global_step=441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   8%|▊         | 6/80 [00:43<07:37,  6.19s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=3.05e-6, train/loss_step=0.000732, global_step=441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   9%|▉         | 7/80 [00:43<06:39,  5.47s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=3.05e-6, train/loss_step=0.000732, global_step=441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:   9%|▉         | 7/80 [00:43<06:39,  5.47s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=3.91e-6, train/loss_step=0.000819, global_step=441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  10%|█         | 8/80 [01:06<08:50,  7.36s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=3.91e-6, train/loss_step=0.000819, global_step=441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  10%|█         | 8/80 [01:06<08:50,  7.36s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.42e-5, train/loss_step=0.00408, global_step=441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 22:  11%|█▏        | 9/80 [01:11<08:30,  7.19s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.42e-5, train/loss_step=0.00408, global_step=441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  11%|█▏        | 9/80 [01:11<08:30,  7.19s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00089, train/loss_vlb_step=3.41e-6, train/loss_step=0.00089, global_step=442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  12%|█▎        | 10/80 [01:22<08:45,  7.51s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00089, train/loss_vlb_step=3.41e-6, train/loss_step=0.00089, global_step=442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  12%|█▎        | 10/80 [01:22<08:45,  7.51s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000646, train/loss_vlb_step=3.92e-6, train/loss_step=0.000646, global_step=442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  14%|█▍        | 11/80 [01:23<07:57,  6.92s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000646, train/loss_vlb_step=3.92e-6, train/loss_step=0.000646, global_step=442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  14%|█▍        | 11/80 [01:23<07:57,  6.92s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.24e-6, train/loss_step=0.000453, global_step=442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  15%|█▌        | 12/80 [01:31<07:59,  7.05s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.24e-6, train/loss_step=0.000453, global_step=442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  15%|█▌        | 12/80 [01:31<07:59,  7.05s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00072, train/loss_vlb_step=5.18e-6, train/loss_step=0.00072, global_step=442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 22:  16%|█▋        | 13/80 [01:32<07:20,  6.58s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00072, train/loss_vlb_step=5.18e-6, train/loss_step=0.00072, global_step=442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  16%|█▋        | 13/80 [01:32<07:20,  6.58s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=1.5e-6, train/loss_step=0.000356, global_step=443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  18%|█▊        | 14/80 [01:32<06:47,  6.18s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=1.5e-6, train/loss_step=0.000356, global_step=443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  18%|█▊        | 14/80 [01:32<06:47,  6.18s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=3.2e-6, train/loss_step=0.000555, global_step=443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  19%|█▉        | 15/80 [01:33<06:18,  5.82s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=3.2e-6, train/loss_step=0.000555, global_step=443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  19%|█▉        | 15/80 [01:33<06:18,  5.82s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000352, train/loss_vlb_step=1.51e-6, train/loss_step=0.000352, global_step=443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  20%|██        | 16/80 [01:40<06:18,  5.92s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000352, train/loss_vlb_step=1.51e-6, train/loss_step=0.000352, global_step=443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  20%|██        | 16/80 [01:40<06:18,  5.92s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=2.98e-6, train/loss_step=0.000631, global_step=443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  21%|██▏       | 17/80 [01:46<06:11,  5.89s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=2.98e-6, train/loss_step=0.000631, global_step=443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  21%|██▏       | 17/80 [01:46<06:11,  5.89s/it, loss=0.00166, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.36e-5, train/loss_step=0.00259, global_step=444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 22:  22%|██▎       | 18/80 [02:04<06:46,  6.56s/it, loss=0.00166, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.36e-5, train/loss_step=0.00259, global_step=444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  22%|██▎       | 18/80 [02:04<06:46,  6.56s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.0107, train/loss_step=0.043, global_step=444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]     Epoch 22:  24%|██▍       | 19/80 [02:05<06:21,  6.26s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.043, train/loss_vlb_step=0.0107, train/loss_step=0.043, global_step=444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  24%|██▍       | 19/80 [02:05<06:21,  6.26s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000559, train/loss_vlb_step=2.27e-6, train/loss_step=0.000559, global_step=444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  25%|██▌       | 20/80 [02:18<06:36,  6.60s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000559, train/loss_vlb_step=2.27e-6, train/loss_step=0.000559, global_step=444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  25%|██▌       | 20/80 [02:18<06:36,  6.60s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=3.83e-6, train/loss_step=0.000544, global_step=444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  26%|██▋       | 21/80 [02:19<06:13,  6.32s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=3.83e-6, train/loss_step=0.000544, global_step=444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  26%|██▋       | 21/80 [02:19<06:13,  6.32s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=2.31e-6, train/loss_step=0.000494, global_step=445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  28%|██▊       | 22/80 [02:19<05:52,  6.07s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=2.31e-6, train/loss_step=0.000494, global_step=445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  28%|██▊       | 22/80 [02:19<05:52,  6.07s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.37e-5, train/loss_step=0.00364, global_step=445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 22:  29%|██▉       | 23/80 [02:20<05:32,  5.84s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.37e-5, train/loss_step=0.00364, global_step=445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  29%|██▉       | 23/80 [02:20<05:32,  5.84s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=3.18e-6, train/loss_step=0.000599, global_step=445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  30%|███       | 24/80 [02:20<05:15,  5.63s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=3.18e-6, train/loss_step=0.000599, global_step=445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  30%|███       | 24/80 [02:20<05:15,  5.63s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00073, train/loss_vlb_step=1.5e-5, train/loss_step=0.00073, global_step=445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]   Epoch 22:  31%|███▏      | 25/80 [02:29<05:16,  5.76s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00073, train/loss_vlb_step=1.5e-5, train/loss_step=0.00073, global_step=445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  31%|███▏      | 25/80 [02:29<05:16,  5.76s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=1.45e-5, train/loss_step=0.00421, global_step=446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  32%|███▎      | 26/80 [02:47<05:34,  6.20s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=1.45e-5, train/loss_step=0.00421, global_step=446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  32%|███▎      | 26/80 [02:47<05:34,  6.20s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=7.4e-5, train/loss_step=0.0128, global_step=446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]   Epoch 22:  34%|███▍      | 27/80 [02:47<05:17,  5.99s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=7.4e-5, train/loss_step=0.0128, global_step=446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  34%|███▍      | 27/80 [02:47<05:17,  5.99s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.83e-5, train/loss_step=0.00648, global_step=446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  35%|███▌      | 28/80 [03:01<05:25,  6.25s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=3.83e-5, train/loss_step=0.00648, global_step=446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  35%|███▌      | 28/80 [03:01<05:25,  6.25s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.5e-5, train/loss_step=0.0183, global_step=446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]   Epoch 22:  36%|███▋      | 29/80 [03:01<05:09,  6.06s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=7.5e-5, train/loss_step=0.0183, global_step=446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  36%|███▋      | 29/80 [03:01<05:09,  6.06s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.15e-5, train/loss_step=0.0108, global_step=447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  38%|███▊      | 30/80 [03:02<04:54,  5.88s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.15e-5, train/loss_step=0.0108, global_step=447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  38%|███▊      | 30/80 [03:02<04:54,  5.88s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=2.67e-6, train/loss_step=0.00059, global_step=447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  39%|███▉      | 31/80 [03:02<04:40,  5.71s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=2.67e-6, train/loss_step=0.00059, global_step=447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  39%|███▉      | 31/80 [03:02<04:40,  5.71s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=1.77e-5, train/loss_step=0.00441, global_step=447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  40%|████      | 32/80 [03:03<04:26,  5.56s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.00441, train/loss_vlb_step=1.77e-5, train/loss_step=0.00441, global_step=447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  40%|████      | 32/80 [03:03<04:26,  5.56s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=3.49e-6, train/loss_step=0.000834, global_step=447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  41%|████▏     | 33/80 [03:23<04:41,  5.99s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=3.49e-6, train/loss_step=0.000834, global_step=447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  41%|████▏     | 33/80 [03:23<04:41,  5.99s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=0.000224, train/loss_step=0.00161, global_step=448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428] Epoch 22:  42%|████▎     | 34/80 [03:40<04:50,  6.31s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=0.000224, train/loss_step=0.00161, global_step=448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  42%|████▎     | 34/80 [03:40<04:50,  6.31s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.000782, train/loss_vlb_step=3.51e-6, train/loss_step=0.000782, global_step=448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  44%|████▍     | 35/80 [03:41<04:36,  6.15s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.000782, train/loss_vlb_step=3.51e-6, train/loss_step=0.000782, global_step=448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  44%|████▍     | 35/80 [03:41<04:36,  6.15s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.31e-5, train/loss_step=0.003, global_step=448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]     Epoch 22:  45%|████▌     | 36/80 [03:50<04:34,  6.23s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.31e-5, train/loss_step=0.003, global_step=448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  45%|████▌     | 36/80 [03:50<04:34,  6.23s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=5.04e-5, train/loss_step=0.00668, global_step=448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  46%|████▋     | 37/80 [03:51<04:21,  6.08s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=5.04e-5, train/loss_step=0.00668, global_step=448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  46%|████▋     | 37/80 [03:51<04:21,  6.08s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=3.3e-6, train/loss_step=0.000476, global_step=449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  48%|████▊     | 38/80 [03:51<04:09,  5.94s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=3.3e-6, train/loss_step=0.000476, global_step=449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  48%|████▊     | 38/80 [03:51<04:09,  5.94s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.52e-6, train/loss_step=0.000392, global_step=449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  49%|████▉     | 39/80 [03:52<03:57,  5.80s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.52e-6, train/loss_step=0.000392, global_step=449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  49%|████▉     | 39/80 [03:52<03:57,  5.80s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000119, train/loss_step=0.0151, global_step=449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]   Epoch 22:  50%|█████     | 40/80 [03:52<03:46,  5.67s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000119, train/loss_step=0.0151, global_step=449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  50%|█████     | 40/80 [03:52<03:46,  5.67s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=1.91e-5, train/loss_step=0.0047, global_step=449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428] Epoch 22:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=1.91e-5, train/loss_step=0.0047, global_step=449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.33e-5, train/loss_step=0.00395, global_step=450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  52%|█████▎    | 42/80 [04:23<03:53,  6.14s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.33e-5, train/loss_step=0.00395, global_step=450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  52%|█████▎    | 42/80 [04:23<03:53,  6.14s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.86e-5, train/loss_step=0.0019, global_step=450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  54%|█████▍    | 43/80 [04:24<03:42,  6.01s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.86e-5, train/loss_step=0.0019, global_step=450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  54%|█████▍    | 43/80 [04:24<03:42,  6.01s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=8.02e-5, train/loss_step=0.0104, global_step=450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428] Epoch 22:  55%|█████▌    | 44/80 [04:35<03:40,  6.12s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=8.02e-5, train/loss_step=0.0104, global_step=450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  55%|█████▌    | 44/80 [04:35<03:40,  6.12s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=2.85e-5, train/loss_step=0.00151, global_step=450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  56%|█████▋    | 45/80 [04:36<03:30,  6.00s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=2.85e-5, train/loss_step=0.00151, global_step=450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  56%|█████▋    | 45/80 [04:36<03:30,  6.00s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=2.3e-6, train/loss_step=0.000489, global_step=451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  57%|█████▊    | 46/80 [04:36<03:20,  5.88s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=2.3e-6, train/loss_step=0.000489, global_step=451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  57%|█████▊    | 46/80 [04:36<03:20,  5.88s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000695, train/loss_step=0.0255, global_step=451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 22:  59%|█████▉    | 47/80 [04:37<03:10,  5.77s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000695, train/loss_step=0.0255, global_step=451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  59%|█████▉    | 47/80 [04:37<03:10,  5.77s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.000943, train/loss_vlb_step=1.13e-5, train/loss_step=0.000943, global_step=451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  60%|██████    | 48/80 [04:37<03:01,  5.66s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.000943, train/loss_vlb_step=1.13e-5, train/loss_step=0.000943, global_step=451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  60%|██████    | 48/80 [04:37<03:01,  5.66s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000858, train/loss_vlb_step=1.57e-5, train/loss_step=0.000858, global_step=451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  61%|██████▏   | 49/80 [04:52<03:01,  5.85s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000858, train/loss_vlb_step=1.57e-5, train/loss_step=0.000858, global_step=451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  61%|██████▏   | 49/80 [04:52<03:01,  5.85s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000914, train/loss_vlb_step=5.21e-6, train/loss_step=0.000914, global_step=452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  62%|██████▎   | 50/80 [05:07<03:00,  6.02s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000914, train/loss_vlb_step=5.21e-6, train/loss_step=0.000914, global_step=452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  62%|██████▎   | 50/80 [05:07<03:00,  6.02s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=0.000393, train/loss_step=0.00228, global_step=452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428] Epoch 22:  64%|██████▍   | 51/80 [05:07<02:51,  5.92s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=0.000393, train/loss_step=0.00228, global_step=452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  64%|██████▍   | 51/80 [05:07<02:51,  5.92s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=2.09e-5, train/loss_step=0.0062, global_step=452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]   Epoch 22:  65%|██████▌   | 52/80 [05:12<02:44,  5.89s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=2.09e-5, train/loss_step=0.0062, global_step=452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  65%|██████▌   | 52/80 [05:12<02:44,  5.89s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.47e-5, train/loss_step=0.0118, global_step=452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  66%|██████▋   | 53/80 [05:13<02:36,  5.80s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.47e-5, train/loss_step=0.0118, global_step=452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  66%|██████▋   | 53/80 [05:13<02:36,  5.80s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.63e-5, train/loss_step=0.00361, global_step=453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  68%|██████▊   | 54/80 [05:13<02:28,  5.71s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.63e-5, train/loss_step=0.00361, global_step=453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  68%|██████▊   | 54/80 [05:13<02:28,  5.71s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.04e-6, train/loss_step=0.000271, global_step=453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  69%|██████▉   | 55/80 [05:14<02:20,  5.61s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.04e-6, train/loss_step=0.000271, global_step=453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  69%|██████▉   | 55/80 [05:14<02:20,  5.61s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.49e-5, train/loss_step=0.0101, global_step=453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]     Epoch 22:  70%|███████   | 56/80 [05:15<02:12,  5.53s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.49e-5, train/loss_step=0.0101, global_step=453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  70%|███████   | 56/80 [05:15<02:12,  5.53s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=2.16e-5, train/loss_step=0.00264, global_step=453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  71%|███████▏  | 57/80 [05:38<02:14,  5.83s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=2.16e-5, train/loss_step=0.00264, global_step=453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  71%|███████▏  | 57/80 [05:38<02:14,  5.83s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.5e-5, train/loss_step=0.00653, global_step=454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428] Epoch 22:  72%|███████▎  | 58/80 [05:58<02:13,  6.08s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=3.5e-5, train/loss_step=0.00653, global_step=454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  72%|███████▎  | 58/80 [05:58<02:13,  6.08s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.6e-5, train/loss_step=0.00266, global_step=454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  74%|███████▍  | 59/80 [05:59<02:05,  5.99s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.6e-5, train/loss_step=0.00266, global_step=454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  74%|███████▍  | 59/80 [05:59<02:05,  5.99s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=2.88e-5, train/loss_step=0.00845, global_step=454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  75%|███████▌  | 60/80 [06:07<02:00,  6.02s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=2.88e-5, train/loss_step=0.00845, global_step=454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  75%|███████▌  | 60/80 [06:07<02:00,  6.02s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.85e-6, train/loss_step=0.000393, global_step=454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  76%|███████▋  | 61/80 [06:07<01:52,  5.93s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.85e-6, train/loss_step=0.000393, global_step=454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  76%|███████▋  | 61/80 [06:07<01:52,  5.93s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=0.00191, train/loss_step=0.0102, global_step=455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]    Epoch 22:  78%|███████▊  | 62/80 [06:08<01:45,  5.84s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=0.00191, train/loss_step=0.0102, global_step=455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  78%|███████▊  | 62/80 [06:08<01:45,  5.84s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.2e-5, train/loss_step=0.00352, global_step=455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  79%|███████▉  | 63/80 [06:08<01:37,  5.76s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.2e-5, train/loss_step=0.00352, global_step=455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  79%|███████▉  | 63/80 [06:08<01:37,  5.76s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=2.39e-5, train/loss_step=0.00692, global_step=455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  80%|████████  | 64/80 [06:09<01:30,  5.68s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=2.39e-5, train/loss_step=0.00692, global_step=455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  80%|████████  | 64/80 [06:09<01:30,  5.68s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.03e-5, train/loss_step=0.00809, global_step=455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  81%|████████▏ | 65/80 [06:27<01:27,  5.87s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.03e-5, train/loss_step=0.00809, global_step=455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  81%|████████▏ | 65/80 [06:27<01:27,  5.87s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.36e-6, train/loss_step=0.00167, global_step=456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  82%|████████▎ | 66/80 [06:32<01:22,  5.86s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.36e-6, train/loss_step=0.00167, global_step=456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  82%|████████▎ | 66/80 [06:32<01:22,  5.86s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.04e-5, train/loss_step=0.0139, global_step=456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]   Epoch 22:  84%|████████▍ | 67/80 [06:33<01:15,  5.78s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.04e-5, train/loss_step=0.0139, global_step=456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  84%|████████▍ | 67/80 [06:33<01:15,  5.78s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=3.12e-5, train/loss_step=0.00846, global_step=456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  85%|████████▌ | 68/80 [06:40<01:09,  5.81s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=3.12e-5, train/loss_step=0.00846, global_step=456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  85%|████████▌ | 68/80 [06:40<01:09,  5.81s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=1.31e-6, train/loss_step=0.000294, global_step=456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  86%|████████▋ | 69/80 [06:41<01:03,  5.73s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=1.31e-6, train/loss_step=0.000294, global_step=456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  86%|█████��██▋ | 69/80 [06:41<01:03,  5.73s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000556, train/loss_vlb_step=3.06e-6, train/loss_step=0.000556, global_step=457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  88%|████████▊ | 70/80 [06:41<00:56,  5.66s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000556, train/loss_vlb_step=3.06e-6, train/loss_step=0.000556, global_step=457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  88%|████████▊ | 70/80 [06:41<00:56,  5.66s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=8.65e-6, train/loss_step=0.00241, global_step=457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 22:  89%|████████▉ | 71/80 [06:42<00:50,  5.59s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=8.65e-6, train/loss_step=0.00241, global_step=457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  89%|████████▉ | 71/80 [06:42<00:50,  5.59s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.000795, train/loss_vlb_step=3.12e-6, train/loss_step=0.000795, global_step=457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  90%|█████████ | 72/80 [06:42<00:44,  5.52s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.000795, train/loss_vlb_step=3.12e-6, train/loss_step=0.000795, global_step=457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  90%|█████████ | 72/80 [06:42<00:44,  5.52s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=4.57e-6, train/loss_step=0.000737, global_step=457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  91%|█████████▏| 73/80 [07:02<00:40,  5.71s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=4.57e-6, train/loss_step=0.000737, global_step=457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  91%|█████████▏| 73/80 [07:02<00:40,  5.71s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=1.55e-6, train/loss_step=0.000386, global_step=458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  92%|█████████▎| 74/80 [07:04<00:33,  5.66s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=1.55e-6, train/loss_step=0.000386, global_step=458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  92%|█████████▎| 74/80 [07:04<00:33,  5.66s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=1.82e-5, train/loss_step=0.00538, global_step=458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 22:  94%|█████████▍| 75/80 [07:05<00:27,  5.60s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=1.82e-5, train/loss_step=0.00538, global_step=458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  94%|█████████▍| 75/80 [07:05<00:27,  5.60s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=4.33e-6, train/loss_step=0.000842, global_step=458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=4.33e-6, train/loss_step=0.000842, global_step=458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=0.000559, train/loss_step=0.00731, global_step=458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428] Epoch 22:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=0.000559, train/loss_step=0.00731, global_step=458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=3.31e-6, train/loss_step=0.000525, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=3.31e-6, train/loss_step=0.000525, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=5.21e-5, train/loss_step=0.00356, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 22:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=5.21e-5, train/loss_step=0.00356, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000181, train/loss_step=0.0139, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 22: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000181, train/loss_step=0.0139, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 22: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.22e-6, train/loss_step=0.000299, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Average Epoch time: 430.93 seconds
+Average Peak memory 29565.07MiB
+Epoch 22:   0%|          | 0/80 [00:00<00:00, 6159.04it/s, loss=0.00449, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.22e-6, train/loss_step=0.000299, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 23:   0%|          | 0/80 [00:00<00:00, 2413.29it/s, loss=0.00449, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.22e-6, train/loss_step=0.000299, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]Epoch 23:   1%|▏         | 1/80 [00:38<25:19, 19.23s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.22e-6, train/loss_step=0.000299, global_step=459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=7.91e-5, train/loss_epoch=0.00428]  Epoch 23:   1%|▏         | 1/80 [00:38<25:19, 19.23s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=8.35e-6, train/loss_step=0.000748, global_step=460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:   2%|▎         | 2/80 [00:48<21:09, 16.27s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=8.35e-6, train/loss_step=0.000748, global_step=460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:   2%|▎         | 2/80 [00:48<21:09, 16.27s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000773, train/loss_vlb_step=3.7e-6, train/loss_step=0.000773, global_step=460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464] Epoch 23:   4%|▍         | 3/80 [00:49<15:49, 12.33s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000773, train/loss_vlb_step=3.7e-6, train/loss_step=0.000773, global_step=460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:   4%|▍         | 3/80 [00:49<15:49, 12.33s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=8.36e-6, train/loss_step=0.00116, global_step=460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464] Epoch 23:   5%|▌         | 4/80 [00:49<12:37,  9.97s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=8.36e-6, train/loss_step=0.00116, global_step=460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:   5%|▌         | 4/80 [00:49<12:37,  9.97s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=1.68e-6, train/loss_step=0.00043, global_step=460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:   6%|▋         | 5/80 [00:50<10:29,  8.39s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=1.68e-6, train/loss_step=0.00043, global_step=460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:   6%|▋         | 5/80 [00:50<10:29,  8.39s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000682, train/loss_vlb_step=3e-6, train/loss_step=0.000682, global_step=461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464] Epoch 23:   8%|▊         | 6/80 [00:50<08:57,  7.26s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000682, train/loss_vlb_step=3e-6, train/loss_step=0.000682, global_step=461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:   8%|▊         | 6/80 [00:50<08:57,  7.26s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=1.62e-5, train/loss_step=0.00487, global_step=461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:   9%|▉         | 7/80 [00:51<07:48,  6.42s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=1.62e-5, train/loss_step=0.00487, global_step=461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:   9%|▉         | 7/80 [00:51<07:48,  6.42s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000473, train/loss_vlb_step=1.72e-6, train/loss_step=0.000473, global_step=461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  10%|█         | 8/80 [01:13<09:47,  8.15s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000473, train/loss_vlb_step=1.72e-6, train/loss_step=0.000473, global_step=461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  10%|█         | 8/80 [01:13<09:47,  8.15s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=1.95e-5, train/loss_step=0.00532, global_step=461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  11%|█▏        | 9/80 [01:15<08:52,  7.50s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=1.95e-5, train/loss_step=0.00532, global_step=461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  11%|█▏        | 9/80 [01:15<08:52,  7.50s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=4.23e-5, train/loss_step=0.00678, global_step=462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  12%|█▎        | 10/80 [01:32<09:45,  8.37s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=4.23e-5, train/loss_step=0.00678, global_step=462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  12%|█▎        | 10/80 [01:32<09:45,  8.37s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000671, train/loss_vlb_step=3.09e-6, train/loss_step=0.000671, global_step=462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  14%|█▍        | 11/80 [01:32<08:52,  7.72s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000671, train/loss_vlb_step=3.09e-6, train/loss_step=0.000671, global_step=462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  14%|█▍        | 11/80 [01:32<08:52,  7.72s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000689, train/loss_vlb_step=3.07e-6, train/loss_step=0.000689, global_step=462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  15%|█▌        | 12/80 [01:33<08:07,  7.17s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000689, train/loss_vlb_step=3.07e-6, train/loss_step=0.000689, global_step=462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  15%|█▌        | 12/80 [01:33<08:07,  7.17s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=8.87e-5, train/loss_step=0.0186, global_step=462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]    Epoch 23:  16%|█▋        | 13/80 [01:33<07:28,  6.69s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=8.87e-5, train/loss_step=0.0186, global_step=462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  16%|█▋        | 13/80 [01:33<07:28,  6.69s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=3.7e-6, train/loss_step=0.000842, global_step=463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  18%|█▊        | 14/80 [01:34<06:54,  6.28s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=3.7e-6, train/loss_step=0.000842, global_step=463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  18%|█▊        | 14/80 [01:34<06:54,  6.28s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=2.51e-6, train/loss_step=0.000564, global_step=463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  19%|█▉        | 15/80 [01:34<06:24,  5.92s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=2.51e-6, train/loss_step=0.000564, global_step=463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  19%|█▉        | 15/80 [01:34<06:24,  5.92s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=1.45e-6, train/loss_step=0.000356, global_step=463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  20%|██        | 16/80 [01:46<06:41,  6.27s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=1.45e-6, train/loss_step=0.000356, global_step=463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  20%|██        | 16/80 [01:46<06:41,  6.27s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.2e-5, train/loss_step=0.00291, global_step=463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]   Epoch 23:  21%|██▏       | 17/80 [01:58<06:55,  6.59s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.2e-5, train/loss_step=0.00291, global_step=463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  21%|██▏       | 17/80 [01:58<06:55,  6.59s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000184, train/loss_vlb_step=8.97e-7, train/loss_step=0.000184, global_step=464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  22%|██▎       | 18/80 [02:12<07:12,  6.98s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000184, train/loss_vlb_step=8.97e-7, train/loss_step=0.000184, global_step=464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  22%|██▎       | 18/80 [02:12<07:12,  6.98s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=2.42e-5, train/loss_step=0.00662, global_step=464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  24%|██▍       | 19/80 [02:13<06:45,  6.65s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=2.42e-5, train/loss_step=0.00662, global_step=464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  24%|██▍       | 19/80 [02:13<06:45,  6.65s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.47e-5, train/loss_step=0.0139, global_step=464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  25%|██▌       | 20/80 [02:13<06:21,  6.36s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.47e-5, train/loss_step=0.0139, global_step=464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  25%|██▌       | 20/80 [02:13<06:21,  6.36s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.34e-5, train/loss_step=0.00945, global_step=464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  26%|██▋       | 21/80 [02:14<05:59,  6.09s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.34e-5, train/loss_step=0.00945, global_step=464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  26%|██▋       | 21/80 [02:14<05:59,  6.09s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000824, train/loss_vlb_step=2.93e-6, train/loss_step=0.000824, global_step=465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  28%|██▊       | 22/80 [02:14<05:39,  5.85s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000824, train/loss_vlb_step=2.93e-6, train/loss_step=0.000824, global_step=465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  28%|██▊       | 22/80 [02:14<05:39,  5.85s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.54e-5, train/loss_step=0.00384, global_step=465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464] Epoch 23:  29%|██▉       | 23/80 [02:15<05:20,  5.63s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.54e-5, train/loss_step=0.00384, global_step=465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  29%|██▉       | 23/80 [02:15<05:20,  5.63s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=8.47e-6, train/loss_step=0.00124, global_step=465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  30%|███       | 24/80 [02:21<05:16,  5.66s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=8.47e-6, train/loss_step=0.00124, global_step=465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  30%|███       | 24/80 [02:21<05:16,  5.66s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=2.66e-6, train/loss_step=0.000574, global_step=465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  31%|███▏      | 25/80 [02:35<05:29,  5.99s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=2.66e-6, train/loss_step=0.000574, global_step=465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  31%|███▏      | 25/80 [02:35<05:29,  5.99s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=2.85e-5, train/loss_step=0.00125, global_step=466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]    Epoch 23:  32%|███▎      | 26/80 [02:52<05:44,  6.38s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=2.85e-5, train/loss_step=0.00125, global_step=466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  32%|███▎      | 26/80 [02:52<05:44,  6.38s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.3e-5, train/loss_step=0.00966, global_step=466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  34%|███▍      | 27/80 [02:52<05:26,  6.17s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.3e-5, train/loss_step=0.00966, global_step=466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  34%|███▍      | 27/80 [02:52<05:26,  6.17s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=0.000743, train/loss_step=0.0206, global_step=466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  35%|███▌      | 28/80 [02:53<05:10,  5.97s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=0.000743, train/loss_step=0.0206, global_step=466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  35%|███▌      | 28/80 [02:53<05:10,  5.97s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000973, train/loss_vlb_step=5.27e-6, train/loss_step=0.000973, global_step=466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  36%|███▋      | 29/80 [02:53<04:55,  5.79s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000973, train/loss_vlb_step=5.27e-6, train/loss_step=0.000973, global_step=466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  36%|███▋      | 29/80 [02:53<04:55,  5.79s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000885, train/loss_vlb_step=4.62e-6, train/loss_step=0.000885, global_step=467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  38%|███▊      | 30/80 [02:54<04:40,  5.62s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000885, train/loss_vlb_step=4.62e-6, train/loss_step=0.000885, global_step=467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  38%|███▊      | 30/80 [02:54<04:40,  5.62s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000983, train/loss_vlb_step=2.77e-5, train/loss_step=0.000983, global_step=467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  39%|███▉      | 31/80 [02:54<04:27,  5.46s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000983, train/loss_vlb_step=2.77e-5, train/loss_step=0.000983, global_step=467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  39%|███▉      | 31/80 [02:54<04:27,  5.46s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.15e-5, train/loss_step=0.00287, global_step=467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  40%|████      | 32/80 [03:04<04:28,  5.59s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.15e-5, train/loss_step=0.00287, global_step=467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  40%|████      | 32/80 [03:04<04:28,  5.59s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=4.26e-6, train/loss_step=0.000805, global_step=467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  41%|████▏     | 33/80 [03:16<04:30,  5.76s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=4.26e-6, train/loss_step=0.000805, global_step=467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  41%|████▏     | 33/80 [03:16<04:30,  5.76s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=8.61e-6, train/loss_step=0.00109, global_step=468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  42%|████▎     | 34/80 [03:34<04:42,  6.14s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=8.61e-6, train/loss_step=0.00109, global_step=468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  42%|████▎     | 34/80 [03:34<04:42,  6.14s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.35e-5, train/loss_step=0.00212, global_step=468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  44%|████▍     | 35/80 [03:35<04:29,  5.98s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.35e-5, train/loss_step=0.00212, global_step=468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  44%|████▍     | 35/80 [03:35<04:29,  5.98s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.7e-6, train/loss_step=0.000599, global_step=468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  45%|████▌     | 36/80 [03:35<04:16,  5.83s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.7e-6, train/loss_step=0.000599, global_step=468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  45%|████▌     | 36/80 [03:35<04:16,  5.83s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=7.69e-6, train/loss_step=0.00201, global_step=468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464] Epoch 23:  46%|████▋     | 37/80 [03:36<04:04,  5.70s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=7.69e-6, train/loss_step=0.00201, global_step=468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  46%|████▋     | 37/80 [03:36<04:04,  5.70s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=2.53e-5, train/loss_step=0.00718, global_step=469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  48%|████▊     | 38/80 [03:36<03:53,  5.56s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=2.53e-5, train/loss_step=0.00718, global_step=469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  48%|████▊     | 38/80 [03:36<03:53,  5.56s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000111, train/loss_step=0.0125, global_step=469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464] Epoch 23:  49%|████▉     | 39/80 [03:37<03:42,  5.44s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000111, train/loss_step=0.0125, global_step=469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  49%|████▉     | 39/80 [03:37<03:42,  5.44s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=2.54e-5, train/loss_step=0.000969, global_step=469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  50%|█████     | 40/80 [03:50<03:44,  5.62s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=2.54e-5, train/loss_step=0.000969, global_step=469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  50%|█████     | 40/80 [03:50<03:44,  5.62s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=0.000407, train/loss_step=0.00219, global_step=469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464] Epoch 23:  51%|█████▏    | 41/80 [03:55<03:39,  5.62s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=0.000407, train/loss_step=0.00219, global_step=469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  51%|█████▏    | 41/80 [03:55<03:39,  5.62s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=1.3e-5, train/loss_step=0.00387, global_step=470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  52%|█████▎    | 42/80 [04:10<03:41,  5.83s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00387, train/loss_vlb_step=1.3e-5, train/loss_step=0.00387, global_step=470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  52%|█████▎    | 42/80 [04:10<03:41,  5.83s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=7.35e-5, train/loss_step=0.0111, global_step=470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464] Epoch 23:  54%|█████▍    | 43/80 [04:14<03:33,  5.78s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=7.35e-5, train/loss_step=0.0111, global_step=470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  54%|█████▍    | 43/80 [04:14<03:33,  5.78s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=2.3e-5, train/loss_step=0.00231, global_step=470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  55%|█████▌    | 44/80 [04:14<03:23,  5.66s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=2.3e-5, train/loss_step=0.00231, global_step=470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  55%|█████▌    | 44/80 [04:14<03:23,  5.66s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000869, train/loss_vlb_step=3.03e-6, train/loss_step=0.000869, global_step=470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  56%|█████▋    | 45/80 [04:15<03:14,  5.55s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000869, train/loss_vlb_step=3.03e-6, train/loss_step=0.000869, global_step=470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  56%|█████▋    | 45/80 [04:15<03:14,  5.55s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.16e-6, train/loss_step=0.00033, global_step=471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]   Epoch 23:  57%|█████▊    | 46/80 [04:15<03:04,  5.44s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.16e-6, train/loss_step=0.00033, global_step=471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  57%|█████▊    | 46/80 [04:15<03:04,  5.44s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.9e-5, train/loss_step=0.0134, global_step=471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  59%|█████▉    | 47/80 [04:16<02:56,  5.34s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.9e-5, train/loss_step=0.0134, global_step=471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  59%|█████▉    | 47/80 [04:16<02:56,  5.34s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=0.000128, train/loss_step=0.00187, global_step=471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  60%|██████    | 48/80 [04:28<02:55,  5.47s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=0.000128, train/loss_step=0.00187, global_step=471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  60%|██████    | 48/80 [04:28<02:55,  5.47s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=3.87e-5, train/loss_step=0.0104, global_step=471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]   Epoch 23:  61%|██████▏   | 49/80 [04:35<02:50,  5.51s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=3.87e-5, train/loss_step=0.0104, global_step=471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  61%|██████▏   | 49/80 [04:35<02:50,  5.51s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.78e-5, train/loss_step=0.00664, global_step=472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  62%|██████▎   | 50/80 [05:01<02:57,  5.92s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=3.78e-5, train/loss_step=0.00664, global_step=472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  62%|██████▎   | 50/80 [05:01<02:57,  5.92s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=6.49e-6, train/loss_step=0.00134, global_step=472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  64%|██████▍   | 51/80 [05:02<02:48,  5.82s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=6.49e-6, train/loss_step=0.00134, global_step=472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  64%|██████▍   | 51/80 [05:02<02:48,  5.82s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=0.00015, train/loss_step=0.00336, global_step=472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  65%|██████▌   | 52/80 [05:03<02:40,  5.72s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=0.00015, train/loss_step=0.00336, global_step=472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  65%|██████▌   | 52/80 [05:03<02:40,  5.72s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000114, train/loss_step=0.0165, global_step=472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464] Epoch 23:  66%|██████▋   | 53/80 [05:03<02:31,  5.63s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000114, train/loss_step=0.0165, global_step=472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  66%|██████▋   | 53/80 [05:03<02:31,  5.63s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=4.15e-6, train/loss_step=0.000928, global_step=473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  68%|██████▊   | 54/80 [05:04<02:23,  5.54s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=4.15e-6, train/loss_step=0.000928, global_step=473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  68%|██████▊   | 54/80 [05:04<02:23,  5.54s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=0.00135, train/loss_step=0.00605, global_step=473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  69%|██████▉   | 55/80 [05:04<02:16,  5.45s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=0.00135, train/loss_step=0.00605, global_step=473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  69%|██████▉   | 55/80 [05:04<02:16,  5.45s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000633, train/loss_vlb_step=2.3e-6, train/loss_step=0.000633, global_step=473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  70%|███████   | 56/80 [05:23<02:16,  5.67s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000633, train/loss_vlb_step=2.3e-6, train/loss_step=0.000633, global_step=473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  70%|███████   | 56/80 [05:23<02:16,  5.67s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.00038, train/loss_step=0.0191, global_step=473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]   Epoch 23:  71%|███████▏  | 57/80 [05:23<02:08,  5.58s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.00038, train/loss_step=0.0191, global_step=473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  71%|███████▏  | 57/80 [05:23<02:08,  5.58s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=3.26e-6, train/loss_step=0.000524, global_step=474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  72%|███████▎  | 58/80 [05:36<02:05,  5.70s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=3.26e-6, train/loss_step=0.000524, global_step=474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  72%|███████▎  | 58/80 [05:36<02:05,  5.70s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=2.54e-5, train/loss_step=0.0016, global_step=474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]     Epoch 23:  74%|███████▍  | 59/80 [05:39<01:58,  5.66s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=2.54e-5, train/loss_step=0.0016, global_step=474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  74%|███████▍  | 59/80 [05:39<01:58,  5.66s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=2.11e-5, train/loss_step=0.00251, global_step=474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  75%|███████▌  | 60/80 [05:40<01:51,  5.58s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=2.11e-5, train/loss_step=0.00251, global_step=474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  75%|███████▌  | 60/80 [05:40<01:51,  5.58s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00084, train/loss_vlb_step=8.34e-6, train/loss_step=0.00084, global_step=474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  76%|███████▋  | 61/80 [05:40<01:44,  5.50s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00084, train/loss_vlb_step=8.34e-6, train/loss_step=0.00084, global_step=474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  76%|███████▋  | 61/80 [05:40<01:44,  5.50s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=6.37e-5, train/loss_step=0.0166, global_step=475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  78%|███████▊  | 62/80 [05:48<01:39,  5.53s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=6.37e-5, train/loss_step=0.0166, global_step=475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  78%|███████▊  | 62/80 [05:48<01:39,  5.53s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=7.39e-6, train/loss_step=0.00118, global_step=475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  79%|███████▉  | 63/80 [05:48<01:32,  5.45s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=7.39e-6, train/loss_step=0.00118, global_step=475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  79%|███████▉  | 63/80 [05:48<01:32,  5.45s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=4.97e-6, train/loss_step=0.000451, global_step=475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  80%|████████  | 64/80 [06:10<01:31,  5.71s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=4.97e-6, train/loss_step=0.000451, global_step=475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  80%|████████  | 64/80 [06:10<01:31,  5.71s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.00027, train/loss_step=0.0144, global_step=475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]    Epoch 23:  81%|████████▏ | 65/80 [06:11<01:24,  5.63s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.00027, train/loss_step=0.0144, global_step=475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  81%|████████▏ | 65/80 [06:11<01:24,  5.63s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=2.38e-6, train/loss_step=0.000673, global_step=476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  82%|████████▎ | 66/80 [06:26<01:20,  5.76s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=2.38e-6, train/loss_step=0.000673, global_step=476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  82%|████████▎ | 66/80 [06:26<01:20,  5.76s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.28e-5, train/loss_step=0.00211, global_step=476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  84%|████████▍ | 67/80 [06:29<01:14,  5.73s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.28e-5, train/loss_step=0.00211, global_step=476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  84%|████████▍ | 67/80 [06:29<01:14,  5.73s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=2.64e-6, train/loss_step=0.000658, global_step=476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  85%|████████▌ | 68/80 [06:30<01:07,  5.65s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=2.64e-6, train/loss_step=0.000658, global_step=476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  85%|████████▌ | 68/80 [06:30<01:07,  5.65s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.77e-7, train/loss_step=0.000167, global_step=476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  86%|████████▋ | 69/80 [06:30<01:01,  5.58s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.77e-7, train/loss_step=0.000167, global_step=476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  86%|████████▋ | 69/80 [06:30<01:01,  5.58s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000113, train/loss_step=0.0121, global_step=477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]   Epoch 23:  88%|████████▊ | 70/80 [06:31<00:55,  5.51s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000113, train/loss_step=0.0121, global_step=477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  88%|████████▊ | 70/80 [06:31<00:55,  5.51s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=6.42e-6, train/loss_step=0.00162, global_step=477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  89%|████████▉ | 71/80 [06:31<00:48,  5.44s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=6.42e-6, train/loss_step=0.00162, global_step=477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  89%|████████▉ | 71/80 [06:31<00:48,  5.44s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000608, train/loss_vlb_step=3.93e-6, train/loss_step=0.000608, global_step=477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  90%|█████████ | 72/80 [06:47<00:44,  5.59s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000608, train/loss_vlb_step=3.93e-6, train/loss_step=0.000608, global_step=477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  90%|█████████ | 72/80 [06:47<00:44,  5.59s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.51e-5, train/loss_step=0.00193, global_step=477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  91%|█████████▏| 73/80 [06:48<00:38,  5.52s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.51e-5, train/loss_step=0.00193, global_step=477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  91%|█████████▏| 73/80 [06:48<00:38,  5.52s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=2.37e-5, train/loss_step=0.00659, global_step=478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=2.37e-5, train/loss_step=0.00659, global_step=478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=0.000473, train/loss_step=0.00941, global_step=478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=0.000473, train/loss_step=0.00941, global_step=478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=5.99e-6, train/loss_step=0.0011, global_step=478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]   Epoch 23:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=5.99e-6, train/loss_step=0.0011, global_step=478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.44e-5, train/loss_step=0.00394, global_step=478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.44e-5, train/loss_step=0.00394, global_step=478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000906, train/loss_vlb_step=4.32e-6, train/loss_step=0.000906, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  98%|█████████▊| 78/80 [07:10<00:10,  5.44s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000906, train/loss_vlb_step=4.32e-6, train/loss_step=0.000906, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  98%|█████████▊| 78/80 [07:10<00:10,  5.44s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=3.51e-5, train/loss_step=0.00325, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=3.51e-5, train/loss_step=0.00325, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.05e-5, train/loss_step=0.0055, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 23: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.05e-5, train/loss_step=0.0055, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 23: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=3.37e-5, train/loss_step=0.00952, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Average Epoch time: 431.02 seconds
+Average Peak memory 29567.10MiB
+Epoch 23:   0%|          | 0/80 [00:00<00:00, 6423.13it/s, loss=0.00464, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=3.37e-5, train/loss_step=0.00952, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 24:   0%|          | 0/80 [00:00<00:00, 2335.36it/s, loss=0.00464, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=3.37e-5, train/loss_step=0.00952, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]Epoch 24:   1%|▏         | 1/80 [00:36<24:13, 18.40s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00952, train/loss_vlb_step=3.37e-5, train/loss_step=0.00952, global_step=479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00464, train/loss_vlb_epoch=0.000215, train/loss_epoch=0.00464]  Epoch 24:   1%|▏         | 1/80 [00:36<24:13, 18.40s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00077, train/loss_vlb_step=5.66e-6, train/loss_step=0.00077, global_step=480.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:   2%|▎         | 2/80 [00:43<18:46, 14.44s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00077, train/loss_vlb_step=5.66e-6, train/loss_step=0.00077, global_step=480.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:   2%|▎         | 2/80 [00:43<18:46, 14.44s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.65e-5, train/loss_step=0.00458, global_step=480.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:   4%|▍         | 3/80 [00:43<14:03, 10.95s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.65e-5, train/loss_step=0.00458, global_step=480.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:   4%|▍         | 3/80 [00:43<14:03, 10.95s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.31e-5, train/loss_step=0.00347, global_step=480.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:   5%|▌         | 4/80 [00:50<12:40, 10.01s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.31e-5, train/loss_step=0.00347, global_step=480.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:   5%|▌         | 4/80 [00:50<12:40, 10.01s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=9.43e-5, train/loss_step=0.00117, global_step=480.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045] Epoch 24:   6%|▋         | 5/80 [00:50<10:31,  8.42s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=9.43e-5, train/loss_step=0.00117, global_step=480.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:   6%|▋         | 5/80 [00:50<10:31,  8.42s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=1.16e-5, train/loss_step=0.000852, global_step=481.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:   8%|▊         | 6/80 [00:51<08:59,  7.29s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=1.16e-5, train/loss_step=0.000852, global_step=481.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:   8%|▊         | 6/80 [00:51<08:59,  7.29s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.32e-5, train/loss_step=0.00519, global_step=481.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:   9%|▉         | 7/80 [00:51<07:50,  6.44s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.32e-5, train/loss_step=0.00519, global_step=481.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:   9%|▉         | 7/80 [00:51<07:50,  6.44s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.94e-6, train/loss_step=0.00211, global_step=481.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  10%|█         | 8/80 [01:21<10:50,  9.04s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.94e-6, train/loss_step=0.00211, global_step=481.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  10%|█         | 8/80 [01:21<10:50,  9.04s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.31e-5, train/loss_step=0.00808, global_step=481.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  11%|█▏        | 9/80 [01:23<09:49,  8.31s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.31e-5, train/loss_step=0.00808, global_step=481.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  11%|█▏        | 9/80 [01:23<09:49,  8.31s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=1.83e-5, train/loss_step=0.00492, global_step=482.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  12%|█▎        | 10/80 [01:27<09:17,  7.96s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=1.83e-5, train/loss_step=0.00492, global_step=482.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  12%|█▎        | 10/80 [01:27<09:17,  7.96s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=1.49e-5, train/loss_step=0.00434, global_step=482.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  14%|█▍        | 11/80 [01:28<08:26,  7.34s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=1.49e-5, train/loss_step=0.00434, global_step=482.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  14%|█▍        | 11/80 [01:28<08:26,  7.34s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=1.91e-5, train/loss_step=0.00553, global_step=482.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  15%|█▌        | 12/80 [01:42<08:53,  7.85s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=1.91e-5, train/loss_step=0.00553, global_step=482.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  15%|█▌        | 12/80 [01:42<08:53,  7.85s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.000758, train/loss_vlb_step=3.44e-6, train/loss_step=0.000758, global_step=482.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  16%|█▋        | 13/80 [01:42<08:10,  7.32s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.000758, train/loss_vlb_step=3.44e-6, train/loss_step=0.000758, global_step=482.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  16%|█▋        | 13/80 [01:42<08:10,  7.32s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.72e-5, train/loss_step=0.00394, global_step=483.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045] Epoch 24:  18%|█▊        | 14/80 [01:43<07:33,  6.87s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=2.72e-5, train/loss_step=0.00394, global_step=483.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  18%|█▊        | 14/80 [01:43<07:33,  6.87s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000924, train/loss_vlb_step=1.69e-5, train/loss_step=0.000924, global_step=483.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  19%|█▉        | 15/80 [01:43<07:00,  6.47s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000924, train/loss_vlb_step=1.69e-5, train/loss_step=0.000924, global_step=483.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  19%|█▉        | 15/80 [01:43<07:00,  6.47s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=5.23e-5, train/loss_step=0.00896, global_step=483.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  20%|██        | 16/80 [02:07<07:59,  7.50s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=5.23e-5, train/loss_step=0.00896, global_step=483.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  20%|██        | 16/80 [02:07<07:59,  7.50s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.000599, train/loss_step=0.022, global_step=483.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]   Epoch 24:  21%|██▏       | 17/80 [02:07<07:27,  7.11s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.000599, train/loss_step=0.022, global_step=483.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  21%|██▏       | 17/80 [02:07<07:27,  7.11s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.23e-6, train/loss_step=0.00133, global_step=484.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  22%|██▎       | 18/80 [02:08<06:59,  6.76s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.23e-6, train/loss_step=0.00133, global_step=484.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  22%|██▎       | 18/80 [02:08<06:59,  6.76s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.67e-6, train/loss_step=0.00153, global_step=484.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  24%|██▍       | 19/80 [02:08<06:33,  6.45s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.67e-6, train/loss_step=0.00153, global_step=484.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  24%|██▍       | 19/80 [02:08<06:33,  6.45s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=0.000832, train/loss_step=0.00199, global_step=484.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  25%|██▌       | 20/80 [02:21<06:45,  6.76s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=0.000832, train/loss_step=0.00199, global_step=484.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  25%|██▌       | 20/80 [02:21<06:45,  6.76s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=4.19e-5, train/loss_step=0.00697, global_step=484.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  26%|██▋       | 21/80 [02:22<06:21,  6.47s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=4.19e-5, train/loss_step=0.00697, global_step=484.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  26%|██▋       | 21/80 [02:22<06:21,  6.47s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.04e-5, train/loss_step=0.00586, global_step=485.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  28%|██▊       | 22/80 [02:22<06:00,  6.21s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.04e-5, train/loss_step=0.00586, global_step=485.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  28%|██▊       | 22/80 [02:22<06:00,  6.21s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=2.63e-6, train/loss_step=0.00051, global_step=485.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  29%|██▉       | 23/80 [02:23<05:40,  5.97s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=2.63e-6, train/loss_step=0.00051, global_step=485.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  29%|██▉       | 23/80 [02:23<05:40,  5.97s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000974, train/loss_vlb_step=7.03e-6, train/loss_step=0.000974, global_step=485.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  30%|███       | 24/80 [02:50<06:21,  6.80s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000974, train/loss_vlb_step=7.03e-6, train/loss_step=0.000974, global_step=485.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  30%|███       | 24/80 [02:50<06:21,  6.80s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.25e-6, train/loss_step=0.000557, global_step=485.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  31%|███▏      | 25/80 [02:50<06:00,  6.56s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.25e-6, train/loss_step=0.000557, global_step=485.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  31%|███▏      | 25/80 [02:50<06:00,  6.56s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.29e-5, train/loss_step=0.00351, global_step=486.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]   Epoch 24:  32%|███▎      | 26/80 [02:51<05:42,  6.34s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.29e-5, train/loss_step=0.00351, global_step=486.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  32%|███▎      | 26/80 [02:51<05:42,  6.34s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000843, train/loss_vlb_step=4.68e-6, train/loss_step=0.000843, global_step=486.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  34%|███▍      | 27/80 [02:51<05:24,  6.13s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000843, train/loss_vlb_step=4.68e-6, train/loss_step=0.000843, global_step=486.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  34%|███▍      | 27/80 [02:51<05:24,  6.13s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000265, train/loss_vlb_step=1.19e-6, train/loss_step=0.000265, global_step=486.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  35%|███▌      | 28/80 [02:57<05:19,  6.14s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000265, train/loss_vlb_step=1.19e-6, train/loss_step=0.000265, global_step=486.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  35%|███▌      | 28/80 [02:57<05:19,  6.14s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=3.92e-6, train/loss_step=0.000934, global_step=486.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  36%|███▋      | 29/80 [02:58<05:03,  5.95s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=3.92e-6, train/loss_step=0.000934, global_step=486.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  36%|███▋      | 29/80 [02:58<05:03,  5.95s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=2.92e-5, train/loss_step=0.00834, global_step=487.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  38%|███▊      | 30/80 [02:59<04:48,  5.78s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=2.92e-5, train/loss_step=0.00834, global_step=487.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  38%|███▊      | 30/80 [02:59<04:48,  5.78s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=1.61e-5, train/loss_step=0.00153, global_step=487.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  39%|███▉      | 31/80 [02:59<04:34,  5.61s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=1.61e-5, train/loss_step=0.00153, global_step=487.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  39%|███▉      | 31/80 [02:59<04:34,  5.61s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.07e-5, train/loss_step=0.00804, global_step=487.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  40%|████      | 32/80 [03:30<05:06,  6.39s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=3.07e-5, train/loss_step=0.00804, global_step=487.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  40%|████      | 32/80 [03:30<05:06,  6.39s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=2.86e-6, train/loss_step=0.00061, global_step=487.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  41%|████▏     | 33/80 [03:31<04:52,  6.22s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=2.86e-6, train/loss_step=0.00061, global_step=487.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  41%|████▏     | 33/80 [03:31<04:52,  6.22s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=1.14e-6, train/loss_step=0.000232, global_step=488.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  42%|████▎     | 34/80 [03:31<04:38,  6.06s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=1.14e-6, train/loss_step=0.000232, global_step=488.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  42%|████▎     | 34/80 [03:31<04:38,  6.06s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=8.73e-5, train/loss_step=0.0149, global_step=488.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]    Epoch 24:  44%|████▍     | 35/80 [03:32<04:25,  5.90s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=8.73e-5, train/loss_step=0.0149, global_step=488.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  44%|████▍     | 35/80 [03:32<04:25,  5.90s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.49e-5, train/loss_step=0.00419, global_step=488.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  45%|████▌     | 36/80 [03:32<04:13,  5.76s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.49e-5, train/loss_step=0.00419, global_step=488.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  45%|████▌     | 36/80 [03:32<04:13,  5.76s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=5.14e-5, train/loss_step=0.00734, global_step=488.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  46%|████▋     | 37/80 [03:33<04:01,  5.62s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=5.14e-5, train/loss_step=0.00734, global_step=488.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  46%|████▋     | 37/80 [03:33<04:01,  5.62s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000139, train/loss_step=0.0158, global_step=489.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045] Epoch 24:  48%|████▊     | 38/80 [03:34<03:50,  5.49s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000139, train/loss_step=0.0158, global_step=489.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  48%|████▊     | 38/80 [03:34<03:50,  5.49s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=3.14e-6, train/loss_step=0.000658, global_step=489.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  49%|████▉     | 39/80 [03:40<03:46,  5.52s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=3.14e-6, train/loss_step=0.000658, global_step=489.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  49%|████▉     | 39/80 [03:40<03:46,  5.52s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000211, train/loss_vlb_step=9.02e-7, train/loss_step=0.000211, global_step=489.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  50%|█████     | 40/80 [04:05<03:59,  5.98s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000211, train/loss_vlb_step=9.02e-7, train/loss_step=0.000211, global_step=489.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  50%|█████     | 40/80 [04:05<03:59,  5.98s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.02e-5, train/loss_step=0.00913, global_step=489.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  51%|█████▏    | 41/80 [04:16<03:58,  6.12s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.02e-5, train/loss_step=0.00913, global_step=489.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  51%|█████▏    | 41/80 [04:16<03:58,  6.12s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=6.93e-6, train/loss_step=0.00122, global_step=490.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  52%|█████▎    | 42/80 [04:17<03:47,  5.99s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=6.93e-6, train/loss_step=0.00122, global_step=490.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  52%|█████▎    | 42/80 [04:17<03:47,  5.99s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=2.39e-5, train/loss_step=0.00662, global_step=490.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045] Epoch 24:  54%|█████▍    | 43/80 [04:17<03:36,  5.86s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00662, train/loss_vlb_step=2.39e-5, train/loss_step=0.00662, global_step=490.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  54%|█████▍    | 43/80 [04:17<03:36,  5.86s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000789, train/loss_vlb_step=3.45e-6, train/loss_step=0.000789, global_step=490.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  55%|█████▌    | 44/80 [04:18<03:26,  5.74s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000789, train/loss_vlb_step=3.45e-6, train/loss_step=0.000789, global_step=490.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  55%|█████▌    | 44/80 [04:18<03:26,  5.74s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=8.31e-6, train/loss_step=0.00104, global_step=490.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  56%|█████▋    | 45/80 [04:18<03:17,  5.63s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=8.31e-6, train/loss_step=0.00104, global_step=490.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  56%|█████▋    | 45/80 [04:18<03:17,  5.63s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.15e-5, train/loss_step=0.00311, global_step=491.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  57%|█████▊    | 46/80 [04:19<03:07,  5.52s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.15e-5, train/loss_step=0.00311, global_step=491.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  57%|█████▊    | 46/80 [04:19<03:07,  5.52s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.6e-6, train/loss_step=0.000377, global_step=491.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  59%|█████▉    | 47/80 [04:28<03:04,  5.60s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.6e-6, train/loss_step=0.000377, global_step=491.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  59%|█████▉    | 47/80 [04:28<03:04,  5.60s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=3.78e-5, train/loss_step=0.00208, global_step=491.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045] Epoch 24:  60%|██████    | 48/80 [04:51<03:10,  5.96s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=3.78e-5, train/loss_step=0.00208, global_step=491.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  60%|██████    | 48/80 [04:51<03:10,  5.96s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000622, train/loss_vlb_step=2.21e-6, train/loss_step=0.000622, global_step=491.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  61%|██████▏   | 49/80 [04:52<03:01,  5.85s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000622, train/loss_vlb_step=2.21e-6, train/loss_step=0.000622, global_step=491.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  61%|██████▏   | 49/80 [04:52<03:01,  5.85s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=5.63e-6, train/loss_step=0.00143, global_step=492.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]    Epoch 24:  62%|██████▎   | 50/80 [04:52<02:52,  5.74s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=5.63e-6, train/loss_step=0.00143, global_step=492.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  62%|██████▎   | 50/80 [04:52<02:52,  5.74s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=3.07e-6, train/loss_step=0.000525, global_step=492.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  64%|██████▍   | 51/80 [04:53<02:43,  5.64s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=3.07e-6, train/loss_step=0.000525, global_step=492.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  64%|██████▍   | 51/80 [04:53<02:43,  5.64s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=6.9e-6, train/loss_step=0.00129, global_step=492.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]   Epoch 24:  65%|██████▌   | 52/80 [04:54<02:35,  5.55s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=6.9e-6, train/loss_step=0.00129, global_step=492.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  65%|██████▌   | 52/80 [04:54<02:35,  5.55s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.83e-5, train/loss_step=0.00585, global_step=492.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  66%|██████▋   | 53/80 [04:54<02:27,  5.46s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=2.83e-5, train/loss_step=0.00585, global_step=492.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  66%|██████▋   | 53/80 [04:54<02:27,  5.46s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.15e-5, train/loss_step=0.00219, global_step=493.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  68%|██████▊   | 54/80 [04:55<02:19,  5.37s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=1.15e-5, train/loss_step=0.00219, global_step=493.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  68%|██████▊   | 54/80 [04:55<02:19,  5.37s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00345, train/loss_step=0.0425, global_step=493.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  69%|██████▉   | 55/80 [05:08<02:17,  5.52s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.0425, train/loss_vlb_step=0.00345, train/loss_step=0.0425, global_step=493.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  69%|██████▉   | 55/80 [05:08<02:17,  5.52s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000212, train/loss_vlb_step=9.74e-7, train/loss_step=0.000212, global_step=493.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  70%|███████   | 56/80 [05:37<02:22,  5.92s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000212, train/loss_vlb_step=9.74e-7, train/loss_step=0.000212, global_step=493.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  70%|███████   | 56/80 [05:37<02:22,  5.92s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=2.9e-6, train/loss_step=0.000697, global_step=493.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045] Epoch 24:  71%|███████▏  | 57/80 [05:37<02:13,  5.82s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=2.9e-6, train/loss_step=0.000697, global_step=493.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  71%|███████▏  | 57/80 [05:37<02:13,  5.82s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=2.14e-6, train/loss_step=0.000476, global_step=494.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  72%|███████▎  | 58/80 [05:38<02:06,  5.73s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=2.14e-6, train/loss_step=0.000476, global_step=494.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  72%|███████▎  | 58/80 [05:38<02:06,  5.73s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.000286, train/loss_step=0.0203, global_step=494.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]   Epoch 24:  74%|███████▍  | 59/80 [05:38<01:58,  5.65s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.000286, train/loss_step=0.0203, global_step=494.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  74%|███████▍  | 59/80 [05:38<01:58,  5.65s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=4.13e-6, train/loss_step=0.000718, global_step=494.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  75%|███████▌  | 60/80 [05:39<01:51,  5.57s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=4.13e-6, train/loss_step=0.000718, global_step=494.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  75%|███████▌  | 60/80 [05:39<01:51,  5.57s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.54e-6, train/loss_step=0.00144, global_step=494.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  76%|███████▋  | 61/80 [05:40<01:44,  5.48s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.54e-6, train/loss_step=0.00144, global_step=494.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  76%|███████▋  | 61/80 [05:40<01:44,  5.48s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.1e-6, train/loss_step=0.000267, global_step=495.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  78%|███████▊  | 62/80 [05:40<01:37,  5.41s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.1e-6, train/loss_step=0.000267, global_step=495.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  78%|███████▊  | 62/80 [05:40<01:37,  5.41s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=3.09e-6, train/loss_step=0.000459, global_step=495.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  79%|███████▉  | 63/80 [05:51<01:33,  5.49s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=3.09e-6, train/loss_step=0.000459, global_step=495.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  79%|███████▉  | 63/80 [05:51<01:33,  5.49s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=2.05e-5, train/loss_step=0.00537, global_step=495.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  80%|████████  | 64/80 [06:26<01:35,  5.94s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=2.05e-5, train/loss_step=0.00537, global_step=495.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  80%|████████  | 64/80 [06:26<01:35,  5.94s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=9.51e-6, train/loss_step=0.00207, global_step=495.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045] Epoch 24:  81%|████████▏ | 65/80 [06:26<01:27,  5.86s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=9.51e-6, train/loss_step=0.00207, global_step=495.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  81%|████████▏ | 65/80 [06:26<01:27,  5.86s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.2e-5, train/loss_step=0.00332, global_step=496.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  82%|████████▎ | 66/80 [06:27<01:20,  5.78s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.2e-5, train/loss_step=0.00332, global_step=496.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  82%|████████▎ | 66/80 [06:27<01:20,  5.78s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=7e-6, train/loss_step=0.00125, global_step=496.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  84%|████████▍ | 67/80 [06:27<01:14,  5.70s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=7e-6, train/loss_step=0.00125, global_step=496.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  84%|████████▍ | 67/80 [06:27<01:14,  5.70s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000809, train/loss_vlb_step=3.93e-6, train/loss_step=0.000809, global_step=496.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000809, train/loss_vlb_step=3.93e-6, train/loss_step=0.000809, global_step=496.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=0.000196, train/loss_step=0.0168, global_step=496.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]    Epoch 24:  86%|████████▋ | 69/80 [06:29<01:01,  5.56s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=0.000196, train/loss_step=0.0168, global_step=496.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  86%|████████▋ | 69/80 [06:29<01:01,  5.56s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.000609, train/loss_vlb_step=3.3e-6, train/loss_step=0.000609, global_step=497.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  88%|████████▊ | 70/80 [06:29<00:54,  5.49s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.000609, train/loss_vlb_step=3.3e-6, train/loss_step=0.000609, global_step=497.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  88%|████████▊ | 70/80 [06:29<00:54,  5.49s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=7.08e-5, train/loss_step=0.00939, global_step=497.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=7.08e-5, train/loss_step=0.00939, global_step=497.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=8.63e-6, train/loss_step=0.00193, global_step=497.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  90%|█████████ | 72/80 [07:06<00:46,  5.85s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=8.63e-6, train/loss_step=0.00193, global_step=497.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  90%|█████████ | 72/80 [07:06<00:46,  5.85s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000958, train/loss_vlb_step=3.99e-6, train/loss_step=0.000958, global_step=497.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  91%|█████████▏| 73/80 [07:07<00:40,  5.78s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000958, train/loss_vlb_step=3.99e-6, train/loss_step=0.000958, global_step=497.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  91%|█████████▏| 73/80 [07:07<00:40,  5.78s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=5.64e-6, train/loss_step=0.00139, global_step=498.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  92%|█████████▎| 74/80 [07:07<00:34,  5.70s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=5.64e-6, train/loss_step=0.00139, global_step=498.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  92%|█████████▎| 74/80 [07:07<00:34,  5.70s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=2.38e-5, train/loss_step=0.00153, global_step=498.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045] Epoch 24:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=2.38e-5, train/loss_step=0.00153, global_step=498.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000898, train/loss_vlb_step=3.91e-6, train/loss_step=0.000898, global_step=498.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000898, train/loss_vlb_step=3.91e-6, train/loss_step=0.000898, global_step=498.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.42e-5, train/loss_step=0.00498, global_step=498.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 24:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.42e-5, train/loss_step=0.00498, global_step=498.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=3.49e-6, train/loss_step=0.000701, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=3.49e-6, train/loss_step=0.000701, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=0.000454, train/loss_step=0.0101, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]   Epoch 24:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=0.000454, train/loss_step=0.0101, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=1.79e-5, train/loss_step=0.000956, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=1.79e-5, train/loss_step=0.000956, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 24: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=0.000109, train/loss_step=0.0235, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]   Average Epoch time: 430.92 seconds
+Average Peak memory 29561.30MiB
+Epoch 24:   0%|          | 0/80 [00:00<00:00, 4760.84it/s, loss=0.00437, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=0.000109, train/loss_step=0.0235, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 25:   0%|          | 0/80 [00:00<00:00, 2023.30it/s, loss=0.00437, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=0.000109, train/loss_step=0.0235, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]Epoch 25:   1%|▏         | 1/80 [00:38<25:06, 19.07s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0235, train/loss_vlb_step=0.000109, train/loss_step=0.0235, global_step=499.0, lr_abs=0.0001, train/loss_simple_epoch=0.0045, train/loss_vlb_epoch=0.000153, train/loss_epoch=0.0045]  Epoch 25:   1%|▏         | 1/80 [00:38<25:06, 19.07s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=9.17e-5, train/loss_step=0.00678, global_step=500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   2%|▎         | 2/80 [00:39<17:14, 13.27s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=9.17e-5, train/loss_step=0.00678, global_step=500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   2%|▎         | 2/80 [00:39<17:14, 13.27s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.19e-6, train/loss_step=0.000552, global_step=500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   4%|▍         | 3/80 [00:40<12:55, 10.07s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.19e-6, train/loss_step=0.000552, global_step=500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   4%|▍         | 3/80 [00:40<12:55, 10.07s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.1e-5, train/loss_step=0.00249, global_step=500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:   5%|▌         | 4/80 [00:46<11:45,  9.28s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.1e-5, train/loss_step=0.00249, global_step=500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   5%|▌         | 4/80 [00:46<11:45,  9.28s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000408, train/loss_vlb_step=1.47e-6, train/loss_step=0.000408, global_step=500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   6%|▋         | 5/80 [00:46<09:46,  7.82s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000408, train/loss_vlb_step=1.47e-6, train/loss_step=0.000408, global_step=500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   6%|▋         | 5/80 [00:46<09:46,  7.82s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=8.25e-5, train/loss_step=0.0113, global_step=501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]    Epoch 25:   8%|▊         | 6/80 [00:47<08:21,  6.78s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=8.25e-5, train/loss_step=0.0113, global_step=501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   8%|▊         | 6/80 [00:47<08:21,  6.78s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.14e-5, train/loss_step=0.00271, global_step=501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   9%|▉         | 7/80 [00:47<07:17,  5.99s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.14e-5, train/loss_step=0.00271, global_step=501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:   9%|▉         | 7/80 [00:47<07:17,  5.99s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.5e-5, train/loss_step=0.0087, global_step=501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]   Epoch 25:  10%|█         | 8/80 [01:11<09:34,  7.98s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=4.5e-5, train/loss_step=0.0087, global_step=501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  10%|█         | 8/80 [01:11<09:34,  7.98s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=1.09e-5, train/loss_step=0.00113, global_step=501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  11%|█▏        | 9/80 [01:16<09:06,  7.69s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=1.09e-5, train/loss_step=0.00113, global_step=501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  11%|█▏        | 9/80 [01:16<09:06,  7.69s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=6.52e-6, train/loss_step=0.00147, global_step=502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434] Epoch 25:  12%|█▎        | 10/80 [01:23<08:51,  7.60s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=6.52e-6, train/loss_step=0.00147, global_step=502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  12%|█▎        | 10/80 [01:23<08:51,  7.60s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=2.53e-5, train/loss_step=0.0071, global_step=502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434] Epoch 25:  14%|█▍        | 11/80 [01:28<08:27,  7.36s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=2.53e-5, train/loss_step=0.0071, global_step=502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  14%|█▍        | 11/80 [01:28<08:27,  7.36s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000753, train/loss_vlb_step=5.22e-6, train/loss_step=0.000753, global_step=502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  15%|█▌        | 12/80 [01:28<07:44,  6.83s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000753, train/loss_vlb_step=5.22e-6, train/loss_step=0.000753, global_step=502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  15%|█▌        | 12/80 [01:28<07:44,  6.83s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000854, train/loss_vlb_step=4.45e-6, train/loss_step=0.000854, global_step=502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  16%|█▋        | 13/80 [01:29<07:07,  6.38s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000854, train/loss_vlb_step=4.45e-6, train/loss_step=0.000854, global_step=502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  16%|█▋        | 13/80 [01:29<07:07,  6.38s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.19e-5, train/loss_step=0.00331, global_step=503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  18%|█▊        | 14/80 [01:29<06:35,  5.99s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.19e-5, train/loss_step=0.00331, global_step=503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  18%|█▊        | 14/80 [01:29<06:35,  5.99s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=0.000602, train/loss_step=0.0033, global_step=503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  19%|█▉        | 15/80 [01:30<06:06,  5.65s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=0.000602, train/loss_step=0.0033, global_step=503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  19%|█▉        | 15/80 [01:30<06:06,  5.65s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000982, train/loss_vlb_step=1.58e-5, train/loss_step=0.000982, global_step=503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  20%|██        | 16/80 [01:47<06:46,  6.35s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000982, train/loss_vlb_step=1.58e-5, train/loss_step=0.000982, global_step=503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  20%|██        | 16/80 [01:47<06:46,  6.35s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=6.4e-5, train/loss_step=0.00908, global_step=503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]   Epoch 25:  21%|██▏       | 17/80 [01:54<06:41,  6.37s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=6.4e-5, train/loss_step=0.00908, global_step=503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  21%|██▏       | 17/80 [01:54<06:41,  6.37s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=2e-6, train/loss_step=0.000428, global_step=504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434] Epoch 25:  22%|██▎       | 18/80 [02:14<07:19,  7.08s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=2e-6, train/loss_step=0.000428, global_step=504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  22%|██▎       | 18/80 [02:14<07:19,  7.08s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.01e-5, train/loss_step=0.00514, global_step=504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  24%|██▍       | 19/80 [02:15<06:51,  6.75s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.01e-5, train/loss_step=0.00514, global_step=504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  24%|██▍       | 19/80 [02:15<06:51,  6.75s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000966, train/loss_vlb_step=6.64e-6, train/loss_step=0.000966, global_step=504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  25%|██▌       | 20/80 [02:15<06:27,  6.46s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000966, train/loss_vlb_step=6.64e-6, train/loss_step=0.000966, global_step=504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  25%|██▌       | 20/80 [02:15<06:27,  6.46s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=8.39e-6, train/loss_step=0.00153, global_step=504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  26%|██▋       | 21/80 [02:16<06:04,  6.19s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=8.39e-6, train/loss_step=0.00153, global_step=504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  26%|██▋       | 21/80 [02:16<06:04,  6.19s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=2.48e-5, train/loss_step=0.0073, global_step=505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  28%|██▊       | 22/80 [02:16<05:44,  5.94s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=2.48e-5, train/loss_step=0.0073, global_step=505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  28%|██▊       | 22/80 [02:16<05:44,  5.94s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000121, train/loss_step=0.0165, global_step=505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  29%|██▉       | 23/80 [02:17<05:25,  5.71s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000121, train/loss_step=0.0165, global_step=505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  29%|██▉       | 23/80 [02:17<05:25,  5.71s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.28e-5, train/loss_step=0.00676, global_step=505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  30%|███       | 24/80 [02:32<05:42,  6.11s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.28e-5, train/loss_step=0.00676, global_step=505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  30%|███       | 24/80 [02:32<05:42,  6.11s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=0.000306, train/loss_step=0.021, global_step=505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]   Epoch 25:  31%|███▏      | 25/80 [02:41<05:40,  6.19s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=0.000306, train/loss_step=0.021, global_step=505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  31%|███▏      | 25/80 [02:41<05:40,  6.19s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=5.76e-6, train/loss_step=0.0013, global_step=506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  32%|███▎      | 26/80 [03:01<06:03,  6.73s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=5.76e-6, train/loss_step=0.0013, global_step=506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  32%|███▎      | 26/80 [03:01<06:03,  6.73s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=3.07e-5, train/loss_step=0.00129, global_step=506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  34%|███▍      | 27/80 [03:02<05:44,  6.51s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=3.07e-5, train/loss_step=0.00129, global_step=506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  34%|███▍      | 27/80 [03:02<05:44,  6.51s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=1.66e-5, train/loss_step=0.000718, global_step=506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=1.66e-5, train/loss_step=0.000718, global_step=506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=1.94e-5, train/loss_step=0.005, global_step=506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]      Epoch 25:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=1.94e-5, train/loss_step=0.005, global_step=506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=9.26e-5, train/loss_step=0.0129, global_step=507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=9.26e-5, train/loss_step=0.0129, global_step=507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.64e-5, train/loss_step=0.00268, global_step=507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.64e-5, train/loss_step=0.00268, global_step=507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000981, train/loss_vlb_step=4.42e-6, train/loss_step=0.000981, global_step=507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  40%|████      | 32/80 [03:08<04:34,  5.71s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000981, train/loss_vlb_step=4.42e-6, train/loss_step=0.000981, global_step=507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  40%|████      | 32/80 [03:08<04:34,  5.71s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=1.64e-5, train/loss_step=0.00101, global_step=507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434] Epoch 25:  41%|████▏     | 33/80 [03:20<04:37,  5.90s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=1.64e-5, train/loss_step=0.00101, global_step=507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  41%|████▏     | 33/80 [03:20<04:37,  5.90s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000683, train/loss_vlb_step=6.05e-6, train/loss_step=0.000683, global_step=508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  42%|████▎     | 34/80 [03:40<04:49,  6.30s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000683, train/loss_vlb_step=6.05e-6, train/loss_step=0.000683, global_step=508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  42%|████▎     | 34/80 [03:40<04:49,  6.30s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=3.01e-5, train/loss_step=0.00195, global_step=508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  44%|████▍     | 35/80 [03:41<04:36,  6.14s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=3.01e-5, train/loss_step=0.00195, global_step=508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  44%|████▍     | 35/80 [03:41<04:36,  6.14s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000885, train/loss_vlb_step=5.58e-6, train/loss_step=0.000885, global_step=508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  45%|████▌     | 36/80 [03:49<04:32,  6.19s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000885, train/loss_vlb_step=5.58e-6, train/loss_step=0.000885, global_step=508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  45%|████▌     | 36/80 [03:49<04:32,  6.19s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000596, train/loss_vlb_step=5.23e-6, train/loss_step=0.000596, global_step=508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  46%|████▋     | 37/80 [03:49<04:19,  6.04s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000596, train/loss_vlb_step=5.23e-6, train/loss_step=0.000596, global_step=508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  46%|████▋     | 37/80 [03:49<04:19,  6.04s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=1.05e-5, train/loss_step=0.000831, global_step=509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434] Epoch 25:  48%|████▊     | 38/80 [03:50<04:07,  5.90s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=1.05e-5, train/loss_step=0.000831, global_step=509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  48%|████▊     | 38/80 [03:50<04:07,  5.90s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=7.57e-6, train/loss_step=0.00118, global_step=509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  49%|████▉     | 39/80 [03:50<03:56,  5.77s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=7.57e-6, train/loss_step=0.00118, global_step=509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  49%|████▉     | 39/80 [03:50<03:56,  5.77s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.18e-6, train/loss_step=0.000285, global_step=509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  50%|█████     | 40/80 [03:53<03:47,  5.68s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.18e-6, train/loss_step=0.000285, global_step=509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  50%|█████     | 40/80 [03:53<03:47,  5.68s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000593, train/loss_vlb_step=3e-6, train/loss_step=0.000593, global_step=509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]   Epoch 25:  51%|█████▏    | 41/80 [04:09<03:51,  5.94s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000593, train/loss_vlb_step=3e-6, train/loss_step=0.000593, global_step=509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  51%|█████▏    | 41/80 [04:09<03:51,  5.94s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=4.02e-5, train/loss_step=0.00778, global_step=510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  52%|█████▎    | 42/80 [04:19<03:49,  6.04s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=4.02e-5, train/loss_step=0.00778, global_step=510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  52%|█████▎    | 42/80 [04:19<03:49,  6.04s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=3.29e-6, train/loss_step=0.000582, global_step=510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  54%|█████▍    | 43/80 [04:22<03:40,  5.95s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=3.29e-6, train/loss_step=0.000582, global_step=510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  54%|█████▍    | 43/80 [04:22<03:40,  5.95s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.09e-6, train/loss_step=0.00103, global_step=510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  55%|█████▌    | 44/80 [04:24<03:31,  5.88s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.09e-6, train/loss_step=0.00103, global_step=510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  55%|█████▌    | 44/80 [04:24<03:31,  5.88s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=0.00011, train/loss_step=0.00652, global_step=510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  56%|█████▋    | 45/80 [04:24<03:21,  5.76s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=0.00011, train/loss_step=0.00652, global_step=510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  56%|█████▋    | 45/80 [04:24<03:21,  5.76s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.36e-5, train/loss_step=0.0107, global_step=511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  57%|█████▊    | 46/80 [04:25<03:12,  5.65s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.36e-5, train/loss_step=0.0107, global_step=511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  57%|█████▊    | 46/80 [04:25<03:12,  5.65s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.19e-5, train/loss_step=0.00873, global_step=511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  59%|█████▉    | 47/80 [04:25<03:02,  5.54s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.19e-5, train/loss_step=0.00873, global_step=511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  59%|█████▉    | 47/80 [04:25<03:02,  5.54s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000814, train/loss_vlb_step=1.36e-5, train/loss_step=0.000814, global_step=511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  60%|██████    | 48/80 [04:34<02:58,  5.59s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000814, train/loss_vlb_step=1.36e-5, train/loss_step=0.000814, global_step=511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  60%|██████    | 48/80 [04:34<02:58,  5.59s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=1.69e-5, train/loss_step=0.00118, global_step=511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]   Epoch 25:  61%|██████▏   | 49/80 [04:43<02:55,  5.67s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=1.69e-5, train/loss_step=0.00118, global_step=511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  61%|██████▏   | 49/80 [04:43<02:55,  5.67s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.25e-6, train/loss_step=0.00142, global_step=512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  62%|██████▎   | 50/80 [04:55<02:53,  5.80s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.25e-6, train/loss_step=0.00142, global_step=512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  62%|██████▎   | 50/80 [04:55<02:53,  5.80s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000991, train/loss_vlb_step=4.87e-6, train/loss_step=0.000991, global_step=512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000991, train/loss_vlb_step=4.87e-6, train/loss_step=0.000991, global_step=512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.71e-6, train/loss_step=0.00154, global_step=512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  65%|██████▌   | 52/80 [05:07<02:42,  5.81s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.71e-6, train/loss_step=0.00154, global_step=512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  65%|██████▌   | 52/80 [05:07<02:42,  5.81s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=5.16e-6, train/loss_step=0.00154, global_step=512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  66%|██████▋   | 53/80 [05:08<02:34,  5.71s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=5.16e-6, train/loss_step=0.00154, global_step=512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  66%|██████▋   | 53/80 [05:08<02:34,  5.71s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.68e-5, train/loss_step=0.0112, global_step=513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  68%|██████▊   | 54/80 [05:08<02:26,  5.62s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.68e-5, train/loss_step=0.0112, global_step=513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  68%|██████▊   | 54/80 [05:08<02:26,  5.62s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.06e-5, train/loss_step=0.00712, global_step=513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  69%|██████▉   | 55/80 [05:09<02:18,  5.53s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=3.06e-5, train/loss_step=0.00712, global_step=513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  69%|██████▉   | 55/80 [05:09<02:18,  5.53s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00049, train/loss_vlb_step=1.92e-6, train/loss_step=0.00049, global_step=513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  70%|███████   | 56/80 [05:14<02:12,  5.53s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00049, train/loss_vlb_step=1.92e-6, train/loss_step=0.00049, global_step=513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  70%|███████   | 56/80 [05:14<02:12,  5.53s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.76e-5, train/loss_step=0.0118, global_step=513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  71%|███████▏  | 57/80 [05:28<02:10,  5.67s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.76e-5, train/loss_step=0.0118, global_step=513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  71%|███████▏  | 57/80 [05:28<02:10,  5.67s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=5.99e-6, train/loss_step=0.00168, global_step=514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  72%|███████▎  | 58/80 [05:37<02:05,  5.72s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=5.99e-6, train/loss_step=0.00168, global_step=514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  72%|███████▎  | 58/80 [05:37<02:05,  5.72s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.48e-6, train/loss_step=0.00102, global_step=514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  74%|███████▍  | 59/80 [05:41<01:59,  5.68s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.48e-6, train/loss_step=0.00102, global_step=514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  74%|███████▍  | 59/80 [05:41<01:59,  5.68s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.03e-6, train/loss_step=0.00136, global_step=514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434] Epoch 25:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.03e-6, train/loss_step=0.00136, global_step=514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00919, train/loss_vlb_step=5.69e-5, train/loss_step=0.00919, global_step=514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  76%|███████▋  | 61/80 [05:50<01:47,  5.66s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00919, train/loss_vlb_step=5.69e-5, train/loss_step=0.00919, global_step=514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  76%|███████▋  | 61/80 [05:50<01:47,  5.66s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=9.62e-7, train/loss_step=0.00025, global_step=515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  78%|███████▊  | 62/80 [05:51<01:40,  5.57s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=9.62e-7, train/loss_step=0.00025, global_step=515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  78%|███████▊  | 62/80 [05:51<01:40,  5.57s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=0.000154, train/loss_step=0.0126, global_step=515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434] Epoch 25:  79%|███████▉  | 63/80 [05:51<01:33,  5.49s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=0.000154, train/loss_step=0.0126, global_step=515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  79%|███████▉  | 63/80 [05:51<01:33,  5.49s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=0.000125, train/loss_step=0.0181, global_step=515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  80%|████████  | 64/80 [05:54<01:27,  5.45s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=0.000125, train/loss_step=0.0181, global_step=515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  80%|████████  | 64/80 [05:54<01:27,  5.45s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=8.44e-7, train/loss_step=0.00023, global_step=515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=8.44e-7, train/loss_step=0.00023, global_step=515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000308, train/loss_step=0.0139, global_step=516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  82%|████████▎ | 66/80 [06:24<01:20,  5.74s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000308, train/loss_step=0.0139, global_step=516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  82%|████████▎ | 66/80 [06:24<01:20,  5.74s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=3.01e-5, train/loss_step=0.00488, global_step=516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  84%|████████▍ | 67/80 [06:25<01:13,  5.66s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=3.01e-5, train/loss_step=0.00488, global_step=516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  84%|████████▍ | 67/80 [06:25<01:13,  5.66s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.25e-5, train/loss_step=0.0151, global_step=516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  85%|████████▌ | 68/80 [06:27<01:07,  5.61s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.25e-5, train/loss_step=0.0151, global_step=516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  85%|████████▌ | 68/80 [06:27<01:07,  5.61s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=9.96e-7, train/loss_step=0.000229, global_step=516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=9.96e-7, train/loss_step=0.000229, global_step=516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=3.84e-5, train/loss_step=0.0016, global_step=517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]    Epoch 25:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=3.84e-5, train/loss_step=0.0016, global_step=517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=0.000109, train/loss_step=0.00391, global_step=517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=0.000109, train/loss_step=0.00391, global_step=517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.33e-5, train/loss_step=0.00852, global_step=517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434] Epoch 25:  90%|█████████ | 72/80 [06:35<00:43,  5.41s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.00852, train/loss_vlb_step=4.33e-5, train/loss_step=0.00852, global_step=517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  90%|█████████ | 72/80 [06:35<00:43,  5.41s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.88e-6, train/loss_step=0.00106, global_step=517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  91%|█████████▏| 73/80 [06:50<00:38,  5.54s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.88e-6, train/loss_step=0.00106, global_step=517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  91%|█████████▏| 73/80 [06:50<00:38,  5.54s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.46e-5, train/loss_step=0.00609, global_step=518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  92%|█████████▎| 74/80 [06:55<00:33,  5.54s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.46e-5, train/loss_step=0.00609, global_step=518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  92%|█████████▎| 74/80 [06:55<00:33,  5.54s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=1.02e-6, train/loss_step=0.000292, global_step=518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  94%|█████████▍| 75/80 [06:57<00:27,  5.49s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=1.02e-6, train/loss_step=0.000292, global_step=518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  94%|█████████▍| 75/80 [06:57<00:27,  5.49s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=3.67e-5, train/loss_step=0.00125, global_step=518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 25:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=3.67e-5, train/loss_step=0.00125, global_step=518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=1.29e-5, train/loss_step=0.00139, global_step=518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=1.29e-5, train/loss_step=0.00139, global_step=518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=3.05e-5, train/loss_step=0.00123, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  98%|█████████▊| 78/80 [07:10<00:10,  5.44s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=3.05e-5, train/loss_step=0.00123, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  98%|█████████▊| 78/80 [07:10<00:10,  5.44s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000895, train/loss_vlb_step=3.97e-6, train/loss_step=0.000895, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000895, train/loss_vlb_step=3.97e-6, train/loss_step=0.000895, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.04e-5, train/loss_step=0.00294, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434] Epoch 25: 100%|██████████| 80/80 [07:11<00:00,  5.32s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.04e-5, train/loss_step=0.00294, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 25: 100%|██████████| 80/80 [07:11<00:00,  5.32s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.59e-6, train/loss_step=0.000452, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Average Epoch time: 431.12 seconds
+Average Peak memory 29561.45MiB
+Epoch 25:   0%|          | 0/80 [00:00<00:00, 4987.28it/s, loss=0.00475, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.59e-6, train/loss_step=0.000452, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 26:   0%|          | 0/80 [00:00<00:00, 2091.92it/s, loss=0.00475, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.59e-6, train/loss_step=0.000452, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]Epoch 26:   1%|▏         | 1/80 [00:49<32:18, 24.54s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.59e-6, train/loss_step=0.000452, global_step=519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000122, train/loss_epoch=0.00434]  Epoch 26:   1%|▏         | 1/80 [00:49<32:18, 24.54s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.23e-5, train/loss_step=0.00906, global_step=520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:   2%|▎         | 2/80 [00:49<21:28, 16.52s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.23e-5, train/loss_step=0.00906, global_step=520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:   2%|▎         | 2/80 [00:49<21:28, 16.52s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.03e-5, train/loss_step=0.00271, global_step=520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:   4%|▍         | 3/80 [00:50<16:03, 12.51s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.03e-5, train/loss_step=0.00271, global_step=520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:   4%|▍         | 3/80 [00:50<16:03, 12.51s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000575, train/loss_vlb_step=5.32e-6, train/loss_step=0.000575, global_step=520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:   5%|▌         | 4/80 [00:50<12:52, 10.16s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000575, train/loss_vlb_step=5.32e-6, train/loss_step=0.000575, global_step=520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:   5%|▌         | 4/80 [00:50<12:52, 10.16s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.61e-5, train/loss_step=0.00725, global_step=520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:   6%|▋         | 5/80 [00:51<10:41,  8.55s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.61e-5, train/loss_step=0.00725, global_step=520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:   6%|▋         | 5/80 [00:51<10:41,  8.55s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000742, train/loss_vlb_step=2.99e-6, train/loss_step=0.000742, global_step=521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:   8%|▊         | 6/80 [00:51<09:07,  7.40s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000742, train/loss_vlb_step=2.99e-6, train/loss_step=0.000742, global_step=521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:   8%|▊         | 6/80 [00:51<09:07,  7.40s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.27e-5, train/loss_step=0.00619, global_step=521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:   9%|▉         | 7/80 [00:52<07:57,  6.54s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.27e-5, train/loss_step=0.00619, global_step=521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:   9%|▉         | 7/80 [00:52<07:57,  6.54s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=7.72e-6, train/loss_step=0.00225, global_step=521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  10%|█         | 8/80 [01:31<12:13, 10.19s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=7.72e-6, train/loss_step=0.00225, global_step=521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  10%|█         | 8/80 [01:31<12:13, 10.19s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=1.29e-5, train/loss_step=0.00158, global_step=521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  11%|█▏        | 9/80 [01:32<10:54,  9.22s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=1.29e-5, train/loss_step=0.00158, global_step=521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  11%|█▏        | 9/80 [01:32<10:54,  9.22s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000513, train/loss_vlb_step=3.4e-6, train/loss_step=0.000513, global_step=522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  12%|█▎        | 10/80 [01:32<09:49,  8.43s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000513, train/loss_vlb_step=3.4e-6, train/loss_step=0.000513, global_step=522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  12%|█▎        | 10/80 [01:32<09:49,  8.43s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=1.42e-5, train/loss_step=0.00406, global_step=522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443] Epoch 26:  14%|█▍        | 11/80 [01:33<08:55,  7.77s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=1.42e-5, train/loss_step=0.00406, global_step=522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  14%|█▍        | 11/80 [01:33<08:55,  7.77s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.08e-6, train/loss_step=0.000251, global_step=522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  15%|█▌        | 12/80 [01:33<08:11,  7.23s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.08e-6, train/loss_step=0.000251, global_step=522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  15%|█▌        | 12/80 [01:33<08:11,  7.23s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=9.66e-6, train/loss_step=0.00174, global_step=522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  16%|█▋        | 13/80 [01:34<07:32,  6.75s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=9.66e-6, train/loss_step=0.00174, global_step=522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  16%|█▋        | 13/80 [01:34<07:32,  6.75s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.77e-6, train/loss_step=0.000375, global_step=523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  18%|█▊        | 14/80 [01:34<06:57,  6.33s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.77e-6, train/loss_step=0.000375, global_step=523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  18%|█▊        | 14/80 [01:34<06:57,  6.33s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=2.19e-5, train/loss_step=0.00147, global_step=523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  19%|█▉        | 15/80 [01:35<06:27,  5.97s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=2.19e-5, train/loss_step=0.00147, global_step=523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  19%|█▉        | 15/80 [01:35<06:27,  5.97s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.000655, train/loss_vlb_step=8.63e-6, train/loss_step=0.000655, global_step=523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  20%|██        | 16/80 [02:12<08:17,  7.77s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.000655, train/loss_vlb_step=8.63e-6, train/loss_step=0.000655, global_step=523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  20%|██        | 16/80 [02:12<08:17,  7.77s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=5.51e-6, train/loss_step=0.00127, global_step=523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  21%|██▏       | 17/80 [02:15<07:53,  7.52s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=5.51e-6, train/loss_step=0.00127, global_step=523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  21%|██▏       | 17/80 [02:15<07:53,  7.52s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=7.89e-6, train/loss_step=0.00152, global_step=524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  22%|██▎       | 18/80 [02:15<07:23,  7.15s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=7.89e-6, train/loss_step=0.00152, global_step=524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  22%|██▎       | 18/80 [02:15<07:23,  7.15s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000262, train/loss_vlb_step=1.07e-6, train/loss_step=0.000262, global_step=524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  24%|██▍       | 19/80 [02:16<06:55,  6.81s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000262, train/loss_vlb_step=1.07e-6, train/loss_step=0.000262, global_step=524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  24%|██▍       | 19/80 [02:16<06:55,  6.81s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000449, train/loss_step=0.0143, global_step=524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]   Epoch 26:  25%|██▌       | 20/80 [02:16<06:30,  6.52s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000449, train/loss_step=0.0143, global_step=524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  25%|██▌       | 20/80 [02:16<06:30,  6.52s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=2.74e-5, train/loss_step=0.00828, global_step=524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  26%|██▋       | 21/80 [02:17<06:09,  6.26s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=2.74e-5, train/loss_step=0.00828, global_step=524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  26%|██▋       | 21/80 [02:17<06:09,  6.26s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=4.95e-6, train/loss_step=0.00118, global_step=525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  28%|██▊       | 22/80 [02:18<05:48,  6.01s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=4.95e-6, train/loss_step=0.00118, global_step=525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  28%|██▊       | 22/80 [02:18<05:48,  6.01s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.36e-6, train/loss_step=0.000324, global_step=525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  29%|██▉       | 23/80 [02:18<05:29,  5.78s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.36e-6, train/loss_step=0.000324, global_step=525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  29%|██▉       | 23/80 [02:18<05:29,  5.78s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.79e-6, train/loss_step=0.00111, global_step=525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  30%|███       | 24/80 [02:49<06:20,  6.80s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.79e-6, train/loss_step=0.00111, global_step=525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  30%|███       | 24/80 [02:49<06:20,  6.80s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=9.47e-6, train/loss_step=0.00122, global_step=525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  31%|███▏      | 25/80 [03:00<06:21,  6.94s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=9.47e-6, train/loss_step=0.00122, global_step=525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  31%|███▏      | 25/80 [03:00<06:21,  6.94s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.28e-5, train/loss_step=0.0181, global_step=526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  32%|███▎      | 26/80 [03:00<06:01,  6.70s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=7.28e-5, train/loss_step=0.0181, global_step=526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  32%|███▎      | 26/80 [03:00<06:01,  6.70s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=2.17e-5, train/loss_step=0.00211, global_step=526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  34%|███▍      | 27/80 [03:01<05:43,  6.48s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=2.17e-5, train/loss_step=0.00211, global_step=526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  34%|███▍      | 27/80 [03:01<05:43,  6.48s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000973, train/loss_vlb_step=4.32e-6, train/loss_step=0.000973, global_step=526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  35%|███▌      | 28/80 [03:01<05:26,  6.28s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000973, train/loss_vlb_step=4.32e-6, train/loss_step=0.000973, global_step=526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  35%|███▌      | 28/80 [03:01<05:26,  6.28s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=2.7e-6, train/loss_step=0.000466, global_step=526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]   Epoch 26:  36%|███▋      | 29/80 [03:02<05:10,  6.08s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=2.7e-6, train/loss_step=0.000466, global_step=526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  36%|███▋      | 29/80 [03:02<05:10,  6.08s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=2.76e-6, train/loss_step=0.000734, global_step=527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  38%|███▊      | 30/80 [03:02<04:55,  5.90s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=2.76e-6, train/loss_step=0.000734, global_step=527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  38%|███▊      | 30/80 [03:02<04:55,  5.90s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=1.98e-5, train/loss_step=0.00437, global_step=527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  39%|███▉      | 31/80 [03:03<04:40,  5.73s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=1.98e-5, train/loss_step=0.00437, global_step=527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  39%|███▉      | 31/80 [03:03<04:40,  5.73s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.39e-5, train/loss_step=0.00632, global_step=527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  40%|████      | 32/80 [03:31<05:07,  6.41s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.39e-5, train/loss_step=0.00632, global_step=527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  40%|████      | 32/80 [03:31<05:07,  6.41s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=7.68e-5, train/loss_step=0.0133, global_step=527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  41%|████▏     | 33/80 [03:45<05:12,  6.64s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=7.68e-5, train/loss_step=0.0133, global_step=527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  41%|████▏     | 33/80 [03:45<05:12,  6.64s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.66e-5, train/loss_step=0.00251, global_step=528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  42%|████▎     | 34/80 [03:46<04:57,  6.47s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.66e-5, train/loss_step=0.00251, global_step=528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  42%|████▎     | 34/80 [03:46<04:57,  6.47s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=2.52e-5, train/loss_step=0.00656, global_step=528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  44%|████▍     | 35/80 [03:46<04:43,  6.30s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=2.52e-5, train/loss_step=0.00656, global_step=528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  44%|████▍     | 35/80 [03:46<04:43,  6.30s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=2.23e-6, train/loss_step=0.000591, global_step=528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  45%|████▌     | 36/80 [03:47<04:30,  6.15s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=2.23e-6, train/loss_step=0.000591, global_step=528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  45%|████▌     | 36/80 [03:47<04:30,  6.15s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.12e-5, train/loss_step=0.0114, global_step=528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]    Epoch 26:  46%|████▋     | 37/80 [03:48<04:18,  6.00s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.12e-5, train/loss_step=0.0114, global_step=528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  46%|████▋     | 37/80 [03:48<04:18,  6.00s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.76e-6, train/loss_step=0.00144, global_step=529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  48%|████▊     | 38/80 [03:48<04:06,  5.86s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.76e-6, train/loss_step=0.00144, global_step=529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  48%|████▊     | 38/80 [03:48<04:06,  5.86s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=7.85e-5, train/loss_step=0.00585, global_step=529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  49%|████▉     | 39/80 [03:49<03:54,  5.73s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00585, train/loss_vlb_step=7.85e-5, train/loss_step=0.00585, global_step=529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  49%|████▉     | 39/80 [03:49<03:54,  5.73s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=8.95e-5, train/loss_step=0.0147, global_step=529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  50%|█████     | 40/80 [04:11<04:05,  6.14s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=8.95e-5, train/loss_step=0.0147, global_step=529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  50%|█████     | 40/80 [04:11<04:05,  6.14s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=6.27e-5, train/loss_step=0.00412, global_step=529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  51%|█████▏    | 41/80 [04:25<04:06,  6.32s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=6.27e-5, train/loss_step=0.00412, global_step=529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  51%|█████▏    | 41/80 [04:25<04:06,  6.32s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.39e-5, train/loss_step=0.00309, global_step=530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.39e-5, train/loss_step=0.00309, global_step=530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=6.05e-6, train/loss_step=0.00144, global_step=530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=6.05e-6, train/loss_step=0.00144, global_step=530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.69e-6, train/loss_step=0.00108, global_step=530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  55%|█████▌    | 44/80 [04:27<03:33,  5.93s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.69e-6, train/loss_step=0.00108, global_step=530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  55%|█████▌    | 44/80 [04:27<03:33,  5.93s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=0.00044, train/loss_step=0.00288, global_step=530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443] Epoch 26:  56%|█████▋    | 45/80 [04:27<03:23,  5.82s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=0.00044, train/loss_step=0.00288, global_step=530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  56%|█████▋    | 45/80 [04:27<03:23,  5.82s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=3.4e-6, train/loss_step=0.000737, global_step=531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  57%|█████▊    | 46/80 [04:28<03:13,  5.70s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=3.4e-6, train/loss_step=0.000737, global_step=531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  57%|█████▊    | 46/80 [04:28<03:13,  5.70s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000638, train/loss_vlb_step=2.95e-6, train/loss_step=0.000638, global_step=531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000638, train/loss_vlb_step=2.95e-6, train/loss_step=0.000638, global_step=531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=7.39e-6, train/loss_step=0.00124, global_step=531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  60%|██████    | 48/80 [05:01<03:16,  6.15s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=7.39e-6, train/loss_step=0.00124, global_step=531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  60%|██████    | 48/80 [05:01<03:16,  6.15s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.44e-5, train/loss_step=0.00395, global_step=531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  61%|██████▏   | 49/80 [05:17<03:17,  6.36s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.44e-5, train/loss_step=0.00395, global_step=531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  61%|██████▏   | 49/80 [05:17<03:17,  6.36s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=8.12e-6, train/loss_step=0.00173, global_step=532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443] Epoch 26:  62%|██████▎   | 50/80 [05:18<03:07,  6.24s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=8.12e-6, train/loss_step=0.00173, global_step=532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  62%|██████▎   | 50/80 [05:18<03:07,  6.24s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000855, train/loss_vlb_step=4.18e-6, train/loss_step=0.000855, global_step=532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  64%|██████▍   | 51/80 [05:18<02:57,  6.13s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000855, train/loss_vlb_step=4.18e-6, train/loss_step=0.000855, global_step=532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  64%|██████▍   | 51/80 [05:18<02:57,  6.13s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.53e-5, train/loss_step=0.0046, global_step=532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]    Epoch 26:  65%|██████▌   | 52/80 [05:19<02:48,  6.03s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.53e-5, train/loss_step=0.0046, global_step=532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  65%|██████▌   | 52/80 [05:19<02:48,  6.03s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=6.25e-6, train/loss_step=0.00101, global_step=532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  66%|██████▋   | 53/80 [05:19<02:39,  5.92s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=6.25e-6, train/loss_step=0.00101, global_step=532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  66%|██████▋   | 53/80 [05:19<02:39,  5.92s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=4.24e-5, train/loss_step=0.0119, global_step=533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]    Epoch 26:  68%|██████▊   | 54/80 [05:20<02:31,  5.82s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=4.24e-5, train/loss_step=0.0119, global_step=533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  68%|██████▊   | 54/80 [05:20<02:31,  5.82s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=6.9e-5, train/loss_step=0.0128, global_step=533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  69%|██████▉   | 55/80 [05:20<02:23,  5.73s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=6.9e-5, train/loss_step=0.0128, global_step=533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  69%|██████▉   | 55/80 [05:20<02:23,  5.73s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=0.000719, train/loss_step=0.0223, global_step=533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  70%|███████   | 56/80 [05:49<02:27,  6.13s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0223, train/loss_vlb_step=0.000719, train/loss_step=0.0223, global_step=533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  70%|███████   | 56/80 [05:49<02:27,  6.13s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.22e-5, train/loss_step=0.00251, global_step=533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  71%|███████▏  | 57/80 [06:00<02:23,  6.22s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=1.22e-5, train/loss_step=0.00251, global_step=533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  71%|███████▏  | 57/80 [06:00<02:23,  6.22s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.66e-5, train/loss_step=0.00225, global_step=534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  72%|███████▎  | 58/80 [06:01<02:14,  6.12s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.66e-5, train/loss_step=0.00225, global_step=534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  72%|███████▎  | 58/80 [06:01<02:14,  6.12s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=2.67e-5, train/loss_step=0.00763, global_step=534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  74%|███████▍  | 59/80 [06:01<02:06,  6.03s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=2.67e-5, train/loss_step=0.00763, global_step=534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  74%|███████▍  | 59/80 [06:01<02:06,  6.03s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=7.02e-6, train/loss_step=0.00184, global_step=534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  75%|███████▌  | 60/80 [06:02<01:58,  5.94s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=7.02e-6, train/loss_step=0.00184, global_step=534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  75%|███████▌  | 60/80 [06:02<01:58,  5.94s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0005, train/loss_vlb_step=2.49e-6, train/loss_step=0.0005, global_step=534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  76%|███████▋  | 61/80 [06:03<01:51,  5.86s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0005, train/loss_vlb_step=2.49e-6, train/loss_step=0.0005, global_step=534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  76%|███████▋  | 61/80 [06:03<01:51,  5.86s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.22e-5, train/loss_step=0.00116, global_step=535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  78%|███████▊  | 62/80 [06:03<01:43,  5.77s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.22e-5, train/loss_step=0.00116, global_step=535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  78%|███████▊  | 62/80 [06:03<01:43,  5.77s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=0.000939, train/loss_step=0.00241, global_step=535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  79%|███████▉  | 63/80 [06:04<01:36,  5.69s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=0.000939, train/loss_step=0.00241, global_step=535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  79%|███████▉  | 63/80 [06:04<01:36,  5.69s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=1.68e-6, train/loss_step=0.000374, global_step=535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  80%|████████  | 64/80 [06:31<01:36,  6.03s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=1.68e-6, train/loss_step=0.000374, global_step=535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  80%|████████  | 64/80 [06:31<01:36,  6.03s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=7.53e-6, train/loss_step=0.00199, global_step=535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  81%|████████▏ | 65/80 [06:42<01:31,  6.09s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=7.53e-6, train/loss_step=0.00199, global_step=535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  81%|████████▏ | 65/80 [06:42<01:31,  6.09s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=0.000364, train/loss_step=0.00216, global_step=536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  82%|████████▎ | 66/80 [06:42<01:24,  6.01s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=0.000364, train/loss_step=0.00216, global_step=536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  82%|████████▎ | 66/80 [06:42<01:24,  6.01s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=1.95e-6, train/loss_step=0.000525, global_step=536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  84%|████████▍ | 67/80 [06:43<01:17,  5.93s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=1.95e-6, train/loss_step=0.000525, global_step=536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  84%|████████▍ | 67/80 [06:43<01:17,  5.93s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=4.41e-6, train/loss_step=0.000852, global_step=536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=4.41e-6, train/loss_step=0.000852, global_step=536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=3.66e-5, train/loss_step=0.00947, global_step=536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  86%|████████▋ | 69/80 [06:44<01:03,  5.77s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=3.66e-5, train/loss_step=0.00947, global_step=536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  86%|████████▋ | 69/80 [06:44<01:03,  5.77s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000231, train/loss_step=0.0153, global_step=537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443] Epoch 26:  88%|████████▊ | 70/80 [06:44<00:56,  5.70s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000231, train/loss_step=0.0153, global_step=537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  88%|████████▊ | 70/80 [06:44<00:56,  5.70s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.72e-6, train/loss_step=0.00148, global_step=537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  89%|████████▉ | 71/80 [06:45<00:50,  5.63s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.72e-6, train/loss_step=0.00148, global_step=537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  89%|████████▉ | 71/80 [06:45<00:50,  5.63s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.52e-6, train/loss_step=0.00056, global_step=537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  90%|█████████ | 72/80 [07:04<00:46,  5.82s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.52e-6, train/loss_step=0.00056, global_step=537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  90%|█████████ | 72/80 [07:04<00:46,  5.82s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=2.75e-6, train/loss_step=0.000589, global_step=537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  91%|█████████▏| 73/80 [07:18<00:41,  5.92s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=2.75e-6, train/loss_step=0.000589, global_step=537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  91%|█████████▏| 73/80 [07:18<00:41,  5.92s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000483, train/loss_vlb_step=2.89e-6, train/loss_step=0.000483, global_step=538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  92%|█████████▎| 74/80 [07:18<00:35,  5.85s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000483, train/loss_vlb_step=2.89e-6, train/loss_step=0.000483, global_step=538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  92%|█████████▎| 74/80 [07:18<00:35,  5.85s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=3.22e-5, train/loss_step=0.00541, global_step=538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 26:  94%|█████████▍| 75/80 [07:19<00:28,  5.78s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=3.22e-5, train/loss_step=0.00541, global_step=538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  94%|█████████▍| 75/80 [07:19<00:28,  5.78s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=5.01e-6, train/loss_step=0.00106, global_step=538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  95%|█████████▌| 76/80 [07:19<00:22,  5.71s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=5.01e-6, train/loss_step=0.00106, global_step=538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  95%|█████████▌| 76/80 [07:19<00:22,  5.71s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.0006, train/loss_vlb_step=4.2e-6, train/loss_step=0.0006, global_step=538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]   Epoch 26:  96%|█████████▋| 77/80 [07:20<00:16,  5.64s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.0006, train/loss_vlb_step=4.2e-6, train/loss_step=0.0006, global_step=538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  96%|█████████▋| 77/80 [07:20<00:16,  5.64s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.4e-5, train/loss_step=0.00296, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  98%|█████████▊| 78/80 [07:20<00:11,  5.58s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.4e-5, train/loss_step=0.00296, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  98%|█████████▊| 78/80 [07:20<00:11,  5.58s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=3.94e-6, train/loss_step=0.000828, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  99%|█████████▉| 79/80 [07:21<00:05,  5.52s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=3.94e-6, train/loss_step=0.000828, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26:  99%|█████████▉| 79/80 [07:21<00:05,  5.52s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=1e-5, train/loss_step=0.00124, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]      Epoch 26: 100%|██████████| 80/80 [07:21<00:00,  5.45s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=1e-5, train/loss_step=0.00124, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 26: 100%|██████████| 80/80 [07:21<00:00,  5.45s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=8.6e-7, train/loss_step=0.000247, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Average Epoch time: 441.73 seconds
+Average Peak memory 29563.13MiB
+Epoch 26:   0%|          | 0/80 [00:00<00:00, 5940.94it/s, loss=0.00249, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=8.6e-7, train/loss_step=0.000247, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 27:   0%|          | 0/80 [00:00<00:00, 2328.88it/s, loss=0.00249, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=8.6e-7, train/loss_step=0.000247, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]Epoch 27:   1%|▏         | 1/80 [00:43<28:57, 21.99s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=8.6e-7, train/loss_step=0.000247, global_step=539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=0.000111, train/loss_epoch=0.00443]  Epoch 27:   1%|▏         | 1/80 [00:43<28:57, 21.99s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=1.86e-5, train/loss_step=0.00142, global_step=540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]   Epoch 27:   2%|▎         | 2/80 [00:44<19:16, 14.82s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=1.86e-5, train/loss_step=0.00142, global_step=540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:   2%|▎         | 2/80 [00:44<19:16, 14.82s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.04e-5, train/loss_step=0.00237, global_step=540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:   4%|▍         | 3/80 [00:44<14:25, 11.24s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=1.04e-5, train/loss_step=0.00237, global_step=540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:   4%|▍         | 3/80 [00:44<14:25, 11.24s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.62e-5, train/loss_step=0.00514, global_step=540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:   5%|▌         | 4/80 [00:45<11:31,  9.10s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.00514, train/loss_vlb_step=2.62e-5, train/loss_step=0.00514, global_step=540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:   5%|▌         | 4/80 [00:45<11:31,  9.10s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.57e-5, train/loss_step=0.0103, global_step=540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 27:   6%|▋         | 5/80 [00:47<09:50,  7.87s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.57e-5, train/loss_step=0.0103, global_step=540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:   6%|▋         | 5/80 [00:47<09:50,  7.87s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=7.24e-5, train/loss_step=0.0112, global_step=541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438] Epoch 27:   8%|▊         | 6/80 [00:47<08:24,  6.82s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=7.24e-5, train/loss_step=0.0112, global_step=541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:   8%|▊         | 6/80 [00:47<08:24,  6.82s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=0.0016, train/loss_step=0.0221, global_step=541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:   9%|▉         | 7/80 [00:48<07:19,  6.03s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=0.0016, train/loss_step=0.0221, global_step=541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:   9%|▉         | 7/80 [00:48<07:19,  6.03s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=1.8e-5, train/loss_step=0.00544, global_step=541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  10%|█         | 8/80 [01:26<11:33,  9.63s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=1.8e-5, train/loss_step=0.00544, global_step=541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  10%|█         | 8/80 [01:26<11:33,  9.63s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.27e-5, train/loss_step=0.00116, global_step=541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  11%|█▏        | 9/80 [01:27<10:19,  8.72s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.27e-5, train/loss_step=0.00116, global_step=541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  11%|█▏        | 9/80 [01:27<10:19,  8.72s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.52e-6, train/loss_step=0.00103, global_step=542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  12%|█▎        | 10/80 [01:27<09:17,  7.97s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.52e-6, train/loss_step=0.00103, global_step=542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  12%|█▎        | 10/80 [01:27<09:17,  7.97s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=5.08e-6, train/loss_step=0.00107, global_step=542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  14%|█▍        | 11/80 [01:28<08:26,  7.35s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=5.08e-6, train/loss_step=0.00107, global_step=542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  14%|█▍        | 11/80 [01:28<08:26,  7.35s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000205, train/loss_step=0.0124, global_step=542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438] Epoch 27:  15%|█▌        | 12/80 [01:31<07:58,  7.04s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000205, train/loss_step=0.0124, global_step=542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  15%|█▌        | 12/80 [01:31<07:58,  7.04s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.7e-6, train/loss_step=0.00111, global_step=542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  16%|█▋        | 13/80 [01:36<07:42,  6.91s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.7e-6, train/loss_step=0.00111, global_step=542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  16%|█▋        | 13/80 [01:36<07:42,  6.91s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000811, train/loss_vlb_step=3.22e-6, train/loss_step=0.000811, global_step=543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  18%|█▊        | 14/80 [01:37<07:07,  6.48s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000811, train/loss_vlb_step=3.22e-6, train/loss_step=0.000811, global_step=543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  18%|█▊        | 14/80 [01:37<07:07,  6.48s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=0.000128, train/loss_step=0.00825, global_step=543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  19%|█▉        | 15/80 [01:37<06:36,  6.11s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=0.000128, train/loss_step=0.00825, global_step=543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  19%|█▉        | 15/80 [01:37<06:36,  6.11s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=0.0002, train/loss_step=0.00452, global_step=543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 27:  20%|██        | 16/80 [02:05<07:51,  7.36s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=0.0002, train/loss_step=0.00452, global_step=543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  20%|██        | 16/80 [02:05<07:51,  7.36s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=0.000105, train/loss_step=0.0202, global_step=543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438] Epoch 27:  21%|██▏       | 17/80 [02:05<07:19,  6.98s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=0.000105, train/loss_step=0.0202, global_step=543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  21%|██▏       | 17/80 [02:05<07:19,  6.98s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000107, train/loss_step=0.0121, global_step=544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  22%|██▎       | 18/80 [02:06<06:51,  6.64s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000107, train/loss_step=0.0121, global_step=544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  22%|██▎       | 18/80 [02:06<06:51,  6.64s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.000657, train/loss_vlb_step=7.82e-6, train/loss_step=0.000657, global_step=544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  24%|██▍       | 19/80 [02:06<06:26,  6.33s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.000657, train/loss_vlb_step=7.82e-6, train/loss_step=0.000657, global_step=544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  24%|██▍       | 19/80 [02:06<06:26,  6.33s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=7.84e-6, train/loss_step=0.0013, global_step=544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]    Epoch 27:  25%|██▌       | 20/80 [02:10<06:13,  6.23s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=7.84e-6, train/loss_step=0.0013, global_step=544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  25%|██��       | 20/80 [02:10<06:13,  6.23s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.000509, train/loss_vlb_step=2.11e-6, train/loss_step=0.000509, global_step=544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  26%|██▋       | 21/80 [02:15<06:02,  6.15s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.000509, train/loss_vlb_step=2.11e-6, train/loss_step=0.000509, global_step=544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  26%|██▋       | 21/80 [02:15<06:02,  6.15s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=2.34e-6, train/loss_step=0.000488, global_step=545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  28%|██▊       | 22/80 [02:18<05:49,  6.02s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=2.34e-6, train/loss_step=0.000488, global_step=545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  28%|██▊       | 22/80 [02:18<05:49,  6.02s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.16e-5, train/loss_step=0.0137, global_step=545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]    Epoch 27:  29%|██▉       | 23/80 [02:18<05:30,  5.79s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=5.16e-5, train/loss_step=0.0137, global_step=545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  29%|██▉       | 23/80 [02:18<05:30,  5.79s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=0.001, train/loss_step=0.00259, global_step=545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  30%|███       | 24/80 [02:49<06:19,  6.78s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=0.001, train/loss_step=0.00259, global_step=545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  30%|███       | 24/80 [02:49<06:19,  6.78s/it, loss=0.00617, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=9.5e-6, train/loss_step=0.00261, global_step=545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  31%|███▏      | 25/80 [02:50<05:59,  6.54s/it, loss=0.00617, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=9.5e-6, train/loss_step=0.00261, global_step=545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  31%|███▏      | 25/80 [02:50<05:59,  6.54s/it, loss=0.00671, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.0004, train/loss_step=0.022, global_step=546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]    Epoch 27:  32%|███▎      | 26/80 [02:50<05:41,  6.32s/it, loss=0.00671, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.0004, train/loss_step=0.022, global_step=546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  32%|███▎      | 26/80 [02:50<05:41,  6.32s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=4.51e-6, train/loss_step=0.000728, global_step=546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  34%|███▍      | 27/80 [02:51<05:23,  6.11s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=4.51e-6, train/loss_step=0.000728, global_step=546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  34%|███▍      | 27/80 [02:51<05:23,  6.11s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000993, train/loss_vlb_step=3.88e-6, train/loss_step=0.000993, global_step=546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  35%|███▌      | 28/80 [02:51<05:07,  5.92s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000993, train/loss_vlb_step=3.88e-6, train/loss_step=0.000993, global_step=546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  35%|███▌      | 28/80 [02:51<05:07,  5.92s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.45e-6, train/loss_step=0.000718, global_step=546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  36%|███▋      | 29/80 [02:58<05:04,  5.96s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.45e-6, train/loss_step=0.000718, global_step=546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  36%|███▋      | 29/80 [02:58<05:04,  5.96s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.64e-5, train/loss_step=0.00167, global_step=547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 27:  38%|███▊      | 30/80 [02:59<04:49,  5.79s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.64e-5, train/loss_step=0.00167, global_step=547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  38%|███▊      | 30/80 [02:59<04:49,  5.79s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=3.65e-5, train/loss_step=0.00794, global_step=547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  39%|███▉      | 31/80 [02:59<04:35,  5.62s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=3.65e-5, train/loss_step=0.00794, global_step=547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  39%|███▉      | 31/80 [02:59<04:35,  5.62s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000608, train/loss_vlb_step=4.86e-6, train/loss_step=0.000608, global_step=547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  40%|████      | 32/80 [03:28<05:03,  6.33s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000608, train/loss_vlb_step=4.86e-6, train/loss_step=0.000608, global_step=547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  40%|████      | 32/80 [03:28<05:03,  6.33s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=2.02e-6, train/loss_step=0.000422, global_step=547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  41%|████▏     | 33/80 [03:53<05:22,  6.85s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=2.02e-6, train/loss_step=0.000422, global_step=547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  41%|████▏     | 33/80 [03:53<05:22,  6.85s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=9.6e-6, train/loss_step=0.00245, global_step=548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]   Epoch 27:  42%|████▎     | 34/80 [03:53<05:06,  6.67s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=9.6e-6, train/loss_step=0.00245, global_step=548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  42%|████▎     | 34/80 [03:53<05:06,  6.67s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=3.9e-6, train/loss_step=0.000586, global_step=548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  44%|████▍     | 35/80 [03:54<04:52,  6.50s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=3.9e-6, train/loss_step=0.000586, global_step=548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  44%|████▍     | 35/80 [03:54<04:52,  6.50s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000938, train/loss_vlb_step=4.11e-6, train/loss_step=0.000938, global_step=548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  45%|████▌     | 36/80 [03:54<04:38,  6.34s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000938, train/loss_vlb_step=4.11e-6, train/loss_step=0.000938, global_step=548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  45%|████▌     | 36/80 [03:54<04:38,  6.34s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00083, train/loss_vlb_step=1.22e-5, train/loss_step=0.00083, global_step=548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 27:  46%|████▋     | 37/80 [03:55<04:25,  6.19s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00083, train/loss_vlb_step=1.22e-5, train/loss_step=0.00083, global_step=548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  46%|████▋     | 37/80 [03:55<04:25,  6.19s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=2.05e-5, train/loss_step=0.00621, global_step=549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  48%|████▊     | 38/80 [03:55<04:13,  6.04s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=2.05e-5, train/loss_step=0.00621, global_step=549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  48%|████▊     | 38/80 [03:55<04:13,  6.04s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.21e-5, train/loss_step=0.00559, global_step=549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  49%|████▉     | 39/80 [03:56<04:01,  5.90s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.21e-5, train/loss_step=0.00559, global_step=549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  49%|████▉     | 39/80 [03:56<04:01,  5.90s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=6.56e-5, train/loss_step=0.00896, global_step=549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  50%|█████     | 40/80 [03:59<03:54,  5.85s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=6.56e-5, train/loss_step=0.00896, global_step=549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  50%|█████     | 40/80 [03:59<03:54,  5.85s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.18e-5, train/loss_step=0.00348, global_step=549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  51%|█████▏    | 41/80 [04:38<04:18,  6.62s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.18e-5, train/loss_step=0.00348, global_step=549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  51%|█████▏    | 41/80 [04:38<04:18,  6.62s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=0.000339, train/loss_step=0.002, global_step=550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]   Epoch 27:  52%|█████▎    | 42/80 [04:38<04:06,  6.48s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=0.000339, train/loss_step=0.002, global_step=550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  52%|█████▎    | 42/80 [04:38<04:06,  6.48s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=2.16e-6, train/loss_step=0.000421, global_step=550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  54%|█████▍    | 43/80 [04:39<03:54,  6.35s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=2.16e-6, train/loss_step=0.000421, global_step=550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  54%|█████▍    | 43/80 [04:39<03:54,  6.35s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.62e-5, train/loss_step=0.00354, global_step=550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 27:  55%|█████▌    | 44/80 [04:39<03:43,  6.22s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.62e-5, train/loss_step=0.00354, global_step=550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  55%|█████▌    | 44/80 [04:39<03:43,  6.22s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.46e-6, train/loss_step=0.000523, global_step=550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.46e-6, train/loss_step=0.000523, global_step=550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.000405, train/loss_vlb_step=1.54e-6, train/loss_step=0.000405, global_step=551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  57%|█████▊    | 46/80 [04:40<03:23,  5.97s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.000405, train/loss_vlb_step=1.54e-6, train/loss_step=0.000405, global_step=551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  57%|█████▊    | 46/80 [04:40<03:23,  5.97s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000957, train/loss_vlb_step=4.51e-6, train/loss_step=0.000957, global_step=551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  59%|█████▉    | 47/80 [04:41<03:13,  5.86s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000957, train/loss_vlb_step=4.51e-6, train/loss_step=0.000957, global_step=551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  59%|█████▉    | 47/80 [04:41<03:13,  5.86s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.5e-5, train/loss_step=0.00444, global_step=551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]   Epoch 27:  60%|██████    | 48/80 [04:41<03:04,  5.75s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=2.5e-5, train/loss_step=0.00444, global_step=551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  60%|██████    | 48/80 [04:41<03:04,  5.75s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.54e-5, train/loss_step=0.00305, global_step=551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  61%|██████▏   | 49/80 [05:25<03:21,  6.51s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.54e-5, train/loss_step=0.00305, global_step=551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  61%|██████▏   | 49/80 [05:25<03:21,  6.51s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=4.92e-6, train/loss_step=0.000834, global_step=552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  62%|██████▎   | 50/80 [05:25<03:11,  6.39s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=4.92e-6, train/loss_step=0.000834, global_step=552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  62%|██████▎   | 50/80 [05:25<03:11,  6.39s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.85e-5, train/loss_step=0.00116, global_step=552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 27:  64%|██████▍   | 51/80 [05:26<03:01,  6.27s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.85e-5, train/loss_step=0.00116, global_step=552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  64%|██████▍   | 51/80 [05:26<03:01,  6.27s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=6.16e-5, train/loss_step=0.00111, global_step=552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438] Epoch 27:  65%|██████▌   | 52/80 [05:27<02:52,  6.17s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=6.16e-5, train/loss_step=0.00111, global_step=552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  65%|██████▌   | 52/80 [05:27<02:52,  6.17s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=0.000232, train/loss_step=0.00186, global_step=552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  66%|██████▋   | 53/80 [05:27<02:43,  6.07s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=0.000232, train/loss_step=0.00186, global_step=552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  66%|██████▋   | 53/80 [05:27<02:43,  6.07s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2e-5, train/loss_step=0.00578, global_step=553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]    Epoch 27:  68%|██████▊   | 54/80 [05:28<02:35,  5.97s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2e-5, train/loss_step=0.00578, global_step=553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  68%|██████▊   | 54/80 [05:28<02:35,  5.97s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=1.51e-6, train/loss_step=0.000338, global_step=553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  69%|██████▉   | 55/80 [05:28<02:26,  5.87s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=1.51e-6, train/loss_step=0.000338, global_step=553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  69%|██████▉   | 55/80 [05:28<02:26,  5.87s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.58e-5, train/loss_step=0.00411, global_step=553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 27:  70%|███████   | 56/80 [05:34<02:21,  5.88s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.58e-5, train/loss_step=0.00411, global_step=553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  70%|███████   | 56/80 [05:34<02:21,  5.88s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=9.01e-6, train/loss_step=0.00237, global_step=553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  71%|███████▏  | 57/80 [06:08<02:25,  6.35s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=9.01e-6, train/loss_step=0.00237, global_step=553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  71%|███████▏  | 57/80 [06:08<02:25,  6.35s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.29e-6, train/loss_step=0.000351, global_step=554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  72%|███████▎  | 58/80 [06:08<02:17,  6.25s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.29e-6, train/loss_step=0.000351, global_step=554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  72%|███████▎  | 58/80 [06:08<02:17,  6.25s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=1.41e-6, train/loss_step=0.000337, global_step=554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438] Epoch 27:  74%|███████▍  | 59/80 [06:09<02:09,  6.15s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=1.41e-6, train/loss_step=0.000337, global_step=554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  74%|███████▍  | 59/80 [06:09<02:09,  6.15s/it, loss=0.00188, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.9e-6, train/loss_step=0.000444, global_step=554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  75%|███████▌  | 60/80 [06:09<02:01,  6.06s/it, loss=0.00188, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.9e-6, train/loss_step=0.000444, global_step=554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  75%|███████▌  | 60/80 [06:09<02:01,  6.06s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=1.99e-5, train/loss_step=0.0056, global_step=554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]   Epoch 27:  76%|███████▋  | 61/80 [06:10<01:53,  5.97s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=1.99e-5, train/loss_step=0.0056, global_step=554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  76%|███████▋  | 61/80 [06:10<01:53,  5.97s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00078, train/loss_vlb_step=1.24e-5, train/loss_step=0.00078, global_step=555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  78%|███████▊  | 62/80 [06:10<01:45,  5.88s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00078, train/loss_vlb_step=1.24e-5, train/loss_step=0.00078, global_step=555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  78%|███████▊  | 62/80 [06:10<01:45,  5.88s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=1.51e-6, train/loss_step=0.000407, global_step=555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  79%|███████▉  | 63/80 [06:11<01:38,  5.80s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=1.51e-6, train/loss_step=0.000407, global_step=555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  79%|███████▉  | 63/80 [06:11<01:38,  5.80s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=3.53e-6, train/loss_step=0.000525, global_step=555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  80%|████████  | 64/80 [06:22<01:34,  5.89s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=3.53e-6, train/loss_step=0.000525, global_step=555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  80%|████████  | 64/80 [06:22<01:34,  5.89s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=3.72e-6, train/loss_step=0.000462, global_step=555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  81%|████████▏ | 65/80 [06:47<01:32,  6.17s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=3.72e-6, train/loss_step=0.000462, global_step=555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  81%|████████▏ | 65/80 [06:47<01:32,  6.17s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000164, train/loss_step=0.0131, global_step=556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]    Epoch 27:  82%|████████▎ | 66/80 [06:47<01:25,  6.09s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000164, train/loss_step=0.0131, global_step=556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  82%|████████▎ | 66/80 [06:47<01:25,  6.09s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=9.47e-5, train/loss_step=0.00123, global_step=556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  84%|████████▍ | 67/80 [06:48<01:18,  6.01s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=9.47e-5, train/loss_step=0.00123, global_step=556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  84%|████████▍ | 67/80 [06:48<01:18,  6.01s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.94e-6, train/loss_step=0.00116, global_step=556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  85%|████████▌ | 68/80 [06:48<01:11,  5.93s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.94e-6, train/loss_step=0.00116, global_step=556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  85%|████████▌ | 68/80 [06:48<01:11,  5.93s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=2.39e-6, train/loss_step=0.000386, global_step=556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  86%|████████▋ | 69/80 [06:49<01:04,  5.85s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=2.39e-6, train/loss_step=0.000386, global_step=556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  86%|████████▋ | 69/80 [06:49<01:04,  5.85s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=6.82e-6, train/loss_step=0.00134, global_step=557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 27:  88%|████████▊ | 70/80 [06:49<00:57,  5.77s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=6.82e-6, train/loss_step=0.00134, global_step=557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  88%|████████▊ | 70/80 [06:49<00:57,  5.77s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000121, train/loss_step=0.0134, global_step=557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438] Epoch 27:  89%|████████▉ | 71/80 [06:50<00:51,  5.70s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000121, train/loss_step=0.0134, global_step=557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  89%|████████▉ | 71/80 [06:50<00:51,  5.70s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.00063, train/loss_vlb_step=3.32e-6, train/loss_step=0.00063, global_step=557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  90%|█████████ | 72/80 [06:58<00:45,  5.73s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.00063, train/loss_vlb_step=3.32e-6, train/loss_step=0.00063, global_step=557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  90%|█████████ | 72/80 [06:58<00:45,  5.73s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=1.05e-5, train/loss_step=0.00113, global_step=557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438] Epoch 27:  91%|█████████▏| 73/80 [07:25<00:42,  6.02s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=1.05e-5, train/loss_step=0.00113, global_step=557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  91%|█████████▏| 73/80 [07:25<00:42,  6.02s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.31e-5, train/loss_step=0.00311, global_step=558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  92%|█████████▎| 74/80 [07:25<00:35,  5.94s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.31e-5, train/loss_step=0.00311, global_step=558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  92%|█████████▎| 74/80 [07:25<00:35,  5.94s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=1.43e-6, train/loss_step=0.000347, global_step=558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  94%|█████████▍| 75/80 [07:26<00:29,  5.87s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=1.43e-6, train/loss_step=0.000347, global_step=558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  94%|█████████▍| 75/80 [07:26<00:29,  5.87s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000164, train/loss_step=0.0224, global_step=558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]   Epoch 27:  95%|█████████▌| 76/80 [07:26<00:23,  5.80s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000164, train/loss_step=0.0224, global_step=558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  95%|█████████▌| 76/80 [07:26<00:23,  5.80s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=2.35e-6, train/loss_step=0.000459, global_step=558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  96%|█████████▋| 77/80 [07:27<00:17,  5.73s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=2.35e-6, train/loss_step=0.000459, global_step=558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  96%|█████████▋| 77/80 [07:27<00:17,  5.73s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=1.42e-5, train/loss_step=0.00398, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 27:  98%|█████████▊| 78/80 [07:27<00:11,  5.67s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=1.42e-5, train/loss_step=0.00398, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  98%|█████████▊| 78/80 [07:27<00:11,  5.67s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.25e-6, train/loss_step=0.000453, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  99%|█████████▉| 79/80 [07:28<00:05,  5.60s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.25e-6, train/loss_step=0.000453, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27:  99%|█████████▉| 79/80 [07:28<00:05,  5.60s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=8.92e-5, train/loss_step=0.0113, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]    Epoch 27: 100%|██████████| 80/80 [07:28<00:00,  5.54s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=8.92e-5, train/loss_step=0.0113, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 27: 100%|██████████| 80/80 [07:28<00:00,  5.54s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.37e-6, train/loss_step=0.000344, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Average Epoch time: 448.81 seconds
+Average Peak memory 29563.46MiB
+Epoch 27:   0%|          | 0/80 [00:00<00:00, 3731.59it/s, loss=0.00385, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.37e-6, train/loss_step=0.000344, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 28:   0%|          | 0/80 [00:00<00:00, 1777.25it/s, loss=0.00385, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.37e-6, train/loss_step=0.000344, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]Epoch 28:   1%|▏         | 1/80 [00:45<30:02, 22.82s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.37e-6, train/loss_step=0.000344, global_step=559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00438, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00438]  Epoch 28:   1%|▏         | 1/80 [00:45<30:02, 22.82s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=6.35e-5, train/loss_step=0.00869, global_step=560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:   2%|▎         | 2/80 [00:46<19:58, 15.37s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=6.35e-5, train/loss_step=0.00869, global_step=560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:   2%|▎         | 2/80 [00:46<19:58, 15.37s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.69e-5, train/loss_step=0.00753, global_step=560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432] Epoch 28:   4%|▍         | 3/80 [00:46<14:57, 11.65s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.69e-5, train/loss_step=0.00753, global_step=560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:   4%|▍         | 3/80 [00:46<14:57, 11.65s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=7.73e-5, train/loss_step=0.0105, global_step=560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:   5%|▌         | 4/80 [00:47<11:56,  9.43s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=7.73e-5, train/loss_step=0.0105, global_step=560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:   5%|▌         | 4/80 [00:47<11:56,  9.43s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.03e-5, train/loss_step=0.0037, global_step=560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:   6%|▋         | 5/80 [00:47<09:55,  7.94s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=2.03e-5, train/loss_step=0.0037, global_step=560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:   6%|▋         | 5/80 [00:47<09:55,  7.94s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000899, train/loss_vlb_step=1.71e-5, train/loss_step=0.000899, global_step=561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:   8%|▊         | 6/80 [00:48<08:28,  6.88s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000899, train/loss_vlb_step=1.71e-5, train/loss_step=0.000899, global_step=561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:   8%|▊         | 6/80 [00:48<08:29,  6.88s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=8.14e-5, train/loss_step=0.012, global_step=561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]      Epoch 28:   9%|▉         | 7/80 [00:48<07:23,  6.08s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=8.14e-5, train/loss_step=0.012, global_step=561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:   9%|▉         | 7/80 [00:48<07:23,  6.08s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.19e-5, train/loss_step=0.00814, global_step=561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  10%|█         | 8/80 [01:23<11:10,  9.31s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.19e-5, train/loss_step=0.00814, global_step=561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  10%|█         | 8/80 [01:23<11:10,  9.31s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=5.27e-6, train/loss_step=0.000696, global_step=561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  11%|█▏        | 9/80 [01:24<09:58,  8.43s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=5.27e-6, train/loss_step=0.000696, global_step=561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  11%|█▏        | 9/80 [01:24<09:58,  8.43s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=3.07e-6, train/loss_step=0.000643, global_step=562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  12%|█▎        | 10/80 [01:24<08:59,  7.71s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=3.07e-6, train/loss_step=0.000643, global_step=562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  12%|█▎        | 10/80 [01:24<08:59,  7.71s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=0.000145, train/loss_step=0.00754, global_step=562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432] Epoch 28:  14%|█▍        | 11/80 [01:25<08:10,  7.11s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=0.000145, train/loss_step=0.00754, global_step=562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  14%|█▍        | 11/80 [01:25<08:10,  7.11s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.06e-5, train/loss_step=0.00316, global_step=562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432] Epoch 28:  15%|█▌        | 12/80 [01:25<07:29,  6.61s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.06e-5, train/loss_step=0.00316, global_step=562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  15%|█▌        | 12/80 [01:25<07:29,  6.61s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.46e-6, train/loss_step=0.00056, global_step=562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  16%|█▋        | 13/80 [01:26<06:53,  6.17s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.46e-6, train/loss_step=0.00056, global_step=562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  16%|█▋        | 13/80 [01:26<06:53,  6.17s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=1.86e-6, train/loss_step=0.00045, global_step=563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  18%|█▊        | 14/80 [01:27<06:26,  5.86s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=1.86e-6, train/loss_step=0.00045, global_step=563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  18%|█▊        | 14/80 [01:27<06:26,  5.86s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=6.49e-6, train/loss_step=0.000999, global_step=563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  19%|█▉        | 15/80 [01:28<05:59,  5.53s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=6.49e-6, train/loss_step=0.000999, global_step=563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  19%|█▉        | 15/80 [01:28<05:59,  5.53s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=1.77e-5, train/loss_step=0.00521, global_step=563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  20%|██        | 16/80 [02:11<08:13,  7.72s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=1.77e-5, train/loss_step=0.00521, global_step=563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  20%|██        | 16/80 [02:11<08:13,  7.72s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=4.22e-6, train/loss_step=0.00051, global_step=563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  21%|██▏       | 17/80 [02:11<07:41,  7.32s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=4.22e-6, train/loss_step=0.00051, global_step=563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  21%|██▏       | 17/80 [02:11<07:41,  7.32s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.03e-6, train/loss_step=0.000554, global_step=564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  22%|██▎       | 18/80 [02:12<07:11,  6.96s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.03e-6, train/loss_step=0.000554, global_step=564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  22%|██▎       | 18/80 [02:12<07:11,  6.96s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=4.51e-6, train/loss_step=0.00119, global_step=564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  24%|██▍       | 19/80 [02:12<06:44,  6.64s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=4.51e-6, train/loss_step=0.00119, global_step=564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  24%|██▍       | 19/80 [02:12<06:44,  6.64s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.66e-5, train/loss_step=0.00508, global_step=564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  25%|██▌       | 20/80 [02:13<06:21,  6.36s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.66e-5, train/loss_step=0.00508, global_step=564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  25%|██▌       | 20/80 [02:13<06:21,  6.36s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000804, train/loss_vlb_step=6.68e-6, train/loss_step=0.000804, global_step=564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  26%|██▋       | 21/80 [02:14<05:59,  6.09s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000804, train/loss_vlb_step=6.68e-6, train/loss_step=0.000804, global_step=564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  26%|██▋       | 21/80 [02:14<05:59,  6.09s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=7.88e-5, train/loss_step=0.00561, global_step=565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  28%|██▊       | 22/80 [02:21<05:55,  6.13s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=7.88e-5, train/loss_step=0.00561, global_step=565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  28%|██▊       | 22/80 [02:21<05:55,  6.13s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=1.8e-5, train/loss_step=0.00491, global_step=565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432] Epoch 28:  29%|██▉       | 23/80 [02:21<05:36,  5.90s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=1.8e-5, train/loss_step=0.00491, global_step=565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  29%|██▉       | 23/80 [02:21<05:36,  5.90s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=1.87e-6, train/loss_step=0.000476, global_step=565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  30%|███       | 24/80 [02:42<06:03,  6.49s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=1.87e-6, train/loss_step=0.000476, global_step=565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  30%|███       | 24/80 [02:42<06:03,  6.49s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.1e-5, train/loss_step=0.0042, global_step=565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]     Epoch 28:  31%|███▏      | 25/80 [02:42<05:44,  6.26s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=2.1e-5, train/loss_step=0.0042, global_step=565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  31%|███▏      | 25/80 [02:42<05:44,  6.26s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=2.24e-5, train/loss_step=0.00297, global_step=566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  32%|███▎      | 26/80 [02:43<05:26,  6.05s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=2.24e-5, train/loss_step=0.00297, global_step=566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  32%|███▎      | 26/80 [02:43<05:26,  6.05s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=2e-5, train/loss_step=0.00123, global_step=566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]   Epoch 28:  34%|███▍      | 27/80 [02:43<05:09,  5.85s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=2e-5, train/loss_step=0.00123, global_step=566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  34%|███▍      | 27/80 [02:43<05:09,  5.85s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=0.000547, train/loss_step=0.0189, global_step=566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  35%|███▌      | 28/80 [02:53<05:11,  5.99s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=0.000547, train/loss_step=0.0189, global_step=566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  35%|███▌      | 28/80 [02:53<05:11,  5.99s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000597, train/loss_vlb_step=4.73e-6, train/loss_step=0.000597, global_step=566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  36%|███▋      | 29/80 [02:54<04:56,  5.81s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000597, train/loss_vlb_step=4.73e-6, train/loss_step=0.000597, global_step=566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  36%|███▋      | 29/80 [02:54<04:56,  5.81s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.18e-5, train/loss_step=0.0022, global_step=567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]    Epoch 28:  38%|███▊      | 30/80 [02:54<04:41,  5.64s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.18e-5, train/loss_step=0.0022, global_step=567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  38%|███▊      | 30/80 [02:54<04:41,  5.64s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=3.26e-6, train/loss_step=0.000454, global_step=567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  39%|███▉      | 31/80 [02:55<04:28,  5.48s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=3.26e-6, train/loss_step=0.000454, global_step=567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  39%|███▉      | 31/80 [02:55<04:28,  5.48s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=3.07e-5, train/loss_step=0.00887, global_step=567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  40%|████      | 32/80 [03:34<05:11,  6.49s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=3.07e-5, train/loss_step=0.00887, global_step=567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  40%|████      | 32/80 [03:34<05:11,  6.49s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=2.26e-6, train/loss_step=0.000566, global_step=567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  41%|████▏     | 33/80 [03:35<04:57,  6.33s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=2.26e-6, train/loss_step=0.000566, global_step=567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  41%|████▏     | 33/80 [03:35<04:57,  6.33s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.25e-6, train/loss_step=0.000344, global_step=568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  42%|████▎     | 34/80 [03:35<04:43,  6.16s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.25e-6, train/loss_step=0.000344, global_step=568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  42%|████▎     | 34/80 [03:35<04:43,  6.16s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.66e-5, train/loss_step=0.0137, global_step=568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]    Epoch 28:  44%|████▍     | 35/80 [03:36<04:30,  6.01s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.66e-5, train/loss_step=0.0137, global_step=568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  44%|████▍     | 35/80 [03:36<04:30,  6.01s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=8.52e-7, train/loss_step=0.000222, global_step=568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  45%|████▌     | 36/80 [03:50<04:33,  6.23s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=8.52e-7, train/loss_step=0.000222, global_step=568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  45%|████▌     | 36/80 [03:50<04:33,  6.23s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=0.00249, train/loss_step=0.0102, global_step=568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]    Epoch 28:  46%|████▋     | 37/80 [03:50<04:21,  6.08s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=0.00249, train/loss_step=0.0102, global_step=568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  46%|████▋     | 37/80 [03:50<04:21,  6.08s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=1.86e-5, train/loss_step=0.00535, global_step=569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  48%|████▊     | 38/80 [03:51<04:09,  5.93s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=1.86e-5, train/loss_step=0.00535, global_step=569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  48%|████▊     | 38/80 [03:51<04:09,  5.93s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=8.86e-6, train/loss_step=0.0017, global_step=569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  49%|████▉     | 39/80 [03:51<03:57,  5.80s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=8.86e-6, train/loss_step=0.0017, global_step=569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  49%|████▉     | 39/80 [03:51<03:57,  5.80s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=9.42e-6, train/loss_step=0.00188, global_step=569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  50%|█████     | 40/80 [04:14<04:08,  6.22s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=9.42e-6, train/loss_step=0.00188, global_step=569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  50%|█████     | 40/80 [04:14<04:08,  6.22s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.76e-6, train/loss_step=0.000599, global_step=569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  51%|█████▏    | 41/80 [04:15<03:57,  6.08s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.76e-6, train/loss_step=0.000599, global_step=569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  51%|█████▏    | 41/80 [04:15<03:57,  6.08s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=1.71e-6, train/loss_step=0.000424, global_step=570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  52%|█████▎    | 42/80 [04:15<03:46,  5.95s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=1.71e-6, train/loss_step=0.000424, global_step=570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  52%|█████▎    | 42/80 [04:15<03:46,  5.95s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=7.54e-6, train/loss_step=0.00191, global_step=570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  54%|█████▍    | 43/80 [04:16<03:35,  5.83s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=7.54e-6, train/loss_step=0.00191, global_step=570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  54%|█████▍    | 43/80 [04:16<03:35,  5.83s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.3e-5, train/loss_step=0.00572, global_step=570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  55%|█████▌    | 44/80 [04:32<03:37,  6.05s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.3e-5, train/loss_step=0.00572, global_step=570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  55%|█████▌    | 44/80 [04:32<03:37,  6.05s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=3.21e-5, train/loss_step=0.00121, global_step=570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=3.21e-5, train/loss_step=0.00121, global_step=570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=2.64e-5, train/loss_step=0.0011, global_step=571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=2.64e-5, train/loss_step=0.0011, global_step=571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.28e-5, train/loss_step=0.00375, global_step=571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.28e-5, train/loss_step=0.00375, global_step=571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=4.59e-5, train/loss_step=0.00491, global_step=571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  60%|██████    | 48/80 [04:59<03:15,  6.11s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=4.59e-5, train/loss_step=0.00491, global_step=571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  60%|██████    | 48/80 [04:59<03:15,  6.11s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=2.65e-6, train/loss_step=0.000749, global_step=571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  61%|██████▏   | 49/80 [05:00<03:06,  6.00s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=2.65e-6, train/loss_step=0.000749, global_step=571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  61%|██████▏   | 49/80 [05:00<03:06,  6.00s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000764, train/loss_vlb_step=3.72e-6, train/loss_step=0.000764, global_step=572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000764, train/loss_vlb_step=3.72e-6, train/loss_step=0.000764, global_step=572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.88e-6, train/loss_step=0.000641, global_step=572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  64%|██████▍   | 51/80 [05:01<02:47,  5.79s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.88e-6, train/loss_step=0.000641, global_step=572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  64%|██████▍   | 51/80 [05:01<02:47,  5.79s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=4.63e-6, train/loss_step=0.000619, global_step=572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  65%|██████▌   | 52/80 [05:12<02:45,  5.90s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=4.63e-6, train/loss_step=0.000619, global_step=572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  65%|██████▌   | 52/80 [05:12<02:45,  5.90s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.73e-6, train/loss_step=0.000444, global_step=572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  66%|██████▋   | 53/80 [05:13<02:36,  5.80s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.73e-6, train/loss_step=0.000444, global_step=572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  66%|██████▋   | 53/80 [05:13<02:36,  5.80s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000677, train/loss_vlb_step=2.83e-6, train/loss_step=0.000677, global_step=573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  68%|██████▊   | 54/80 [05:13<02:28,  5.70s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000677, train/loss_vlb_step=2.83e-6, train/loss_step=0.000677, global_step=573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  68%|██████▊   | 54/80 [05:13<02:28,  5.70s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000649, train/loss_step=0.0367, global_step=573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]   Epoch 28:  69%|██████▉   | 55/80 [05:14<02:20,  5.61s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.0367, train/loss_vlb_step=0.000649, train/loss_step=0.0367, global_step=573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  69%|██████▉   | 55/80 [05:14<02:20,  5.61s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=2.34e-5, train/loss_step=0.0067, global_step=573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  70%|███████   | 56/80 [05:33<02:20,  5.85s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=2.34e-5, train/loss_step=0.0067, global_step=573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  70%|███████   | 56/80 [05:33<02:20,  5.85s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00063, train/loss_vlb_step=7.4e-6, train/loss_step=0.00063, global_step=573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  71%|███████▏  | 57/80 [05:40<02:15,  5.87s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00063, train/loss_vlb_step=7.4e-6, train/loss_step=0.00063, global_step=573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  71%|███████▏  | 57/80 [05:40<02:15,  5.87s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=8.5e-6, train/loss_step=0.00123, global_step=574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  72%|███████▎  | 58/80 [05:40<02:07,  5.78s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=8.5e-6, train/loss_step=0.00123, global_step=574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  72%|███████▎  | 58/80 [05:40<02:07,  5.78s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.04e-5, train/loss_step=0.00593, global_step=574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  74%|███████▍  | 59/80 [05:41<01:59,  5.69s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.04e-5, train/loss_step=0.00593, global_step=574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  74%|███████▍  | 59/80 [05:41<01:59,  5.69s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=9.78e-5, train/loss_step=0.0126, global_step=574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  75%|███████▌  | 60/80 [05:49<01:54,  5.72s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=9.78e-5, train/loss_step=0.0126, global_step=574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  75%|███████▌  | 60/80 [05:49<01:54,  5.72s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.64e-6, train/loss_step=0.000314, global_step=574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  76%|███████▋  | 61/80 [05:49<01:47,  5.64s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.64e-6, train/loss_step=0.000314, global_step=574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  76%|███████▋  | 61/80 [05:49<01:47,  5.64s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=1.88e-5, train/loss_step=0.0051, global_step=575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]    Epoch 28:  78%|███████▊  | 62/80 [05:50<01:40,  5.56s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0051, train/loss_vlb_step=1.88e-5, train/loss_step=0.0051, global_step=575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  78%|███████▊  | 62/80 [05:50<01:40,  5.56s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.00123, train/loss_step=0.0279, global_step=575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  79%|███████▉  | 63/80 [05:50<01:33,  5.48s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.0279, train/loss_vlb_step=0.00123, train/loss_step=0.0279, global_step=575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  79%|███████▉  | 63/80 [05:50<01:33,  5.48s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.74e-6, train/loss_step=0.000433, global_step=575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  80%|████████  | 64/80 [06:21<01:33,  5.86s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.74e-6, train/loss_step=0.000433, global_step=575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  80%|████████  | 64/80 [06:21<01:33,  5.86s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=4.87e-6, train/loss_step=0.00059, global_step=575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  81%|████████▏ | 65/80 [06:21<01:26,  5.78s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=4.87e-6, train/loss_step=0.00059, global_step=575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  81%|████████▏ | 65/80 [06:21<01:26,  5.78s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=6.99e-6, train/loss_step=0.00161, global_step=576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  82%|████████▎ | 66/80 [06:22<01:19,  5.70s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=6.99e-6, train/loss_step=0.00161, global_step=576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  82%|████████▎ | 66/80 [06:22<01:19,  5.70s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.000612, train/loss_vlb_step=3.14e-6, train/loss_step=0.000612, global_step=576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  84%|████████▍ | 67/80 [06:22<01:13,  5.63s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.000612, train/loss_vlb_step=3.14e-6, train/loss_step=0.000612, global_step=576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  84%|████████▍ | 67/80 [06:22<01:13,  5.63s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.59e-5, train/loss_step=0.00106, global_step=576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  85%|████████▌ | 68/80 [06:26<01:07,  5.60s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.59e-5, train/loss_step=0.00106, global_step=576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  85%|████████▌ | 68/80 [06:26<01:07,  5.60s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=2e-5, train/loss_step=0.000788, global_step=576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432] Epoch 28:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=2e-5, train/loss_step=0.000788, global_step=576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=1.65e-5, train/loss_step=0.00496, global_step=577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=1.65e-5, train/loss_step=0.00496, global_step=577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.57e-6, train/loss_step=0.00114, global_step=577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432] Epoch 28:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.57e-6, train/loss_step=0.00114, global_step=577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=4.01e-6, train/loss_step=0.000567, global_step=577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  90%|█████████ | 72/80 [06:52<00:45,  5.65s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=4.01e-6, train/loss_step=0.000567, global_step=577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  90%|█████████ | 72/80 [06:52<00:45,  5.65s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.95e-6, train/loss_step=0.00118, global_step=577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432] Epoch 28:  91%|█████████▏| 73/80 [06:52<00:39,  5.58s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.95e-6, train/loss_step=0.00118, global_step=577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  91%|█████████▏| 73/80 [06:52<00:39,  5.58s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=1.77e-6, train/loss_step=0.000421, global_step=578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=1.77e-6, train/loss_step=0.000421, global_step=578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.64e-6, train/loss_step=0.00056, global_step=578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 28:  94%|█████████▍| 75/80 [06:53<00:27,  5.45s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.64e-6, train/loss_step=0.00056, global_step=578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  94%|█████████▍| 75/80 [06:53<00:27,  5.45s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.76e-6, train/loss_step=0.00133, global_step=578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  95%|█████████▌| 76/80 [06:56<00:21,  5.41s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.76e-6, train/loss_step=0.00133, global_step=578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  95%|█████████▌| 76/80 [06:56<00:21,  5.41s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000223, train/loss_vlb_step=9.69e-7, train/loss_step=0.000223, global_step=578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000223, train/loss_vlb_step=9.69e-7, train/loss_step=0.000223, global_step=578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.3e-5, train/loss_step=0.0101, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]     Epoch 28:  98%|█████████▊| 78/80 [07:06<00:10,  5.39s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.3e-5, train/loss_step=0.0101, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  98%|█████████▊| 78/80 [07:06<00:10,  5.39s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=0.000668, train/loss_step=0.0135, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  99%|█████████▉| 79/80 [07:06<00:05,  5.33s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=0.000668, train/loss_step=0.0135, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28:  99%|█████████▉| 79/80 [07:06<00:05,  5.33s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=0.000209, train/loss_step=0.0156, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432] Epoch 28: 100%|██████████| 80/80 [07:07<00:00,  5.27s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=0.000209, train/loss_step=0.0156, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 28: 100%|██████████| 80/80 [07:07<00:00,  5.27s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=1.59e-6, train/loss_step=0.000453, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Average Epoch time: 427.16 seconds
+Average Peak memory 29566.72MiB
+Epoch 28:   0%|          | 0/80 [00:00<00:00, 3563.55it/s, loss=0.00441, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=1.59e-6, train/loss_step=0.000453, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 29:   0%|          | 0/80 [00:00<00:00, 1596.01it/s, loss=0.00441, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=1.59e-6, train/loss_step=0.000453, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]Epoch 29:   1%|▏         | 1/80 [00:47<31:35, 23.99s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=1.59e-6, train/loss_step=0.000453, global_step=579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=9.87e-5, train/loss_epoch=0.00432]  Epoch 29:   1%|▏         | 1/80 [00:47<31:35, 23.99s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=6.55e-5, train/loss_step=0.0072, global_step=580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]   Epoch 29:   2%|▎         | 2/80 [00:48<20:59, 16.15s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=6.55e-5, train/loss_step=0.0072, global_step=580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   2%|▎         | 2/80 [00:48<20:59, 16.15s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.83e-6, train/loss_step=0.00168, global_step=580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   4%|▍         | 3/80 [00:48<15:42, 12.24s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.83e-6, train/loss_step=0.00168, global_step=580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   4%|▍         | 3/80 [00:48<15:42, 12.24s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000913, train/loss_vlb_step=1.4e-5, train/loss_step=0.000913, global_step=580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   5%|▌         | 4/80 [00:49<12:31,  9.89s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000913, train/loss_vlb_step=1.4e-5, train/loss_step=0.000913, global_step=580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   5%|▌         | 4/80 [00:49<12:31,  9.89s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=2.8e-5, train/loss_step=0.00167, global_step=580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:   6%|▋         | 5/80 [00:49<10:24,  8.33s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=2.8e-5, train/loss_step=0.00167, global_step=580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   6%|▋         | 5/80 [00:49<10:24,  8.33s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=1.76e-6, train/loss_step=0.000452, global_step=581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   8%|▊         | 6/80 [00:50<08:53,  7.21s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=1.76e-6, train/loss_step=0.000452, global_step=581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   8%|▊         | 6/80 [00:50<08:53,  7.21s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=4.96e-6, train/loss_step=0.000697, global_step=581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   9%|▉         | 7/80 [00:50<07:44,  6.37s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=4.96e-6, train/loss_step=0.000697, global_step=581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:   9%|▉         | 7/80 [00:50<07:44,  6.37s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000212, train/loss_step=0.0109, global_step=581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]   Epoch 29:  10%|█         | 8/80 [01:27<11:40,  9.73s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000212, train/loss_step=0.0109, global_step=581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  10%|█         | 8/80 [01:27<11:40,  9.73s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7.9e-6, train/loss_step=0.00114, global_step=581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  11%|█▏        | 9/80 [01:28<10:26,  8.82s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7.9e-6, train/loss_step=0.00114, global_step=581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  11%|█▏        | 9/80 [01:28<10:26,  8.82s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=8.43e-6, train/loss_step=0.00182, global_step=582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  12%|█▎        | 10/80 [01:34<10:00,  8.57s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=8.43e-6, train/loss_step=0.00182, global_step=582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  12%|█▎        | 10/80 [01:34<10:00,  8.57s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.6e-5, train/loss_step=0.00615, global_step=582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432] Epoch 29:  14%|█▍        | 11/80 [01:34<09:04,  7.90s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.6e-5, train/loss_step=0.00615, global_step=582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  14%|█▍        | 11/80 [01:34<09:05,  7.90s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000618, train/loss_vlb_step=2.54e-6, train/loss_step=0.000618, global_step=582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  15%|█▌        | 12/80 [01:35<08:18,  7.33s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000618, train/loss_vlb_step=2.54e-6, train/loss_step=0.000618, global_step=582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  15%|█▌        | 12/80 [01:35<08:18,  7.33s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000681, train/loss_vlb_step=3.59e-6, train/loss_step=0.000681, global_step=582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  16%|█▋        | 13/80 [01:35<07:38,  6.84s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000681, train/loss_vlb_step=3.59e-6, train/loss_step=0.000681, global_step=582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  16%|█▋        | 13/80 [01:35<07:38,  6.84s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000593, train/loss_vlb_step=4e-6, train/loss_step=0.000593, global_step=583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]   Epoch 29:  18%|█▊        | 14/80 [01:36<07:03,  6.42s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000593, train/loss_vlb_step=4e-6, train/loss_step=0.000593, global_step=583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  18%|█▊        | 14/80 [01:36<07:03,  6.42s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=2.83e-6, train/loss_step=0.000584, global_step=583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  19%|█▉        | 15/80 [01:36<06:33,  6.05s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=2.83e-6, train/loss_step=0.000584, global_step=583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  19%|█▉        | 15/80 [01:36<06:33,  6.05s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=5.04e-5, train/loss_step=0.00858, global_step=583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  20%|██        | 16/80 [02:02<07:40,  7.20s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=5.04e-5, train/loss_step=0.00858, global_step=583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  20%|██        | 16/80 [02:02<07:40,  7.20s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=3.68e-5, train/loss_step=0.00882, global_step=583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  21%|██▏       | 17/80 [02:02<07:10,  6.83s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=3.68e-5, train/loss_step=0.00882, global_step=583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  21%|██▏       | 17/80 [02:02<07:10,  6.83s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.33e-5, train/loss_step=0.00191, global_step=584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432] Epoch 29:  22%|██▎       | 18/80 [02:16<07:24,  7.17s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.33e-5, train/loss_step=0.00191, global_step=584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  22%|██▎       | 18/80 [02:16<07:24,  7.17s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=3.72e-5, train/loss_step=0.0108, global_step=584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432] Epoch 29:  24%|██▍       | 19/80 [02:16<06:57,  6.84s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=3.72e-5, train/loss_step=0.0108, global_step=584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  24%|██▍       | 19/80 [02:16<06:57,  6.84s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000918, train/loss_vlb_step=5.09e-6, train/loss_step=0.000918, global_step=584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  25%|██▌       | 20/80 [02:17<06:32,  6.54s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000918, train/loss_vlb_step=5.09e-6, train/loss_step=0.000918, global_step=584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  25%|██▌       | 20/80 [02:17<06:32,  6.54s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=5.35e-6, train/loss_step=0.0013, global_step=584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]    Epoch 29:  26%|██▋       | 21/80 [02:17<06:09,  6.26s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=5.35e-6, train/loss_step=0.0013, global_step=584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  26%|██▋       | 21/80 [02:17<06:09,  6.27s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=1.97e-5, train/loss_step=0.00583, global_step=585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  28%|██▊       | 22/80 [02:18<05:48,  6.01s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=1.97e-5, train/loss_step=0.00583, global_step=585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  28%|██▊       | 22/80 [02:18<05:48,  6.01s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=6.27e-5, train/loss_step=0.0109, global_step=585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432] Epoch 29:  29%|██▉       | 23/80 [02:18<05:29,  5.78s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=6.27e-5, train/loss_step=0.0109, global_step=585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  29%|██▉       | 23/80 [02:18<05:29,  5.78s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.14e-5, train/loss_step=0.00305, global_step=585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  30%|███       | 24/80 [02:41<06:02,  6.47s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.14e-5, train/loss_step=0.00305, global_step=585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  30%|███       | 24/80 [02:41<06:02,  6.47s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=1.58e-5, train/loss_step=0.00417, global_step=585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  31%|███▏      | 25/80 [02:42<05:43,  6.25s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=1.58e-5, train/loss_step=0.00417, global_step=585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  31%|███▏      | 25/80 [02:42<05:43,  6.25s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=1.58e-5, train/loss_step=0.00435, global_step=586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  32%|███▎      | 26/80 [03:00<06:01,  6.69s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=1.58e-5, train/loss_step=0.00435, global_step=586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  32%|███▎      | 26/80 [03:00<06:01,  6.69s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.00085, train/loss_step=0.0224, global_step=586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  34%|███▍      | 27/80 [03:01<05:42,  6.47s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.00085, train/loss_step=0.0224, global_step=586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  34%|███▍      | 27/80 [03:01<05:42,  6.47s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=7.8e-5, train/loss_step=0.00871, global_step=586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  35%|███▌      | 28/80 [03:08<05:37,  6.49s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=7.8e-5, train/loss_step=0.00871, global_step=586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  35%|███▌      | 28/80 [03:08<05:37,  6.49s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00093, train/loss_vlb_step=3.88e-6, train/loss_step=0.00093, global_step=586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  36%|███▋      | 29/80 [03:08<05:20,  6.29s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00093, train/loss_vlb_step=3.88e-6, train/loss_step=0.00093, global_step=586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  36%|███▋      | 29/80 [03:08<05:20,  6.29s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.5e-5, train/loss_step=0.0102, global_step=587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]   Epoch 29:  38%|███▊      | 30/80 [03:09<05:05,  6.10s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.5e-5, train/loss_step=0.0102, global_step=587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  38%|███▊      | 30/80 [03:09<05:05,  6.10s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.54e-5, train/loss_step=0.0134, global_step=587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  39%|███▉      | 31/80 [03:09<04:50,  5.93s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.54e-5, train/loss_step=0.0134, global_step=587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  39%|███▉      | 31/80 [03:09<04:50,  5.93s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=2.58e-5, train/loss_step=0.00256, global_step=587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  40%|████      | 32/80 [03:36<05:14,  6.55s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=2.58e-5, train/loss_step=0.00256, global_step=587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  40%|████      | 32/80 [03:36<05:14,  6.55s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.13e-5, train/loss_step=0.00156, global_step=587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  41%|████▏     | 33/80 [03:36<04:59,  6.37s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.13e-5, train/loss_step=0.00156, global_step=587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  41%|████▏     | 33/80 [03:36<04:59,  6.37s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000196, train/loss_step=0.0158, global_step=588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432] Epoch 29:  42%|████▎     | 34/80 [03:39<04:48,  6.28s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000196, train/loss_step=0.0158, global_step=588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  42%|████▎     | 34/80 [03:39<04:48,  6.28s/it, loss=0.00707, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.91e-5, train/loss_step=0.00512, global_step=588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00707, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.91e-5, train/loss_step=0.00512, global_step=588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.000751, train/loss_vlb_step=3.99e-6, train/loss_step=0.000751, global_step=588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  45%|████▌     | 36/80 [03:58<04:43,  6.44s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.000751, train/loss_vlb_step=3.99e-6, train/loss_step=0.000751, global_step=588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  45%|████▌     | 36/80 [03:58<04:43,  6.44s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=9.73e-6, train/loss_step=0.00171, global_step=588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  46%|████▋     | 37/80 [03:58<04:30,  6.29s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=9.73e-6, train/loss_step=0.00171, global_step=588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  46%|████▋     | 37/80 [03:58<04:30,  6.29s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=6.36e-6, train/loss_step=0.00147, global_step=589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432] Epoch 29:  48%|████▊     | 38/80 [03:59<04:17,  6.14s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=6.36e-6, train/loss_step=0.00147, global_step=589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  48%|████▊     | 38/80 [03:59<04:17,  6.14s/it, loss=0.00619, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=0.000725, train/loss_step=0.00861, global_step=589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  49%|████▉     | 39/80 [03:59<04:05,  6.00s/it, loss=0.00619, v_num=0, train/loss_simple_step=0.00861, train/loss_vlb_step=0.000725, train/loss_step=0.00861, global_step=589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  49%|████▉     | 39/80 [03:59<04:05,  6.00s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=2.09e-5, train/loss_step=0.0022, global_step=589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]   Epoch 29:  50%|█████     | 40/80 [04:16<04:10,  6.26s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=2.09e-5, train/loss_step=0.0022, global_step=589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  50%|█████     | 40/80 [04:16<04:10,  6.26s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.000677, train/loss_vlb_step=2.75e-6, train/loss_step=0.000677, global_step=589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  51%|█████▏    | 41/80 [04:17<03:58,  6.12s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.000677, train/loss_vlb_step=2.75e-6, train/loss_step=0.000677, global_step=589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  51%|█████▏    | 41/80 [04:17<03:58,  6.12s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000261, train/loss_step=0.015, global_step=590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]     Epoch 29:  52%|█████▎    | 42/80 [04:17<03:47,  5.99s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000261, train/loss_step=0.015, global_step=590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  52%|█████▎    | 42/80 [04:17<03:47,  5.99s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.6e-5, train/loss_step=0.00352, global_step=590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  54%|█████▍    | 43/80 [04:18<03:37,  5.87s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.6e-5, train/loss_step=0.00352, global_step=590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  54%|█████▍    | 43/80 [04:18<03:37,  5.87s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=6.2e-5, train/loss_step=0.00515, global_step=590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=6.2e-5, train/loss_step=0.00515, global_step=590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.62e-6, train/loss_step=0.00111, global_step=590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.62e-6, train/loss_step=0.00111, global_step=590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.08e-5, train/loss_step=0.00737, global_step=591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  57%|█████▊    | 46/80 [04:40<03:22,  5.97s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=3.08e-5, train/loss_step=0.00737, global_step=591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  57%|█████▊    | 46/80 [04:40<03:22,  5.97s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=4.64e-5, train/loss_step=0.0124, global_step=591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  59%|█████▉    | 47/80 [04:41<03:13,  5.86s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=4.64e-5, train/loss_step=0.0124, global_step=591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  59%|█████▉    | 47/80 [04:41<03:13,  5.86s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=8.25e-6, train/loss_step=0.00194, global_step=591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  60%|██████    | 48/80 [04:56<03:13,  6.05s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=8.25e-6, train/loss_step=0.00194, global_step=591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  60%|██████    | 48/80 [04:56<03:13,  6.05s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=2.18e-6, train/loss_step=0.000433, global_step=591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  61%|██████▏   | 49/80 [04:57<03:04,  5.95s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=2.18e-6, train/loss_step=0.000433, global_step=591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  61%|██████▏   | 49/80 [04:57<03:04,  5.95s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000108, train/loss_step=0.0125, global_step=592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]   Epoch 29:  62%|██████▎   | 50/80 [04:57<02:55,  5.84s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000108, train/loss_step=0.0125, global_step=592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  62%|██████▎   | 50/80 [04:57<02:55,  5.84s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00058, train/loss_vlb_step=4.35e-6, train/loss_step=0.00058, global_step=592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  64%|██████▍   | 51/80 [04:58<02:46,  5.74s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00058, train/loss_vlb_step=4.35e-6, train/loss_step=0.00058, global_step=592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  64%|██████▍   | 51/80 [04:58<02:46,  5.74s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.24e-5, train/loss_step=0.00155, global_step=592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.24e-5, train/loss_step=0.00155, global_step=592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=1.67e-5, train/loss_step=0.00498, global_step=592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  66%|██████▋   | 53/80 [05:11<02:35,  5.77s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=1.67e-5, train/loss_step=0.00498, global_step=592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  66%|██████▋   | 53/80 [05:11<02:35,  5.77s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=7.35e-6, train/loss_step=0.00181, global_step=593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=7.35e-6, train/loss_step=0.00181, global_step=593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=7.07e-5, train/loss_step=0.0102, global_step=593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  69%|██████▉   | 55/80 [05:12<02:19,  5.58s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=7.07e-5, train/loss_step=0.0102, global_step=593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  69%|██████▉   | 55/80 [05:12<02:19,  5.58s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=1.77e-5, train/loss_step=0.00535, global_step=593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  70%|███████   | 56/80 [05:37<02:21,  5.92s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=1.77e-5, train/loss_step=0.00535, global_step=593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  70%|███████   | 56/80 [05:37<02:21,  5.92s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.62e-6, train/loss_step=0.000375, global_step=593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  71%|███████▏  | 57/80 [05:37<02:14,  5.83s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.62e-6, train/loss_step=0.000375, global_step=593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  71%|███████▏  | 57/80 [05:37<02:14,  5.83s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.36e-5, train/loss_step=0.00615, global_step=594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  72%|███████▎  | 58/80 [05:38<02:06,  5.74s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.36e-5, train/loss_step=0.00615, global_step=594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  72%|███████▎  | 58/80 [05:38<02:06,  5.74s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=2.57e-6, train/loss_step=0.000536, global_step=594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  74%|███████▍  | 59/80 [05:38<01:58,  5.65s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=2.57e-6, train/loss_step=0.000536, global_step=594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  74%|███████▍  | 59/80 [05:38<01:58,  5.65s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=6.35e-5, train/loss_step=0.0125, global_step=594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]     Epoch 29:  75%|███████▌  | 60/80 [06:00<01:58,  5.91s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=6.35e-5, train/loss_step=0.0125, global_step=594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  75%|███████▌  | 60/80 [06:00<01:58,  5.91s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.61e-5, train/loss_step=0.0083, global_step=594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  76%|███████▋  | 61/80 [06:00<01:50,  5.82s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=4.61e-5, train/loss_step=0.0083, global_step=594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  76%|███████▋  | 61/80 [06:00<01:50,  5.82s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=2.48e-5, train/loss_step=0.00103, global_step=595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  78%|███████▊  | 62/80 [06:01<01:43,  5.73s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=2.48e-5, train/loss_step=0.00103, global_step=595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  78%|███████▊  | 62/80 [06:01<01:43,  5.73s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=7.04e-6, train/loss_step=0.00175, global_step=595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432] Epoch 29:  79%|███████▉  | 63/80 [06:01<01:36,  5.65s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=7.04e-6, train/loss_step=0.00175, global_step=595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  79%|███████▉  | 63/80 [06:01<01:36,  5.65s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=7.03e-6, train/loss_step=0.00145, global_step=595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  80%|████████  | 64/80 [06:28<01:35,  5.98s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=7.03e-6, train/loss_step=0.00145, global_step=595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  80%|████████  | 64/80 [06:28<01:35,  5.98s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=2.99e-5, train/loss_step=0.00801, global_step=595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  81%|████████▏ | 65/80 [06:29<01:28,  5.90s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=2.99e-5, train/loss_step=0.00801, global_step=595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  81%|████████▏ | 65/80 [06:29<01:28,  5.90s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000335, train/loss_vlb_step=1.32e-6, train/loss_step=0.000335, global_step=596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  82%|████████▎ | 66/80 [06:29<01:21,  5.82s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000335, train/loss_vlb_step=1.32e-6, train/loss_step=0.000335, global_step=596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  82%|████████▎ | 66/80 [06:29<01:21,  5.82s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000607, train/loss_vlb_step=4.42e-6, train/loss_step=0.000607, global_step=596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000607, train/loss_vlb_step=4.42e-6, train/loss_step=0.000607, global_step=596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=3.04e-5, train/loss_step=0.00828, global_step=596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  85%|████████▌ | 68/80 [06:36<01:09,  5.75s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=3.04e-5, train/loss_step=0.00828, global_step=596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  85%|████████▌ | 68/80 [06:36<01:09,  5.75s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.69e-5, train/loss_step=0.0174, global_step=596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=7.69e-5, train/loss_step=0.0174, global_step=596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=1.24e-5, train/loss_step=0.00164, global_step=597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  88%|████████▊ | 70/80 [06:37<00:56,  5.61s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=1.24e-5, train/loss_step=0.00164, global_step=597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  88%|████████▊ | 70/80 [06:37<00:56,  5.61s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=7.47e-6, train/loss_step=0.000733, global_step=597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  89%|████████▉ | 71/80 [06:38<00:49,  5.53s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=7.47e-6, train/loss_step=0.000733, global_step=597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  89%|████████▉ | 71/80 [06:38<00:49,  5.53s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=3.75e-5, train/loss_step=0.00447, global_step=597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 29:  90%|█████████ | 72/80 [07:06<00:46,  5.85s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=3.75e-5, train/loss_step=0.00447, global_step=597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  90%|█████████ | 72/80 [07:06<00:46,  5.85s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=4.99e-6, train/loss_step=0.00139, global_step=597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  91%|█████████▏| 73/80 [07:07<00:40,  5.77s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=4.99e-6, train/loss_step=0.00139, global_step=597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  91%|█████████▏| 73/80 [07:07<00:40,  5.77s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=3.48e-5, train/loss_step=0.00973, global_step=598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  92%|█████████▎| 74/80 [07:07<00:34,  5.70s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=3.48e-5, train/loss_step=0.00973, global_step=598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  92%|█████████▎| 74/80 [07:07<00:34,  5.70s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00078, train/loss_vlb_step=4.07e-6, train/loss_step=0.00078, global_step=598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00078, train/loss_vlb_step=4.07e-6, train/loss_step=0.00078, global_step=598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000854, train/loss_vlb_step=3.7e-6, train/loss_step=0.000854, global_step=598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  95%|█████████▌| 76/80 [07:11<00:22,  5.60s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000854, train/loss_vlb_step=3.7e-6, train/loss_step=0.000854, global_step=598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  95%|█████████▌| 76/80 [07:11<00:22,  5.60s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=3.08e-6, train/loss_step=0.000641, global_step=598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  96%|█████████▋| 77/80 [07:11<00:16,  5.53s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=3.08e-6, train/loss_step=0.000641, global_step=598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  96%|█████████▋| 77/80 [07:11<00:16,  5.53s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=1.29e-5, train/loss_step=0.0014, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]    Epoch 29:  98%|█████████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=1.29e-5, train/loss_step=0.0014, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  98%|██��██████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=9.4e-6, train/loss_step=0.00258, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=9.4e-6, train/loss_step=0.00258, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=5.95e-6, train/loss_step=0.00145, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=5.95e-6, train/loss_step=0.00145, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 29: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000266, train/loss_vlb_step=1.04e-6, train/loss_step=0.000266, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Average Epoch time: 433.20 seconds
+Average Peak memory 29564.10MiB
+Epoch 29:   0%|          | 0/80 [00:00<00:00, 5745.62it/s, loss=0.00324, v_num=0, train/loss_simple_step=0.000266, train/loss_vlb_step=1.04e-6, train/loss_step=0.000266, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 30:   0%|          | 0/80 [00:00<00:00, 2055.02it/s, loss=0.00324, v_num=0, train/loss_simple_step=0.000266, train/loss_vlb_step=1.04e-6, train/loss_step=0.000266, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]Epoch 30:   1%|▏         | 1/80 [00:45<29:39, 22.53s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000266, train/loss_vlb_step=1.04e-6, train/loss_step=0.000266, global_step=599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00432]  Epoch 30:   1%|▏         | 1/80 [00:45<29:39, 22.53s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.18e-5, train/loss_step=0.00342, global_step=600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:   2%|▎         | 2/80 [00:45<19:43, 15.18s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.18e-5, train/loss_step=0.00342, global_step=600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   2%|▎         | 2/80 [00:45<19:43, 15.18s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.06e-5, train/loss_step=0.0101, global_step=600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:   4%|▍         | 3/80 [00:46<14:46, 11.51s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.06e-5, train/loss_step=0.0101, global_step=600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   4%|▍         | 3/80 [00:46<14:46, 11.51s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=8.25e-5, train/loss_step=0.0134, global_step=600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   5%|▌         | 4/80 [00:46<11:47,  9.31s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=8.25e-5, train/loss_step=0.0134, global_step=600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   5%|▌         | 4/80 [00:46<11:47,  9.31s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.22e-5, train/loss_step=0.00368, global_step=600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   6%|▋         | 5/80 [00:47<09:48,  7.85s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.22e-5, train/loss_step=0.00368, global_step=600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   6%|▋         | 5/80 [00:47<09:48,  7.85s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=2.08e-5, train/loss_step=0.00582, global_step=601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   8%|▊         | 6/80 [00:47<08:22,  6.79s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=2.08e-5, train/loss_step=0.00582, global_step=601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   8%|▊         | 6/80 [00:47<08:22,  6.80s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=1.56e-5, train/loss_step=0.00468, global_step=601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   9%|▉         | 7/80 [00:48<07:18,  6.01s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=1.56e-5, train/loss_step=0.00468, global_step=601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:   9%|▉         | 7/80 [00:48<07:18,  6.01s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.15e-5, train/loss_step=0.00562, global_step=601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  10%|█         | 8/80 [01:11<09:29,  7.91s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=2.15e-5, train/loss_step=0.00562, global_step=601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  10%|█         | 8/80 [01:11<09:29,  7.91s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=1.45e-6, train/loss_step=0.000386, global_step=601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  11%|█▏        | 9/80 [01:24<09:59,  8.44s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=1.45e-6, train/loss_step=0.000386, global_step=601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  11%|█▏        | 9/80 [01:24<09:59,  8.44s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=7.91e-5, train/loss_step=0.00348, global_step=602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  12%|█▎        | 10/80 [01:24<09:00,  7.72s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=7.91e-5, train/loss_step=0.00348, global_step=602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  12%|█▎        | 10/80 [01:24<09:00,  7.72s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000752, train/loss_vlb_step=9.54e-6, train/loss_step=0.000752, global_step=602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  14%|█▍        | 11/80 [01:25<08:11,  7.12s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000752, train/loss_vlb_step=9.54e-6, train/loss_step=0.000752, global_step=602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  14%|█▍        | 11/80 [01:25<08:11,  7.12s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=2.78e-5, train/loss_step=0.00742, global_step=602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  15%|█▌        | 12/80 [01:25<07:29,  6.61s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=2.78e-5, train/loss_step=0.00742, global_step=602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  15%|█▌        | 12/80 [01:25<07:29,  6.61s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2.3e-6, train/loss_step=0.000398, global_step=602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  16%|█▋        | 13/80 [01:26<06:53,  6.17s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2.3e-6, train/loss_step=0.000398, global_step=602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  16%|█▋        | 13/80 [01:26<06:53,  6.17s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.00142, train/loss_step=0.0229, global_step=603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]    Epoch 30:  18%|█▊        | 14/80 [01:26<06:22,  5.80s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.00142, train/loss_step=0.0229, global_step=603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  18%|█▊        | 14/80 [01:26<06:22,  5.80s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000745, train/loss_vlb_step=8.45e-6, train/loss_step=0.000745, global_step=603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  19%|█▉        | 15/80 [01:27<05:55,  5.46s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000745, train/loss_vlb_step=8.45e-6, train/loss_step=0.000745, global_step=603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  19%|█▉        | 15/80 [01:27<05:55,  5.46s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=5.37e-5, train/loss_step=0.00222, global_step=603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  20%|██        | 16/80 [01:50<06:56,  6.51s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=5.37e-5, train/loss_step=0.00222, global_step=603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  20%|██        | 16/80 [01:50<06:56,  6.51s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=0.000222, train/loss_step=0.0164, global_step=603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  21%|██▏       | 17/80 [01:59<06:57,  6.63s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=0.000222, train/loss_step=0.0164, global_step=603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  21%|██▏       | 17/80 [01:59<06:57,  6.63s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.29e-5, train/loss_step=0.0111, global_step=604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  22%|██▎       | 18/80 [01:59<06:31,  6.31s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.29e-5, train/loss_step=0.0111, global_step=604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  22%|██▎       | 18/80 [01:59<06:31,  6.31s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=2.42e-6, train/loss_step=0.000563, global_step=604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  24%|██▍       | 19/80 [02:00<06:07,  6.02s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=2.42e-6, train/loss_step=0.000563, global_step=604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  24%|██▍       | 19/80 [02:00<06:07,  6.02s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=7.38e-6, train/loss_step=0.00116, global_step=604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  25%|██▌       | 20/80 [02:01<05:47,  5.79s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=7.38e-6, train/loss_step=0.00116, global_step=604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  25%|██▌       | 20/80 [02:01<05:47,  5.79s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=2.29e-5, train/loss_step=0.00627, global_step=604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  26%|██▋       | 21/80 [02:02<05:27,  5.55s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=2.29e-5, train/loss_step=0.00627, global_step=604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  26%|██▋       | 21/80 [02:02<05:27,  5.55s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000921, train/loss_vlb_step=3.42e-6, train/loss_step=0.000921, global_step=605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  28%|██▊       | 22/80 [02:02<05:09,  5.33s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000921, train/loss_vlb_step=3.42e-6, train/loss_step=0.000921, global_step=605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  28%|██▊       | 22/80 [02:02<05:09,  5.33s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=0.000286, train/loss_step=0.00302, global_step=605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  29%|██▉       | 23/80 [02:03<04:52,  5.13s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=0.000286, train/loss_step=0.00302, global_step=605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  29%|██▉       | 23/80 [02:03<04:52,  5.13s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=9.47e-5, train/loss_step=0.0154, global_step=605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]   Epoch 30:  30%|███       | 24/80 [02:30<05:37,  6.03s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=9.47e-5, train/loss_step=0.0154, global_step=605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  30%|███       | 24/80 [02:30<05:37,  6.03s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=4.55e-6, train/loss_step=0.000802, global_step=605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  31%|███▏      | 25/80 [02:46<05:51,  6.39s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=4.55e-6, train/loss_step=0.000802, global_step=605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  31%|███▏      | 25/80 [02:46<05:51,  6.39s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=8.14e-5, train/loss_step=0.00759, global_step=606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  32%|███▎      | 26/80 [02:46<05:33,  6.17s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00759, train/loss_vlb_step=8.14e-5, train/loss_step=0.00759, global_step=606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  32%|███▎      | 26/80 [02:46<05:33,  6.17s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=5.87e-6, train/loss_step=0.00125, global_step=606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  34%|███▍      | 27/80 [02:47<05:16,  5.97s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=5.87e-6, train/loss_step=0.00125, global_step=606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  34%|███▍      | 27/80 [02:47<05:16,  5.97s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.33e-6, train/loss_step=0.00033, global_step=606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  35%|███▌      | 28/80 [02:48<05:01,  5.79s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.33e-6, train/loss_step=0.00033, global_step=606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  35%|███▌      | 28/80 [02:48<05:01,  5.79s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=7.49e-5, train/loss_step=0.0106, global_step=606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  36%|███▋      | 29/80 [02:48<04:46,  5.62s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=7.49e-5, train/loss_step=0.0106, global_step=606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  36%|███▋      | 29/80 [02:48<04:46,  5.62s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=4.75e-5, train/loss_step=0.0069, global_step=607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  38%|███▊      | 30/80 [02:49<04:32,  5.46s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=4.75e-5, train/loss_step=0.0069, global_step=607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  38%|███▊      | 30/80 [02:49<04:32,  5.46s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.42e-5, train/loss_step=0.0035, global_step=607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  39%|███▉      | 31/80 [02:49<04:19,  5.30s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.42e-5, train/loss_step=0.0035, global_step=607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  39%|███▉      | 31/80 [02:49<04:19,  5.30s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=2.67e-5, train/loss_step=0.00652, global_step=607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  40%|████      | 32/80 [03:08<04:33,  5.70s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.00652, train/loss_vlb_step=2.67e-5, train/loss_step=0.00652, global_step=607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  40%|████      | 32/80 [03:08<04:33,  5.70s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.21e-6, train/loss_step=0.0003, global_step=607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  41%|████▏     | 33/80 [03:23<04:40,  5.97s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.21e-6, train/loss_step=0.0003, global_step=607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  41%|████▏     | 33/80 [03:23<04:40,  5.97s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=0.000232, train/loss_step=0.00251, global_step=608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  42%|████▎     | 34/80 [03:23<04:27,  5.82s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=0.000232, train/loss_step=0.00251, global_step=608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  42%|████▎     | 34/80 [03:23<04:27,  5.82s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000992, train/loss_vlb_step=3.97e-6, train/loss_step=0.000992, global_step=608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  44%|████▍     | 35/80 [03:24<04:15,  5.67s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000992, train/loss_vlb_step=3.97e-6, train/loss_step=0.000992, global_step=608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  44%|████▍     | 35/80 [03:24<04:15,  5.67s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000826, train/loss_vlb_step=3.91e-6, train/loss_step=0.000826, global_step=608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  45%|████▌     | 36/80 [03:24<04:03,  5.54s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000826, train/loss_vlb_step=3.91e-6, train/loss_step=0.000826, global_step=608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  45%|████▌     | 36/80 [03:24<04:03,  5.54s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=0.00301, train/loss_step=0.00831, global_step=608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  46%|████▋     | 37/80 [03:25<03:52,  5.41s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=0.00301, train/loss_step=0.00831, global_step=608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  46%|████▋     | 37/80 [03:25<03:52,  5.41s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000102, train/loss_step=0.0134, global_step=609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  48%|████▊     | 38/80 [03:25<03:41,  5.28s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000102, train/loss_step=0.0134, global_step=609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  48%|████▊     | 38/80 [03:25<03:41,  5.28s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=0.000301, train/loss_step=0.00148, global_step=609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  49%|████▉     | 39/80 [03:26<03:31,  5.16s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=0.000301, train/loss_step=0.00148, global_step=609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  49%|████▉     | 39/80 [03:26<03:31,  5.16s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000598, train/loss_vlb_step=4.49e-6, train/loss_step=0.000598, global_step=609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  50%|█████     | 40/80 [03:42<03:36,  5.42s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000598, train/loss_vlb_step=4.49e-6, train/loss_step=0.000598, global_step=609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  50%|█████     | 40/80 [03:42<03:36,  5.42s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.17e-6, train/loss_step=0.000308, global_step=609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  51%|█████▏    | 41/80 [04:11<03:53,  5.98s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.17e-6, train/loss_step=0.000308, global_step=609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  51%|█████▏    | 41/80 [04:11<03:53,  5.98s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=3.24e-6, train/loss_step=0.000684, global_step=610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  52%|█████▎    | 42/80 [04:11<03:42,  5.85s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=3.24e-6, train/loss_step=0.000684, global_step=610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  52%|█████▎    | 42/80 [04:11<03:42,  5.85s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=7.77e-6, train/loss_step=0.00191, global_step=610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  54%|█████▍    | 43/80 [04:12<03:32,  5.73s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=7.77e-6, train/loss_step=0.00191, global_step=610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  54%|█████▍    | 43/80 [04:12<03:32,  5.73s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.63e-5, train/loss_step=0.00326, global_step=610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  55%|█████▌    | 44/80 [04:14<03:23,  5.65s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.63e-5, train/loss_step=0.00326, global_step=610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  55%|█████▌    | 44/80 [04:14<03:23,  5.65s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000869, train/loss_vlb_step=1.32e-5, train/loss_step=0.000869, global_step=610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  56%|█████▋    | 45/80 [04:14<03:13,  5.54s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000869, train/loss_vlb_step=1.32e-5, train/loss_step=0.000869, global_step=610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  56%|█████▋    | 45/80 [04:14<03:13,  5.54s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=1.46e-6, train/loss_step=0.000406, global_step=611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  57%|█████▊    | 46/80 [04:15<03:04,  5.43s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=1.46e-6, train/loss_step=0.000406, global_step=611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  57%|█████▊    | 46/80 [04:15<03:04,  5.43s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=1.88e-5, train/loss_step=0.00142, global_step=611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  59%|█████▉    | 47/80 [04:15<02:55,  5.33s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=1.88e-5, train/loss_step=0.00142, global_step=611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  59%|█████▉    | 47/80 [04:15<02:55,  5.33s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.37e-5, train/loss_step=0.00796, global_step=611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  60%|██████    | 48/80 [04:32<02:57,  5.56s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.37e-5, train/loss_step=0.00796, global_step=611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  60%|██████    | 48/80 [04:32<02:57,  5.56s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.000504, train/loss_step=0.0191, global_step=611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  61%|██████▏   | 49/80 [05:05<03:09,  6.11s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.000504, train/loss_step=0.0191, global_step=611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  61%|██████▏   | 49/80 [05:05<03:09,  6.11s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=3.8e-5, train/loss_step=0.00855, global_step=612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  62%|██████▎   | 50/80 [05:06<03:00,  6.00s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00855, train/loss_vlb_step=3.8e-5, train/loss_step=0.00855, global_step=612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  62%|██████▎   | 50/80 [05:06<03:00,  6.00s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000965, train/loss_vlb_step=5.33e-6, train/loss_step=0.000965, global_step=612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  64%|██████▍   | 51/80 [05:06<02:51,  5.90s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000965, train/loss_vlb_step=5.33e-6, train/loss_step=0.000965, global_step=612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  64%|██████▍   | 51/80 [05:06<02:51,  5.90s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=6.86e-5, train/loss_step=0.00194, global_step=612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 30:  65%|██████▌   | 52/80 [05:07<02:42,  5.80s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=6.86e-5, train/loss_step=0.00194, global_step=612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  65%|██████▌   | 52/80 [05:07<02:42,  5.80s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=4.93e-6, train/loss_step=0.000865, global_step=612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  66%|██████▋   | 53/80 [05:07<02:33,  5.70s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=4.93e-6, train/loss_step=0.000865, global_step=612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  66%|██████▋   | 53/80 [05:07<02:33,  5.70s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=8.95e-5, train/loss_step=0.0105, global_step=613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]    Epoch 30:  68%|██████▊   | 54/80 [05:08<02:25,  5.60s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=8.95e-5, train/loss_step=0.0105, global_step=613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  68%|██████▊   | 54/80 [05:08<02:25,  5.60s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=2.87e-6, train/loss_step=0.000631, global_step=613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  69%|██████▉   | 55/80 [05:08<02:17,  5.51s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=2.87e-6, train/loss_step=0.000631, global_step=613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  69%|██████▉   | 55/80 [05:08<02:17,  5.51s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=9.15e-5, train/loss_step=0.0163, global_step=613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]   Epoch 30:  70%|███████   | 56/80 [05:09<02:10,  5.43s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=9.15e-5, train/loss_step=0.0163, global_step=613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  70%|███████   | 56/80 [05:09<02:10,  5.43s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=0.000344, train/loss_step=0.0035, global_step=613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  71%|███████▏  | 57/80 [05:40<02:15,  5.88s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=0.000344, train/loss_step=0.0035, global_step=613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  71%|███████▏  | 57/80 [05:40<02:15,  5.88s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.34e-5, train/loss_step=0.00368, global_step=614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  72%|███████▎  | 58/80 [05:41<02:07,  5.78s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.34e-5, train/loss_step=0.00368, global_step=614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  72%|███████▎  | 58/80 [05:41<02:07,  5.78s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7.66e-6, train/loss_step=0.00114, global_step=614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7.66e-6, train/loss_step=0.00114, global_step=614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.25e-5, train/loss_step=0.00557, global_step=614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  75%|███████▌  | 60/80 [05:42<01:52,  5.61s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.25e-5, train/loss_step=0.00557, global_step=614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  75%|███████▌  | 60/80 [05:42<01:52,  5.61s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=8.6e-7, train/loss_step=0.00024, global_step=614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  76%|███████▋  | 61/80 [05:53<01:48,  5.69s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=8.6e-7, train/loss_step=0.00024, global_step=614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  76%|███████▋  | 61/80 [05:53<01:48,  5.69s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=3.85e-6, train/loss_step=0.000857, global_step=615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  78%|███████▊  | 62/80 [05:53<01:40,  5.61s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=3.85e-6, train/loss_step=0.000857, global_step=615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  78%|███████▊  | 62/80 [05:53<01:40,  5.61s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000102, train/loss_step=0.0124, global_step=615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]   Epoch 30:  79%|███████▉  | 63/80 [05:53<01:34,  5.53s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000102, train/loss_step=0.0124, global_step=615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  79%|███████▉  | 63/80 [05:53<01:34,  5.53s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000961, train/loss_vlb_step=1.1e-5, train/loss_step=0.000961, global_step=615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  80%|████████  | 64/80 [05:54<01:27,  5.45s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000961, train/loss_vlb_step=1.1e-5, train/loss_step=0.000961, global_step=615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  80%|████████  | 64/80 [05:54<01:27,  5.45s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=3.44e-5, train/loss_step=0.00405, global_step=615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  81%|████████▏ | 65/80 [06:20<01:26,  5.76s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=3.44e-5, train/loss_step=0.00405, global_step=615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  81%|��███████▏ | 65/80 [06:20<01:26,  5.76s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=0.000216, train/loss_step=0.023, global_step=616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]   Epoch 30:  82%|████████▎ | 66/80 [06:20<01:19,  5.69s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=0.000216, train/loss_step=0.023, global_step=616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  82%|████████▎ | 66/80 [06:20<01:19,  5.69s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.46e-5, train/loss_step=0.00375, global_step=616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  84%|████████▍ | 67/80 [06:21<01:12,  5.61s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.46e-5, train/loss_step=0.00375, global_step=616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  84%|████████▍ | 67/80 [06:21<01:12,  5.61s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=9.42e-7, train/loss_step=0.000273, global_step=616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  85%|████████▌ | 68/80 [06:24<01:06,  5.57s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=9.42e-7, train/loss_step=0.000273, global_step=616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  85%|████████▌ | 68/80 [06:24<01:06,  5.57s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000903, train/loss_vlb_step=1.54e-5, train/loss_step=0.000903, global_step=616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  86%|████████▋ | 69/80 [06:35<01:02,  5.65s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000903, train/loss_vlb_step=1.54e-5, train/loss_step=0.000903, global_step=616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  86%|████████▋ | 69/80 [06:35<01:02,  5.65s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=2.41e-6, train/loss_step=0.000574, global_step=617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  88%|████████▊ | 70/80 [06:35<00:55,  5.58s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=2.41e-6, train/loss_step=0.000574, global_step=617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  88%|████████▊ | 70/80 [06:35<00:55,  5.58s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000903, train/loss_vlb_step=6.64e-6, train/loss_step=0.000903, global_step=617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409] Epoch 30:  89%|████████▉ | 71/80 [06:36<00:49,  5.51s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000903, train/loss_vlb_step=6.64e-6, train/loss_step=0.000903, global_step=617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  89%|████████▉ | 71/80 [06:36<00:49,  5.51s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=6.37e-5, train/loss_step=0.0072, global_step=617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]   Epoch 30:  90%|█████████ | 72/80 [06:36<00:43,  5.44s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=6.37e-5, train/loss_step=0.0072, global_step=617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  90%|█████████ | 72/80 [06:36<00:43,  5.44s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=4.34e-5, train/loss_step=0.00569, global_step=617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  91%|█████████▏| 73/80 [06:51<00:38,  5.56s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=4.34e-5, train/loss_step=0.00569, global_step=617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  91%|█████████▏| 73/80 [06:51<00:38,  5.56s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.79e-6, train/loss_step=0.00211, global_step=618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  92%|█████████▎| 74/80 [06:52<00:32,  5.50s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.79e-6, train/loss_step=0.00211, global_step=618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  92%|█████████▎| 74/80 [06:52<00:32,  5.50s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=1.44e-5, train/loss_step=0.00424, global_step=618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  94%|█████████▍| 75/80 [06:52<00:27,  5.43s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=1.44e-5, train/loss_step=0.00424, global_step=618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  94%|█████████▍| 75/80 [06:52<00:27,  5.43s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=1.95e-5, train/loss_step=0.00571, global_step=618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=1.95e-5, train/loss_step=0.00571, global_step=618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.05e-5, train/loss_step=0.00291, global_step=618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  96%|█████████▋| 77/80 [07:08<00:16,  5.49s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.05e-5, train/loss_step=0.00291, global_step=618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  96%|█████████▋| 77/80 [07:08<00:16,  5.49s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=1.79e-5, train/loss_step=0.0054, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]   Epoch 30:  98%|█████████▊| 78/80 [07:09<00:10,  5.43s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=1.79e-5, train/loss_step=0.0054, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  98%|█████████▊| 78/80 [07:09<00:10,  5.43s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000529, train/loss_vlb_step=2.59e-6, train/loss_step=0.000529, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  99%|█████████▉| 79/80 [07:09<00:05,  5.37s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000529, train/loss_vlb_step=2.59e-6, train/loss_step=0.000529, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30:  99%|█████████▉| 79/80 [07:09<00:05,  5.37s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000899, train/loss_vlb_step=4.53e-6, train/loss_step=0.000899, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30: 100%|██████████| 80/80 [07:10<00:00,  5.31s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000899, train/loss_vlb_step=4.53e-6, train/loss_step=0.000899, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 30: 100%|██████████| 80/80 [07:10<00:00,  5.31s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=1.77e-6, train/loss_step=0.000425, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Average Epoch time: 430.02 seconds
+Average Peak memory 29562.97MiB
+Epoch 30:   0%|          | 0/80 [00:00<00:00, 4120.14it/s, loss=0.00414, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=1.77e-6, train/loss_step=0.000425, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 31:   0%|          | 0/80 [00:00<00:00, 1617.55it/s, loss=0.00414, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=1.77e-6, train/loss_step=0.000425, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]Epoch 31:   1%|▏         | 1/80 [00:54<35:58, 27.32s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=1.77e-6, train/loss_step=0.000425, global_step=619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00409]  Epoch 31:   1%|▏         | 1/80 [00:54<35:58, 27.32s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.75e-6, train/loss_step=0.000393, global_step=620.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:   2%|▎         | 2/80 [00:55<23:53, 18.37s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.75e-6, train/loss_step=0.000393, global_step=620.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:   2%|▎         | 2/80 [00:55<23:53, 18.37s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.73e-5, train/loss_step=0.00409, global_step=620.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]   Epoch 31:   4%|▍         | 3/80 [00:55<17:50, 13.90s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.73e-5, train/loss_step=0.00409, global_step=620.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:   4%|▍         | 3/80 [00:55<17:50, 13.90s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.37e-5, train/loss_step=0.00565, global_step=620.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:   5%|▌         | 4/80 [00:56<14:13, 11.23s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.37e-5, train/loss_step=0.00565, global_step=620.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:   5%|▌         | 4/80 [00:56<14:13, 11.23s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=4.18e-5, train/loss_step=0.00644, global_step=620.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:   6%|▋         | 5/80 [00:56<11:48,  9.44s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=4.18e-5, train/loss_step=0.00644, global_step=620.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:   6%|▋         | 5/80 [00:56<11:48,  9.44s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.1e-5, train/loss_step=0.00573, global_step=621.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044] Epoch 31:   8%|▊         | 6/80 [00:57<10:04,  8.16s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.1e-5, train/loss_step=0.00573, global_step=621.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:   8%|▊         | 6/80 [00:57<10:04,  8.16s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.06e-5, train/loss_step=0.00262, global_step=621.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:   9%|▉         | 7/80 [00:57<08:45,  7.20s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.06e-5, train/loss_step=0.00262, global_step=621.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:   9%|▉         | 7/80 [00:57<08:45,  7.20s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=2.92e-5, train/loss_step=0.00714, global_step=621.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  10%|█         | 8/80 [01:31<12:10, 10.15s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=2.92e-5, train/loss_step=0.00714, global_step=621.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  10%|█         | 8/80 [01:31<12:10, 10.15s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000862, train/loss_vlb_step=6.42e-6, train/loss_step=0.000862, global_step=621.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  11%|█▏        | 9/80 [01:31<10:52,  9.19s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000862, train/loss_vlb_step=6.42e-6, train/loss_step=0.000862, global_step=621.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  11%|█▏        | 9/80 [01:31<10:52,  9.19s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=2.45e-6, train/loss_step=0.000412, global_step=622.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  12%|█▎        | 10/80 [01:32<09:47,  8.40s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=2.45e-6, train/loss_step=0.000412, global_step=622.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  12%|█▎        | 10/80 [01:32<09:47,  8.40s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=2.93e-5, train/loss_step=0.00754, global_step=622.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]   Epoch 31:  14%|█▍        | 11/80 [01:32<08:54,  7.74s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=2.93e-5, train/loss_step=0.00754, global_step=622.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  14%|█▍        | 11/80 [01:32<08:54,  7.74s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=2.12e-6, train/loss_step=0.000446, global_step=622.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  15%|█▌        | 12/80 [01:33<08:08,  7.19s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=2.12e-6, train/loss_step=0.000446, global_step=622.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  15%|█▌        | 12/80 [01:33<08:08,  7.19s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.12e-5, train/loss_step=0.002, global_step=622.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]      Epoch 31:  16%|█▋        | 13/80 [01:34<07:29,  6.71s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.12e-5, train/loss_step=0.002, global_step=622.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  16%|█▋        | 13/80 [01:34<07:29,  6.71s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=6.21e-6, train/loss_step=0.00159, global_step=623.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  18%|█▊        | 14/80 [01:35<06:59,  6.36s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=6.21e-6, train/loss_step=0.00159, global_step=623.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  18%|█▊        | 14/80 [01:35<06:59,  6.36s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.11e-6, train/loss_step=0.000274, global_step=623.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  19%|█▉        | 15/80 [01:35<06:29,  5.99s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.11e-6, train/loss_step=0.000274, global_step=623.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  19%|█▉        | 15/80 [01:35<06:29,  5.99s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=1.98e-6, train/loss_step=0.000521, global_step=623.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  20%|██        | 16/80 [02:09<08:08,  7.63s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=1.98e-6, train/loss_step=0.000521, global_step=623.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  20%|██        | 16/80 [02:09<08:08,  7.63s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.72e-6, train/loss_step=0.000573, global_step=623.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  21%|██▏       | 17/80 [02:10<07:37,  7.26s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.72e-6, train/loss_step=0.000573, global_step=623.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  21%|██▏       | 17/80 [02:10<07:37,  7.26s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.35e-6, train/loss_step=0.00123, global_step=624.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  22%|██▎       | 18/80 [02:11<07:07,  6.90s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.35e-6, train/loss_step=0.00123, global_step=624.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  22%|██▎       | 18/80 [02:11<07:07,  6.90s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.07e-5, train/loss_step=0.00297, global_step=624.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  24%|██▍       | 19/80 [02:11<06:41,  6.58s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.00297, train/loss_vlb_step=1.07e-5, train/loss_step=0.00297, global_step=624.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  24%|██▍       | 19/80 [02:11<06:41,  6.58s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=1.48e-5, train/loss_step=0.00422, global_step=624.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  25%|██▌       | 20/80 [02:12<06:17,  6.30s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=1.48e-5, train/loss_step=0.00422, global_step=624.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  25%|██▌       | 20/80 [02:12<06:17,  6.30s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.00015, train/loss_step=0.0154, global_step=624.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]   Epoch 31:  26%|██▋       | 21/80 [02:12<05:56,  6.04s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.00015, train/loss_step=0.0154, global_step=624.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  26%|██▋       | 21/80 [02:12<05:56,  6.04s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000179, train/loss_vlb_step=6.44e-7, train/loss_step=0.000179, global_step=625.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  28%|██▊       | 22/80 [02:16<05:44,  5.95s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000179, train/loss_vlb_step=6.44e-7, train/loss_step=0.000179, global_step=625.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  28%|██▊       | 22/80 [02:16<05:44,  5.95s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=3.09e-5, train/loss_step=0.0016, global_step=625.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]    Epoch 31:  29%|██▉       | 23/80 [02:17<05:25,  5.72s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=3.09e-5, train/loss_step=0.0016, global_step=625.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  29%|██▉       | 23/80 [02:17<05:25,  5.72s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.16e-5, train/loss_step=0.00879, global_step=625.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  30%|███       | 24/80 [03:04<06:54,  7.39s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00879, train/loss_vlb_step=4.16e-5, train/loss_step=0.00879, global_step=625.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  30%|███       | 24/80 [03:04<06:54,  7.39s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=5.56e-6, train/loss_step=0.000778, global_step=625.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  31%|███▏      | 25/80 [03:05<06:32,  7.13s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=5.56e-6, train/loss_step=0.000778, global_step=625.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  31%|███▏      | 25/80 [03:05<06:32,  7.13s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.00016, train/loss_step=0.0237, global_step=626.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]    Epoch 31:  32%|███▎      | 26/80 [03:05<06:11,  6.88s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=0.00016, train/loss_step=0.0237, global_step=626.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  32%|███▎      | 26/80 [03:05<06:11,  6.88s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=1.28e-5, train/loss_step=0.00146, global_step=626.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  34%|███▍      | 27/80 [03:06<05:52,  6.65s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=1.28e-5, train/loss_step=0.00146, global_step=626.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  34%|███▍      | 27/80 [03:06<05:52,  6.65s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.8e-5, train/loss_step=0.00503, global_step=626.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044] Epoch 31:  35%|███▌      | 28/80 [03:07<05:35,  6.45s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.8e-5, train/loss_step=0.00503, global_step=626.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  35%|███▌      | 28/80 [03:07<05:35,  6.45s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=5.08e-5, train/loss_step=0.00186, global_step=626.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  36%|███▋      | 29/80 [03:07<05:18,  6.25s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=5.08e-5, train/loss_step=0.00186, global_step=626.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  36%|███▋      | 29/80 [03:07<05:18,  6.25s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000755, train/loss_vlb_step=9.49e-6, train/loss_step=0.000755, global_step=627.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  38%|███▊      | 30/80 [03:08<05:03,  6.06s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000755, train/loss_vlb_step=9.49e-6, train/loss_step=0.000755, global_step=627.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  38%|███▊      | 30/80 [03:08<05:03,  6.06s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=9.87e-5, train/loss_step=0.00606, global_step=627.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  39%|███▉      | 31/80 [03:08<04:48,  5.89s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=9.87e-5, train/loss_step=0.00606, global_step=627.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  39%|███▉      | 31/80 [03:08<04:48,  5.89s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4.86e-5, train/loss_step=0.00874, global_step=627.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  40%|████      | 32/80 [03:42<05:23,  6.74s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4.86e-5, train/loss_step=0.00874, global_step=627.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  40%|████      | 32/80 [03:42<05:23,  6.74s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.0178, train/loss_step=0.0407, global_step=627.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]   Epoch 31:  41%|████▏     | 33/80 [03:43<05:08,  6.57s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0407, train/loss_vlb_step=0.0178, train/loss_step=0.0407, global_step=627.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  41%|████▏     | 33/80 [03:43<05:08,  6.57s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=2e-6, train/loss_step=0.000563, global_step=628.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  42%|████▎     | 34/80 [03:43<04:54,  6.39s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=2e-6, train/loss_step=0.000563, global_step=628.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  42%|████▎     | 34/80 [03:43<04:54,  6.39s/it, loss=0.00628, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=2.54e-6, train/loss_step=0.00051, global_step=628.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  44%|████▍     | 35/80 [03:46<04:42,  6.29s/it, loss=0.00628, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=2.54e-6, train/loss_step=0.00051, global_step=628.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  44%|████▍     | 35/80 [03:46<04:42,  6.29s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.07e-6, train/loss_step=0.000303, global_step=628.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  45%|████▌     | 36/80 [03:46<04:29,  6.13s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.07e-6, train/loss_step=0.000303, global_step=628.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  45%|████▌     | 36/80 [03:46<04:29,  6.13s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=6.15e-5, train/loss_step=0.00292, global_step=628.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  46%|████▋     | 37/80 [03:47<04:17,  5.98s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=6.15e-5, train/loss_step=0.00292, global_step=628.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  46%|████▋     | 37/80 [03:47<04:17,  5.98s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=2.35e-6, train/loss_step=0.000389, global_step=629.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  48%|████▊     | 38/80 [03:47<04:05,  5.84s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=2.35e-6, train/loss_step=0.000389, global_step=629.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  48%|████▊     | 38/80 [03:47<04:05,  5.84s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=3.49e-5, train/loss_step=0.00823, global_step=629.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  49%|████▉     | 39/80 [03:48<03:53,  5.71s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=3.49e-5, train/loss_step=0.00823, global_step=629.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  49%|████▉     | 39/80 [03:48<03:53,  5.71s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=2.88e-6, train/loss_step=0.00057, global_step=629.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  50%|█████     | 40/80 [04:24<04:17,  6.44s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=2.88e-6, train/loss_step=0.00057, global_step=629.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  50%|█████     | 40/80 [04:24<04:17,  6.44s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.35e-6, train/loss_step=0.00116, global_step=629.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  51%|█████▏    | 41/80 [04:24<04:06,  6.31s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.35e-6, train/loss_step=0.00116, global_step=629.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  51%|█████▏    | 41/80 [04:24<04:06,  6.31s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=6.01e-6, train/loss_step=0.00121, global_step=630.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  52%|█████▎    | 42/80 [04:25<03:54,  6.17s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=6.01e-6, train/loss_step=0.00121, global_step=630.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  52%|█████▎    | 42/80 [04:25<03:54,  6.17s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.73e-5, train/loss_step=0.00643, global_step=630.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  54%|█████▍    | 43/80 [04:35<03:51,  6.27s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=3.73e-5, train/loss_step=0.00643, global_step=630.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  54%|█████▍    | 43/80 [04:35<03:51,  6.27s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=2.26e-5, train/loss_step=0.00665, global_step=630.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044] Epoch 31:  55%|█████▌    | 44/80 [04:36<03:40,  6.14s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=2.26e-5, train/loss_step=0.00665, global_step=630.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  55%|█████▌    | 44/80 [04:36<03:40,  6.14s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.000908, train/loss_vlb_step=4.27e-6, train/loss_step=0.000908, global_step=630.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  56%|█████▋    | 45/80 [04:36<03:30,  6.02s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.000908, train/loss_vlb_step=4.27e-6, train/loss_step=0.000908, global_step=630.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  56%|█████▋    | 45/80 [04:36<03:30,  6.02s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.16e-5, train/loss_step=0.00263, global_step=631.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  57%|█████▊    | 46/80 [04:37<03:20,  5.90s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.16e-5, train/loss_step=0.00263, global_step=631.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  57%|█████▊    | 46/80 [04:37<03:20,  5.90s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=2.33e-5, train/loss_step=0.00664, global_step=631.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  59%|█████▉    | 47/80 [04:37<03:10,  5.79s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=2.33e-5, train/loss_step=0.00664, global_step=631.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  59%|█████▉    | 47/80 [04:37<03:10,  5.79s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=0.00268, train/loss_step=0.00658, global_step=631.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  60%|██████    | 48/80 [05:05<03:19,  6.24s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=0.00268, train/loss_step=0.00658, global_step=631.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  60%|██████    | 48/80 [05:05<03:19,  6.24s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.26e-5, train/loss_step=0.00367, global_step=631.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  61%|██████▏   | 49/80 [05:06<03:09,  6.13s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.26e-5, train/loss_step=0.00367, global_step=631.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  61%|██████▏   | 49/80 [05:06<03:09,  6.13s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=2.34e-6, train/loss_step=0.000459, global_step=632.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  62%|██████▎   | 50/80 [05:06<03:00,  6.02s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=2.34e-6, train/loss_step=0.000459, global_step=632.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  62%|██████▎   | 50/80 [05:06<03:00,  6.02s/it, loss=0.00717, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.0145, train/loss_step=0.0441, global_step=632.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]     Epoch 31:  64%|██████▍   | 51/80 [05:18<02:57,  6.13s/it, loss=0.00717, v_num=0, train/loss_simple_step=0.0441, train/loss_vlb_step=0.0145, train/loss_step=0.0441, global_step=632.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  64%|██████▍   | 51/80 [05:18<02:57,  6.13s/it, loss=0.00675, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.36e-6, train/loss_step=0.000305, global_step=632.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  65%|██████▌   | 52/80 [05:19<02:48,  6.02s/it, loss=0.00675, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.36e-6, train/loss_step=0.000305, global_step=632.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  65%|██████▌   | 52/80 [05:19<02:48,  6.02s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.61e-5, train/loss_step=0.0117, global_step=632.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]     Epoch 31:  66%|██████▋   | 53/80 [05:19<02:39,  5.92s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.61e-5, train/loss_step=0.0117, global_step=632.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  66%|██████▋   | 53/80 [05:19<02:39,  5.92s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.31e-5, train/loss_step=0.00513, global_step=633.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  68%|██████▊   | 54/80 [05:20<02:31,  5.82s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=2.31e-5, train/loss_step=0.00513, global_step=633.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  68%|██████▊   | 54/80 [05:20<02:31,  5.82s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.88e-5, train/loss_step=0.00649, global_step=633.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  69%|██████▉   | 55/80 [05:20<02:23,  5.73s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.88e-5, train/loss_step=0.00649, global_step=633.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  69%|██████▉   | 55/80 [05:20<02:23,  5.73s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.22e-5, train/loss_step=0.00797, global_step=633.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  70%|███████   | 56/80 [05:53<02:28,  6.21s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=3.22e-5, train/loss_step=0.00797, global_step=633.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  70%|███████   | 56/80 [05:53<02:28,  6.21s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=9.94e-5, train/loss_step=0.0109, global_step=633.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  71%|███████▏  | 57/80 [05:54<02:20,  6.11s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=9.94e-5, train/loss_step=0.0109, global_step=633.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  71%|███████▏  | 57/80 [05:54<02:20,  6.11s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.58e-5, train/loss_step=0.00285, global_step=634.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  72%|███████▎  | 58/80 [05:55<02:12,  6.02s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.58e-5, train/loss_step=0.00285, global_step=634.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  72%|███████▎  | 58/80 [05:55<02:12,  6.02s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=1.71e-5, train/loss_step=0.00513, global_step=634.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  74%|███████▍  | 59/80 [05:55<02:04,  5.93s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00513, train/loss_vlb_step=1.71e-5, train/loss_step=0.00513, global_step=634.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  74%|███████▍  | 59/80 [05:55<02:04,  5.93s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=1.84e-6, train/loss_step=0.000466, global_step=634.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  75%|███████▌  | 60/80 [05:56<01:56,  5.84s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=1.84e-6, train/loss_step=0.000466, global_step=634.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  75%|███████▌  | 60/80 [05:56<01:56,  5.84s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.56e-5, train/loss_step=0.00247, global_step=634.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  76%|███████▋  | 61/80 [05:56<01:49,  5.75s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=1.56e-5, train/loss_step=0.00247, global_step=634.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  76%|███████▋  | 61/80 [05:56<01:49,  5.75s/it, loss=0.00847, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.00161, train/loss_step=0.0378, global_step=635.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  78%|███████▊  | 62/80 [05:57<01:42,  5.67s/it, loss=0.00847, v_num=0, train/loss_simple_step=0.0378, train/loss_vlb_step=0.00161, train/loss_step=0.0378, global_step=635.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  78%|███████▊  | 62/80 [05:57<01:42,  5.67s/it, loss=0.00855, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=0.000128, train/loss_step=0.00804, global_step=635.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  79%|███████▉  | 63/80 [05:57<01:35,  5.59s/it, loss=0.00855, v_num=0, train/loss_simple_step=0.00804, train/loss_vlb_step=0.000128, train/loss_step=0.00804, global_step=635.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  79%|███████▉  | 63/80 [05:57<01:35,  5.59s/it, loss=0.00853, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=2.39e-5, train/loss_step=0.00638, global_step=635.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044] Epoch 31:  80%|████████  | 64/80 [06:31<01:36,  6.03s/it, loss=0.00853, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=2.39e-5, train/loss_step=0.00638, global_step=635.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  80%|████████  | 64/80 [06:31<01:36,  6.03s/it, loss=0.00851, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.81e-6, train/loss_step=0.000392, global_step=635.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  81%|████████▏ | 65/80 [06:32<01:29,  5.94s/it, loss=0.00851, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.81e-6, train/loss_step=0.000392, global_step=635.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  81%|████████▏ | 65/80 [06:32<01:29,  5.94s/it, loss=0.00882, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=4.53e-5, train/loss_step=0.00887, global_step=636.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  82%|████████▎ | 66/80 [06:32<01:22,  5.86s/it, loss=0.00882, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=4.53e-5, train/loss_step=0.00887, global_step=636.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  82%|████████▎ | 66/80 [06:32<01:22,  5.86s/it, loss=0.00851, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=1.74e-6, train/loss_step=0.000399, global_step=636.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  84%|████████▍ | 67/80 [06:36<01:15,  5.84s/it, loss=0.00851, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=1.74e-6, train/loss_step=0.000399, global_step=636.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  84%|████████▍ | 67/80 [06:36<01:15,  5.84s/it, loss=0.00863, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.77e-5, train/loss_step=0.00908, global_step=636.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.00863, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=4.77e-5, train/loss_step=0.00908, global_step=636.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.00849, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=3.62e-6, train/loss_step=0.000788, global_step=636.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00849, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=3.62e-6, train/loss_step=0.000788, global_step=636.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00849, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=2.01e-6, train/loss_step=0.000545, global_step=637.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00849, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=2.01e-6, train/loss_step=0.000545, global_step=637.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00633, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=9.81e-6, train/loss_step=0.000847, global_step=637.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  89%|████████▉ | 71/80 [06:38<00:49,  5.54s/it, loss=0.00633, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=9.81e-6, train/loss_step=0.000847, global_step=637.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  89%|████████▉ | 71/80 [06:38<00:49,  5.54s/it, loss=0.00633, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.14e-6, train/loss_step=0.000275, global_step=637.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  90%|█████████ | 72/80 [07:03<00:46,  5.80s/it, loss=0.00633, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.14e-6, train/loss_step=0.000275, global_step=637.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  90%|█████████ | 72/80 [07:03<00:46,  5.80s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=9.2e-7, train/loss_step=0.000221, global_step=637.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044] Epoch 31:  91%|█████████▏| 73/80 [07:03<00:40,  5.73s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=9.2e-7, train/loss_step=0.000221, global_step=637.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  91%|█████████▏| 73/80 [07:03<00:40,  5.73s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=0.000134, train/loss_step=0.0126, global_step=638.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 31:  92%|█████████▎| 74/80 [07:04<00:33,  5.66s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=0.000134, train/loss_step=0.0126, global_step=638.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  92%|█████████▎| 74/80 [07:04<00:33,  5.66s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=4.85e-5, train/loss_step=0.00189, global_step=638.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  94%|█████████▍| 75/80 [07:06<00:28,  5.61s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=4.85e-5, train/loss_step=0.00189, global_step=638.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  94%|█████████▍| 75/80 [07:06<00:28,  5.61s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=1.19e-6, train/loss_step=0.000313, global_step=638.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  95%|█████████▌| 76/80 [07:06<00:22,  5.54s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=1.19e-6, train/loss_step=0.000313, global_step=638.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  95%|█████████▌| 76/80 [07:06<00:22,  5.54s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000354, train/loss_vlb_step=2.56e-6, train/loss_step=0.000354, global_step=638.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  96%|█████████▋| 77/80 [07:07<00:16,  5.48s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000354, train/loss_vlb_step=2.56e-6, train/loss_step=0.000354, global_step=638.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  96%|█████████▋| 77/80 [07:07<00:16,  5.48s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=4.86e-5, train/loss_step=0.00126, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]   Epoch 31:  98%|█████████▊| 78/80 [07:07<00:10,  5.41s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=4.86e-5, train/loss_step=0.00126, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  98%|█████████▊| 78/80 [07:07<00:10,  5.41s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=5.31e-6, train/loss_step=0.000876, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  99%|█████████▉| 79/80 [07:08<00:05,  5.35s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=5.31e-6, train/loss_step=0.000876, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31:  99%|█████████▉| 79/80 [07:08<00:05,  5.35s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=3.91e-6, train/loss_step=0.000615, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044] Epoch 31: 100%|██████████| 80/80 [07:08<00:00,  5.29s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=3.91e-6, train/loss_step=0.000615, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 31: 100%|██████████| 80/80 [07:08<00:00,  5.29s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=5.48e-6, train/loss_step=0.00159, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044] Average Epoch time: 428.74 seconds
+Average Peak memory 29564.70MiB
+Epoch 31:   0%|          | 0/80 [00:00<00:00, 4419.71it/s, loss=0.00465, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=5.48e-6, train/loss_step=0.00159, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 32:   0%|          | 0/80 [00:00<00:00, 2143.23it/s, loss=0.00465, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=5.48e-6, train/loss_step=0.00159, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]Epoch 32:   1%|▏         | 1/80 [00:45<29:53, 22.71s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=5.48e-6, train/loss_step=0.00159, global_step=639.0, lr_abs=0.0001, train/loss_simple_epoch=0.0044, train/loss_vlb_epoch=0.000164, train/loss_epoch=0.0044]  Epoch 32:   1%|▏         | 1/80 [00:45<29:53, 22.71s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.59e-6, train/loss_step=0.00038, global_step=640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   2%|▎         | 2/80 [00:45<19:53, 15.30s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.59e-6, train/loss_step=0.00038, global_step=640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   2%|▎         | 2/80 [00:45<19:53, 15.30s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.58e-5, train/loss_step=0.00116, global_step=640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   4%|▍         | 3/80 [00:46<14:52, 11.60s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.58e-5, train/loss_step=0.00116, global_step=640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   4%|▍         | 3/80 [00:46<14:52, 11.60s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=1.48e-5, train/loss_step=0.00444, global_step=640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   5%|▌         | 4/80 [00:46<11:53,  9.38s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=1.48e-5, train/loss_step=0.00444, global_step=640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   5%|▌         | 4/80 [00:46<11:53,  9.39s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=3.09e-5, train/loss_step=0.0032, global_step=640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]  Epoch 32:   6%|▋         | 5/80 [00:47<09:52,  7.91s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=3.09e-5, train/loss_step=0.0032, global_step=640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   6%|▋         | 5/80 [00:47<09:52,  7.91s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.26e-5, train/loss_step=0.00336, global_step=641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   8%|▊         | 6/80 [00:51<09:07,  7.40s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.26e-5, train/loss_step=0.00336, global_step=641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   8%|▊         | 6/80 [00:51<09:07,  7.40s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=1.62e-5, train/loss_step=0.00461, global_step=641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   9%|▉         | 7/80 [00:52<07:57,  6.54s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=1.62e-5, train/loss_step=0.00461, global_step=641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:   9%|▉         | 7/80 [00:52<07:57,  6.54s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=7.55e-5, train/loss_step=0.00254, global_step=641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  10%|█         | 8/80 [01:27<11:37,  9.69s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=7.55e-5, train/loss_step=0.00254, global_step=641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  10%|█         | 8/80 [01:27<11:37,  9.69s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000651, train/loss_vlb_step=3.33e-6, train/loss_step=0.000651, global_step=641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  11%|█▏        | 9/80 [01:27<10:23,  8.78s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000651, train/loss_vlb_step=3.33e-6, train/loss_step=0.000651, global_step=641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  11%|█▏        | 9/80 [01:27<10:23,  8.78s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.85e-5, train/loss_step=0.0069, global_step=642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]     Epoch 32:  12%|█▎        | 10/80 [01:28<09:21,  8.03s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.85e-5, train/loss_step=0.0069, global_step=642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  12%|█▎        | 10/80 [01:28<09:21,  8.03s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=5.28e-5, train/loss_step=0.00923, global_step=642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  14%|█▍        | 11/80 [01:28<08:30,  7.40s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=5.28e-5, train/loss_step=0.00923, global_step=642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  14%|█▍        | 11/80 [01:28<08:30,  7.40s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.76e-5, train/loss_step=0.00913, global_step=642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  15%|█▌        | 12/80 [01:29<07:47,  6.87s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.76e-5, train/loss_step=0.00913, global_step=642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  15%|█▌        | 12/80 [01:29<07:47,  6.87s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000126, train/loss_step=0.014, global_step=642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]   Epoch 32:  16%|█▋        | 13/80 [01:29<07:09,  6.42s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000126, train/loss_step=0.014, global_step=642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  16%|█▋        | 13/80 [01:29<07:09,  6.42s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.06e-5, train/loss_step=0.00294, global_step=643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  18%|█▊        | 14/80 [01:41<07:24,  6.74s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.06e-5, train/loss_step=0.00294, global_step=643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  18%|█▊        | 14/80 [01:41<07:24,  6.74s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=0.000949, train/loss_step=0.00365, global_step=643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  19%|█▉        | 15/80 [01:41<06:52,  6.35s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=0.000949, train/loss_step=0.00365, global_step=643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  19%|█▉        | 15/80 [01:41<06:52,  6.35s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.07e-5, train/loss_step=0.00245, global_step=643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467] Epoch 32:  20%|██        | 16/80 [02:12<08:17,  7.77s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.07e-5, train/loss_step=0.00245, global_step=643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  20%|██        | 16/80 [02:12<08:17,  7.77s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=9.24e-6, train/loss_step=0.00175, global_step=643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  21%|██▏       | 17/80 [02:12<07:44,  7.37s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=9.24e-6, train/loss_step=0.00175, global_step=643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  21%|██▏       | 17/80 [02:12<07:44,  7.37s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=8.56e-6, train/loss_step=0.00108, global_step=644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  22%|██▎       | 18/80 [02:13<07:14,  7.01s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=8.56e-6, train/loss_step=0.00108, global_step=644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  22%|██▎       | 18/80 [02:13<07:14,  7.01s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=4.5e-5, train/loss_step=0.00822, global_step=644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]  Epoch 32:  24%|██▍       | 19/80 [02:13<06:47,  6.68s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00822, train/loss_vlb_step=4.5e-5, train/loss_step=0.00822, global_step=644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  24%|██▍       | 19/80 [02:13<06:47,  6.68s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.18e-5, train/loss_step=0.00334, global_step=644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  25%|██▌       | 20/80 [02:14<06:23,  6.39s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.18e-5, train/loss_step=0.00334, global_step=644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  25%|██▌       | 20/80 [02:14<06:23,  6.39s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.34e-6, train/loss_step=0.000557, global_step=644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  26%|██▋       | 21/80 [02:14<06:01,  6.12s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.34e-6, train/loss_step=0.000557, global_step=644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  26%|██▋       | 21/80 [02:14<06:01,  6.12s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.38e-5, train/loss_step=0.00346, global_step=645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]  Epoch 32:  28%|██▊       | 22/80 [02:23<06:01,  6.23s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.38e-5, train/loss_step=0.00346, global_step=645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  28%|██▊       | 22/80 [02:23<06:01,  6.23s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=2.9e-5, train/loss_step=0.00793, global_step=645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467] Epoch 32:  29%|██▉       | 23/80 [02:23<05:41,  5.99s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=2.9e-5, train/loss_step=0.00793, global_step=645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  29%|██▉       | 23/80 [02:23<05:41,  5.99s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.79e-6, train/loss_step=0.000389, global_step=645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  30%|███       | 24/80 [02:41<06:02,  6.47s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.79e-6, train/loss_step=0.000389, global_step=645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  30%|███       | 24/80 [02:41<06:02,  6.47s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=4.58e-5, train/loss_step=0.0136, global_step=645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]    Epoch 32:  31%|███▏      | 25/80 [02:42<05:43,  6.25s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=4.58e-5, train/loss_step=0.0136, global_step=645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  31%|███▏      | 25/80 [02:42<05:43,  6.25s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=4.24e-5, train/loss_step=0.00238, global_step=646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  32%|███▎      | 26/80 [02:42<05:25,  6.03s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=4.24e-5, train/loss_step=0.00238, global_step=646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  32%|███▎      | 26/80 [02:42<05:25,  6.03s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=3.35e-5, train/loss_step=0.00993, global_step=646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  34%|███▍      | 27/80 [02:54<05:29,  6.22s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=3.35e-5, train/loss_step=0.00993, global_step=646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  34%|███▍      | 27/80 [02:54<05:29,  6.22s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=1.08e-5, train/loss_step=0.000876, global_step=646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  35%|███▌      | 28/80 [02:54<05:13,  6.02s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=1.08e-5, train/loss_step=0.000876, global_step=646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  35%|███▌      | 28/80 [02:54<05:13,  6.02s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=6.97e-5, train/loss_step=0.0115, global_step=646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]    Epoch 32:  36%|███▋      | 29/80 [02:55<04:57,  5.84s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=6.97e-5, train/loss_step=0.0115, global_step=646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  36%|███▋      | 29/80 [02:55<04:57,  5.84s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=3.97e-5, train/loss_step=0.0112, global_step=647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  38%|███▊      | 30/80 [03:01<04:52,  5.84s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=3.97e-5, train/loss_step=0.0112, global_step=647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  38%|███▊      | 30/80 [03:01<04:52,  5.84s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.12e-6, train/loss_step=0.000453, global_step=647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  39%|███▉      | 31/80 [03:01<04:38,  5.68s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.12e-6, train/loss_step=0.000453, global_step=647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  39%|███▉      | 31/80 [03:01<04:38,  5.68s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=4.95e-6, train/loss_step=0.000857, global_step=647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  40%|████      | 32/80 [03:15<04:43,  5.91s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=4.95e-6, train/loss_step=0.000857, global_step=647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  40%|████      | 32/80 [03:15<04:43,  5.91s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.83e-5, train/loss_step=0.0169, global_step=647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]    Epoch 32:  41%|████▏     | 33/80 [03:16<04:31,  5.77s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.83e-5, train/loss_step=0.0169, global_step=647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  41%|████▏     | 33/80 [03:16<04:31,  5.77s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.07e-5, train/loss_step=0.00171, global_step=648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  42%|████▎     | 34/80 [03:21<04:24,  5.75s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.07e-5, train/loss_step=0.00171, global_step=648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  42%|████▎     | 34/80 [03:21<04:24,  5.75s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.8e-5, train/loss_step=0.00319, global_step=648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467] Epoch 32:  44%|████▍     | 35/80 [03:31<04:24,  5.89s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.8e-5, train/loss_step=0.00319, global_step=648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  44%|████▍     | 35/80 [03:31<04:24,  5.89s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000822, train/loss_vlb_step=5.4e-6, train/loss_step=0.000822, global_step=648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  45%|████▌     | 36/80 [03:32<04:12,  5.74s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000822, train/loss_vlb_step=5.4e-6, train/loss_step=0.000822, global_step=648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  45%|████▌     | 36/80 [03:32<04:12,  5.74s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000906, train/loss_vlb_step=2.39e-5, train/loss_step=0.000906, global_step=648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  46%|████▋     | 37/80 [03:32<04:00,  5.60s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000906, train/loss_vlb_step=2.39e-5, train/loss_step=0.000906, global_step=648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  46%|████▋     | 37/80 [03:32<04:00,  5.60s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=1.55e-5, train/loss_step=0.0015, global_step=649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]    Epoch 32:  48%|████▊     | 38/80 [03:49<04:07,  5.89s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=1.55e-5, train/loss_step=0.0015, global_step=649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  48%|████▊     | 38/80 [03:49<04:07,  5.89s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=1.66e-5, train/loss_step=0.0013, global_step=649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  49%|████▉     | 39/80 [03:50<03:56,  5.76s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=1.66e-5, train/loss_step=0.0013, global_step=649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  49%|████▉     | 39/80 [03:50<03:56,  5.76s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=1.42e-5, train/loss_step=0.0042, global_step=649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  50%|█████     | 40/80 [04:02<03:56,  5.92s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=1.42e-5, train/loss_step=0.0042, global_step=649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  50%|█████     | 40/80 [04:02<03:56,  5.92s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=7.27e-5, train/loss_step=0.00306, global_step=649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  51%|█████▏    | 41/80 [04:10<03:52,  5.96s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00306, train/loss_vlb_step=7.27e-5, train/loss_step=0.00306, global_step=649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  51%|█████▏    | 41/80 [04:10<03:52,  5.96s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=5.05e-5, train/loss_step=0.00227, global_step=650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  52%|█████▎    | 42/80 [04:10<03:41,  5.83s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=5.05e-5, train/loss_step=0.00227, global_step=650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  52%|█████▎    | 42/80 [04:10<03:41,  5.83s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=4.82e-5, train/loss_step=0.0127, global_step=650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]  Epoch 32:  54%|█████▍    | 43/80 [04:18<03:37,  5.88s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=4.82e-5, train/loss_step=0.0127, global_step=650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  54%|█████▍    | 43/80 [04:18<03:37,  5.88s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=4.7e-6, train/loss_step=0.000635, global_step=650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  55%|█████▌    | 44/80 [04:19<03:27,  5.76s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=4.7e-6, train/loss_step=0.000635, global_step=650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  55%|█████▌    | 44/80 [04:19<03:27,  5.76s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=4.3e-5, train/loss_step=0.00727, global_step=650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  56%|█████▋    | 45/80 [04:22<03:19,  5.70s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=4.3e-5, train/loss_step=0.00727, global_step=650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  56%|█████▋    | 45/80 [04:22<03:19,  5.70s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=2.79e-5, train/loss_step=0.00762, global_step=651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  57%|█████▊    | 46/80 [04:27<03:13,  5.69s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=2.79e-5, train/loss_step=0.00762, global_step=651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  57%|█████▊    | 46/80 [04:27<03:13,  5.69s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=2.89e-5, train/loss_step=0.00669, global_step=651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00669, train/loss_vlb_step=2.89e-5, train/loss_step=0.00669, global_step=651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=1.38e-5, train/loss_step=0.00128, global_step=651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467] Epoch 32:  60%|██████    | 48/80 [04:37<03:01,  5.66s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=1.38e-5, train/loss_step=0.00128, global_step=651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  60%|██████    | 48/80 [04:37<03:01,  5.66s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=6.51e-5, train/loss_step=0.0011, global_step=651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467] Epoch 32:  61%|██████▏   | 49/80 [04:46<02:57,  5.74s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=6.51e-5, train/loss_step=0.0011, global_step=651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  61%|██████▏   | 49/80 [04:46<02:57,  5.74s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=7.37e-5, train/loss_step=0.00124, global_step=652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  62%|██████▎   | 50/80 [04:47<02:49,  5.63s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=7.37e-5, train/loss_step=0.00124, global_step=652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  62%|██████▎   | 50/80 [04:47<02:49,  5.63s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.64e-5, train/loss_step=0.0115, global_step=652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]  Epoch 32:  64%|██████▍   | 51/80 [05:07<02:51,  5.92s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.64e-5, train/loss_step=0.0115, global_step=652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  64%|██████▍   | 51/80 [05:07<02:51,  5.92s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000542, train/loss_vlb_step=4.07e-6, train/loss_step=0.000542, global_step=652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  65%|██████▌   | 52/80 [05:08<02:42,  5.81s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000542, train/loss_vlb_step=4.07e-6, train/loss_step=0.000542, global_step=652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  65%|██████▌   | 52/80 [05:08<02:42,  5.81s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000592, train/loss_vlb_step=2.25e-6, train/loss_step=0.000592, global_step=652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000592, train/loss_vlb_step=2.25e-6, train/loss_step=0.000592, global_step=652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.00187, train/loss_step=0.0456, global_step=653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]     Epoch 32:  68%|██████▊   | 54/80 [05:11<02:27,  5.66s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.0456, train/loss_vlb_step=0.00187, train/loss_step=0.0456, global_step=653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  68%|██████▊   | 54/80 [05:11<02:27,  5.66s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=4.38e-5, train/loss_step=0.00833, global_step=653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  69%|██████▉   | 55/80 [05:11<02:19,  5.57s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=4.38e-5, train/loss_step=0.00833, global_step=653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  69%|██████▉   | 55/80 [05:11<02:19,  5.57s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.000715, train/loss_vlb_step=3.59e-6, train/loss_step=0.000715, global_step=653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  70%|███████   | 56/80 [05:23<02:16,  5.67s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.000715, train/loss_vlb_step=3.59e-6, train/loss_step=0.000715, global_step=653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  70%|███████   | 56/80 [05:23<02:16,  5.67s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.000469, train/loss_vlb_step=4.94e-6, train/loss_step=0.000469, global_step=653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  71%|███████▏  | 57/80 [05:29<02:10,  5.67s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.000469, train/loss_vlb_step=4.94e-6, train/loss_step=0.000469, global_step=653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  71%|███████▏  | 57/80 [05:29<02:10,  5.67s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.000281, train/loss_vlb_step=1.07e-6, train/loss_step=0.000281, global_step=654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  72%|███████▎  | 58/80 [05:29<02:02,  5.59s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.000281, train/loss_vlb_step=1.07e-6, train/loss_step=0.000281, global_step=654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  72%|███████▎  | 58/80 [05:29<02:02,  5.59s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=4.56e-6, train/loss_step=0.00068, global_step=654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]  Epoch 32:  74%|███████▍  | 59/80 [05:58<02:05,  5.98s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=4.56e-6, train/loss_step=0.00068, global_step=654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  74%|███████▍  | 59/80 [05:58<02:05,  5.98s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.06e-5, train/loss_step=0.00753, global_step=654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.00753, train/loss_vlb_step=3.06e-5, train/loss_step=0.00753, global_step=654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=2.46e-5, train/loss_step=0.00659, global_step=654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  76%|███████▋  | 61/80 [05:59<01:50,  5.81s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=2.46e-5, train/loss_step=0.00659, global_step=654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  76%|███████▋  | 61/80 [05:59<01:50,  5.81s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=3.32e-6, train/loss_step=0.000599, global_step=655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  78%|███████▊  | 62/80 [06:00<01:42,  5.72s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=3.32e-6, train/loss_step=0.000599, global_step=655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  78%|███████▊  | 62/80 [06:00<01:42,  5.72s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000429, train/loss_vlb_step=2.24e-6, train/loss_step=0.000429, global_step=655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  79%|███████▉  | 63/80 [06:00<01:35,  5.64s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000429, train/loss_vlb_step=2.24e-6, train/loss_step=0.000429, global_step=655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  79%|███████▉  | 63/80 [06:00<01:35,  5.64s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000628, train/loss_vlb_step=5.3e-6, train/loss_step=0.000628, global_step=655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467] Epoch 32:  80%|████████  | 64/80 [06:05<01:29,  5.62s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000628, train/loss_vlb_step=5.3e-6, train/loss_step=0.000628, global_step=655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  80%|████████  | 64/80 [06:05<01:29,  5.62s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=3.8e-5, train/loss_step=0.00862, global_step=655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]  Epoch 32:  81%|████████▏ | 65/80 [06:13<01:24,  5.65s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=3.8e-5, train/loss_step=0.00862, global_step=655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  81%|████████▏ | 65/80 [06:13<01:24,  5.65s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.2e-5, train/loss_step=0.00806, global_step=656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  82%|████████▎ | 66/80 [06:13<01:18,  5.58s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00806, train/loss_vlb_step=3.2e-5, train/loss_step=0.00806, global_step=656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  82%|████████▎ | 66/80 [06:13<01:18,  5.58s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000449, train/loss_vlb_step=3.08e-6, train/loss_step=0.000449, global_step=656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  84%|████████▍ | 67/80 [06:45<01:17,  5.97s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000449, train/loss_vlb_step=3.08e-6, train/loss_step=0.000449, global_step=656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  84%|████████▍ | 67/80 [06:45<01:17,  5.97s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=2.76e-6, train/loss_step=0.000533, global_step=656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  85%|████████▌ | 68/80 [06:46<01:10,  5.89s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=2.76e-6, train/loss_step=0.000533, global_step=656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  85%|████████▌ | 68/80 [06:46<01:10,  5.89s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=6.8e-6, train/loss_step=0.00165, global_step=656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]   Epoch 32:  86%|████████▋ | 69/80 [06:46<01:03,  5.81s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=6.8e-6, train/loss_step=0.00165, global_step=656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  86%|████████▋ | 69/80 [06:46<01:03,  5.81s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.00023, train/loss_step=0.0144, global_step=657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467] Epoch 32:  88%|████████▊ | 70/80 [06:47<00:57,  5.74s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.00023, train/loss_step=0.0144, global_step=657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  88%|████████▊ | 70/80 [06:47<00:57,  5.74s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000276, train/loss_vlb_step=1.71e-6, train/loss_step=0.000276, global_step=657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  89%|████████▉ | 71/80 [06:47<00:50,  5.66s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000276, train/loss_vlb_step=1.71e-6, train/loss_step=0.000276, global_step=657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  89%|████████▉ | 71/80 [06:47<00:50,  5.66s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=6.4e-6, train/loss_step=0.00183, global_step=657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]   Epoch 32:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=6.4e-6, train/loss_step=0.00183, global_step=657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.62e-6, train/loss_step=0.000355, global_step=657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  91%|��████████▏| 73/80 [06:52<00:39,  5.58s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.62e-6, train/loss_step=0.000355, global_step=657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  91%|█████████▏| 73/80 [06:52<00:39,  5.58s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.57e-5, train/loss_step=0.0136, global_step=658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]    Epoch 32:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.57e-5, train/loss_step=0.0136, global_step=658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.33e-5, train/loss_step=0.00395, global_step=658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  94%|█████████▍| 75/80 [07:20<00:28,  5.80s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.33e-5, train/loss_step=0.00395, global_step=658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  94%|█████████▍| 75/80 [07:20<00:28,  5.80s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000236, train/loss_step=0.0144, global_step=658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467] Epoch 32:  95%|█████████▌| 76/80 [07:21<00:22,  5.73s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000236, train/loss_step=0.0144, global_step=658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  95%|█████████▌| 76/80 [07:21<00:22,  5.73s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.01e-5, train/loss_step=0.00486, global_step=658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  96%|█████████▋| 77/80 [07:21<00:16,  5.66s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=2.01e-5, train/loss_step=0.00486, global_step=658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  96%|█████████▋| 77/80 [07:21<00:16,  5.66s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000957, train/loss_vlb_step=3.47e-5, train/loss_step=0.000957, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  98%|█████████▊| 78/80 [07:22<00:11,  5.60s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000957, train/loss_vlb_step=3.47e-5, train/loss_step=0.000957, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  98%|█████████▊| 78/80 [07:22<00:11,  5.60s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=8.27e-7, train/loss_step=0.000189, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  99%|█████████▉| 79/80 [07:22<00:05,  5.53s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=8.27e-7, train/loss_step=0.000189, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32:  99%|█████████▉| 79/80 [07:22<00:05,  5.53s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=9.84e-6, train/loss_step=0.000718, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32: 100%|██████████| 80/80 [07:23<00:00,  5.47s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=9.84e-6, train/loss_step=0.000718, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 32: 100%|██████████| 80/80 [07:23<00:00,  5.47s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.26e-6, train/loss_step=0.000454, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Average Epoch time: 443.09 seconds
+Average Peak memory 29566.62MiB
+Epoch 32:   0%|          | 0/80 [00:00<00:00, 3934.62it/s, loss=0.00384, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.26e-6, train/loss_step=0.000454, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 33:   0%|          | 0/80 [00:00<00:00, 1707.08it/s, loss=0.00384, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.26e-6, train/loss_step=0.000454, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]Epoch 33:   1%|▏         | 1/80 [00:44<29:07, 22.12s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.26e-6, train/loss_step=0.000454, global_step=659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00467, train/loss_vlb_epoch=0.000209, train/loss_epoch=0.00467]  Epoch 33:   1%|▏         | 1/80 [00:44<29:07, 22.12s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=7.7e-6, train/loss_step=0.000817, global_step=660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456] Epoch 33:   2%|▎         | 2/80 [00:44<19:22, 14.91s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=7.7e-6, train/loss_step=0.000817, global_step=660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:   2%|▎         | 2/80 [00:44<19:22, 14.91s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=2.62e-6, train/loss_step=0.000286, global_step=660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:   4%|▍         | 3/80 [00:45<14:30, 11.30s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=2.62e-6, train/loss_step=0.000286, global_step=660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:   4%|▍         | 3/80 [00:45<14:30, 11.31s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000206, train/loss_step=0.0205, global_step=660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]   Epoch 33:   5%|▌         | 4/80 [00:45<11:35,  9.15s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000206, train/loss_step=0.0205, global_step=660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:   5%|▌         | 4/80 [00:45<11:35,  9.15s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=2.01e-6, train/loss_step=0.000393, global_step=660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:   6%|▋         | 5/80 [00:46<09:38,  7.71s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=2.01e-6, train/loss_step=0.000393, global_step=660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:   6%|▋         | 5/80 [00:46<09:38,  7.71s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=1.69e-5, train/loss_step=0.00443, global_step=661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 33:   8%|▊         | 6/80 [00:46<08:14,  6.68s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=1.69e-5, train/loss_step=0.00443, global_step=661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:   8%|▊         | 6/80 [00:46<08:14,  6.68s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000614, train/loss_vlb_step=2.42e-6, train/loss_step=0.000614, global_step=661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:   9%|▉         | 7/80 [00:47<07:11,  5.90s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000614, train/loss_vlb_step=2.42e-6, train/loss_step=0.000614, global_step=661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:   9%|▉         | 7/80 [00:47<07:11,  5.90s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=9.47e-5, train/loss_step=0.00537, global_step=661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]   Epoch 33:  10%|█         | 8/80 [01:13<09:45,  8.14s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00537, train/loss_vlb_step=9.47e-5, train/loss_step=0.00537, global_step=661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  10%|█         | 8/80 [01:13<09:45,  8.14s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=0.000262, train/loss_step=0.00534, global_step=661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  11%|█▏        | 9/80 [01:24<10:01,  8.47s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=0.000262, train/loss_step=0.00534, global_step=661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  11%|█▏        | 9/80 [01:24<10:01,  8.47s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=1.49e-5, train/loss_step=0.000531, global_step=662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  12%|█▎        | 10/80 [01:29<09:28,  8.12s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=1.49e-5, train/loss_step=0.000531, global_step=662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  12%|█▎        | 10/80 [01:29<09:28,  8.12s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.00052, train/loss_step=0.036, global_step=662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]      Epoch 33:  14%|█▍        | 11/80 [01:29<08:36,  7.48s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.036, train/loss_vlb_step=0.00052, train/loss_step=0.036, global_step=662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  14%|█▍        | 11/80 [01:29<08:36,  7.48s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.73e-6, train/loss_step=0.00102, global_step=662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  15%|█▌        | 12/80 [01:30<07:52,  6.95s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.73e-6, train/loss_step=0.00102, global_step=662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  15%|█▌        | 12/80 [01:30<07:52,  6.95s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.77e-5, train/loss_step=0.0101, global_step=662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 33:  16%|█▋        | 13/80 [01:30<07:14,  6.49s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.77e-5, train/loss_step=0.0101, global_step=662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  16%|█▋        | 13/80 [01:30<07:14,  6.49s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.86e-6, train/loss_step=0.00104, global_step=663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  18%|█▊        | 14/80 [01:31<06:41,  6.09s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.86e-6, train/loss_step=0.00104, global_step=663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  18%|█▊        | 14/80 [01:31<06:41,  6.09s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.26e-5, train/loss_step=0.00619, global_step=663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  19%|█▉        | 15/80 [01:31<06:12,  5.74s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.26e-5, train/loss_step=0.00619, global_step=663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  19%|█▉        | 15/80 [01:31<06:12,  5.74s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.38e-6, train/loss_step=0.00207, global_step=663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  20%|██        | 16/80 [01:59<07:28,  7.00s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.38e-6, train/loss_step=0.00207, global_step=663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  20%|██        | 16/80 [01:59<07:28,  7.00s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=9.14e-7, train/loss_step=0.000222, global_step=663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  21%|██▏       | 17/80 [02:02<07:08,  6.80s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=9.14e-7, train/loss_step=0.000222, global_step=663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  21%|██▏       | 17/80 [02:02<07:08,  6.80s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=2.1e-5, train/loss_step=0.0063, global_step=664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]     Epoch 33:  22%|██▎       | 18/80 [02:23<07:47,  7.55s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=2.1e-5, train/loss_step=0.0063, global_step=664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  22%|██▎       | 18/80 [02:23<07:47,  7.55s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=6.28e-6, train/loss_step=0.00149, global_step=664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  24%|██▍       | 19/80 [02:23<07:18,  7.20s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=6.28e-6, train/loss_step=0.00149, global_step=664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  24%|██▍       | 19/80 [02:23<07:18,  7.20s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000517, train/loss_vlb_step=2.18e-6, train/loss_step=0.000517, global_step=664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  25%|██▌       | 20/80 [02:24<06:52,  6.88s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000517, train/loss_vlb_step=2.18e-6, train/loss_step=0.000517, global_step=664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  25%|██▌       | 20/80 [02:24<06:52,  6.88s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=3.68e-5, train/loss_step=0.00119, global_step=664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 33:  26%|██▋       | 21/80 [02:25<06:29,  6.60s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=3.68e-5, train/loss_step=0.00119, global_step=664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  26%|██▋       | 21/80 [02:25<06:29,  6.60s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=2.86e-5, train/loss_step=0.00798, global_step=665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  28%|██▊       | 22/80 [02:25<06:07,  6.33s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=2.86e-5, train/loss_step=0.00798, global_step=665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  28%|██▊       | 22/80 [02:25<06:07,  6.33s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=0.000218, train/loss_step=0.00274, global_step=665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  29%|██▉       | 23/80 [02:26<05:46,  6.09s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=0.000218, train/loss_step=0.00274, global_step=665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  29%|██▉       | 23/80 [02:26<05:46,  6.09s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000809, train/loss_vlb_step=2.85e-5, train/loss_step=0.000809, global_step=665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  30%|███       | 24/80 [02:40<06:00,  6.43s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000809, train/loss_vlb_step=2.85e-5, train/loss_step=0.000809, global_step=665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  30%|███       | 24/80 [02:40<06:00,  6.43s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000576, train/loss_vlb_step=2.79e-6, train/loss_step=0.000576, global_step=665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  31%|███▏      | 25/80 [02:41<05:41,  6.21s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000576, train/loss_vlb_step=2.79e-6, train/loss_step=0.000576, global_step=665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  31%|███▏      | 25/80 [02:41<05:41,  6.21s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=8.35e-6, train/loss_step=0.0019, global_step=666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]     Epoch 33:  32%|███▎      | 26/80 [03:00<06:00,  6.67s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=8.35e-6, train/loss_step=0.0019, global_step=666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  32%|███▎      | 26/80 [03:00<06:00,  6.67s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.03e-5, train/loss_step=0.00483, global_step=666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  34%|███▍      | 27/80 [03:00<05:42,  6.45s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.03e-5, train/loss_step=0.00483, global_step=666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  34%|███▍      | 27/80 [03:00<05:42,  6.45s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=1.07e-6, train/loss_step=0.000301, global_step=666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  35%|███▌      | 28/80 [03:01<05:24,  6.25s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=1.07e-6, train/loss_step=0.000301, global_step=666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  35%|███▌      | 28/80 [03:01<05:24,  6.25s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.8e-5, train/loss_step=0.00725, global_step=666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]   Epoch 33:  36%|███▋      | 29/80 [03:01<05:08,  6.06s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.8e-5, train/loss_step=0.00725, global_step=666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  36%|███▋      | 29/80 [03:01<05:08,  6.06s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=0.00102, train/loss_step=0.0104, global_step=667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456] Epoch 33:  38%|███▊      | 30/80 [03:02<04:53,  5.88s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=0.00102, train/loss_step=0.0104, global_step=667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  38%|███▊      | 30/80 [03:02<04:53,  5.88s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000982, train/loss_vlb_step=1.26e-5, train/loss_step=0.000982, global_step=667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  39%|███▉      | 31/80 [03:02<04:39,  5.71s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000982, train/loss_vlb_step=1.26e-5, train/loss_step=0.000982, global_step=667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  39%|███▉      | 31/80 [03:02<04:39,  5.71s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=5.54e-6, train/loss_step=0.00112, global_step=667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 33:  40%|████      | 32/80 [03:16<04:45,  5.95s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=5.54e-6, train/loss_step=0.00112, global_step=667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  40%|████      | 32/80 [03:16<04:45,  5.95s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000809, train/loss_vlb_step=4.46e-6, train/loss_step=0.000809, global_step=667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  41%|████▏     | 33/80 [03:22<04:40,  5.97s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000809, train/loss_vlb_step=4.46e-6, train/loss_step=0.000809, global_step=667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  41%|████▏     | 33/80 [03:22<04:40,  5.97s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=5.5e-6, train/loss_step=0.001, global_step=668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]       Epoch 33:  42%|████▎     | 34/80 [03:37<04:46,  6.22s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=5.5e-6, train/loss_step=0.001, global_step=668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  42%|████▎     | 34/80 [03:37<04:46,  6.22s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000111, train/loss_step=0.018, global_step=668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  44%|████▍     | 35/80 [03:38<04:32,  6.06s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000111, train/loss_step=0.018, global_step=668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  44%|████▍     | 35/80 [03:38<04:32,  6.06s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=6.97e-6, train/loss_step=0.00153, global_step=668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  45%|████▌     | 36/80 [03:38<04:20,  5.91s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=6.97e-6, train/loss_step=0.00153, global_step=668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  45%|████▌     | 36/80 [03:38<04:20,  5.91s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=2.3e-5, train/loss_step=0.00176, global_step=668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  46%|████▋     | 37/80 [03:39<04:08,  5.77s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=2.3e-5, train/loss_step=0.00176, global_step=668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  46%|████▋     | 37/80 [03:39<04:08,  5.77s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.12e-5, train/loss_step=0.00578, global_step=669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  48%|████▊     | 38/80 [03:39<03:56,  5.64s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.12e-5, train/loss_step=0.00578, global_step=669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  48%|████▊     | 38/80 [03:39<03:56,  5.64s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000784, train/loss_vlb_step=5.36e-6, train/loss_step=0.000784, global_step=669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  49%|████▉     | 39/80 [03:40<03:45,  5.51s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000784, train/loss_vlb_step=5.36e-6, train/loss_step=0.000784, global_step=669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  49%|████▉     | 39/80 [03:40<03:45,  5.51s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000757, train/loss_vlb_step=5.59e-6, train/loss_step=0.000757, global_step=669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  50%|█████     | 40/80 [04:05<03:59,  5.99s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000757, train/loss_vlb_step=5.59e-6, train/loss_step=0.000757, global_step=669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  50%|█████     | 40/80 [04:05<03:59,  5.99s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000871, train/loss_vlb_step=5.4e-6, train/loss_step=0.000871, global_step=669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456] Epoch 33:  51%|█████▏    | 41/80 [04:06<03:48,  5.86s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000871, train/loss_vlb_step=5.4e-6, train/loss_step=0.000871, global_step=669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  51%|█████▏    | 41/80 [04:06<03:48,  5.86s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=7.1e-6, train/loss_step=0.000968, global_step=670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  52%|█████▎    | 42/80 [04:27<03:56,  6.23s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=7.1e-6, train/loss_step=0.000968, global_step=670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  52%|█████▎    | 42/80 [04:27<03:56,  6.23s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=6.14e-7, train/loss_step=0.000168, global_step=670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=6.14e-7, train/loss_step=0.000168, global_step=670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000849, train/loss_vlb_step=3.92e-6, train/loss_step=0.000849, global_step=670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  55%|█████▌    | 44/80 [04:28<03:35,  5.98s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000849, train/loss_vlb_step=3.92e-6, train/loss_step=0.000849, global_step=670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  55%|█████▌    | 44/80 [04:28<03:35,  5.98s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=5.09e-5, train/loss_step=0.0015, global_step=670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]    Epoch 33:  56%|█████▋    | 45/80 [04:29<03:25,  5.86s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=5.09e-5, train/loss_step=0.0015, global_step=670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  56%|█████▋    | 45/80 [04:29<03:25,  5.86s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=1.16e-5, train/loss_step=0.00103, global_step=671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=1.16e-5, train/loss_step=0.00103, global_step=671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.32e-5, train/loss_step=0.00654, global_step=671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.32e-5, train/loss_step=0.00654, global_step=671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=6.68e-6, train/loss_step=0.00167, global_step=671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  60%|██████    | 48/80 [04:44<03:05,  5.80s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=6.68e-6, train/loss_step=0.00167, global_step=671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  60%|██████    | 48/80 [04:44<03:05,  5.80s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.54e-5, train/loss_step=0.00151, global_step=671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456] Epoch 33:  61%|██████▏   | 49/80 [04:44<02:56,  5.69s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.54e-5, train/loss_step=0.00151, global_step=671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  61%|██████▏   | 49/80 [04:44<02:56,  5.69s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=2.46e-6, train/loss_step=0.000586, global_step=672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  62%|██████▎   | 50/80 [05:20<03:08,  6.28s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=2.46e-6, train/loss_step=0.000586, global_step=672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  62%|██████▎   | 50/80 [05:20<03:08,  6.28s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.06e-5, train/loss_step=0.00304, global_step=672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 33:  64%|██████▍   | 51/80 [05:20<02:58,  6.17s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.06e-5, train/loss_step=0.00304, global_step=672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  64%|██████▍   | 51/80 [05:20<02:58,  6.17s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000446, train/loss_step=0.0224, global_step=672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456] Epoch 33:  65%|██████▌   | 52/80 [05:21<02:49,  6.06s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000446, train/loss_step=0.0224, global_step=672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  65%|██████▌   | 52/80 [05:21<02:49,  6.06s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.39e-6, train/loss_step=0.000336, global_step=672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  66%|██████▋   | 53/80 [05:21<02:40,  5.96s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.39e-6, train/loss_step=0.000336, global_step=672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  66%|██████▋   | 53/80 [05:21<02:40,  5.96s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=3.36e-6, train/loss_step=0.000514, global_step=673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  68%|██████▊   | 54/80 [05:22<02:32,  5.86s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=3.36e-6, train/loss_step=0.000514, global_step=673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  68%|██████▊   | 54/80 [05:22<02:32,  5.86s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=4.48e-5, train/loss_step=0.00971, global_step=673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 33:  69%|██████▉   | 55/80 [05:22<02:24,  5.76s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00971, train/loss_vlb_step=4.48e-5, train/loss_step=0.00971, global_step=673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  69%|██████▉   | 55/80 [05:22<02:24,  5.76s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=3.26e-6, train/loss_step=0.000561, global_step=673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  70%|███████   | 56/80 [05:23<02:16,  5.67s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=3.26e-6, train/loss_step=0.000561, global_step=673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  70%|███████   | 56/80 [05:23<02:16,  5.67s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=2.04e-6, train/loss_step=0.000468, global_step=673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 33:  71%|███████▏  | 57/80 [05:23<02:08,  5.58s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=2.04e-6, train/loss_step=0.000468, global_step=673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  71%|███████▏  | 57/80 [05:23<02:08,  5.58s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.04e-6, train/loss_step=0.000261, global_step=674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  72%|███████▎  | 58/80 [06:04<02:15,  6.17s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.04e-6, train/loss_step=0.000261, global_step=674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  72%|███████▎  | 58/80 [06:04<02:15,  6.17s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=8.98e-5, train/loss_step=0.00123, global_step=674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 33:  74%|███████▍  | 59/80 [06:04<02:07,  6.08s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=8.98e-5, train/loss_step=0.00123, global_step=674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  74%|███████▍  | 59/80 [06:04<02:07,  6.08s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=1.88e-5, train/loss_step=0.00122, global_step=674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  75%|███████▌  | 60/80 [06:05<01:59,  5.99s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=1.88e-5, train/loss_step=0.00122, global_step=674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  75%|███████▌  | 60/80 [06:05<01:59,  5.99s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.22e-5, train/loss_step=0.00354, global_step=674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  76%|███████▋  | 61/80 [06:05<01:52,  5.90s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.22e-5, train/loss_step=0.00354, global_step=674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  76%|███████▋  | 61/80 [06:05<01:52,  5.90s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=1.67e-5, train/loss_step=0.00463, global_step=675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  78%|███████▊  | 62/80 [06:06<01:44,  5.81s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=1.67e-5, train/loss_step=0.00463, global_step=675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  78%|███████▊  | 62/80 [06:06<01:44,  5.81s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=1.58e-5, train/loss_step=0.00105, global_step=675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  79%|███████▉  | 63/80 [06:06<01:37,  5.73s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=1.58e-5, train/loss_step=0.00105, global_step=675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  79%|███████▉  | 63/80 [06:06<01:37,  5.73s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.49e-5, train/loss_step=0.00682, global_step=675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  80%|████████  | 64/80 [06:07<01:30,  5.65s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=3.49e-5, train/loss_step=0.00682, global_step=675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  80%|████████  | 64/80 [06:07<01:30,  5.65s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=4.89e-6, train/loss_step=0.00122, global_step=675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  81%|████████▏ | 65/80 [06:07<01:23,  5.57s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=4.89e-6, train/loss_step=0.00122, global_step=675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  81%|████████▏ | 65/80 [06:07<01:23,  5.57s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.04e-5, train/loss_step=0.00286, global_step=676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  82%|████████▎ | 66/80 [06:44<01:24,  6.04s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.04e-5, train/loss_step=0.00286, global_step=676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  82%|████████▎ | 66/80 [06:44<01:24,  6.04s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000142, train/loss_step=0.0127, global_step=676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456] Epoch 33:  84%|████████▍ | 67/80 [06:45<01:17,  5.96s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000142, train/loss_step=0.0127, global_step=676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  84%|████████▍ | 67/80 [06:45<01:17,  5.96s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=1.83e-5, train/loss_step=0.00524, global_step=676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456] Epoch 33:  85%|████████▌ | 68/80 [06:45<01:10,  5.88s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=1.83e-5, train/loss_step=0.00524, global_step=676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  85%|████████▌ | 68/80 [06:45<01:10,  5.88s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.16e-5, train/loss_step=0.00624, global_step=676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  86%|████████▋ | 69/80 [06:46<01:03,  5.81s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.16e-5, train/loss_step=0.00624, global_step=676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  86%|████████▋ | 69/80 [06:46<01:03,  5.81s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.4e-5, train/loss_step=0.00355, global_step=677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456] Epoch 33:  88%|████████▊ | 70/80 [06:47<00:57,  5.73s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=1.4e-5, train/loss_step=0.00355, global_step=677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  88%|████████▊ | 70/80 [06:47<00:57,  5.73s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.87e-5, train/loss_step=0.00231, global_step=677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  89%|████████▉ | 71/80 [06:47<00:50,  5.66s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.87e-5, train/loss_step=0.00231, global_step=677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  89%|████████▉ | 71/80 [06:47<00:50,  5.66s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=3.74e-6, train/loss_step=0.000876, global_step=677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=3.74e-6, train/loss_step=0.000876, global_step=677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000401, train/loss_vlb_step=2.34e-6, train/loss_step=0.000401, global_step=677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  91%|█████████▏| 73/80 [06:48<00:38,  5.52s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000401, train/loss_vlb_step=2.34e-6, train/loss_step=0.000401, global_step=677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  91%|█████████▏| 73/80 [06:48<00:38,  5.52s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=2.22e-6, train/loss_step=0.000402, global_step=678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  92%|█████████▎| 74/80 [07:18<00:35,  5.85s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=2.22e-6, train/loss_step=0.000402, global_step=678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  92%|█████████▎| 74/80 [07:18<00:35,  5.85s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.38e-5, train/loss_step=0.00487, global_step=678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 33:  94%|█████████▍| 75/80 [07:19<00:28,  5.78s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=2.38e-5, train/loss_step=0.00487, global_step=678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  94%|█████████▍| 75/80 [07:19<00:28,  5.78s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.7e-6, train/loss_step=0.00108, global_step=678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456] Epoch 33:  95%|█████████▌| 76/80 [07:19<00:22,  5.71s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.7e-6, train/loss_step=0.00108, global_step=678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  95%|█████████▌| 76/80 [07:19<00:22,  5.71s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=6.54e-6, train/loss_step=0.00152, global_step=678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  96%|█████████▋| 77/80 [07:25<00:17,  5.71s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=6.54e-6, train/loss_step=0.00152, global_step=678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  96%|█████████▋| 77/80 [07:25<00:17,  5.71s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.59e-6, train/loss_step=0.00038, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  98%|█████████▊| 78/80 [07:25<00:11,  5.64s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.59e-6, train/loss_step=0.00038, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  98%|█████████▊| 78/80 [07:25<00:11,  5.64s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.34e-6, train/loss_step=0.000325, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  99%|█████████▉| 79/80 [07:26<00:05,  5.58s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.34e-6, train/loss_step=0.000325, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33:  99%|█████████▉| 79/80 [07:26<00:05,  5.58s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=1.37e-6, train/loss_step=0.000322, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33: 100%|██████████| 80/80 [07:26<00:00,  5.51s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=1.37e-6, train/loss_step=0.000322, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 33: 100%|██████████| 80/80 [07:26<00:00,  5.51s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.00111, train/loss_step=0.0437, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]    Average Epoch time: 446.66 seconds
+Average Peak memory 29570.26MiB
+Epoch 33:   0%|          | 0/80 [00:00<00:00, 7025.63it/s, loss=0.00502, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.00111, train/loss_step=0.0437, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 34:   0%|          | 0/80 [00:00<00:00, 2504.06it/s, loss=0.00502, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.00111, train/loss_step=0.0437, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]Epoch 34:   1%|▏         | 1/80 [00:45<29:58, 22.76s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.0437, train/loss_vlb_step=0.00111, train/loss_step=0.0437, global_step=679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00456, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00456]  Epoch 34:   1%|▏         | 1/80 [00:45<29:58, 22.76s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=3.41e-6, train/loss_step=0.000734, global_step=680.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   2%|▎         | 2/80 [00:46<19:56, 15.34s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=3.41e-6, train/loss_step=0.000734, global_step=680.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   2%|▎         | 2/80 [00:46<19:56, 15.34s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=2.91e-5, train/loss_step=0.00658, global_step=680.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:   4%|▍         | 3/80 [00:46<14:55, 11.62s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00658, train/loss_vlb_step=2.91e-5, train/loss_step=0.00658, global_step=680.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   4%|▍         | 3/80 [00:46<14:55, 11.62s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=1.48e-5, train/loss_step=0.00443, global_step=680.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   5%|▌         | 4/80 [00:47<11:54,  9.40s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=1.48e-5, train/loss_step=0.00443, global_step=680.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   5%|▌         | 4/80 [00:47<11:54,  9.40s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=7.13e-6, train/loss_step=0.000805, global_step=680.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   6%|▋         | 5/80 [00:47<09:54,  7.93s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=7.13e-6, train/loss_step=0.000805, global_step=680.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   6%|▋         | 5/80 [00:47<09:54,  7.93s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000768, train/loss_vlb_step=5.81e-6, train/loss_step=0.000768, global_step=681.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   8%|▊         | 6/80 [00:49<08:48,  7.14s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000768, train/loss_vlb_step=5.81e-6, train/loss_step=0.000768, global_step=681.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   8%|▊         | 6/80 [00:49<08:48,  7.14s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=1.16e-5, train/loss_step=0.0011, global_step=681.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]    Epoch 34:   9%|▉         | 7/80 [00:50<07:40,  6.31s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=1.16e-5, train/loss_step=0.0011, global_step=681.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:   9%|▉         | 7/80 [00:50<07:40,  6.31s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.15e-5, train/loss_step=0.0026, global_step=681.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  10%|█         | 8/80 [01:37<12:56, 10.78s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.15e-5, train/loss_step=0.0026, global_step=681.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  10%|█         | 8/80 [01:37<12:56, 10.78s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.17e-5, train/loss_step=0.00278, global_step=681.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  11%|█▏        | 9/80 [01:37<11:32,  9.75s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.17e-5, train/loss_step=0.00278, global_step=681.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  11%|█▏        | 9/80 [01:37<11:32,  9.75s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.23e-6, train/loss_step=0.000275, global_step=682.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  12%|█▎        | 10/80 [01:38<10:23,  8.91s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.23e-6, train/loss_step=0.000275, global_step=682.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  12%|█▎        | 10/80 [01:38<10:23,  8.91s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=1.12e-5, train/loss_step=0.00164, global_step=682.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  14%|█▍        | 11/80 [01:38<09:26,  8.21s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=1.12e-5, train/loss_step=0.00164, global_step=682.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  14%|█▍        | 11/80 [01:38<09:26,  8.21s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000669, train/loss_vlb_step=3.02e-6, train/loss_step=0.000669, global_step=682.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  15%|█▌        | 12/80 [01:39<08:38,  7.62s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000669, train/loss_vlb_step=3.02e-6, train/loss_step=0.000669, global_step=682.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  15%|█▌        | 12/80 [01:39<08:38,  7.62s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00686, train/loss_step=0.0275, global_step=682.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]    Epoch 34:  16%|█▋        | 13/80 [01:39<07:56,  7.11s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00686, train/loss_step=0.0275, global_step=682.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  16%|█▋        | 13/80 [01:39<07:56,  7.11s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=9e-7, train/loss_step=0.000236, global_step=683.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  18%|█▊        | 14/80 [01:40<07:20,  6.67s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=9e-7, train/loss_step=0.000236, global_step=683.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  18%|█▊        | 14/80 [01:40<07:20,  6.67s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=1.48e-6, train/loss_step=0.000365, global_step=683.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  19%|█▉        | 15/80 [01:40<06:48,  6.28s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=1.48e-6, train/loss_step=0.000365, global_step=683.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  19%|█▉        | 15/80 [01:40<06:48,  6.28s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=3.7e-5, train/loss_step=0.00105, global_step=683.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]   Epoch 34:  20%|██        | 16/80 [02:13<08:21,  7.84s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=3.7e-5, train/loss_step=0.00105, global_step=683.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  20%|██        | 16/80 [02:13<08:21,  7.84s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000609, train/loss_vlb_step=2.51e-6, train/loss_step=0.000609, global_step=683.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  21%|██▏       | 17/80 [02:13<07:48,  7.43s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000609, train/loss_vlb_step=2.51e-6, train/loss_step=0.000609, global_step=683.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  21%|██▏       | 17/80 [02:13<07:48,  7.43s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.1e-6, train/loss_step=0.0014, global_step=684.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]     Epoch 34:  22%|██▎       | 18/80 [02:14<07:18,  7.07s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.1e-6, train/loss_step=0.0014, global_step=684.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  22%|██▎       | 18/80 [02:14<07:18,  7.07s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=2.35e-5, train/loss_step=0.00657, global_step=684.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  24%|██▍       | 19/80 [02:14<06:51,  6.74s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=2.35e-5, train/loss_step=0.00657, global_step=684.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  24%|██▍       | 19/80 [02:14<06:51,  6.74s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000776, train/loss_vlb_step=3.21e-6, train/loss_step=0.000776, global_step=684.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  25%|██▌       | 20/80 [02:15<06:26,  6.45s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000776, train/loss_vlb_step=3.21e-6, train/loss_step=0.000776, global_step=684.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  25%|██▌       | 20/80 [02:15<06:26,  6.45s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.24e-5, train/loss_step=0.00613, global_step=684.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  26%|██▋       | 21/80 [02:15<06:04,  6.18s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.24e-5, train/loss_step=0.00613, global_step=684.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  26%|██▋       | 21/80 [02:15<06:04,  6.18s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=2.49e-6, train/loss_step=0.000489, global_step=685.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  28%|██▊       | 22/80 [02:16<05:44,  5.93s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=2.49e-6, train/loss_step=0.000489, global_step=685.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  28%|██▊       | 22/80 [02:16<05:44,  5.93s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=5.21e-6, train/loss_step=0.00131, global_step=685.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  29%|██▉       | 23/80 [02:16<05:25,  5.71s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=5.21e-6, train/loss_step=0.00131, global_step=685.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  29%|██▉       | 23/80 [02:16<05:25,  5.71s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=6.72e-6, train/loss_step=0.00173, global_step=685.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  30%|███       | 24/80 [02:54<06:29,  6.96s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=6.72e-6, train/loss_step=0.00173, global_step=685.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  30%|███       | 24/80 [02:54<06:29,  6.96s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=3.48e-6, train/loss_step=0.000642, global_step=685.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  31%|███▏      | 25/80 [02:55<06:10,  6.74s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=3.48e-6, train/loss_step=0.000642, global_step=685.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  31%|███▏      | 25/80 [02:55<06:10,  6.74s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.35e-6, train/loss_step=0.000323, global_step=686.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  32%|███▎      | 26/80 [02:55<05:51,  6.50s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.35e-6, train/loss_step=0.000323, global_step=686.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  32%|███▎      | 26/80 [02:55<05:51,  6.50s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.00119, train/loss_step=0.0256, global_step=686.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]    Epoch 34:  34%|███▍      | 27/80 [02:56<05:33,  6.29s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.00119, train/loss_step=0.0256, global_step=686.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  34%|███▍      | 27/80 [02:56<05:33,  6.29s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=2.56e-6, train/loss_step=0.000363, global_step=686.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  35%|███▌      | 28/80 [02:56<05:16,  6.10s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=2.56e-6, train/loss_step=0.000363, global_step=686.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  35%|███▌      | 28/80 [02:56<05:16,  6.10s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=8.31e-6, train/loss_step=0.00174, global_step=686.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  36%|███▋      | 29/80 [02:57<05:01,  5.91s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=8.31e-6, train/loss_step=0.00174, global_step=686.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  36%|███▋      | 29/80 [02:57<05:01,  5.91s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=8.1e-5, train/loss_step=0.0116, global_step=687.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]   Epoch 34:  38%|███▊      | 30/80 [02:57<04:46,  5.73s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=8.1e-5, train/loss_step=0.0116, global_step=687.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  38%|███▊      | 30/80 [02:57<04:46,  5.73s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=4.81e-5, train/loss_step=0.0143, global_step=687.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  39%|███▉      | 31/80 [02:58<04:32,  5.57s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=4.81e-5, train/loss_step=0.0143, global_step=687.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  39%|███▉      | 31/80 [02:58<04:32,  5.57s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.78e-6, train/loss_step=0.00154, global_step=687.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  40%|████      | 32/80 [03:38<05:17,  6.62s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.78e-6, train/loss_step=0.00154, global_step=687.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  40%|████      | 32/80 [03:38<05:17,  6.62s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.78e-5, train/loss_step=0.00409, global_step=687.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  41%|████▏     | 33/80 [03:39<05:02,  6.45s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.78e-5, train/loss_step=0.00409, global_step=687.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  41%|████▏     | 33/80 [03:39<05:02,  6.45s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=2.91e-6, train/loss_step=0.000825, global_step=688.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  42%|████▎     | 34/80 [03:39<04:48,  6.28s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=2.91e-6, train/loss_step=0.000825, global_step=688.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  42%|████▎     | 34/80 [03:39<04:48,  6.28s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000532, train/loss_vlb_step=2.6e-6, train/loss_step=0.000532, global_step=688.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34:  44%|████▍     | 35/80 [03:40<04:35,  6.11s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000532, train/loss_vlb_step=2.6e-6, train/loss_step=0.000532, global_step=688.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  44%|████▍     | 35/80 [03:40<04:35,  6.11s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=3.53e-5, train/loss_step=0.000893, global_step=688.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  45%|████▌     | 36/80 [03:40<04:22,  5.96s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=3.53e-5, train/loss_step=0.000893, global_step=688.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  45%|████▌     | 36/80 [03:40<04:22,  5.96s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.06e-5, train/loss_step=0.00204, global_step=688.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  46%|████▋     | 37/80 [03:41<04:10,  5.82s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.06e-5, train/loss_step=0.00204, global_step=688.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  46%|████▋     | 37/80 [03:41<04:10,  5.82s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.13e-5, train/loss_step=0.00438, global_step=689.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34:  48%|████▊     | 38/80 [03:41<03:58,  5.68s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=2.13e-5, train/loss_step=0.00438, global_step=689.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  48%|████▊     | 38/80 [03:41<03:58,  5.68s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.54e-5, train/loss_step=0.00602, global_step=689.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  49%|████▉     | 39/80 [03:42<03:47,  5.55s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=3.54e-5, train/loss_step=0.00602, global_step=689.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  49%|████▉     | 39/80 [03:42<03:47,  5.55s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000194, train/loss_step=0.0303, global_step=689.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34:  50%|█████     | 40/80 [04:15<04:09,  6.24s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.0303, train/loss_vlb_step=0.000194, train/loss_step=0.0303, global_step=689.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  50%|█████     | 40/80 [04:15<04:09,  6.24s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.55e-5, train/loss_step=0.0102, global_step=689.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34:  51%|█████▏    | 41/80 [04:16<03:58,  6.11s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.55e-5, train/loss_step=0.0102, global_step=689.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  51%|█████▏    | 41/80 [04:16<03:58,  6.11s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.48e-6, train/loss_step=0.00236, global_step=690.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  52%|█████▎    | 42/80 [04:16<03:47,  5.98s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.48e-6, train/loss_step=0.00236, global_step=690.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  52%|█████▎    | 42/80 [04:16<03:47,  5.98s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.95e-5, train/loss_step=0.0048, global_step=690.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  54%|█████▍    | 43/80 [04:17<03:36,  5.85s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=2.95e-5, train/loss_step=0.0048, global_step=690.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  54%|█████▍    | 43/80 [04:17<03:36,  5.85s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=5.21e-5, train/loss_step=0.0074, global_step=690.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34:  55%|█████▌    | 44/80 [04:18<03:26,  5.73s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=5.21e-5, train/loss_step=0.0074, global_step=690.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  55%|█████▌    | 44/80 [04:18<03:26,  5.73s/it, loss=0.00725, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=8.25e-5, train/loss_step=0.0157, global_step=690.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  56%|█████▋    | 45/80 [04:18<03:16,  5.62s/it, loss=0.00725, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=8.25e-5, train/loss_step=0.0157, global_step=690.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  56%|█████▋    | 45/80 [04:18<03:16,  5.62s/it, loss=0.00739, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.08e-5, train/loss_step=0.00294, global_step=691.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  57%|█████▊    | 46/80 [04:19<03:07,  5.51s/it, loss=0.00739, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.08e-5, train/loss_step=0.00294, global_step=691.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  57%|█████▊    | 46/80 [04:19<03:07,  5.51s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=3.88e-6, train/loss_step=0.00103, global_step=691.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  59%|█████▉    | 47/80 [04:19<02:58,  5.41s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=3.88e-6, train/loss_step=0.00103, global_step=691.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  59%|█████▉    | 47/80 [04:19<02:58,  5.41s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=5.26e-5, train/loss_step=0.00846, global_step=691.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  60%|██████    | 48/80 [04:51<03:10,  5.94s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=5.26e-5, train/loss_step=0.00846, global_step=691.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  60%|██████    | 48/80 [04:51<03:10,  5.94s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.77e-6, train/loss_step=0.00207, global_step=691.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  61%|██████▏   | 49/80 [04:52<03:01,  5.84s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.77e-6, train/loss_step=0.00207, global_step=691.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  61%|██████▏   | 49/80 [04:52<03:01,  5.84s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.000137, train/loss_vlb_step=5.57e-7, train/loss_step=0.000137, global_step=692.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  62%|██████▎   | 50/80 [04:52<02:52,  5.74s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.000137, train/loss_vlb_step=5.57e-7, train/loss_step=0.000137, global_step=692.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  62%|██████▎   | 50/80 [04:52<02:52,  5.74s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=2.18e-5, train/loss_step=0.00563, global_step=692.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  64%|██████▍   | 51/80 [04:56<02:45,  5.70s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=2.18e-5, train/loss_step=0.00563, global_step=692.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  64%|██████▍   | 51/80 [04:56<02:45,  5.70s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000319, train/loss_vlb_step=1.56e-6, train/loss_step=0.000319, global_step=692.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  65%|██████▌   | 52/80 [04:56<02:36,  5.60s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000319, train/loss_vlb_step=1.56e-6, train/loss_step=0.000319, global_step=692.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  65%|██████▌   | 52/80 [04:56<02:36,  5.60s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=6.9e-5, train/loss_step=0.00612, global_step=692.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]   Epoch 34:  66%|██████▋   | 53/80 [04:57<02:28,  5.51s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=6.9e-5, train/loss_step=0.00612, global_step=692.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  66%|██████▋   | 53/80 [04:57<02:28,  5.51s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=7.29e-5, train/loss_step=0.0136, global_step=693.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34:  68%|██████▊   | 54/80 [04:57<02:20,  5.42s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=7.29e-5, train/loss_step=0.0136, global_step=693.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  68%|██████▊   | 54/80 [04:57<02:20,  5.42s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=6.12e-6, train/loss_step=0.00149, global_step=693.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  69%|██████▉   | 55/80 [04:58<02:13,  5.33s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=6.12e-6, train/loss_step=0.00149, global_step=693.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  69%|██████▉   | 55/80 [04:58<02:13,  5.33s/it, loss=0.00628, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=2.26e-6, train/loss_step=0.00062, global_step=693.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  70%|███████   | 56/80 [05:35<02:21,  5.88s/it, loss=0.00628, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=2.26e-6, train/loss_step=0.00062, global_step=693.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  70%|███████   | 56/80 [05:35<02:21,  5.88s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=8.4e-6, train/loss_step=0.00133, global_step=693.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34:  71%|███████▏  | 57/80 [05:38<02:14,  5.84s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=8.4e-6, train/loss_step=0.00133, global_step=693.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  71%|███████▏  | 57/80 [05:38<02:14,  5.84s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=2.53e-5, train/loss_step=0.0068, global_step=694.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34:  72%|███████▎  | 58/80 [05:39<02:06,  5.75s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=2.53e-5, train/loss_step=0.0068, global_step=694.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  72%|███████▎  | 58/80 [05:39<02:06,  5.75s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=3.38e-5, train/loss_step=0.00871, global_step=694.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  74%|███████▍  | 59/80 [05:39<01:58,  5.66s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00871, train/loss_vlb_step=3.38e-5, train/loss_step=0.00871, global_step=694.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  74%|███████▍  | 59/80 [05:39<01:58,  5.66s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=5.66e-6, train/loss_step=0.000702, global_step=694.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  75%|███████▌  | 60/80 [05:40<01:51,  5.58s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=5.66e-6, train/loss_step=0.000702, global_step=694.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  75%|███████▌  | 60/80 [05:40<01:51,  5.58s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=1.54e-6, train/loss_step=0.000395, global_step=694.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  76%|███████▋  | 61/80 [05:40<01:44,  5.50s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=1.54e-6, train/loss_step=0.000395, global_step=694.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  76%|███████▋  | 61/80 [05:40<01:44,  5.50s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.77e-5, train/loss_step=0.00312, global_step=695.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  78%|███████▊  | 62/80 [05:41<01:37,  5.42s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.77e-5, train/loss_step=0.00312, global_step=695.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  78%|███████▊  | 62/80 [05:41<01:37,  5.42s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=1.91e-6, train/loss_step=0.000466, global_step=695.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  79%|███████▉  | 63/80 [05:41<01:30,  5.34s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=1.91e-6, train/loss_step=0.000466, global_step=695.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  79%|███████▉  | 63/80 [05:41<01:30,  5.34s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.28e-5, train/loss_step=0.00346, global_step=695.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  80%|████████  | 64/80 [06:18<01:33,  5.83s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.28e-5, train/loss_step=0.00346, global_step=695.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  80%|████████  | 64/80 [06:18<01:33,  5.83s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=2.92e-5, train/loss_step=0.00717, global_step=695.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=2.92e-5, train/loss_step=0.00717, global_step=695.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=4.64e-6, train/loss_step=0.00125, global_step=696.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  82%|████████▎ | 66/80 [06:20<01:19,  5.67s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=4.64e-6, train/loss_step=0.00125, global_step=696.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  82%|████████▎ | 66/80 [06:20<01:19,  5.67s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=0.000211, train/loss_step=0.0162, global_step=696.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  84%|████████▍ | 67/80 [06:23<01:13,  5.64s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=0.000211, train/loss_step=0.0162, global_step=696.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  84%|████████▍ | 67/80 [06:23<01:13,  5.64s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000879, train/loss_vlb_step=2.02e-5, train/loss_step=0.000879, global_step=696.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  85%|████████▌ | 68/80 [06:26<01:07,  5.60s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000879, train/loss_vlb_step=2.02e-5, train/loss_step=0.000879, global_step=696.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  85%|████████▌ | 68/80 [06:26<01:07,  5.60s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000707, train/loss_vlb_step=5.75e-6, train/loss_step=0.000707, global_step=696.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  86%|████████▋ | 69/80 [06:27<01:00,  5.53s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000707, train/loss_vlb_step=5.75e-6, train/loss_step=0.000707, global_step=696.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  86%|████████▋ | 69/80 [06:27<01:00,  5.53s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=2.69e-5, train/loss_step=0.0011, global_step=697.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]      Epoch 34:  88%|████████▊ | 70/80 [06:27<00:54,  5.46s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=2.69e-5, train/loss_step=0.0011, global_step=697.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  88%|████████▊ | 70/80 [06:27<00:54,  5.46s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=1.98e-6, train/loss_step=0.000494, global_step=697.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  89%|████████▉ | 71/80 [06:27<00:48,  5.39s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=1.98e-6, train/loss_step=0.000494, global_step=697.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  89%|████████▉ | 71/80 [06:27<00:48,  5.39s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00064, train/loss_vlb_step=3.13e-6, train/loss_step=0.00064, global_step=697.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  90%|█████████ | 72/80 [06:56<00:45,  5.70s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00064, train/loss_vlb_step=3.13e-6, train/loss_step=0.00064, global_step=697.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  90%|█████████ | 72/80 [06:56<00:45,  5.70s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.28e-5, train/loss_step=0.00197, global_step=697.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  91%|█████████▏| 73/80 [06:56<00:39,  5.63s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.28e-5, train/loss_step=0.00197, global_step=697.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  91%|█████████▏| 73/80 [06:56<00:39,  5.63s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.19e-5, train/loss_step=0.00218, global_step=698.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.19e-5, train/loss_step=0.00218, global_step=698.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000765, train/loss_vlb_step=3.84e-6, train/loss_step=0.000765, global_step=698.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  94%|█████████▍| 75/80 [07:03<00:27,  5.58s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000765, train/loss_vlb_step=3.84e-6, train/loss_step=0.000765, global_step=698.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  94%|█████████▍| 75/80 [07:03<00:27,  5.58s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=3.92e-6, train/loss_step=0.000956, global_step=698.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  95%|█████████▌| 76/80 [07:04<00:22,  5.51s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=3.92e-6, train/loss_step=0.000956, global_step=698.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  95%|█████████▌| 76/80 [07:04<00:22,  5.51s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=3.73e-5, train/loss_step=0.00892, global_step=698.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 34:  96%|█████████▋| 77/80 [07:04<00:16,  5.45s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=3.73e-5, train/loss_step=0.00892, global_step=698.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  96%|█████████▋| 77/80 [07:04<00:16,  5.45s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000109, train/loss_step=0.0127, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34:  98%|█████████▊| 78/80 [07:05<00:10,  5.38s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000109, train/loss_step=0.0127, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  98%|█████████▊| 78/80 [07:05<00:10,  5.38s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000197, train/loss_step=0.0242, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  99%|█████████▉| 79/80 [07:05<00:05,  5.32s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000197, train/loss_step=0.0242, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34:  99%|█████████▉| 79/80 [07:05<00:05,  5.32s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=8.22e-5, train/loss_step=0.0119, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004] Epoch 34: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=8.22e-5, train/loss_step=0.0119, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 34: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=1.22e-6, train/loss_step=0.000331, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Average Epoch time: 427.95 seconds
+Average Peak memory 29562.89MiB
+Epoch 34:   0%|          | 0/80 [00:00<00:00, 2933.08it/s, loss=0.00497, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=1.22e-6, train/loss_step=0.000331, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 35:   0%|          | 0/80 [00:00<00:00, 1389.76it/s, loss=0.00497, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=1.22e-6, train/loss_step=0.000331, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]Epoch 35:   1%|▏         | 1/80 [00:39<25:41, 19.51s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=1.22e-6, train/loss_step=0.000331, global_step=699.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.004]  Epoch 35:   1%|▏         | 1/80 [00:39<25:41, 19.51s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=0.000224, train/loss_step=0.0208, global_step=700.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:   2%|▎         | 2/80 [00:39<17:06, 13.16s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=0.000224, train/loss_step=0.0208, global_step=700.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:   2%|▎         | 2/80 [00:39<17:06, 13.16s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.000779, train/loss_vlb_step=8.51e-6, train/loss_step=0.000779, global_step=700.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:   4%|▍         | 3/80 [00:50<16:14, 12.65s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.000779, train/loss_vlb_step=8.51e-6, train/loss_step=0.000779, global_step=700.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:   4%|▍         | 3/80 [00:50<16:14, 12.65s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=1.78e-5, train/loss_step=0.00489, global_step=700.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:   5%|▌         | 4/80 [00:52<13:25, 10.59s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=1.78e-5, train/loss_step=0.00489, global_step=700.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:   5%|▌         | 4/80 [00:52<13:25, 10.59s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=9.86e-5, train/loss_step=0.0155, global_step=700.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:   6%|▋         | 5/80 [00:53<11:08,  8.91s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=9.86e-5, train/loss_step=0.0155, global_step=700.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:   6%|▋         | 5/80 [00:53<11:08,  8.91s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.2e-6, train/loss_step=0.000307, global_step=701.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:   8%|▊         | 6/80 [00:53<09:30,  7.71s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.2e-6, train/loss_step=0.000307, global_step=701.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:   8%|▊         | 6/80 [00:53<09:30,  7.71s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.01e-5, train/loss_step=0.00554, global_step=701.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:   9%|▉         | 7/80 [00:54<08:16,  6.81s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.01e-5, train/loss_step=0.00554, global_step=701.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:   9%|▉         | 7/80 [00:54<08:16,  6.81s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=4.12e-6, train/loss_step=0.000833, global_step=701.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  10%|█         | 8/80 [01:17<10:23,  8.66s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=4.12e-6, train/loss_step=0.000833, global_step=701.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  10%|█         | 8/80 [01:17<10:23,  8.66s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.8e-6, train/loss_step=0.000409, global_step=701.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:  11%|█▏        | 9/80 [01:35<11:17,  9.54s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.8e-6, train/loss_step=0.000409, global_step=701.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  11%|█▏        | 9/80 [01:35<11:17,  9.54s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00046, train/loss_vlb_step=2.03e-6, train/loss_step=0.00046, global_step=702.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:  12%|█▎        | 10/80 [01:35<10:09,  8.71s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00046, train/loss_vlb_step=2.03e-6, train/loss_step=0.00046, global_step=702.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  12%|█▎        | 10/80 [01:35<10:09,  8.71s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.44e-6, train/loss_step=0.000329, global_step=702.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  14%|█▍        | 11/80 [01:38<09:24,  8.18s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.44e-6, train/loss_step=0.000329, global_step=702.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  14%|█▍        | 11/80 [01:38<09:24,  8.18s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.000675, train/loss_vlb_step=8.47e-6, train/loss_step=0.000675, global_step=702.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  15%|█▌        | 12/80 [01:38<08:36,  7.59s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.000675, train/loss_vlb_step=8.47e-6, train/loss_step=0.000675, global_step=702.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  15%|█▌        | 12/80 [01:38<08:36,  7.59s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=7.28e-6, train/loss_step=0.00163, global_step=702.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  16%|█▋        | 13/80 [01:39<07:54,  7.09s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=7.28e-6, train/loss_step=0.00163, global_step=702.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  16%|█▋        | 13/80 [01:39<07:54,  7.09s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000949, train/loss_vlb_step=2.61e-5, train/loss_step=0.000949, global_step=703.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  18%|█▊        | 14/80 [01:39<07:18,  6.65s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000949, train/loss_vlb_step=2.61e-5, train/loss_step=0.000949, global_step=703.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  18%|█▊        | 14/80 [01:39<07:18,  6.65s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000195, train/loss_step=0.0158, global_step=703.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]    Epoch 35:  19%|█▉        | 15/80 [01:40<06:47,  6.26s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000195, train/loss_step=0.0158, global_step=703.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  19%|█▉        | 15/80 [01:40<06:47,  6.26s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.000692, train/loss_vlb_step=3.19e-6, train/loss_step=0.000692, global_step=703.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  20%|██        | 16/80 [02:00<07:34,  7.10s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.000692, train/loss_vlb_step=3.19e-6, train/loss_step=0.000692, global_step=703.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  20%|██        | 16/80 [02:00<07:34,  7.10s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=3.42e-6, train/loss_step=0.000763, global_step=703.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  21%|██▏       | 17/80 [02:11<07:40,  7.32s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=3.42e-6, train/loss_step=0.000763, global_step=703.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  21%|██▏       | 17/80 [02:11<07:40,  7.32s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000588, train/loss_vlb_step=1.22e-5, train/loss_step=0.000588, global_step=704.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  22%|██▎       | 18/80 [02:12<07:11,  6.96s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000588, train/loss_vlb_step=1.22e-5, train/loss_step=0.000588, global_step=704.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  22%|██▎       | 18/80 [02:12<07:11,  6.96s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.03e-6, train/loss_step=0.000411, global_step=704.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  24%|██▍       | 19/80 [02:13<06:46,  6.67s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.03e-6, train/loss_step=0.000411, global_step=704.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  24%|██▍       | 19/80 [02:13<06:46,  6.67s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=7.58e-6, train/loss_step=0.00163, global_step=704.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  25%|██▌       | 20/80 [02:13<06:22,  6.38s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=7.58e-6, train/loss_step=0.00163, global_step=704.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  25%|██▌       | 20/80 [02:13<06:22,  6.38s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=1.16e-6, train/loss_step=0.000282, global_step=704.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  26%|██▋       | 21/80 [02:14<06:01,  6.13s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=1.16e-6, train/loss_step=0.000282, global_step=704.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  26%|██▋       | 21/80 [02:14<06:01,  6.13s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=3.14e-5, train/loss_step=0.00388, global_step=705.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  28%|██▊       | 22/80 [02:15<05:41,  5.88s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=3.14e-5, train/loss_step=0.00388, global_step=705.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  28%|██▊       | 22/80 [02:15<05:41,  5.88s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000799, train/loss_vlb_step=6.88e-6, train/loss_step=0.000799, global_step=705.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  29%|██▉       | 23/80 [02:15<05:22,  5.66s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000799, train/loss_vlb_step=6.88e-6, train/loss_step=0.000799, global_step=705.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  29%|██▉       | 23/80 [02:15<05:22,  5.66s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.86e-5, train/loss_step=0.0101, global_step=705.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]    Epoch 35:  30%|███       | 24/80 [02:49<06:20,  6.80s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.86e-5, train/loss_step=0.0101, global_step=705.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  30%|███       | 24/80 [02:49<06:20,  6.80s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.16e-6, train/loss_step=0.000252, global_step=705.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  31%|███▏      | 25/80 [02:53<06:07,  6.68s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.16e-6, train/loss_step=0.000252, global_step=705.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  31%|███▏      | 25/80 [02:53<06:07,  6.68s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=0.000101, train/loss_step=0.0202, global_step=706.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]   Epoch 35:  32%|███▎      | 26/80 [02:54<05:48,  6.45s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.0202, train/loss_vlb_step=0.000101, train/loss_step=0.0202, global_step=706.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  32%|███▎      | 26/80 [02:54<05:48,  6.45s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=4.93e-6, train/loss_step=0.000968, global_step=706.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  34%|███▍      | 27/80 [02:56<05:33,  6.30s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=4.93e-6, train/loss_step=0.000968, global_step=706.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  34%|███▍      | 27/80 [02:56<05:33,  6.30s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.56e-5, train/loss_step=0.0141, global_step=706.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]    Epoch 35:  35%|███▌      | 28/80 [02:56<05:17,  6.10s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=5.56e-5, train/loss_step=0.0141, global_step=706.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  35%|███▌      | 28/80 [02:56<05:17,  6.10s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.76e-5, train/loss_step=0.00116, global_step=706.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  36%|███▋      | 29/80 [02:57<05:01,  5.92s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.76e-5, train/loss_step=0.00116, global_step=706.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  36%|███▋      | 29/80 [02:57<05:01,  5.92s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000163, train/loss_step=0.0152, global_step=707.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:  38%|███▊      | 30/80 [02:57<04:47,  5.74s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000163, train/loss_step=0.0152, global_step=707.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  38%|███▊      | 30/80 [02:57<04:47,  5.74s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=1.78e-6, train/loss_step=0.000468, global_step=707.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  39%|███▉      | 31/80 [02:58<04:33,  5.58s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=1.78e-6, train/loss_step=0.000468, global_step=707.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  39%|███▉      | 31/80 [02:58<04:33,  5.58s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=9.43e-7, train/loss_step=0.000215, global_step=707.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:  40%|████      | 32/80 [03:39<05:19,  6.65s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=9.43e-7, train/loss_step=0.000215, global_step=707.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  40%|████      | 32/80 [03:39<05:19,  6.65s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.79e-6, train/loss_step=0.00137, global_step=707.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:  41%|████▏     | 33/80 [03:39<05:03,  6.47s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.79e-6, train/loss_step=0.00137, global_step=707.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  41%|████▏     | 33/80 [03:39<05:03,  6.47s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=2.02e-6, train/loss_step=0.000433, global_step=708.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  42%|████▎     | 34/80 [03:40<04:49,  6.30s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=2.02e-6, train/loss_step=0.000433, global_step=708.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  42%|████▎     | 34/80 [03:40<04:49,  6.30s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000501, train/loss_vlb_step=3.3e-6, train/loss_step=0.000501, global_step=708.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  44%|████▍     | 35/80 [03:40<04:36,  6.14s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000501, train/loss_vlb_step=3.3e-6, train/loss_step=0.000501, global_step=708.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  44%|████▍     | 35/80 [03:40<04:36,  6.14s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=3.9e-6, train/loss_step=0.000842, global_step=708.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  45%|████▌     | 36/80 [03:41<04:23,  5.99s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=3.9e-6, train/loss_step=0.000842, global_step=708.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  45%|████▌     | 36/80 [03:41<04:23,  5.99s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.26e-6, train/loss_step=0.000261, global_step=708.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  46%|████▋     | 37/80 [03:42<04:11,  5.84s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.26e-6, train/loss_step=0.000261, global_step=708.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  46%|████▋     | 37/80 [03:42<04:11,  5.84s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=2e-6, train/loss_step=0.000378, global_step=709.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]   Epoch 35:  48%|████▊     | 38/80 [03:42<03:59,  5.70s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=2e-6, train/loss_step=0.000378, global_step=709.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  48%|████▊     | 38/80 [03:42<03:59,  5.70s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=3.77e-6, train/loss_step=0.000852, global_step=709.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  49%|████▉     | 39/80 [03:42<03:48,  5.57s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=3.77e-6, train/loss_step=0.000852, global_step=709.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  49%|████▉     | 39/80 [03:42<03:48,  5.57s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.05e-6, train/loss_step=0.000248, global_step=709.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  50%|█████     | 40/80 [04:25<04:18,  6.47s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.05e-6, train/loss_step=0.000248, global_step=709.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  50%|█████     | 40/80 [04:25<04:18,  6.47s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.14e-5, train/loss_step=0.00295, global_step=709.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  51%|█████▏    | 41/80 [04:25<04:06,  6.33s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.14e-5, train/loss_step=0.00295, global_step=709.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  51%|█████▏    | 41/80 [04:25<04:06,  6.33s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000572, train/loss_vlb_step=3.27e-6, train/loss_step=0.000572, global_step=710.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  52%|█████▎    | 42/80 [04:26<03:55,  6.19s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000572, train/loss_vlb_step=3.27e-6, train/loss_step=0.000572, global_step=710.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  52%|█████▎    | 42/80 [04:26<03:55,  6.19s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.86e-5, train/loss_step=0.0106, global_step=710.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]    Epoch 35:  54%|█████▍    | 43/80 [04:26<03:44,  6.06s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.86e-5, train/loss_step=0.0106, global_step=710.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  54%|█████▍    | 43/80 [04:26<03:44,  6.06s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.28e-5, train/loss_step=0.015, global_step=710.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  55%|█████▌    | 44/80 [04:27<03:33,  5.94s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.28e-5, train/loss_step=0.015, global_step=710.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  55%|█████▌    | 44/80 [04:27<03:33,  5.94s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000362, train/loss_vlb_step=1.87e-6, train/loss_step=0.000362, global_step=710.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  56%|█████▋    | 45/80 [04:27<03:23,  5.82s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000362, train/loss_vlb_step=1.87e-6, train/loss_step=0.000362, global_step=710.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  56%|█████▋    | 45/80 [04:27<03:23,  5.82s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.000556, train/loss_step=0.0211, global_step=711.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]   Epoch 35:  57%|█████▊    | 46/80 [04:28<03:14,  5.71s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.000556, train/loss_step=0.0211, global_step=711.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  57%|█████▊    | 46/80 [04:28<03:14,  5.71s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=1.38e-5, train/loss_step=0.00416, global_step=711.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  59%|█████▉    | 47/80 [04:28<03:04,  5.60s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=1.38e-5, train/loss_step=0.00416, global_step=711.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  59%|█████▉    | 47/80 [04:28<03:04,  5.60s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.21e-6, train/loss_step=0.00116, global_step=711.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:  60%|██████    | 48/80 [04:58<03:14,  6.09s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.21e-6, train/loss_step=0.00116, global_step=711.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  60%|██████    | 48/80 [04:58<03:14,  6.09s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000447, train/loss_vlb_step=1.87e-6, train/loss_step=0.000447, global_step=711.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  61%|██████▏   | 49/80 [04:59<03:05,  5.99s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000447, train/loss_vlb_step=1.87e-6, train/loss_step=0.000447, global_step=711.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  61%|██████▏   | 49/80 [04:59<03:05,  5.99s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=1.93e-5, train/loss_step=0.00577, global_step=712.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  62%|██████▎   | 50/80 [04:59<02:56,  5.88s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=1.93e-5, train/loss_step=0.00577, global_step=712.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  62%|██████▎   | 50/80 [04:59<02:56,  5.88s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=6.45e-5, train/loss_step=0.0104, global_step=712.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  64%|██████▍   | 51/80 [05:08<02:52,  5.94s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=6.45e-5, train/loss_step=0.0104, global_step=712.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  64%|██████▍   | 51/80 [05:08<02:52,  5.94s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=2.56e-6, train/loss_step=0.000313, global_step=712.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  65%|██████▌   | 52/80 [05:09<02:43,  5.84s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=2.56e-6, train/loss_step=0.000313, global_step=712.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  65%|██████▌   | 52/80 [05:09<02:43,  5.84s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=3.26e-5, train/loss_step=0.00756, global_step=712.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]   Epoch 35:  66%|██████▋   | 53/80 [05:09<02:34,  5.74s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=3.26e-5, train/loss_step=0.00756, global_step=712.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  66%|██████▋   | 53/80 [05:09<02:34,  5.74s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.29e-5, train/loss_step=0.00333, global_step=713.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.29e-5, train/loss_step=0.00333, global_step=713.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.32e-5, train/loss_step=0.00816, global_step=713.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=3.32e-5, train/loss_step=0.00816, global_step=713.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.16e-5, train/loss_step=0.00215, global_step=713.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  70%|███████   | 56/80 [05:45<02:25,  6.07s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=1.16e-5, train/loss_step=0.00215, global_step=713.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  70%|███████   | 56/80 [05:45<02:25,  6.07s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.08e-5, train/loss_step=0.00588, global_step=713.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  71%|███████▏  | 57/80 [05:46<02:17,  5.98s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.08e-5, train/loss_step=0.00588, global_step=713.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  71%|███████▏  | 57/80 [05:46<02:17,  5.98s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=1.18e-6, train/loss_step=0.000258, global_step=714.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  72%|███████▎  | 58/80 [05:47<02:09,  5.88s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=1.18e-6, train/loss_step=0.000258, global_step=714.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  72%|███████▎  | 58/80 [05:47<02:09,  5.88s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00938, train/loss_vlb_step=3.55e-5, train/loss_step=0.00938, global_step=714.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  74%|███████▍  | 59/80 [05:47<02:01,  5.79s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00938, train/loss_vlb_step=3.55e-5, train/loss_step=0.00938, global_step=714.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  74%|███████▍  | 59/80 [05:47<02:01,  5.79s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=1.08e-6, train/loss_step=0.00025, global_step=714.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  75%|███████▌  | 60/80 [05:48<01:54,  5.71s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=1.08e-6, train/loss_step=0.00025, global_step=714.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  75%|███████▌  | 60/80 [05:48<01:54,  5.71s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.2e-5, train/loss_step=0.00356, global_step=714.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:  76%|███████▋  | 61/80 [05:48<01:46,  5.63s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.2e-5, train/loss_step=0.00356, global_step=714.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  76%|███████▋  | 61/80 [05:48<01:46,  5.63s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.31e-5, train/loss_step=0.00254, global_step=715.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  78%|███████▊  | 62/80 [05:49<01:39,  5.54s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=1.31e-5, train/loss_step=0.00254, global_step=715.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  78%|███████▊  | 62/80 [05:49<01:39,  5.54s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=5.04e-5, train/loss_step=0.00223, global_step=715.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:  79%|███████▉  | 63/80 [05:49<01:32,  5.47s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=5.04e-5, train/loss_step=0.00223, global_step=715.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  79%|███████▉  | 63/80 [05:49<01:32,  5.47s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00071, train/loss_vlb_step=4.58e-6, train/loss_step=0.00071, global_step=715.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  80%|████████  | 64/80 [06:20<01:33,  5.85s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00071, train/loss_vlb_step=4.58e-6, train/loss_step=0.00071, global_step=715.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  80%|████████  | 64/80 [06:20<01:33,  5.85s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.22e-6, train/loss_step=0.000311, global_step=715.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  81%|████████▏ | 65/80 [06:20<01:26,  5.77s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.22e-6, train/loss_step=0.000311, global_step=715.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  81%|████████▏ | 65/80 [06:20<01:26,  5.77s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=0.000111, train/loss_step=0.0111, global_step=716.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]   Epoch 35:  82%|████████▎ | 66/80 [06:21<01:19,  5.69s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=0.000111, train/loss_step=0.0111, global_step=716.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  82%|████████▎ | 66/80 [06:21<01:19,  5.69s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=9.63e-6, train/loss_step=0.00247, global_step=716.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  84%|████████▍ | 67/80 [06:25<01:13,  5.66s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=9.63e-6, train/loss_step=0.00247, global_step=716.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  84%|████████▍ | 67/80 [06:25<01:13,  5.66s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=9.91e-7, train/loss_step=0.000251, global_step=716.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  85%|████████▌ | 68/80 [06:25<01:07,  5.59s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=9.91e-7, train/loss_step=0.000251, global_step=716.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  85%|████████▌ | 68/80 [06:25<01:07,  5.59s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.99e-5, train/loss_step=0.00484, global_step=716.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  86%|████████▋ | 69/80 [06:26<01:00,  5.52s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.99e-5, train/loss_step=0.00484, global_step=716.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  86%|████████▋ | 69/80 [06:26<01:00,  5.52s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=2.83e-5, train/loss_step=0.0058, global_step=717.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  88%|████████▊ | 70/80 [06:26<00:54,  5.45s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=2.83e-5, train/loss_step=0.0058, global_step=717.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  88%|████████▊ | 70/80 [06:26<00:54,  5.45s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.48e-6, train/loss_step=0.000422, global_step=717.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  89%|████████▉ | 71/80 [06:27<00:48,  5.38s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.48e-6, train/loss_step=0.000422, global_step=717.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  89%|████████▉ | 71/80 [06:27<00:48,  5.38s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=8.63e-5, train/loss_step=0.0153, global_step=717.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]    Epoch 35:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=8.63e-5, train/loss_step=0.0153, global_step=717.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.32e-6, train/loss_step=0.000284, global_step=717.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  91%|█████████▏| 73/80 [07:01<00:39,  5.69s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.32e-6, train/loss_step=0.000284, global_step=717.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  91%|█████████▏| 73/80 [07:01<00:39,  5.69s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=3.29e-5, train/loss_step=0.00886, global_step=718.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=3.29e-5, train/loss_step=0.00886, global_step=718.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.59e-5, train/loss_step=0.0043, global_step=718.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  94%|█████████▍| 75/80 [07:02<00:27,  5.55s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.59e-5, train/loss_step=0.0043, global_step=718.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  94%|█████████▍| 75/80 [07:02<00:27,  5.55s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.00019, train/loss_step=0.0154, global_step=718.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439] Epoch 35:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.00019, train/loss_step=0.0154, global_step=718.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000515, train/loss_vlb_step=2.74e-6, train/loss_step=0.000515, global_step=718.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  96%|█████████▋| 77/80 [07:03<00:16,  5.42s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000515, train/loss_vlb_step=2.74e-6, train/loss_step=0.000515, global_step=718.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  96%|█████████▋| 77/80 [07:03<00:16,  5.42s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000769, train/loss_vlb_step=8.43e-6, train/loss_step=0.000769, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000769, train/loss_vlb_step=8.43e-6, train/loss_step=0.000769, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=9.38e-5, train/loss_step=0.00325, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 35:  99%|█████████▉| 79/80 [07:04<00:05,  5.30s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=9.38e-5, train/loss_step=0.00325, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35:  99%|█████████▉| 79/80 [07:04<00:05,  5.30s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.04e-5, train/loss_step=0.00811, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.04e-5, train/loss_step=0.00811, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 35: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=4.4e-6, train/loss_step=0.000727, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Average Epoch time: 424.56 seconds
+Average Peak memory 29563.21MiB
+Epoch 35:   0%|          | 0/80 [00:00<00:00, 6452.78it/s, loss=0.00441, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=4.4e-6, train/loss_step=0.000727, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 36:   0%|          | 0/80 [00:00<00:00, 2256.22it/s, loss=0.00441, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=4.4e-6, train/loss_step=0.000727, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]Epoch 36:   1%|▏         | 1/80 [00:43<28:57, 22.00s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=4.4e-6, train/loss_step=0.000727, global_step=719.0, lr_abs=0.0001, train/loss_simple_epoch=0.00439, train/loss_vlb_epoch=0.000106, train/loss_epoch=0.00439]  Epoch 36:   1%|▏         | 1/80 [00:44<28:58, 22.00s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000385, train/loss_vlb_step=1.75e-6, train/loss_step=0.000385, global_step=720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:   2%|▎         | 2/80 [00:44<19:16, 14.83s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000385, train/loss_vlb_step=1.75e-6, train/loss_step=0.000385, global_step=720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:   2%|▎         | 2/80 [00:44<19:16, 14.83s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.62e-5, train/loss_step=0.00428, global_step=720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:   4%|▍         | 3/80 [00:44<14:25, 11.24s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.62e-5, train/loss_step=0.00428, global_step=720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:   4%|▍         | 3/80 [00:44<14:25, 11.24s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.44e-5, train/loss_step=0.013, global_step=720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]   Epoch 36:   5%|▌         | 4/80 [00:50<12:47, 10.10s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.44e-5, train/loss_step=0.013, global_step=720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:   5%|▌         | 4/80 [00:50<12:47, 10.10s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.29e-5, train/loss_step=0.0037, global_step=720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:   6%|▋         | 5/80 [00:51<10:37,  8.50s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.29e-5, train/loss_step=0.0037, global_step=720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:   6%|▋         | 5/80 [00:51<10:37,  8.51s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=2.9e-6, train/loss_step=0.000658, global_step=721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:   8%|▊         | 6/80 [00:51<09:04,  7.36s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=2.9e-6, train/loss_step=0.000658, global_step=721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:   8%|▊         | 6/80 [00:51<09:04,  7.36s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000863, train/loss_vlb_step=3.77e-6, train/loss_step=0.000863, global_step=721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:   9%|▉         | 7/80 [00:52<07:54,  6.50s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000863, train/loss_vlb_step=3.77e-6, train/loss_step=0.000863, global_step=721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:   9%|▉         | 7/80 [00:52<07:54,  6.50s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=5.71e-5, train/loss_step=0.00961, global_step=721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  10%|█         | 8/80 [01:21<10:50,  9.04s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00961, train/loss_vlb_step=5.71e-5, train/loss_step=0.00961, global_step=721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  10%|█         | 8/80 [01:21<10:50,  9.04s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=5.9e-5, train/loss_step=0.0166, global_step=721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]   Epoch 36:  11%|█▏        | 9/80 [01:26<10:12,  8.63s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=5.9e-5, train/loss_step=0.0166, global_step=721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  11%|█▏        | 9/80 [01:26<10:12,  8.63s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=3.56e-5, train/loss_step=0.00901, global_step=722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  12%|█▎        | 10/80 [01:26<09:12,  7.89s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=3.56e-5, train/loss_step=0.00901, global_step=722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  12%|█▎        | 10/80 [01:26<09:12,  7.89s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.64e-5, train/loss_step=0.0068, global_step=722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  14%|█▍        | 11/80 [01:27<08:21,  7.27s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.64e-5, train/loss_step=0.0068, global_step=722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  14%|█▍        | 11/80 [01:27<08:21,  7.27s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000289, train/loss_vlb_step=2.16e-6, train/loss_step=0.000289, global_step=722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  15%|█▌        | 12/80 [01:31<07:58,  7.04s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000289, train/loss_vlb_step=2.16e-6, train/loss_step=0.000289, global_step=722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  15%|█▌        | 12/80 [01:31<07:58,  7.04s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.15e-5, train/loss_step=0.0088, global_step=722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]    Epoch 36:  16%|█▋        | 13/80 [01:32<07:20,  6.57s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=4.15e-5, train/loss_step=0.0088, global_step=722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  16%|█▋        | 13/80 [01:32<07:20,  6.57s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=8.64e-6, train/loss_step=0.00185, global_step=723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  18%|█▊        | 14/80 [01:32<06:46,  6.17s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=8.64e-6, train/loss_step=0.00185, global_step=723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  18%|█▊        | 14/80 [01:32<06:46,  6.17s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.1e-5, train/loss_step=0.00313, global_step=723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  19%|█▉        | 15/80 [01:39<06:42,  6.19s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.1e-5, train/loss_step=0.00313, global_step=723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  19%|█▉        | 15/80 [01:39<06:42,  6.19s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000603, train/loss_vlb_step=3.04e-6, train/loss_step=0.000603, global_step=723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  20%|██        | 16/80 [02:01<07:38,  7.17s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000603, train/loss_vlb_step=3.04e-6, train/loss_step=0.000603, global_step=723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  20%|██        | 16/80 [02:01<07:38,  7.17s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=7e-6, train/loss_step=0.00175, global_step=723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]     Epoch 36:  21%|██▏       | 17/80 [02:09<07:33,  7.20s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=7e-6, train/loss_step=0.00175, global_step=723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  21%|██▏       | 17/80 [02:09<07:33,  7.20s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=6.59e-5, train/loss_step=0.00911, global_step=724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  22%|██▎       | 18/80 [02:10<07:04,  6.84s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=6.59e-5, train/loss_step=0.00911, global_step=724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  22%|██▎       | 18/80 [02:10<07:04,  6.84s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000724, train/loss_vlb_step=4.87e-6, train/loss_step=0.000724, global_step=724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  24%|██▍       | 19/80 [02:10<06:38,  6.53s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000724, train/loss_vlb_step=4.87e-6, train/loss_step=0.000724, global_step=724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  24%|██▍       | 19/80 [02:10<06:38,  6.53s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=7.84e-7, train/loss_step=0.000186, global_step=724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  25%|██▌       | 20/80 [02:18<06:35,  6.59s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=7.84e-7, train/loss_step=0.000186, global_step=724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  25%|██▌       | 20/80 [02:18<06:35,  6.59s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000558, train/loss_step=0.0145, global_step=724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  26%|██▋       | 21/80 [02:18<06:12,  6.32s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000558, train/loss_step=0.0145, global_step=724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  26%|██▋       | 21/80 [02:18<06:12,  6.32s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=8.66e-7, train/loss_step=0.00021, global_step=725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  28%|██▊       | 22/80 [02:19<05:51,  6.06s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=8.66e-7, train/loss_step=0.00021, global_step=725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  28%|██▊       | 22/80 [02:19<05:51,  6.06s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=9.06e-6, train/loss_step=0.00148, global_step=725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  29%|██▉       | 23/80 [02:30<05:57,  6.27s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=9.06e-6, train/loss_step=0.00148, global_step=725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  29%|██▉       | 23/80 [02:30<05:57,  6.27s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.54e-5, train/loss_step=0.0111, global_step=725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  30%|███       | 24/80 [02:40<05:59,  6.42s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.54e-5, train/loss_step=0.0111, global_step=725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  30%|███       | 24/80 [02:40<05:59,  6.42s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000565, train/loss_vlb_step=2.79e-6, train/loss_step=0.000565, global_step=725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  31%|███▏      | 25/80 [02:50<06:01,  6.57s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000565, train/loss_vlb_step=2.79e-6, train/loss_step=0.000565, global_step=725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  31%|███▏      | 25/80 [02:50<06:01,  6.57s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=2.97e-5, train/loss_step=0.00169, global_step=726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  32%|███▎      | 26/80 [02:51<05:42,  6.35s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=2.97e-5, train/loss_step=0.00169, global_step=726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  32%|███▎      | 26/80 [02:51<05:42,  6.35s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=2.92e-5, train/loss_step=0.00304, global_step=726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  34%|███▍      | 27/80 [02:51<05:25,  6.14s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=2.92e-5, train/loss_step=0.00304, global_step=726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  34%|███▍      | 27/80 [02:51<05:25,  6.14s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.3e-5, train/loss_step=0.00573, global_step=726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  35%|███▌      | 28/80 [03:00<05:23,  6.22s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=2.3e-5, train/loss_step=0.00573, global_step=726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  35%|███▌      | 28/80 [03:00<05:23,  6.22s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=7.34e-6, train/loss_step=0.00159, global_step=726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  36%|███▋      | 29/80 [03:00<05:07,  6.03s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=7.34e-6, train/loss_step=0.00159, global_step=726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  36%|███���      | 29/80 [03:00<05:07,  6.03s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=9.41e-6, train/loss_step=0.00277, global_step=727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  38%|███▊      | 30/80 [03:01<04:52,  5.85s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=9.41e-6, train/loss_step=0.00277, global_step=727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  38%|███▊      | 30/80 [03:01<04:52,  5.85s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000445, train/loss_vlb_step=2.39e-6, train/loss_step=0.000445, global_step=727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  39%|███▉      | 31/80 [03:15<04:59,  6.11s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000445, train/loss_vlb_step=2.39e-6, train/loss_step=0.000445, global_step=727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  39%|███▉      | 31/80 [03:15<04:59,  6.11s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=9.39e-5, train/loss_step=0.00107, global_step=727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  40%|████      | 32/80 [03:21<04:52,  6.09s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=9.39e-5, train/loss_step=0.00107, global_step=727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  40%|████      | 32/80 [03:21<04:52,  6.09s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=1.5e-5, train/loss_step=0.00044, global_step=727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  41%|████▏     | 33/80 [03:32<04:53,  6.25s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=1.5e-5, train/loss_step=0.00044, global_step=727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  41%|████▏     | 33/80 [03:32<04:53,  6.25s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=3.32e-6, train/loss_step=0.000555, global_step=728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  42%|████▎     | 34/80 [03:32<04:39,  6.09s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=3.32e-6, train/loss_step=0.000555, global_step=728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  42%|████▎     | 34/80 [03:32<04:39,  6.09s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.75e-5, train/loss_step=0.00372, global_step=728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  44%|████▍     | 35/80 [03:33<04:26,  5.93s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.75e-5, train/loss_step=0.00372, global_step=728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  44%|████▍     | 35/80 [03:33<04:26,  5.93s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.19e-5, train/loss_step=0.00328, global_step=728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  45%|████▌     | 36/80 [03:45<04:28,  6.10s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.19e-5, train/loss_step=0.00328, global_step=728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  45%|████▌     | 36/80 [03:45<04:28,  6.10s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=4.55e-5, train/loss_step=0.00623, global_step=728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  46%|████▋     | 37/80 [03:46<04:15,  5.95s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=4.55e-5, train/loss_step=0.00623, global_step=728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  46%|████▋     | 37/80 [03:46<04:15,  5.95s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=0.000257, train/loss_step=0.00136, global_step=729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  48%|████▊     | 38/80 [03:46<04:03,  5.81s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=0.000257, train/loss_step=0.00136, global_step=729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  48%|████▊     | 38/80 [03:46<04:03,  5.81s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=1.75e-6, train/loss_step=0.000448, global_step=729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  49%|████▉     | 39/80 [03:56<04:02,  5.91s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=1.75e-6, train/loss_step=0.000448, global_step=729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  49%|████▉     | 39/80 [03:56<04:02,  5.91s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.01e-5, train/loss_step=0.00202, global_step=729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  50%|█████     | 40/80 [03:57<03:52,  5.80s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.01e-5, train/loss_step=0.00202, global_step=729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  50%|█████     | 40/80 [03:57<03:52,  5.80s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000329, train/loss_step=0.0205, global_step=729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  51%|█████▏    | 41/80 [04:24<04:05,  6.29s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000329, train/loss_step=0.0205, global_step=729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  51%|█████▏    | 41/80 [04:24<04:05,  6.29s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.52e-5, train/loss_step=0.00365, global_step=730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  52%|█████▎    | 42/80 [04:24<03:53,  6.16s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.52e-5, train/loss_step=0.00365, global_step=730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  52%|█████▎    | 42/80 [04:24<03:53,  6.16s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.4e-5, train/loss_step=0.00779, global_step=730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  54%|█████▍    | 43/80 [04:25<03:43,  6.03s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=3.4e-5, train/loss_step=0.00779, global_step=730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  54%|█████▍    | 43/80 [04:25<03:43,  6.03s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.79e-5, train/loss_step=0.0113, global_step=730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  55%|█████▌    | 44/80 [04:34<03:39,  6.10s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.79e-5, train/loss_step=0.0113, global_step=730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  55%|█████▌    | 44/80 [04:34<03:39,  6.10s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=6.89e-6, train/loss_step=0.00207, global_step=730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  56%|█████▋    | 45/80 [04:35<03:29,  5.98s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=6.89e-6, train/loss_step=0.00207, global_step=730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  56%|█████▋    | 45/80 [04:35<03:29,  5.98s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.24e-5, train/loss_step=0.011, global_step=731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]    Epoch 36:  57%|█████▊    | 46/80 [04:35<03:19,  5.86s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.24e-5, train/loss_step=0.011, global_step=731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  57%|█████▊    | 46/80 [04:35<03:19,  5.86s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=1.17e-6, train/loss_step=0.000313, global_step=731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  59%|█████▉    | 47/80 [04:52<03:21,  6.10s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=1.17e-6, train/loss_step=0.000313, global_step=731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  59%|█████▉    | 47/80 [04:52<03:21,  6.10s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.01e-5, train/loss_step=0.0071, global_step=731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]    Epoch 36:  60%|██████    | 48/80 [04:53<03:11,  5.99s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.01e-5, train/loss_step=0.0071, global_step=731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  60%|██████    | 48/80 [04:53<03:11,  5.99s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.03e-5, train/loss_step=0.00279, global_step=731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  61%|██████▏   | 49/80 [05:06<03:10,  6.13s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.03e-5, train/loss_step=0.00279, global_step=731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  61%|██████▏   | 49/80 [05:06<03:10,  6.13s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.8e-5, train/loss_step=0.00796, global_step=732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  62%|██████▎   | 50/80 [05:07<03:00,  6.02s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=3.8e-5, train/loss_step=0.00796, global_step=732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  62%|██████▎   | 50/80 [05:07<03:00,  6.02s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.71e-6, train/loss_step=0.00153, global_step=732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.71e-6, train/loss_step=0.00153, global_step=732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.77e-6, train/loss_step=0.00142, global_step=732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  65%|██████▌   | 52/80 [05:20<02:49,  6.05s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.77e-6, train/loss_step=0.00142, global_step=732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  65%|██████▌   | 52/80 [05:20<02:49,  6.05s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=5.02e-6, train/loss_step=0.00105, global_step=732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  66%|██████▋   | 53/80 [05:21<02:40,  5.95s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=5.02e-6, train/loss_step=0.00105, global_step=732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  66%|██████▋   | 53/80 [05:21<02:40,  5.95s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.68e-5, train/loss_step=0.00783, global_step=733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  68%|██████▊   | 54/80 [05:21<02:32,  5.85s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.68e-5, train/loss_step=0.00783, global_step=733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  68%|██████▊   | 54/80 [05:21<02:32,  5.85s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=9.98e-7, train/loss_step=0.000237, global_step=733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  69%|██████▉   | 55/80 [05:38<02:31,  6.04s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=9.98e-7, train/loss_step=0.000237, global_step=733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  69%|██████▉   | 55/80 [05:38<02:31,  6.04s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.00243, train/loss_step=0.0309, global_step=733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]    Epoch 36:  70%|███████   | 56/80 [05:38<02:22,  5.94s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.0309, train/loss_vlb_step=0.00243, train/loss_step=0.0309, global_step=733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  70%|███████   | 56/80 [05:38<02:22,  5.94s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.61e-6, train/loss_step=0.000339, global_step=733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  71%|███████▏  | 57/80 [05:47<02:17,  6.00s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.61e-6, train/loss_step=0.000339, global_step=733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  71%|███████▏  | 57/80 [05:47<02:17,  6.00s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.00851, train/loss_vlb_step=8.57e-5, train/loss_step=0.00851, global_step=734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  72%|███████▎  | 58/80 [05:48<02:09,  5.91s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.00851, train/loss_vlb_step=8.57e-5, train/loss_step=0.00851, global_step=734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  72%|███████▎  | 58/80 [05:48<02:09,  5.91s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.000808, train/loss_vlb_step=8.03e-6, train/loss_step=0.000808, global_step=734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  74%|███████▍  | 59/80 [05:48<02:02,  5.82s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.000808, train/loss_vlb_step=8.03e-6, train/loss_step=0.000808, global_step=734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  74%|███████▍  | 59/80 [05:48<02:02,  5.82s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=7.8e-6, train/loss_step=0.000368, global_step=734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  75%|███████▌  | 60/80 [06:02<01:58,  5.94s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=7.8e-6, train/loss_step=0.000368, global_step=734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  75%|███████▌  | 60/80 [06:02<01:58,  5.94s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.03e-6, train/loss_step=0.000248, global_step=734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  76%|███████▋  | 61/80 [06:03<01:51,  5.86s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.03e-6, train/loss_step=0.000248, global_step=734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  76%|███████▋  | 61/80 [06:03<01:51,  5.86s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.02e-5, train/loss_step=0.00176, global_step=735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  78%|███████▊  | 62/80 [06:03<01:43,  5.77s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.02e-5, train/loss_step=0.00176, global_step=735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  78%|███████▊  | 62/80 [06:03<01:43,  5.77s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=3.19e-6, train/loss_step=0.000536, global_step=735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  79%|███████▉  | 63/80 [06:21<01:41,  5.97s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=3.19e-6, train/loss_step=0.000536, global_step=735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  79%|███████▉  | 63/80 [06:21<01:41,  5.97s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=2.67e-5, train/loss_step=0.00797, global_step=735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  80%|████████  | 64/80 [06:22<01:34,  5.88s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00797, train/loss_vlb_step=2.67e-5, train/loss_step=0.00797, global_step=735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  80%|████████  | 64/80 [06:22<01:34,  5.88s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000283, train/loss_vlb_step=1.1e-6, train/loss_step=0.000283, global_step=735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  81%|████████▏ | 65/80 [06:29<01:28,  5.90s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000283, train/loss_vlb_step=1.1e-6, train/loss_step=0.000283, global_step=735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  81%|████████▏ | 65/80 [06:29<01:28,  5.90s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=8.61e-6, train/loss_step=0.00188, global_step=736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  82%|████████▎ | 66/80 [06:29<01:21,  5.82s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=8.61e-6, train/loss_step=0.00188, global_step=736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  82%|████████▎ | 66/80 [06:29<01:21,  5.82s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.57e-5, train/loss_step=0.0046, global_step=736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.57e-5, train/loss_step=0.0046, global_step=736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000969, train/loss_step=0.0154, global_step=736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  85%|████████▌ | 68/80 [06:41<01:09,  5.82s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000969, train/loss_step=0.0154, global_step=736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  85%|████████▌ | 68/80 [06:41<01:09,  5.82s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=2.74e-6, train/loss_step=0.000763, global_step=736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=2.74e-6, train/loss_step=0.000763, global_step=736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=3.72e-6, train/loss_step=0.000621, global_step=737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=3.72e-6, train/loss_step=0.000621, global_step=737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=2.26e-6, train/loss_step=0.000562, global_step=737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  89%|████████▉ | 71/80 [07:04<00:53,  5.90s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=2.26e-6, train/loss_step=0.000562, global_step=737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  89%|████████▉ | 71/80 [07:04<00:53,  5.90s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=5.17e-5, train/loss_step=0.00947, global_step=737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 36:  90%|█████████ | 72/80 [07:05<00:46,  5.83s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00947, train/loss_vlb_step=5.17e-5, train/loss_step=0.00947, global_step=737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  90%|█████████ | 72/80 [07:05<00:46,  5.83s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000479, train/loss_vlb_step=1.76e-6, train/loss_step=0.000479, global_step=737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  91%|█████████▏| 73/80 [07:05<00:40,  5.75s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000479, train/loss_vlb_step=1.76e-6, train/loss_step=0.000479, global_step=737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  91%|█████████▏| 73/80 [07:05<00:40,  5.75s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.96e-5, train/loss_step=0.0132, global_step=738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]    Epoch 36:  92%|█████████▎| 74/80 [07:06<00:34,  5.68s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.96e-5, train/loss_step=0.0132, global_step=738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  92%|█████████▎| 74/80 [07:06<00:34,  5.68s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=3.73e-5, train/loss_step=0.0112, global_step=738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  94%|█████████▍| 75/80 [07:06<00:28,  5.62s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=3.73e-5, train/loss_step=0.0112, global_step=738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  94%|█████████▍| 75/80 [07:06<00:28,  5.62s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=1.92e-5, train/loss_step=0.00538, global_step=738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  95%|█████████▌| 76/80 [07:18<00:22,  5.70s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=1.92e-5, train/loss_step=0.00538, global_step=738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  95%|█████████▌| 76/80 [07:18<00:22,  5.70s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=5.84e-6, train/loss_step=0.00127, global_step=738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  96%|█████████▋| 77/80 [07:19<00:16,  5.63s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=5.84e-6, train/loss_step=0.00127, global_step=738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  96%|█████████▋| 77/80 [07:19<00:16,  5.63s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00047, train/loss_vlb_step=2.33e-6, train/loss_step=0.00047, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  98%|█████████▊| 78/80 [07:19<00:11,  5.57s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00047, train/loss_vlb_step=2.33e-6, train/loss_step=0.00047, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  98%|█████████▊| 78/80 [07:19<00:11,  5.57s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=1.81e-5, train/loss_step=0.00539, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36:  99%|█████████▉| 79/80 [07:20<00:05,  5.50s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=1.81e-5, train/loss_step=0.00539, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36:  99%|█████████▉| 79/80 [07:20<00:05,  5.50s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.28e-5, train/loss_step=0.0228, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463] Epoch 36: 100%|██████████| 80/80 [07:20<00:00,  5.44s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=9.28e-5, train/loss_step=0.0228, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 36: 100%|██████████| 80/80 [07:20<00:00,  5.44s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.39e-6, train/loss_step=0.000305, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Average Epoch time: 440.63 seconds
+Average Peak memory 29562.30MiB
+Epoch 36:   0%|          | 0/80 [00:00<00:00, 5932.54it/s, loss=0.00522, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.39e-6, train/loss_step=0.000305, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 37:   0%|          | 0/80 [00:00<00:00, 2325.00it/s, loss=0.00522, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.39e-6, train/loss_step=0.000305, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]Epoch 37:   1%|▏         | 1/80 [00:37<24:54, 18.92s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.39e-6, train/loss_step=0.000305, global_step=739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00463, train/loss_vlb_epoch=9.21e-5, train/loss_epoch=0.00463]  Epoch 37:   1%|▏         | 1/80 [00:37<24:54, 18.92s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.000675, train/loss_vlb_step=7.3e-6, train/loss_step=0.000675, global_step=740.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:   2%|▎         | 2/80 [00:38<16:36, 12.78s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.000675, train/loss_vlb_step=7.3e-6, train/loss_step=0.000675, global_step=740.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:   2%|▎         | 2/80 [00:38<16:36, 12.78s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=9.95e-6, train/loss_step=0.00144, global_step=740.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:   4%|▍         | 3/80 [00:38<12:27,  9.71s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=9.95e-6, train/loss_step=0.00144, global_step=740.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:   4%|▍         | 3/80 [00:38<12:27,  9.71s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=2.21e-5, train/loss_step=0.00653, global_step=740.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:   5%|▌         | 4/80 [00:39<09:58,  7.87s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=2.21e-5, train/loss_step=0.00653, global_step=740.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:   5%|▌         | 4/80 [00:39<09:58,  7.87s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000175, train/loss_step=0.0146, global_step=740.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:   6%|▋         | 5/80 [00:39<08:18,  6.64s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000175, train/loss_step=0.0146, global_step=740.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:   6%|▋         | 5/80 [00:39<08:18,  6.64s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.00143, train/loss_step=0.0588, global_step=741.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:   8%|▊         | 6/80 [00:40<07:06,  5.76s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.0588, train/loss_vlb_step=0.00143, train/loss_step=0.0588, global_step=741.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:   8%|▊         | 6/80 [00:40<07:06,  5.76s/it, loss=0.00848, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.21e-6, train/loss_step=0.000315, global_step=741.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:   9%|▉         | 7/80 [00:40<06:12,  5.11s/it, loss=0.00848, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.21e-6, train/loss_step=0.000315, global_step=741.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:   9%|▉         | 7/80 [00:40<06:12,  5.11s/it, loss=0.00775, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=5.54e-6, train/loss_step=0.000711, global_step=741.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  10%|█         | 8/80 [01:22<11:03,  9.21s/it, loss=0.00775, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=5.54e-6, train/loss_step=0.000711, global_step=741.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  10%|█         | 8/80 [01:22<11:03,  9.21s/it, loss=0.00772, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=1.22e-6, train/loss_step=0.000297, global_step=741.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  11%|█▏        | 9/80 [01:24<09:57,  8.42s/it, loss=0.00772, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=1.22e-6, train/loss_step=0.000297, global_step=741.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  11%|█▏        | 9/80 [01:24<09:57,  8.42s/it, loss=0.0077, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=6.81e-7, train/loss_step=0.00019, global_step=742.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]   Epoch 37:  12%|█▎        | 10/80 [01:24<08:58,  7.69s/it, loss=0.0077, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=6.81e-7, train/loss_step=0.00019, global_step=742.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  12%|█▎        | 10/80 [01:24<08:58,  7.69s/it, loss=0.00884, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=0.000148, train/loss_step=0.0234, global_step=742.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  14%|█▍        | 11/80 [01:25<08:09,  7.09s/it, loss=0.00884, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=0.000148, train/loss_step=0.0234, global_step=742.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  14%|█▍        | 11/80 [01:25<08:09,  7.09s/it, loss=0.00839, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.38e-6, train/loss_step=0.000308, global_step=742.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  15%|█▌        | 12/80 [01:25<07:28,  6.59s/it, loss=0.00839, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.38e-6, train/loss_step=0.000308, global_step=742.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  15%|█▌        | 12/80 [01:25<07:28,  6.59s/it, loss=0.00837, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=8.84e-7, train/loss_step=0.000215, global_step=742.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  16%|█▋        | 13/80 [01:26<06:52,  6.16s/it, loss=0.00837, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=8.84e-7, train/loss_step=0.000215, global_step=742.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  16%|█▋        | 13/80 [01:26<06:52,  6.16s/it, loss=0.00775, v_num=0, train/loss_simple_step=0.000779, train/loss_vlb_step=3.08e-6, train/loss_step=0.000779, global_step=743.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  18%|█▊        | 14/80 [01:26<06:21,  5.78s/it, loss=0.00775, v_num=0, train/loss_simple_step=0.000779, train/loss_vlb_step=3.08e-6, train/loss_step=0.000779, global_step=743.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  18%|█▊        | 14/80 [01:26<06:21,  5.78s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=3.62e-5, train/loss_step=0.00159, global_step=743.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  19%|█▉        | 15/80 [01:27<05:54,  5.45s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=3.62e-5, train/loss_step=0.00159, global_step=743.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  19%|█▉        | 15/80 [01:27<05:54,  5.45s/it, loss=0.00703, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=2.49e-6, train/loss_step=0.000524, global_step=743.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  20%|██        | 16/80 [02:04<07:49,  7.34s/it, loss=0.00703, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=2.49e-6, train/loss_step=0.000524, global_step=743.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  20%|██        | 16/80 [02:04<07:49,  7.34s/it, loss=0.00719, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=0.00116, train/loss_step=0.0046, global_step=743.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]    Epoch 37:  21%|██▏       | 17/80 [02:09<07:33,  7.19s/it, loss=0.00719, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=0.00116, train/loss_step=0.0046, global_step=743.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  21%|██▏       | 17/80 [02:09<07:33,  7.19s/it, loss=0.00719, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=1.47e-6, train/loss_step=0.000376, global_step=744.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  22%|██▎       | 18/80 [02:09<07:04,  6.84s/it, loss=0.00719, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=1.47e-6, train/loss_step=0.000376, global_step=744.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  22%|██▎       | 18/80 [02:09<07:04,  6.84s/it, loss=0.00716, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.04e-5, train/loss_step=0.00475, global_step=744.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  24%|██▍       | 19/80 [02:10<06:37,  6.52s/it, loss=0.00716, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.04e-5, train/loss_step=0.00475, global_step=744.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  24%|██▍       | 19/80 [02:10<06:37,  6.52s/it, loss=0.00609, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=6.49e-6, train/loss_step=0.00137, global_step=744.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  25%|██▌       | 20/80 [02:10<06:14,  6.24s/it, loss=0.00609, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=6.49e-6, train/loss_step=0.00137, global_step=744.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  25%|██▌       | 20/80 [02:10<06:14,  6.24s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=1.02e-5, train/loss_step=0.000591, global_step=744.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  26%|██▋       | 21/80 [02:11<05:52,  5.98s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=1.02e-5, train/loss_step=0.000591, global_step=744.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  26%|██▋       | 21/80 [02:11<05:52,  5.98s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.17e-5, train/loss_step=0.00337, global_step=745.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:  28%|██▊       | 22/80 [02:11<05:32,  5.74s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.17e-5, train/loss_step=0.00337, global_step=745.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  28%|██▊       | 22/80 [02:11<05:32,  5.74s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=0.000609, train/loss_step=0.00481, global_step=745.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  29%|██▉       | 23/80 [02:12<05:14,  5.52s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=0.000609, train/loss_step=0.00481, global_step=745.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  29%|██▉       | 23/80 [02:12<05:14,  5.52s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=2.73e-6, train/loss_step=0.000549, global_step=745.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  30%|███       | 24/80 [02:41<06:02,  6.48s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=2.73e-6, train/loss_step=0.000549, global_step=745.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  30%|███       | 24/80 [02:41<06:02,  6.48s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000706, train/loss_vlb_step=2.91e-6, train/loss_step=0.000706, global_step=745.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  31%|███▏      | 25/80 [02:48<05:55,  6.47s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000706, train/loss_vlb_step=2.91e-6, train/loss_step=0.000706, global_step=745.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  31%|███▏      | 25/80 [02:48<05:55,  6.47s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=4.86e-6, train/loss_step=0.000494, global_step=746.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:  32%|███▎      | 26/80 [02:48<05:37,  6.25s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=4.86e-6, train/loss_step=0.000494, global_step=746.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  32%|███▎      | 26/80 [02:48<05:37,  6.25s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=0.000324, train/loss_step=0.0222, global_step=746.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  34%|███▍      | 27/80 [02:49<05:20,  6.05s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=0.000324, train/loss_step=0.0222, global_step=746.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  34%|███▍      | 27/80 [02:49<05:20,  6.05s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=5.46e-5, train/loss_step=0.00529, global_step=746.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  35%|███▌      | 28/80 [02:50<05:04,  5.86s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=5.46e-5, train/loss_step=0.00529, global_step=746.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  35%|███▌      | 28/80 [02:50<05:04,  5.86s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=3.35e-5, train/loss_step=0.00439, global_step=746.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  36%|███▋      | 29/80 [02:50<04:50,  5.69s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=3.35e-5, train/loss_step=0.00439, global_step=746.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  36%|███▋      | 29/80 [02:50<04:50,  5.69s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=1.78e-5, train/loss_step=0.00508, global_step=747.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  38%|███▊      | 30/80 [02:51<04:36,  5.52s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=1.78e-5, train/loss_step=0.00508, global_step=747.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  38%|███▊      | 30/80 [02:51<04:36,  5.52s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=5.8e-6, train/loss_step=0.000632, global_step=747.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  39%|███▉      | 31/80 [02:51<04:22,  5.36s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=5.8e-6, train/loss_step=0.000632, global_step=747.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  39%|███▉      | 31/80 [02:51<04:22,  5.36s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=6.05e-6, train/loss_step=0.00111, global_step=747.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:  40%|████      | 32/80 [03:14<04:42,  5.89s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=6.05e-6, train/loss_step=0.00111, global_step=747.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  40%|████      | 32/80 [03:14<04:42,  5.89s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000463, train/loss_vlb_step=1.9e-6, train/loss_step=0.000463, global_step=747.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  41%|████▏     | 33/80 [03:39<05:03,  6.46s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000463, train/loss_vlb_step=1.9e-6, train/loss_step=0.000463, global_step=747.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  41%|████▏     | 33/80 [03:39<05:03,  6.46s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000652, train/loss_vlb_step=2.9e-6, train/loss_step=0.000652, global_step=748.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  42%|████▎     | 34/80 [03:40<04:49,  6.29s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000652, train/loss_vlb_step=2.9e-6, train/loss_step=0.000652, global_step=748.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  42%|████▎     | 34/80 [03:40<04:49,  6.29s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000783, train/loss_step=0.0105, global_step=748.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  44%|████▍     | 35/80 [03:40<04:35,  6.13s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000783, train/loss_step=0.0105, global_step=748.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  44%|████▍     | 35/80 [03:40<04:35,  6.13s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=9.07e-6, train/loss_step=0.00178, global_step=748.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  45%|████▌     | 36/80 [03:41<04:22,  5.98s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=9.07e-6, train/loss_step=0.00178, global_step=748.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  45%|████▌     | 36/80 [03:41<04:22,  5.98s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=3.53e-5, train/loss_step=0.00793, global_step=748.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  46%|████▋     | 37/80 [03:41<04:10,  5.83s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=3.53e-5, train/loss_step=0.00793, global_step=748.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  46%|████▋     | 37/80 [03:41<04:10,  5.83s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=9.12e-5, train/loss_step=0.00135, global_step=749.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:  48%|████▊     | 38/80 [03:42<03:59,  5.70s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=9.12e-5, train/loss_step=0.00135, global_step=749.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  48%|████▊     | 38/80 [03:42<03:59,  5.70s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000328, train/loss_vlb_step=1.9e-6, train/loss_step=0.000328, global_step=749.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  49%|████▉     | 39/80 [03:42<03:48,  5.57s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000328, train/loss_vlb_step=1.9e-6, train/loss_step=0.000328, global_step=749.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  49%|████▉     | 39/80 [03:42<03:48,  5.57s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.23e-5, train/loss_step=0.00493, global_step=749.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:  50%|█████     | 40/80 [03:52<03:47,  5.68s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.23e-5, train/loss_step=0.00493, global_step=749.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  50%|█████     | 40/80 [03:52<03:47,  5.68s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=7.27e-5, train/loss_step=0.00511, global_step=749.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  51%|█████▏    | 41/80 [04:27<04:08,  6.37s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=7.27e-5, train/loss_step=0.00511, global_step=749.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  51%|█████▏    | 41/80 [04:27<04:08,  6.37s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=4.11e-6, train/loss_step=0.00094, global_step=750.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  52%|█████▎    | 42/80 [04:27<03:56,  6.23s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=4.11e-6, train/loss_step=0.00094, global_step=750.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  52%|█████▎    | 42/80 [04:27<03:56,  6.23s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.89e-5, train/loss_step=0.0121, global_step=750.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.89e-5, train/loss_step=0.0121, global_step=750.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=8.85e-6, train/loss_step=0.00247, global_step=750.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  55%|█████▌    | 44/80 [04:28<03:35,  5.98s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=8.85e-6, train/loss_step=0.00247, global_step=750.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  55%|█████▌    | 44/80 [04:28<03:35,  5.98s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=4.42e-6, train/loss_step=0.000496, global_step=750.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  56%|█████▋    | 45/80 [04:29<03:25,  5.86s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=4.42e-6, train/loss_step=0.000496, global_step=750.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  56%|█████▋    | 45/80 [04:29<03:25,  5.86s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.22e-5, train/loss_step=0.00337, global_step=751.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.22e-5, train/loss_step=0.00337, global_step=751.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=2.27e-5, train/loss_step=0.00598, global_step=751.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=2.27e-5, train/loss_step=0.00598, global_step=751.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.21e-5, train/loss_step=0.00301, global_step=751.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  60%|██████    | 48/80 [04:33<02:58,  5.58s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.21e-5, train/loss_step=0.00301, global_step=751.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  60%|██████    | 48/80 [04:33<02:58,  5.58s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=6.49e-6, train/loss_step=0.00135, global_step=751.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  61%|██████▏   | 49/80 [05:08<03:11,  6.18s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=6.49e-6, train/loss_step=0.00135, global_step=751.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  61%|██████▏   | 49/80 [05:08<03:11,  6.18s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=7.14e-5, train/loss_step=0.0105, global_step=752.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=7.14e-5, train/loss_step=0.0105, global_step=752.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  62%|█████��▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=7.57e-5, train/loss_step=0.0111, global_step=752.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  64%|██████▍   | 51/80 [05:09<02:52,  5.96s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=7.57e-5, train/loss_step=0.0111, global_step=752.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  64%|██████▍   | 51/80 [05:09<02:52,  5.96s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=9.03e-7, train/loss_step=0.000246, global_step=752.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=9.03e-7, train/loss_step=0.000246, global_step=752.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000826, train/loss_vlb_step=1.88e-5, train/loss_step=0.000826, global_step=752.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000826, train/loss_vlb_step=1.88e-5, train/loss_step=0.000826, global_step=752.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=2.7e-6, train/loss_step=0.00062, global_step=753.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]   Epoch 37:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=2.7e-6, train/loss_step=0.00062, global_step=753.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000519, train/loss_vlb_step=2.24e-6, train/loss_step=0.000519, global_step=753.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  69%|██████▉   | 55/80 [05:12<02:19,  5.57s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000519, train/loss_vlb_step=2.24e-6, train/loss_step=0.000519, global_step=753.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  69%|██████▉   | 55/80 [05:12<02:19,  5.57s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000859, train/loss_vlb_step=4.08e-5, train/loss_step=0.000859, global_step=753.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:  70%|███████   | 56/80 [05:16<02:13,  5.56s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000859, train/loss_vlb_step=4.08e-5, train/loss_step=0.000859, global_step=753.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  70%|███████   | 56/80 [05:16<02:13,  5.56s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=7.13e-6, train/loss_step=0.00186, global_step=753.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  71%|███████▏  | 57/80 [05:57<02:21,  6.16s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=7.13e-6, train/loss_step=0.00186, global_step=753.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  71%|███████▏  | 57/80 [05:57<02:21,  6.16s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.71e-6, train/loss_step=0.00236, global_step=754.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  72%|███████▎  | 58/80 [05:57<02:13,  6.06s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.71e-6, train/loss_step=0.00236, global_step=754.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  72%|███████▎  | 58/80 [05:57<02:13,  6.06s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=5.7e-6, train/loss_step=0.00125, global_step=754.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=5.7e-6, train/loss_step=0.00125, global_step=754.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=6.48e-6, train/loss_step=0.00167, global_step=754.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  75%|███████▌  | 60/80 [05:58<01:57,  5.88s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=6.48e-6, train/loss_step=0.00167, global_step=754.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  75%|███████▌  | 60/80 [05:58<01:57,  5.88s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=2.79e-6, train/loss_step=0.00061, global_step=754.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:  76%|███████▋  | 61/80 [05:59<01:50,  5.79s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=2.79e-6, train/loss_step=0.00061, global_step=754.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  76%|███████▋  | 61/80 [05:59<01:50,  5.79s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=5.5e-6, train/loss_step=0.00106, global_step=755.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  78%|███████▊  | 62/80 [05:59<01:42,  5.71s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=5.5e-6, train/loss_step=0.00106, global_step=755.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  78%|███████▊  | 62/80 [05:59<01:42,  5.71s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=7.82e-6, train/loss_step=0.00102, global_step=755.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=7.82e-6, train/loss_step=0.00102, global_step=755.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=2.12e-6, train/loss_step=0.000496, global_step=755.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  80%|████████  | 64/80 [06:00<01:28,  5.55s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=2.12e-6, train/loss_step=0.000496, global_step=755.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  80%|████████  | 64/80 [06:00<01:28,  5.55s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=1.01e-5, train/loss_step=0.000489, global_step=755.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  81%|████████▏ | 65/80 [06:32<01:29,  5.94s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=1.01e-5, train/loss_step=0.000489, global_step=755.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  81%|████████▏ | 65/80 [06:32<01:29,  5.94s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=4.18e-6, train/loss_step=0.000876, global_step=756.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  82%|████████▎ | 66/80 [06:41<01:23,  5.99s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=4.18e-6, train/loss_step=0.000876, global_step=756.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  82%|████████▎ | 66/80 [06:41<01:23,  5.99s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.22e-5, train/loss_step=0.0108, global_step=756.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]    Epoch 37:  84%|████████▍ | 67/80 [06:42<01:16,  5.91s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.22e-5, train/loss_step=0.0108, global_step=756.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  84%|████████▍ | 67/80 [06:42<01:16,  5.91s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=4.04e-5, train/loss_step=0.00793, global_step=756.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  85%|████████▌ | 68/80 [06:42<01:10,  5.84s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=4.04e-5, train/loss_step=0.00793, global_step=756.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  85%|████████▌ | 68/80 [06:42<01:10,  5.84s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=3.4e-6, train/loss_step=0.000487, global_step=756.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  86%|████████▋ | 69/80 [06:43<01:03,  5.76s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=3.4e-6, train/loss_step=0.000487, global_step=756.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  86%|████████▋ | 69/80 [06:43<01:03,  5.76s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000868, train/loss_vlb_step=8.5e-6, train/loss_step=0.000868, global_step=757.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441] Epoch 37:  88%|████████▊ | 70/80 [06:43<00:56,  5.68s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000868, train/loss_vlb_step=8.5e-6, train/loss_step=0.000868, global_step=757.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  88%|████████▊ | 70/80 [06:43<00:56,  5.68s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.07e-5, train/loss_step=0.00291, global_step=757.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  89%|████████▉ | 71/80 [06:44<00:50,  5.61s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.07e-5, train/loss_step=0.00291, global_step=757.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  89%|████████▉ | 71/80 [06:44<00:50,  5.61s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=7.15e-6, train/loss_step=0.000606, global_step=757.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  90%|█████████ | 72/80 [06:44<00:44,  5.55s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=7.15e-6, train/loss_step=0.000606, global_step=757.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  90%|█████████ | 72/80 [06:44<00:44,  5.55s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.53e-6, train/loss_step=0.000554, global_step=757.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  91%|█████████▏| 73/80 [07:07<00:40,  5.78s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.53e-6, train/loss_step=0.000554, global_step=757.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  91%|█████████▏| 73/80 [07:07<00:40,  5.78s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=1.86e-5, train/loss_step=0.00115, global_step=758.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  92%|█████████▎| 74/80 [07:18<00:35,  5.85s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=1.86e-5, train/loss_step=0.00115, global_step=758.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  92%|█████████▎| 74/80 [07:18<00:35,  5.85s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.57e-6, train/loss_step=0.00119, global_step=758.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  94%|█████████▍| 75/80 [07:19<00:28,  5.78s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.57e-6, train/loss_step=0.00119, global_step=758.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  94%|█████████▍| 75/80 [07:19<00:28,  5.78s/it, loss=0.00194, v_num=0, train/loss_simple_step=0.000649, train/loss_vlb_step=2.68e-6, train/loss_step=0.000649, global_step=758.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  95%|█████████▌| 76/80 [07:19<00:22,  5.71s/it, loss=0.00194, v_num=0, train/loss_simple_step=0.000649, train/loss_vlb_step=2.68e-6, train/loss_step=0.000649, global_step=758.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  95%|█████████▌| 76/80 [07:19<00:22,  5.71s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=2.65e-5, train/loss_step=0.00769, global_step=758.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 37:  96%|█████████▋| 77/80 [07:20<00:16,  5.65s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=2.65e-5, train/loss_step=0.00769, global_step=758.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  96%|█████████▋| 77/80 [07:20<00:16,  5.65s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=4.53e-6, train/loss_step=0.000956, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  98%|█████████▊| 78/80 [07:20<00:11,  5.58s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=4.53e-6, train/loss_step=0.000956, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  98%|█████████▊| 78/80 [07:20<00:11,  5.58s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.1e-5, train/loss_step=0.00311, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]   Epoch 37:  99%|█████████▉| 79/80 [07:21<00:05,  5.52s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.1e-5, train/loss_step=0.00311, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37:  99%|█████████▉| 79/80 [07:21<00:05,  5.52s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.000877, train/loss_vlb_step=4.66e-6, train/loss_step=0.000877, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37: 100%|██████████| 80/80 [07:21<00:00,  5.45s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.000877, train/loss_vlb_step=4.66e-6, train/loss_step=0.000877, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 37: 100%|██████████| 80/80 [07:21<00:00,  5.45s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.13e-6, train/loss_step=0.000523, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Average Epoch time: 441.83 seconds
+Average Peak memory 29564.39MiB
+Epoch 37:   0%|          | 0/80 [00:00<00:00, 3182.32it/s, loss=0.00221, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.13e-6, train/loss_step=0.000523, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 38:   0%|          | 0/80 [00:00<00:00, 1396.70it/s, loss=0.00221, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.13e-6, train/loss_step=0.000523, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]Epoch 38:   1%|▏         | 1/80 [00:38<25:32, 19.40s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.13e-6, train/loss_step=0.000523, global_step=759.0, lr_abs=0.0001, train/loss_simple_epoch=0.00441, train/loss_vlb_epoch=6.8e-5, train/loss_epoch=0.00441]  Epoch 38:   1%|▏         | 1/80 [00:38<25:32, 19.40s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=1.88e-6, train/loss_step=0.000347, global_step=760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   2%|▎         | 2/80 [00:39<17:01, 13.10s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=1.88e-6, train/loss_step=0.000347, global_step=760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   2%|▎         | 2/80 [00:39<17:01, 13.10s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000784, train/loss_vlb_step=4.31e-6, train/loss_step=0.000784, global_step=760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   4%|▍         | 3/80 [00:41<13:18, 10.37s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000784, train/loss_vlb_step=4.31e-6, train/loss_step=0.000784, global_step=760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   4%|▍         | 3/80 [00:41<13:18, 10.37s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.48e-6, train/loss_step=0.00111, global_step=760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]   Epoch 38:   5%|▌         | 4/80 [00:42<10:38,  8.40s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.48e-6, train/loss_step=0.00111, global_step=760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   5%|▌         | 4/80 [00:42<10:38,  8.40s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000502, train/loss_vlb_step=6.92e-6, train/loss_step=0.000502, global_step=760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   6%|▋         | 5/80 [00:42<08:51,  7.09s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000502, train/loss_vlb_step=6.92e-6, train/loss_step=0.000502, global_step=760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   6%|▋         | 5/80 [00:42<08:51,  7.09s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=2.27e-6, train/loss_step=0.000267, global_step=761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   8%|▊         | 6/80 [00:43<07:34,  6.14s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=2.27e-6, train/loss_step=0.000267, global_step=761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   8%|▊         | 6/80 [00:43<07:34,  6.15s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=0.000127, train/loss_step=0.012, global_step=761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]     Epoch 38:   9%|▉         | 7/80 [00:44<06:47,  5.58s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=0.000127, train/loss_step=0.012, global_step=761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:   9%|▉         | 7/80 [00:44<06:47,  5.58s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.81e-5, train/loss_step=0.013, global_step=761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409] Epoch 38:  10%|█         | 8/80 [01:15<10:04,  8.39s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.81e-5, train/loss_step=0.013, global_step=761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  10%|█         | 8/80 [01:15<10:04,  8.39s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.47e-5, train/loss_step=0.00419, global_step=761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  11%|█▏        | 9/80 [01:22<09:48,  8.29s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.47e-5, train/loss_step=0.00419, global_step=761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  11%|█▏        | 9/80 [01:22<09:48,  8.29s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=5.88e-6, train/loss_step=0.000865, global_step=762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  12%|█▎        | 10/80 [01:28<09:21,  8.02s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=5.88e-6, train/loss_step=0.000865, global_step=762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  12%|█▎        | 10/80 [01:28<09:21,  8.02s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=5.05e-6, train/loss_step=0.000506, global_step=762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  14%|█▍        | 11/80 [01:28<08:30,  7.40s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=5.05e-6, train/loss_step=0.000506, global_step=762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  14%|█▍        | 11/80 [01:28<08:30,  7.40s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000266, train/loss_vlb_step=1.41e-6, train/loss_step=0.000266, global_step=762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  15%|█▌        | 12/80 [01:29<07:46,  6.87s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000266, train/loss_vlb_step=1.41e-6, train/loss_step=0.000266, global_step=762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  15%|█▌        | 12/80 [01:29<07:46,  6.87s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=8.77e-5, train/loss_step=0.0109, global_step=762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]    Epoch 38:  16%|█▋        | 13/80 [01:29<07:09,  6.41s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=8.77e-5, train/loss_step=0.0109, global_step=762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  16%|█▋        | 13/80 [01:29<07:09,  6.41s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=6.59e-5, train/loss_step=0.00924, global_step=763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  18%|█▊        | 14/80 [01:30<06:37,  6.02s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00924, train/loss_vlb_step=6.59e-5, train/loss_step=0.00924, global_step=763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  18%|█▊        | 14/80 [01:30<06:37,  6.02s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=1.31e-5, train/loss_step=0.00115, global_step=763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  19%|█▉        | 15/80 [01:30<06:08,  5.67s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=1.31e-5, train/loss_step=0.00115, global_step=763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  19%|█▉        | 15/80 [01:30<06:08,  5.67s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.12e-6, train/loss_step=0.000454, global_step=763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  20%|██        | 16/80 [02:02<07:40,  7.20s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.12e-6, train/loss_step=0.000454, global_step=763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  20%|██        | 16/80 [02:02<07:40,  7.20s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000901, train/loss_vlb_step=7.82e-5, train/loss_step=0.000901, global_step=763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409] Epoch 38:  21%|██▏       | 17/80 [02:02<07:10,  6.83s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000901, train/loss_vlb_step=7.82e-5, train/loss_step=0.000901, global_step=763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  21%|██▏       | 17/80 [02:02<07:10,  6.83s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=2.59e-5, train/loss_step=0.00704, global_step=764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 38:  22%|██▎       | 18/80 [02:04<06:45,  6.54s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=2.59e-5, train/loss_step=0.00704, global_step=764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  22%|██▎       | 18/80 [02:04<06:45,  6.54s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=6.03e-6, train/loss_step=0.00158, global_step=764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  24%|██▍       | 19/80 [02:04<06:20,  6.24s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=6.03e-6, train/loss_step=0.00158, global_step=764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  24%|██▍       | 19/80 [02:04<06:20,  6.24s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=7.39e-5, train/loss_step=0.0134, global_step=764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 38:  25%|██▌       | 20/80 [02:05<05:57,  5.96s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=7.39e-5, train/loss_step=0.0134, global_step=764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  25%|██▌       | 20/80 [02:05<05:57,  5.96s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=2.22e-6, train/loss_step=0.000549, global_step=764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  26%|██▋       | 21/80 [02:05<05:37,  5.72s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=2.22e-6, train/loss_step=0.000549, global_step=764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  26%|██▋       | 21/80 [02:05<05:37,  5.72s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000917, train/loss_vlb_step=6.55e-6, train/loss_step=0.000917, global_step=765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  28%|██▊       | 22/80 [02:06<05:18,  5.49s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000917, train/loss_vlb_step=6.55e-6, train/loss_step=0.000917, global_step=765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  28%|██▊       | 22/80 [02:06<05:18,  5.49s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=3.47e-5, train/loss_step=0.0036, global_step=765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]    Epoch 38:  29%|██▉       | 23/80 [02:06<05:01,  5.28s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=3.47e-5, train/loss_step=0.0036, global_step=765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  29%|██▉       | 23/80 [02:06<05:01,  5.28s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=2.14e-5, train/loss_step=0.00616, global_step=765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  30%|███       | 24/80 [02:49<06:20,  6.79s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=2.14e-5, train/loss_step=0.00616, global_step=765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  30%|███       | 24/80 [02:49<06:20,  6.79s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0005, train/loss_vlb_step=2.97e-6, train/loss_step=0.0005, global_step=765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 38:  31%|███▏      | 25/80 [02:50<06:00,  6.55s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0005, train/loss_vlb_step=2.97e-6, train/loss_step=0.0005, global_step=765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  31%|███▏      | 25/80 [02:50<06:00,  6.55s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000391, train/loss_vlb_step=5.68e-6, train/loss_step=0.000391, global_step=766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  32%|███▎      | 26/80 [02:50<05:41,  6.33s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000391, train/loss_vlb_step=5.68e-6, train/loss_step=0.000391, global_step=766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  32%|███▎      | 26/80 [02:50<05:41,  6.33s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=0.000858, train/loss_step=0.00204, global_step=766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409] Epoch 38:  34%|███▍      | 27/80 [02:51<05:24,  6.12s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=0.000858, train/loss_step=0.00204, global_step=766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  34%|███▍      | 27/80 [02:51<05:24,  6.12s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000343, train/loss_vlb_step=1.3e-6, train/loss_step=0.000343, global_step=766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  35%|███▌      | 28/80 [02:51<05:08,  5.93s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000343, train/loss_vlb_step=1.3e-6, train/loss_step=0.000343, global_step=766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  35%|███▌      | 28/80 [02:51<05:08,  5.93s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=2.67e-5, train/loss_step=0.00104, global_step=766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409] Epoch 38:  36%|███▋      | 29/80 [02:52<04:53,  5.75s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=2.67e-5, train/loss_step=0.00104, global_step=766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  36%|███▋      | 29/80 [02:52<04:53,  5.75s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=5.5e-6, train/loss_step=0.000561, global_step=767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  38%|███▊      | 30/80 [02:52<04:38,  5.58s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=5.5e-6, train/loss_step=0.000561, global_step=767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  38%|███▊      | 30/80 [02:52<04:38,  5.58s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=9.11e-7, train/loss_step=0.000231, global_step=767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  39%|███▉      | 31/80 [02:53<04:25,  5.42s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=9.11e-7, train/loss_step=0.000231, global_step=767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  39%|███▉      | 31/80 [02:53<04:25,  5.42s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000782, train/loss_vlb_step=2.45e-5, train/loss_step=0.000782, global_step=767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  40%|████      | 32/80 [03:30<05:06,  6.38s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000782, train/loss_vlb_step=2.45e-5, train/loss_step=0.000782, global_step=767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  40%|████      | 32/80 [03:30<05:06,  6.38s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.43e-6, train/loss_step=0.00101, global_step=767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]   Epoch 38:  41%|████▏     | 33/80 [03:31<04:51,  6.21s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.43e-6, train/loss_step=0.00101, global_step=767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  41%|████▏     | 33/80 [03:31<04:51,  6.21s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.86e-5, train/loss_step=0.00375, global_step=768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  42%|████▎     | 34/80 [03:31<04:38,  6.05s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.86e-5, train/loss_step=0.00375, global_step=768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  42%|████▎     | 34/80 [03:31<04:38,  6.05s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=2.93e-5, train/loss_step=0.00781, global_step=768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  44%|████▍     | 35/80 [03:32<04:25,  5.89s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=2.93e-5, train/loss_step=0.00781, global_step=768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  44%|████▍     | 35/80 [03:32<04:25,  5.89s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000532, train/loss_vlb_step=4.49e-6, train/loss_step=0.000532, global_step=768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  45%|████▌     | 36/80 [03:32<04:13,  5.75s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000532, train/loss_vlb_step=4.49e-6, train/loss_step=0.000532, global_step=768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  45%|████▌     | 36/80 [03:32<04:13,  5.75s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=9.85e-5, train/loss_step=0.00327, global_step=768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 38:  46%|████▋     | 37/80 [03:33<04:01,  5.61s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=9.85e-5, train/loss_step=0.00327, global_step=768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  46%|████▋     | 37/80 [03:33<04:01,  5.61s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=1.32e-5, train/loss_step=0.00123, global_step=769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  48%|████▊     | 38/80 [03:33<03:50,  5.48s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=1.32e-5, train/loss_step=0.00123, global_step=769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  48%|████▊     | 38/80 [03:33<03:50,  5.48s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.61e-6, train/loss_step=0.000355, global_step=769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  49%|████▉     | 39/80 [03:34<03:39,  5.36s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.61e-6, train/loss_step=0.000355, global_step=769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  49%|████▉     | 39/80 [03:34<03:39,  5.36s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.69e-5, train/loss_step=0.0045, global_step=769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]    Epoch 38:  50%|█████     | 40/80 [04:02<03:57,  5.93s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.69e-5, train/loss_step=0.0045, global_step=769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  50%|█████     | 40/80 [04:02<03:57,  5.93s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=6.16e-6, train/loss_step=0.00169, global_step=769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  51%|█████▏    | 41/80 [04:03<03:46,  5.80s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=6.16e-6, train/loss_step=0.00169, global_step=769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  51%|█████▏    | 41/80 [04:03<03:46,  5.80s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.000205, train/loss_step=0.0229, global_step=770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409] Epoch 38:  52%|█████▎    | 42/80 [04:06<03:37,  5.73s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.000205, train/loss_step=0.0229, global_step=770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  52%|█████▎    | 42/80 [04:06<03:37,  5.73s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=1.74e-5, train/loss_step=0.000734, global_step=770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  54%|█████▍    | 43/80 [04:06<03:27,  5.61s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=1.74e-5, train/loss_step=0.000734, global_step=770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  54%|█████▍    | 43/80 [04:06<03:27,  5.61s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=8.12e-6, train/loss_step=0.002, global_step=770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]      Epoch 38:  55%|█████▌    | 44/80 [04:07<03:17,  5.50s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=8.12e-6, train/loss_step=0.002, global_step=770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  55%|█████▌    | 44/80 [04:07<03:17,  5.50s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=1.49e-6, train/loss_step=0.000313, global_step=770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  56%|█████▋    | 45/80 [04:08<03:08,  5.39s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=1.49e-6, train/loss_step=0.000313, global_step=770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  56%|█████▋    | 45/80 [04:08<03:08,  5.39s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=4.25e-5, train/loss_step=0.00824, global_step=771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 38:  57%|█████▊    | 46/80 [04:08<02:59,  5.29s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=4.25e-5, train/loss_step=0.00824, global_step=771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  57%|█████▊    | 46/80 [04:08<02:59,  5.29s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000543, train/loss_vlb_step=4.17e-6, train/loss_step=0.000543, global_step=771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  59%|█████▉    | 47/80 [04:09<02:51,  5.19s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000543, train/loss_vlb_step=4.17e-6, train/loss_step=0.000543, global_step=771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  59%|█████▉    | 47/80 [04:09<02:51,  5.19s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=4.48e-5, train/loss_step=0.00471, global_step=771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 38:  60%|██████    | 48/80 [04:51<03:10,  5.95s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=4.48e-5, train/loss_step=0.00471, global_step=771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  60%|██████    | 48/80 [04:51<03:10,  5.95s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.67e-6, train/loss_step=0.00031, global_step=771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  61%|██████▏   | 49/80 [04:52<03:01,  5.84s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.67e-6, train/loss_step=0.00031, global_step=771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  61%|██████▏   | 49/80 [04:52<03:01,  5.84s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000507, train/loss_vlb_step=7.55e-6, train/loss_step=0.000507, global_step=772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  62%|██████▎   | 50/80 [04:52<02:52,  5.74s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000507, train/loss_vlb_step=7.55e-6, train/loss_step=0.000507, global_step=772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  62%|██████▎   | 50/80 [04:52<02:52,  5.74s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=1.62e-5, train/loss_step=0.00473, global_step=772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]   Epoch 38:  64%|██████▍   | 51/80 [04:53<02:43,  5.64s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=1.62e-5, train/loss_step=0.00473, global_step=772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  64%|██████▍   | 51/80 [04:53<02:43,  5.64s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=4.71e-5, train/loss_step=0.00685, global_step=772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  65%|██████▌   | 52/80 [04:54<02:35,  5.55s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=4.71e-5, train/loss_step=0.00685, global_step=772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  65%|██████▌   | 52/80 [04:54<02:35,  5.55s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.25e-5, train/loss_step=0.00495, global_step=772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409] Epoch 38:  66%|██████▋   | 53/80 [04:54<02:27,  5.46s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.25e-5, train/loss_step=0.00495, global_step=772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  66%|██████▋   | 53/80 [04:54<02:27,  5.46s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=0.000211, train/loss_step=0.0129, global_step=773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  68%|██████▊   | 54/80 [04:55<02:19,  5.37s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=0.000211, train/loss_step=0.0129, global_step=773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  68%|██████▊   | 54/80 [04:55<02:19,  5.37s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.5e-6, train/loss_step=0.000345, global_step=773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  69%|██████▉   | 55/80 [04:55<02:11,  5.28s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.5e-6, train/loss_step=0.000345, global_step=773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  69%|██████▉   | 55/80 [04:55<02:11,  5.28s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=2.57e-6, train/loss_step=0.000373, global_step=773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  70%|███████   | 56/80 [05:34<02:20,  5.87s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=2.57e-6, train/loss_step=0.000373, global_step=773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  70%|███████   | 56/80 [05:34<02:20,  5.87s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.85e-5, train/loss_step=0.0106, global_step=773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]    Epoch 38:  71%|███████▏  | 57/80 [05:35<02:12,  5.78s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.85e-5, train/loss_step=0.0106, global_step=773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  71%|███████▏  | 57/80 [05:35<02:12,  5.78s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.72e-5, train/loss_step=0.0037, global_step=774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  72%|███████▎  | 58/80 [05:35<02:05,  5.69s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.72e-5, train/loss_step=0.0037, global_step=774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  72%|███████▎  | 58/80 [05:35<02:05,  5.69s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=2.87e-5, train/loss_step=0.00733, global_step=774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  74%|███████▍  | 59/80 [05:36<01:57,  5.61s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=2.87e-5, train/loss_step=0.00733, global_step=774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  74%|███████▍  | 59/80 [05:36<01:57,  5.61s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=6.77e-6, train/loss_step=0.00101, global_step=774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  75%|███████▌  | 60/80 [05:37<01:50,  5.53s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=6.77e-6, train/loss_step=0.00101, global_step=774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  75%|███████▌  | 60/80 [05:37<01:50,  5.53s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=7.27e-6, train/loss_step=0.00104, global_step=774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  76%|███████▋  | 61/80 [05:37<01:43,  5.45s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=7.27e-6, train/loss_step=0.00104, global_step=774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  76%|███████▋  | 61/80 [05:37<01:43,  5.45s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.79e-5, train/loss_step=0.00778, global_step=775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  78%|███████▊  | 62/80 [05:38<01:36,  5.37s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.79e-5, train/loss_step=0.00778, global_step=775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  78%|███████▊  | 62/80 [05:38<01:36,  5.37s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=5.53e-6, train/loss_step=0.000537, global_step=775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  79%|███████▉  | 63/80 [05:40<01:30,  5.32s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=5.53e-6, train/loss_step=0.000537, global_step=775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  79%|███████▉  | 63/80 [05:40<01:30,  5.32s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=5.35e-5, train/loss_step=0.00964, global_step=775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 38:  80%|████████  | 64/80 [06:14<01:32,  5.76s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=5.35e-5, train/loss_step=0.00964, global_step=775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  80%|████████  | 64/80 [06:14<01:32,  5.76s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.19e-5, train/loss_step=0.00149, global_step=775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  81%|████████▏ | 65/80 [06:15<01:25,  5.68s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.19e-5, train/loss_step=0.00149, global_step=775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  81%|████████▏ | 65/80 [06:15<01:25,  5.68s/it, loss=0.004, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=6.28e-6, train/loss_step=0.000645, global_step=776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  82%|████████▎ | 66/80 [06:15<01:18,  5.60s/it, loss=0.004, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=6.28e-6, train/loss_step=0.000645, global_step=776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  82%|████████▎ | 66/80 [06:15<01:18,  5.60s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=1.36e-5, train/loss_step=0.00406, global_step=776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  84%|████████▍ | 67/80 [06:16<01:11,  5.53s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=1.36e-5, train/loss_step=0.00406, global_step=776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  84%|████████▍ | 67/80 [06:16<01:11,  5.53s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=8.08e-6, train/loss_step=0.000893, global_step=776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  85%|████████▌ | 68/80 [06:16<01:05,  5.46s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=8.08e-6, train/loss_step=0.000893, global_step=776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  85%|████████▌ | 68/80 [06:16<01:05,  5.46s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=1.56e-6, train/loss_step=0.000398, global_step=776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  86%|████████▋ | 69/80 [06:17<00:59,  5.39s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=1.56e-6, train/loss_step=0.000398, global_step=776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  86%|████████▋ | 69/80 [06:17<00:59,  5.39s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00985, train/loss_vlb_step=7.09e-5, train/loss_step=0.00985, global_step=777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 38:  88%|████████▊ | 70/80 [06:17<00:53,  5.32s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00985, train/loss_vlb_step=7.09e-5, train/loss_step=0.00985, global_step=777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  88%|████████▊ | 70/80 [06:17<00:53,  5.32s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=7.48e-6, train/loss_step=0.00115, global_step=777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  89%|████████▉ | 71/80 [06:25<00:48,  5.36s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=7.48e-6, train/loss_step=0.00115, global_step=777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  89%|████████▉ | 71/80 [06:25<00:48,  5.36s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=7.98e-6, train/loss_step=0.00204, global_step=777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  90%|█████████ | 72/80 [06:44<00:44,  5.55s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=7.98e-6, train/loss_step=0.00204, global_step=777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  90%|█████████ | 72/80 [06:44<00:44,  5.55s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000269, train/loss_vlb_step=1.16e-6, train/loss_step=0.000269, global_step=777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  91%|█████████▏| 73/80 [06:45<00:38,  5.48s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000269, train/loss_vlb_step=1.16e-6, train/loss_step=0.000269, global_step=777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  91%|█████████▏| 73/80 [06:45<00:38,  5.48s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.12e-6, train/loss_step=0.00028, global_step=778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409] Epoch 38:  92%|█████████▎| 74/80 [06:45<00:32,  5.41s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.12e-6, train/loss_step=0.00028, global_step=778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  92%|█████████▎| 74/80 [06:45<00:32,  5.41s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.98e-6, train/loss_step=0.00153, global_step=778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  94%|█████████▍| 75/80 [06:54<00:27,  5.45s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.98e-6, train/loss_step=0.00153, global_step=778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  94%|█████████▍| 75/80 [06:54<00:27,  5.45s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=5e-5, train/loss_step=0.0143, global_step=778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]     Epoch 38:  95%|█████████▌| 76/80 [06:54<00:21,  5.39s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=5e-5, train/loss_step=0.0143, global_step=778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  95%|█████████▌| 76/80 [06:54<00:21,  5.39s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000676, train/loss_vlb_step=2.34e-6, train/loss_step=0.000676, global_step=778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  96%|█████████▋| 77/80 [06:55<00:15,  5.32s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000676, train/loss_vlb_step=2.34e-6, train/loss_step=0.000676, global_step=778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  96%|█████████▋| 77/80 [06:55<00:15,  5.32s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=6.57e-6, train/loss_step=0.000697, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  98%|█████████▊| 78/80 [06:55<00:10,  5.26s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=6.57e-6, train/loss_step=0.000697, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  98%|█████████▊| 78/80 [06:55<00:10,  5.26s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000796, train/loss_vlb_step=3.16e-6, train/loss_step=0.000796, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  99%|█████████▉| 79/80 [06:56<00:05,  5.20s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000796, train/loss_vlb_step=3.16e-6, train/loss_step=0.000796, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38:  99%|█████████▉| 79/80 [06:56<00:05,  5.20s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=5.12e-6, train/loss_step=0.00121, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 38: 100%|██████████| 80/80 [06:56<00:00,  5.14s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=5.12e-6, train/loss_step=0.00121, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 38: 100%|██████████| 80/80 [06:56<00:00,  5.14s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00053, train/loss_vlb_step=3.19e-6, train/loss_step=0.00053, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Average Epoch time: 416.66 seconds
+Average Peak memory 29563.38MiB
+Epoch 38:   0%|          | 0/80 [00:00<00:00, 6150.01it/s, loss=0.00294, v_num=0, train/loss_simple_step=0.00053, train/loss_vlb_step=3.19e-6, train/loss_step=0.00053, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 39:   0%|          | 0/80 [00:00<00:00, 2317.30it/s, loss=0.00294, v_num=0, train/loss_simple_step=0.00053, train/loss_vlb_step=3.19e-6, train/loss_step=0.00053, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]Epoch 39:   1%|▏         | 1/80 [00:40<26:24, 20.06s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00053, train/loss_vlb_step=3.19e-6, train/loss_step=0.00053, global_step=779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=8.8e-5, train/loss_epoch=0.00409]  Epoch 39:   1%|▏         | 1/80 [00:40<26:24, 20.06s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.39e-6, train/loss_step=0.000323, global_step=780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   2%|▎         | 2/80 [00:40<17:35, 13.53s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.39e-6, train/loss_step=0.000323, global_step=780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   2%|▎         | 2/80 [00:40<17:35, 13.53s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=2.41e-5, train/loss_step=0.00612, global_step=780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:   4%|▍         | 3/80 [00:53<17:14, 13.43s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00612, train/loss_vlb_step=2.41e-5, train/loss_step=0.00612, global_step=780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   4%|▍         | 3/80 [00:53<17:14, 13.43s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=0.000266, train/loss_step=0.0218, global_step=780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:   5%|▌         | 4/80 [00:54<13:44, 10.85s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=0.000266, train/loss_step=0.0218, global_step=780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   5%|▌         | 4/80 [00:54<13:44, 10.85s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=1.98e-5, train/loss_step=0.00565, global_step=780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   6%|▋         | 5/80 [00:54<11:24,  9.13s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=1.98e-5, train/loss_step=0.00565, global_step=780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   6%|▋         | 5/80 [00:54<11:24,  9.13s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.2e-6, train/loss_step=0.000296, global_step=781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   8%|▊         | 6/80 [00:55<09:44,  7.89s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.2e-6, train/loss_step=0.000296, global_step=781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   8%|▊         | 6/80 [00:55<09:44,  7.89s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000649, train/loss_vlb_step=1.09e-5, train/loss_step=0.000649, global_step=781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   9%|▉         | 7/80 [00:55<08:28,  6.97s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000649, train/loss_vlb_step=1.09e-5, train/loss_step=0.000649, global_step=781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:   9%|▉         | 7/80 [00:55<08:28,  6.97s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.38e-5, train/loss_step=0.00384, global_step=781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  10%|█         | 8/80 [01:23<11:11,  9.32s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=2.38e-5, train/loss_step=0.00384, global_step=781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  10%|█         | 8/80 [01:23<11:11,  9.32s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.41e-5, train/loss_step=0.00373, global_step=781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  11%|█▏        | 9/80 [01:24<09:59,  8.45s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.41e-5, train/loss_step=0.00373, global_step=781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  11%|█▏        | 9/80 [01:24<09:59,  8.45s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000588, train/loss_vlb_step=2.66e-6, train/loss_step=0.000588, global_step=782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  12%|█▎        | 10/80 [01:25<09:06,  7.81s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000588, train/loss_vlb_step=2.66e-6, train/loss_step=0.000588, global_step=782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  12%|█▎        | 10/80 [01:25<09:06,  7.81s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=2.15e-6, train/loss_step=0.000437, global_step=782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  14%|█▍        | 11/80 [01:44<09:59,  8.68s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=2.15e-6, train/loss_step=0.000437, global_step=782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  14%|█▍        | 11/80 [01:44<09:59,  8.68s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=2.14e-5, train/loss_step=0.00276, global_step=782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  15%|█▌        | 12/80 [01:44<09:07,  8.05s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=2.14e-5, train/loss_step=0.00276, global_step=782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  15%|█▌        | 12/80 [01:44<09:07,  8.05s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.33e-6, train/loss_step=0.000307, global_step=782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  16%|█▋        | 13/80 [01:45<08:23,  7.51s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.33e-6, train/loss_step=0.000307, global_step=782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  16%|█▋        | 13/80 [01:45<08:23,  7.51s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=8.38e-6, train/loss_step=0.000817, global_step=783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  18%|█▊        | 14/80 [01:45<07:45,  7.05s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=8.38e-6, train/loss_step=0.000817, global_step=783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  18%|█▊        | 14/80 [01:45<07:45,  7.05s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.03e-5, train/loss_step=0.00578, global_step=783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  19%|█▉        | 15/80 [01:46<07:11,  6.64s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.03e-5, train/loss_step=0.00578, global_step=783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  19%|█▉        | 15/80 [01:46<07:11,  6.64s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=2.71e-6, train/loss_step=0.000584, global_step=783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  20%|██        | 16/80 [02:05<07:50,  7.36s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=2.71e-6, train/loss_step=0.000584, global_step=783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  20%|██        | 16/80 [02:05<07:50,  7.36s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=0.000363, train/loss_step=0.00388, global_step=783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  21%|██▏       | 17/80 [02:05<07:19,  6.98s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=0.000363, train/loss_step=0.00388, global_step=783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  21%|██▏       | 17/80 [02:05<07:19,  6.98s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.15e-5, train/loss_step=0.00291, global_step=784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  22%|██▎       | 18/80 [02:06<06:51,  6.63s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.15e-5, train/loss_step=0.00291, global_step=784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  22%|██▎       | 18/80 [02:06<06:51,  6.63s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.02e-5, train/loss_step=0.00581, global_step=784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  24%|██▍       | 19/80 [02:26<07:26,  7.32s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.02e-5, train/loss_step=0.00581, global_step=784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  24%|██▍       | 19/80 [02:26<07:26,  7.32s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=7.24e-5, train/loss_step=0.00944, global_step=784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  25%|██▌       | 20/80 [02:26<06:59,  7.00s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=7.24e-5, train/loss_step=0.00944, global_step=784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  25%|██▌       | 20/80 [02:26<06:59,  7.00s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=0.000154, train/loss_step=0.0112, global_step=784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  26%|██▋       | 21/80 [02:27<06:35,  6.70s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=0.000154, train/loss_step=0.0112, global_step=784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  26%|██▋       | 21/80 [02:27<06:35,  6.70s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.46e-6, train/loss_step=0.000433, global_step=785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  28%|██▊       | 22/80 [02:27<06:13,  6.43s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.46e-6, train/loss_step=0.000433, global_step=785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  28%|██▊       | 22/80 [02:27<06:13,  6.43s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=3.62e-5, train/loss_step=0.00545, global_step=785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  29%|██▉       | 23/80 [02:28<05:52,  6.19s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=3.62e-5, train/loss_step=0.00545, global_step=785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  29%|██▉       | 23/80 [02:28<05:52,  6.19s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=1.28e-5, train/loss_step=0.000819, global_step=785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  30%|███       | 24/80 [02:49<06:20,  6.79s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=1.28e-5, train/loss_step=0.000819, global_step=785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  30%|███       | 24/80 [02:49<06:20,  6.79s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000677, train/loss_vlb_step=2.66e-6, train/loss_step=0.000677, global_step=785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  31%|███▏      | 25/80 [02:50<06:00,  6.55s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000677, train/loss_vlb_step=2.66e-6, train/loss_step=0.000677, global_step=785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  31%|███▏      | 25/80 [02:50<06:00,  6.55s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=2.31e-6, train/loss_step=0.000356, global_step=786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  32%|███▎      | 26/80 [02:50<05:41,  6.32s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=2.31e-6, train/loss_step=0.000356, global_step=786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  32%|███▎      | 26/80 [02:50<05:41,  6.32s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=1.64e-5, train/loss_step=0.00445, global_step=786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  34%|███▍      | 27/80 [02:54<05:30,  6.24s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=1.64e-5, train/loss_step=0.00445, global_step=786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  34%|███▍      | 27/80 [02:54<05:30,  6.24s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.84e-5, train/loss_step=0.00395, global_step=786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  35%|███▌      | 28/80 [02:55<05:14,  6.04s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.84e-5, train/loss_step=0.00395, global_step=786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  35%|███▌      | 28/80 [02:55<05:14,  6.04s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.31e-6, train/loss_step=0.00128, global_step=786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  36%|███▋      | 29/80 [02:55<04:58,  5.86s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.31e-6, train/loss_step=0.00128, global_step=786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  36%|███▋      | 29/80 [02:55<04:58,  5.86s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000171, train/loss_step=0.0153, global_step=787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  38%|███▊      | 30/80 [02:56<04:44,  5.69s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000171, train/loss_step=0.0153, global_step=787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  38%|███▊      | 30/80 [02:56<04:44,  5.69s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000846, train/loss_step=0.0119, global_step=787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  39%|███▉      | 31/80 [02:56<04:30,  5.52s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000846, train/loss_step=0.0119, global_step=787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  39%|███▉      | 31/80 [02:56<04:30,  5.52s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.12e-5, train/loss_step=0.006, global_step=787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  40%|████      | 32/80 [03:31<05:08,  6.42s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.12e-5, train/loss_step=0.006, global_step=787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  40%|████      | 32/80 [03:31<05:08,  6.42s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=9.16e-6, train/loss_step=0.00179, global_step=787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  41%|████▏     | 33/80 [03:32<04:53,  6.25s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=9.16e-6, train/loss_step=0.00179, global_step=787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  41%|████▏     | 33/80 [03:32<04:53,  6.25s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000595, train/loss_vlb_step=6.62e-6, train/loss_step=0.000595, global_step=788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  42%|████▎     | 34/80 [03:33<04:39,  6.09s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000595, train/loss_vlb_step=6.62e-6, train/loss_step=0.000595, global_step=788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  42%|████▎     | 34/80 [03:33<04:39,  6.09s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000576, train/loss_step=0.0178, global_step=788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]   Epoch 39:  44%|████▍     | 35/80 [03:46<04:43,  6.29s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000576, train/loss_step=0.0178, global_step=788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  44%|████▍     | 35/80 [03:46<04:43,  6.29s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000602, train/loss_vlb_step=2.4e-6, train/loss_step=0.000602, global_step=788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  45%|████▌     | 36/80 [03:47<04:30,  6.14s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000602, train/loss_vlb_step=2.4e-6, train/loss_step=0.000602, global_step=788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  45%|████▌     | 36/80 [03:47<04:30,  6.14s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=2.5e-5, train/loss_step=0.00744, global_step=788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  46%|████▋     | 37/80 [03:47<04:17,  5.99s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=2.5e-5, train/loss_step=0.00744, global_step=788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  46%|████▋     | 37/80 [03:47<04:17,  5.99s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=9.27e-5, train/loss_step=0.0149, global_step=789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  48%|████▊     | 38/80 [03:48<04:05,  5.85s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=9.27e-5, train/loss_step=0.0149, global_step=789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  48%|████▊     | 38/80 [03:48<04:05,  5.85s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.73e-5, train/loss_step=0.0115, global_step=789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  49%|████▉     | 39/80 [03:48<03:54,  5.72s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.73e-5, train/loss_step=0.0115, global_step=789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  49%|████▉     | 39/80 [03:48<03:54,  5.72s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.09e-5, train/loss_step=0.0031, global_step=789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  50%|█████     | 40/80 [04:07<04:01,  6.04s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.09e-5, train/loss_step=0.0031, global_step=789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  50%|█████     | 40/80 [04:07<04:01,  6.04s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000736, train/loss_vlb_step=5.8e-6, train/loss_step=0.000736, global_step=789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  51%|█████▏    | 41/80 [04:08<03:50,  5.91s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000736, train/loss_vlb_step=5.8e-6, train/loss_step=0.000736, global_step=789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  51%|█████▏    | 41/80 [04:08<03:50,  5.91s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=2.83e-5, train/loss_step=0.00206, global_step=790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  52%|█████▎    | 42/80 [04:08<03:39,  5.78s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=2.83e-5, train/loss_step=0.00206, global_step=790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  52%|█████▎    | 42/80 [04:08<03:39,  5.78s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=6.84e-6, train/loss_step=0.00159, global_step=790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  54%|█████▍    | 43/80 [04:31<03:48,  6.18s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=6.84e-6, train/loss_step=0.00159, global_step=790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  54%|█████▍    | 43/80 [04:31<03:48,  6.18s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.6e-5, train/loss_step=0.0107, global_step=790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]   Epoch 39:  55%|█████▌    | 44/80 [04:32<03:37,  6.05s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.6e-5, train/loss_step=0.0107, global_step=790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  55%|█████▌    | 44/80 [04:32<03:37,  6.05s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=4.49e-6, train/loss_step=0.00104, global_step=790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=4.49e-6, train/loss_step=0.00104, global_step=790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.01e-5, train/loss_step=0.00264, global_step=791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.01e-5, train/loss_step=0.00264, global_step=791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.3e-5, train/loss_step=0.0115, global_step=791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]   Epoch 39:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.3e-5, train/loss_step=0.0115, global_step=791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.000729, train/loss_vlb_step=3.48e-6, train/loss_step=0.000729, global_step=791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  60%|██████    | 48/80 [04:47<03:07,  5.86s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.000729, train/loss_vlb_step=3.48e-6, train/loss_step=0.000729, global_step=791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  60%|██████    | 48/80 [04:47<03:07,  5.86s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.25e-5, train/loss_step=0.00555, global_step=791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  61%|██████▏   | 49/80 [04:47<02:58,  5.76s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.25e-5, train/loss_step=0.00555, global_step=791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  61%|██████▏   | 49/80 [04:47<02:58,  5.76s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=6.97e-6, train/loss_step=0.000626, global_step=792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  62%|██████▎   | 50/80 [04:56<02:54,  5.82s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=6.97e-6, train/loss_step=0.000626, global_step=792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  62%|██████▎   | 50/80 [04:56<02:54,  5.82s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.86e-5, train/loss_step=0.00512, global_step=792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]   Epoch 39:  64%|██████▍   | 51/80 [05:22<02:59,  6.20s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.86e-5, train/loss_step=0.00512, global_step=792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  64%|██████▍   | 51/80 [05:22<02:59,  6.20s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=1.73e-5, train/loss_step=0.00481, global_step=792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  65%|██████▌   | 52/80 [05:23<02:50,  6.10s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=1.73e-5, train/loss_step=0.00481, global_step=792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  65%|██████▌   | 52/80 [05:23<02:50,  6.10s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.3e-6, train/loss_step=0.00126, global_step=792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  66%|██████▋   | 53/80 [05:23<02:41,  5.99s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.3e-6, train/loss_step=0.00126, global_step=792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  66%|██████▋   | 53/80 [05:23<02:41,  5.99s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=6.87e-5, train/loss_step=0.00737, global_step=793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  68%|██████▊   | 54/80 [05:24<02:33,  5.89s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=6.87e-5, train/loss_step=0.00737, global_step=793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  68%|██████▊   | 54/80 [05:24<02:33,  5.89s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000483, train/loss_vlb_step=2.42e-6, train/loss_step=0.000483, global_step=793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  69%|██████▉   | 55/80 [05:24<02:24,  5.80s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000483, train/loss_vlb_step=2.42e-6, train/loss_step=0.000483, global_step=793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  69%|██████▉   | 55/80 [05:24<02:24,  5.80s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=0.00015, train/loss_step=0.0043, global_step=793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]    Epoch 39:  70%|███████   | 56/80 [05:32<02:19,  5.83s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=0.00015, train/loss_step=0.0043, global_step=793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  70%|███████   | 56/80 [05:32<02:19,  5.83s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.67e-5, train/loss_step=0.00542, global_step=793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  71%|███████▏  | 57/80 [05:33<02:12,  5.74s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=2.67e-5, train/loss_step=0.00542, global_step=793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  71%|███████▏  | 57/80 [05:33<02:12,  5.74s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=2.23e-6, train/loss_step=0.000488, global_step=794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  72%|███████▎  | 58/80 [05:39<02:06,  5.76s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=2.23e-6, train/loss_step=0.000488, global_step=794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  72%|███████▎  | 58/80 [05:39<02:06,  5.76s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000463, train/loss_step=0.0159, global_step=794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]   Epoch 39:  74%|███████▍  | 59/80 [06:07<02:08,  6.12s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000463, train/loss_step=0.0159, global_step=794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  74%|███████▍  | 59/80 [06:07<02:08,  6.12s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=3.39e-5, train/loss_step=0.00486, global_step=794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  75%|███████▌  | 60/80 [06:07<02:00,  6.03s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00486, train/loss_vlb_step=3.39e-5, train/loss_step=0.00486, global_step=794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  75%|███████▌  | 60/80 [06:07<02:00,  6.03s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.69e-6, train/loss_step=0.00113, global_step=794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  76%|███████▋  | 61/80 [06:08<01:52,  5.94s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.69e-6, train/loss_step=0.00113, global_step=794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  76%|███████▋  | 61/80 [06:08<01:52,  5.94s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=3.6e-6, train/loss_step=0.000798, global_step=795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  78%|███████▊  | 62/80 [06:08<01:45,  5.86s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=3.6e-6, train/loss_step=0.000798, global_step=795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  78%|███████▊  | 62/80 [06:08<01:45,  5.86s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000751, train/loss_vlb_step=3.05e-6, train/loss_step=0.000751, global_step=795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  79%|███████▉  | 63/80 [06:09<01:38,  5.77s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000751, train/loss_vlb_step=3.05e-6, train/loss_step=0.000751, global_step=795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  79%|███████▉  | 63/80 [06:09<01:38,  5.77s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=0.000365, train/loss_step=0.00185, global_step=795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  80%|████████  | 64/80 [06:15<01:32,  5.78s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=0.000365, train/loss_step=0.00185, global_step=795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  80%|████████  | 64/80 [06:15<01:32,  5.78s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000964, train/loss_vlb_step=3.81e-6, train/loss_step=0.000964, global_step=795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000964, train/loss_vlb_step=3.81e-6, train/loss_step=0.000964, global_step=795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.83e-5, train/loss_step=0.00761, global_step=796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  82%|████████▎ | 66/80 [06:20<01:19,  5.69s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.83e-5, train/loss_step=0.00761, global_step=796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  82%|████████▎ | 66/80 [06:20<01:19,  5.69s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=2.41e-5, train/loss_step=0.00277, global_step=796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  84%|████████▍ | 67/80 [06:44<01:17,  5.94s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=2.41e-5, train/loss_step=0.00277, global_step=796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  84%|████████▍ | 67/80 [06:44<01:17,  5.94s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.49e-6, train/loss_step=0.00107, global_step=796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  85%|████████▌ | 68/80 [06:44<01:10,  5.86s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.49e-6, train/loss_step=0.00107, global_step=796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  85%|████████▌ | 68/80 [06:44<01:10,  5.86s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.26e-6, train/loss_step=0.000267, global_step=796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  86%|████████▋ | 69/80 [06:45<01:03,  5.79s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.26e-6, train/loss_step=0.000267, global_step=796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  86%|████████▋ | 69/80 [06:45<01:03,  5.79s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.32e-5, train/loss_step=0.00357, global_step=797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  88%|████████▊ | 70/80 [06:45<00:57,  5.71s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.32e-5, train/loss_step=0.00357, global_step=797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  88%|████████▊ | 70/80 [06:45<00:57,  5.71s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000674, train/loss_vlb_step=4.38e-6, train/loss_step=0.000674, global_step=797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  89%|████████▉ | 71/80 [06:46<00:50,  5.64s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000674, train/loss_vlb_step=4.38e-6, train/loss_step=0.000674, global_step=797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  89%|████████▉ | 71/80 [06:46<00:50,  5.64s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.41e-6, train/loss_step=0.0011, global_step=797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]    Epoch 39:  90%|█████████ | 72/80 [06:50<00:45,  5.63s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.41e-6, train/loss_step=0.0011, global_step=797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  90%|█████████ | 72/80 [06:50<00:45,  5.63s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=1.33e-5, train/loss_step=0.00127, global_step=797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  91%|█████████▏| 73/80 [06:56<00:39,  5.62s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=1.33e-5, train/loss_step=0.00127, global_step=797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  91%|█████████▏| 73/80 [06:56<00:39,  5.62s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000177, train/loss_step=0.0224, global_step=798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399] Epoch 39:  92%|█████████▎| 74/80 [06:56<00:33,  5.55s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000177, train/loss_step=0.0224, global_step=798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  92%|█████████▎| 74/80 [06:56<00:33,  5.55s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=1.77e-5, train/loss_step=0.00488, global_step=798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  94%|█████████▍| 75/80 [07:13<00:28,  5.71s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=1.77e-5, train/loss_step=0.00488, global_step=798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  94%|█████████▍| 75/80 [07:13<00:28,  5.71s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=3.24e-5, train/loss_step=0.00868, global_step=798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  95%|█████████▌| 76/80 [07:14<00:22,  5.64s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=3.24e-5, train/loss_step=0.00868, global_step=798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  95%|█████████▌| 76/80 [07:14<00:22,  5.64s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.4e-5, train/loss_step=0.0106, global_step=798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]   Epoch 39:  96%|█████████▋| 77/80 [07:14<00:16,  5.57s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.4e-5, train/loss_step=0.0106, global_step=798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  96%|█████████▋| 77/80 [07:14<00:16,  5.57s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=7.86e-6, train/loss_step=0.00161, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  98%|█████████▊| 78/80 [07:15<00:11,  5.51s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=7.86e-6, train/loss_step=0.00161, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  98%|█████████▊| 78/80 [07:15<00:11,  5.51s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.17e-5, train/loss_step=0.0107, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 39:  99%|█████████▉| 79/80 [07:15<00:05,  5.45s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.17e-5, train/loss_step=0.0107, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39:  99%|█████████▉| 79/80 [07:15<00:05,  5.45s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000115, train/loss_step=0.0153, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000115, train/loss_step=0.0153, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 39: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=1.17e-6, train/loss_step=0.000239, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Average Epoch time: 436.32 seconds
+Average Peak memory 29566.22MiB
+Epoch 39:   0%|          | 0/80 [00:00<00:00, 5071.71it/s, loss=0.00486, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=1.17e-6, train/loss_step=0.000239, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 40:   0%|          | 0/80 [00:00<00:00, 2200.58it/s, loss=0.00486, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=1.17e-6, train/loss_step=0.000239, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]Epoch 40:   1%|▏         | 1/80 [00:39<25:46, 19.57s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=1.17e-6, train/loss_step=0.000239, global_step=799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00399, train/loss_vlb_epoch=7.98e-5, train/loss_epoch=0.00399]  Epoch 40:   1%|▏         | 1/80 [00:39<25:46, 19.57s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000773, train/loss_vlb_step=5.23e-6, train/loss_step=0.000773, global_step=800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:   2%|▎         | 2/80 [00:39<17:10, 13.21s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000773, train/loss_vlb_step=5.23e-6, train/loss_step=0.000773, global_step=800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:   2%|▎         | 2/80 [00:39<17:10, 13.21s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.05e-5, train/loss_step=0.00738, global_step=800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:   4%|▍         | 3/80 [01:01<19:44, 15.39s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.05e-5, train/loss_step=0.00738, global_step=800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:   4%|▍         | 3/80 [01:01<19:44, 15.39s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=5.15e-5, train/loss_step=0.00108, global_step=800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:   5%|▌         | 4/80 [01:02<15:43, 12.41s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=5.15e-5, train/loss_step=0.00108, global_step=800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:   5%|▌         | 4/80 [01:02<15:43, 12.41s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=2.47e-5, train/loss_step=0.0062, global_step=800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:   6%|▋         | 5/80 [01:02<13:02, 10.43s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=2.47e-5, train/loss_step=0.0062, global_step=800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:   6%|▋         | 5/80 [01:02<13:02, 10.43s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=1.89e-5, train/loss_step=0.00562, global_step=801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:   8%|▊         | 6/80 [01:03<11:06,  9.01s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=1.89e-5, train/loss_step=0.00562, global_step=801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:   8%|▊         | 6/80 [01:03<11:06,  9.01s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000141, train/loss_step=0.0144, global_step=801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:   9%|▉         | 7/80 [01:03<09:39,  7.94s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000141, train/loss_step=0.0144, global_step=801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:   9%|▉         | 7/80 [01:03<09:39,  7.94s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.48e-6, train/loss_step=0.00036, global_step=801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  10%|█         | 8/80 [01:12<09:42,  8.09s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.48e-6, train/loss_step=0.00036, global_step=801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  10%|█         | 8/80 [01:12<09:42,  8.09s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=8.93e-7, train/loss_step=0.000201, global_step=801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  11%|█▏        | 9/80 [01:13<08:40,  7.34s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=8.93e-7, train/loss_step=0.000201, global_step=801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  11%|█▏        | 9/80 [01:13<08:40,  7.34s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=8.3e-5, train/loss_step=0.0141, global_step=802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]     Epoch 40:  12%|█▎        | 10/80 [01:13<07:49,  6.71s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=8.3e-5, train/loss_step=0.0141, global_step=802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  12%|█▎        | 10/80 [01:13<07:49,  6.71s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=4.48e-5, train/loss_step=0.00769, global_step=802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  14%|█▍        | 11/80 [01:41<09:41,  8.42s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=4.48e-5, train/loss_step=0.00769, global_step=802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  14%|█▍        | 11/80 [01:41<09:41,  8.42s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.000978, train/loss_vlb_step=9.42e-6, train/loss_step=0.000978, global_step=802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  15%|█▌        | 12/80 [01:41<08:51,  7.82s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.000978, train/loss_vlb_step=9.42e-6, train/loss_step=0.000978, global_step=802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  15%|█▌        | 12/80 [01:41<08:51,  7.82s/it, loss=0.00711, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=3.54e-5, train/loss_step=0.00886, global_step=802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  16%|█▋        | 13/80 [01:42<08:08,  7.29s/it, loss=0.00711, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=3.54e-5, train/loss_step=0.00886, global_step=802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  16%|█▋        | 13/80 [01:42<08:08,  7.29s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=6.58e-5, train/loss_step=0.0123, global_step=803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]   Epoch 40:  18%|█▊        | 14/80 [01:42<07:31,  6.84s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=6.58e-5, train/loss_step=0.0123, global_step=803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  18%|█▊        | 14/80 [01:42<07:31,  6.84s/it, loss=0.00666, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=2.3e-5, train/loss_step=0.00599, global_step=803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  19%|█▉        | 15/80 [01:43<06:58,  6.44s/it, loss=0.00666, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=2.3e-5, train/loss_step=0.00599, global_step=803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  19%|█▉        | 15/80 [01:43<06:58,  6.44s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.8e-5, train/loss_step=0.0138, global_step=803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  20%|██        | 16/80 [01:55<07:15,  6.80s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=5.8e-5, train/loss_step=0.0138, global_step=803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  20%|██        | 16/80 [01:55<07:15,  6.80s/it, loss=0.00675, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=6.83e-5, train/loss_step=0.00726, global_step=803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  21%|██▏       | 17/80 [01:56<06:48,  6.48s/it, loss=0.00675, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=6.83e-5, train/loss_step=0.00726, global_step=803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  21%|██▏       | 17/80 [01:56<06:48,  6.48s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=2.76e-6, train/loss_step=0.000541, global_step=804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  22%|██▎       | 18/80 [01:57<06:22,  6.17s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=2.76e-6, train/loss_step=0.000541, global_step=804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  22%|██▎       | 18/80 [01:57<06:22,  6.17s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=0.000141, train/loss_step=0.0113, global_step=804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]   Epoch 40:  24%|██▍       | 19/80 [02:08<06:30,  6.40s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=0.000141, train/loss_step=0.0113, global_step=804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  24%|██▍       | 19/80 [02:08<06:30,  6.40s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.56e-5, train/loss_step=0.00451, global_step=804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  25%|██▌       | 20/80 [02:08<06:07,  6.12s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.56e-5, train/loss_step=0.00451, global_step=804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  25%|██▌       | 20/80 [02:08<06:07,  6.12s/it, loss=0.00754, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00017, train/loss_step=0.0275, global_step=804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  26%|██▋       | 21/80 [02:09<05:47,  5.88s/it, loss=0.00754, v_num=0, train/loss_simple_step=0.0275, train/loss_vlb_step=0.00017, train/loss_step=0.0275, global_step=804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  26%|██▋       | 21/80 [02:09<05:47,  5.88s/it, loss=0.00774, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=1.91e-5, train/loss_step=0.00464, global_step=805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  28%|██▊       | 22/80 [02:09<05:27,  5.65s/it, loss=0.00774, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=1.91e-5, train/loss_step=0.00464, global_step=805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  28%|██▊       | 22/80 [02:09<05:27,  5.65s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.000672, train/loss_vlb_step=5.12e-6, train/loss_step=0.000672, global_step=805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  29%|██▉       | 23/80 [02:10<05:09,  5.43s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.000672, train/loss_vlb_step=5.12e-6, train/loss_step=0.000672, global_step=805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  29%|██▉       | 23/80 [02:10<05:09,  5.43s/it, loss=0.00885, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.00023, train/loss_step=0.0301, global_step=805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]   Epoch 40:  30%|███       | 24/80 [02:43<06:06,  6.54s/it, loss=0.00885, v_num=0, train/loss_simple_step=0.0301, train/loss_vlb_step=0.00023, train/loss_step=0.0301, global_step=805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  30%|███       | 24/80 [02:43<06:06,  6.54s/it, loss=0.0092, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=8.78e-5, train/loss_step=0.0131, global_step=805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445] Epoch 40:  31%|███▏      | 25/80 [02:44<05:47,  6.31s/it, loss=0.0092, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=8.78e-5, train/loss_step=0.0131, global_step=805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  31%|███▏      | 25/80 [02:44<05:47,  6.31s/it, loss=0.00926, v_num=0, train/loss_simple_step=0.00686, train/loss_vlb_step=3.68e-5, train/loss_step=0.00686, global_step=806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  32%|███▎      | 26/80 [02:44<05:29,  6.10s/it, loss=0.00926, v_num=0, train/loss_simple_step=0.00686, train/loss_vlb_step=3.68e-5, train/loss_step=0.00686, global_step=806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  32%|███▎      | 26/80 [02:44<05:29,  6.10s/it, loss=0.00876, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=0.000929, train/loss_step=0.00435, global_step=806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  34%|███▍      | 27/80 [02:45<05:12,  5.90s/it, loss=0.00876, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=0.000929, train/loss_step=0.00435, global_step=806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  34%|███▍      | 27/80 [02:45<05:12,  5.90s/it, loss=0.00876, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=1.9e-6, train/loss_step=0.000395, global_step=806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  35%|███▌      | 28/80 [02:46<04:58,  5.75s/it, loss=0.00876, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=1.9e-6, train/loss_step=0.000395, global_step=806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  35%|███▌      | 28/80 [02:46<04:58,  5.75s/it, loss=0.0089, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.25e-5, train/loss_step=0.00288, global_step=806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  36%|███▋      | 29/80 [02:47<04:44,  5.58s/it, loss=0.0089, v_num=0, train/loss_simple_step=0.00288, train/loss_vlb_step=1.25e-5, train/loss_step=0.00288, global_step=806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  36%|███▋      | 29/80 [02:47<04:44,  5.58s/it, loss=0.0082, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.23e-6, train/loss_step=0.000304, global_step=807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  38%|███▊      | 30/80 [02:47<04:30,  5.42s/it, loss=0.0082, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.23e-6, train/loss_step=0.000304, global_step=807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  38%|███▊      | 30/80 [02:47<04:30,  5.42s/it, loss=0.00784, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.9e-6, train/loss_step=0.000422, global_step=807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  39%|███▉      | 31/80 [02:48<04:17,  5.26s/it, loss=0.00784, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.9e-6, train/loss_step=0.000422, global_step=807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  39%|███▉      | 31/80 [02:48<04:17,  5.26s/it, loss=0.00782, v_num=0, train/loss_simple_step=0.000596, train/loss_vlb_step=3.24e-6, train/loss_step=0.000596, global_step=807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  40%|████      | 32/80 [03:23<04:56,  6.18s/it, loss=0.00782, v_num=0, train/loss_simple_step=0.000596, train/loss_vlb_step=3.24e-6, train/loss_step=0.000596, global_step=807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  40%|████      | 32/80 [03:23<04:56,  6.18s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.000429, train/loss_vlb_step=2.54e-6, train/loss_step=0.000429, global_step=807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445] Epoch 40:  41%|████▏     | 33/80 [03:28<04:47,  6.12s/it, loss=0.0074, v_num=0, train/loss_simple_step=0.000429, train/loss_vlb_step=2.54e-6, train/loss_step=0.000429, global_step=807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  41%|████▏     | 33/80 [03:28<04:47,  6.12s/it, loss=0.00743, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=9.05e-5, train/loss_step=0.013, global_step=808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]     Epoch 40:  42%|████▎     | 34/80 [03:28<04:34,  5.96s/it, loss=0.00743, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=9.05e-5, train/loss_step=0.013, global_step=808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  42%|████▎     | 34/80 [03:28<04:34,  5.96s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.78e-6, train/loss_step=0.000392, global_step=808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  44%|████▍     | 35/80 [03:31<04:23,  5.87s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.78e-6, train/loss_step=0.000392, global_step=808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  44%|████▍     | 35/80 [03:31<04:23,  5.87s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.67e-5, train/loss_step=0.00289, global_step=808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  45%|████▌     | 36/80 [03:31<04:11,  5.72s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.67e-5, train/loss_step=0.00289, global_step=808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  45%|████▌     | 36/80 [03:31<04:11,  5.72s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.000844, train/loss_vlb_step=3.69e-6, train/loss_step=0.000844, global_step=808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  46%|████▋     | 37/80 [03:32<04:00,  5.59s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.000844, train/loss_vlb_step=3.69e-6, train/loss_step=0.000844, global_step=808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  46%|████▋     | 37/80 [03:32<04:00,  5.59s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=2.04e-5, train/loss_step=0.00592, global_step=809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  48%|████▊     | 38/80 [03:32<03:49,  5.45s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=2.04e-5, train/loss_step=0.00592, global_step=809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  48%|████▊     | 38/80 [03:32<03:49,  5.45s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.18e-6, train/loss_step=0.00166, global_step=809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  49%|████▉     | 39/80 [03:33<03:38,  5.33s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.18e-6, train/loss_step=0.00166, global_step=809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  49%|████▉     | 39/80 [03:33<03:38,  5.33s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=3.75e-5, train/loss_step=0.00199, global_step=809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  50%|█████     | 40/80 [03:58<03:52,  5.82s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=3.75e-5, train/loss_step=0.00199, global_step=809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  50%|█████     | 40/80 [03:58<03:52,  5.82s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=2.39e-5, train/loss_step=0.00127, global_step=809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  51%|█████▏    | 41/80 [04:12<03:54,  6.01s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=2.39e-5, train/loss_step=0.00127, global_step=809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  51%|█████▏    | 41/80 [04:12<03:54,  6.01s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=6.16e-6, train/loss_step=0.00145, global_step=810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  52%|█████▎    | 42/80 [04:12<03:43,  5.88s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=6.16e-6, train/loss_step=0.00145, global_step=810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  52%|█████▎    | 42/80 [04:12<03:43,  5.88s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=2.26e-5, train/loss_step=0.00116, global_step=810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445] Epoch 40:  54%|█████▍    | 43/80 [04:13<03:33,  5.76s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=2.26e-5, train/loss_step=0.00116, global_step=810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  54%|█████▍    | 43/80 [04:13<03:33,  5.76s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000901, train/loss_vlb_step=3.98e-6, train/loss_step=0.000901, global_step=810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  55%|█████▌    | 44/80 [04:13<03:23,  5.64s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000901, train/loss_vlb_step=3.98e-6, train/loss_step=0.000901, global_step=810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  55%|█████▌    | 44/80 [04:13<03:23,  5.64s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.56e-5, train/loss_step=0.0046, global_step=810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]    Epoch 40:  56%|█████▋    | 45/80 [04:14<03:13,  5.53s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.56e-5, train/loss_step=0.0046, global_step=810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  56%|█████▋    | 45/80 [04:14<03:13,  5.53s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=8.28e-5, train/loss_step=0.00997, global_step=811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  57%|█████▊    | 46/80 [04:15<03:04,  5.43s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=8.28e-5, train/loss_step=0.00997, global_step=811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  57%|█████▊    | 46/80 [04:15<03:04,  5.43s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.22e-5, train/loss_step=0.00354, global_step=811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  59%|█████▉    | 47/80 [04:15<02:55,  5.32s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.22e-5, train/loss_step=0.00354, global_step=811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  59%|█████▉    | 47/80 [04:15<02:55,  5.32s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.14e-6, train/loss_step=0.00256, global_step=811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  60%|██████    | 48/80 [04:40<03:03,  5.72s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.14e-6, train/loss_step=0.00256, global_step=811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  60%|██████    | 48/80 [04:40<03:03,  5.72s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.49e-5, train/loss_step=0.002, global_step=811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]    Epoch 40:  61%|██████▏   | 49/80 [04:54<03:02,  5.89s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.49e-5, train/loss_step=0.002, global_step=811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  61%|██████▏   | 49/80 [04:54<03:02,  5.89s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=3.01e-6, train/loss_step=0.00056, global_step=812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  62%|██████▎   | 50/80 [04:54<02:53,  5.78s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=3.01e-6, train/loss_step=0.00056, global_step=812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  62%|██████▎   | 50/80 [04:54<02:53,  5.78s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000886, train/loss_step=0.0248, global_step=812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445] Epoch 40:  64%|██████▍   | 51/80 [04:55<02:44,  5.68s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000886, train/loss_step=0.0248, global_step=812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  64%|██████▍   | 51/80 [04:55<02:44,  5.68s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=9.08e-5, train/loss_step=0.0142, global_step=812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445] Epoch 40:  65%|██████▌   | 52/80 [04:56<02:36,  5.59s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=9.08e-5, train/loss_step=0.0142, global_step=812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  65%|██████▌   | 52/80 [04:56<02:36,  5.59s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00047, train/loss_vlb_step=2.43e-6, train/loss_step=0.00047, global_step=812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  66%|██████▋   | 53/80 [04:57<02:28,  5.51s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00047, train/loss_vlb_step=2.43e-6, train/loss_step=0.00047, global_step=812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  66%|██████▋   | 53/80 [04:57<02:28,  5.51s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.02e-5, train/loss_step=0.00301, global_step=813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  68%|██████▊   | 54/80 [04:57<02:20,  5.42s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.02e-5, train/loss_step=0.00301, global_step=813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  68%|██████▊   | 54/80 [04:57<02:20,  5.42s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=2.76e-5, train/loss_step=0.00328, global_step=813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  69%|██████▉   | 55/80 [04:58<02:13,  5.33s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=2.76e-5, train/loss_step=0.00328, global_step=813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  69%|██████▉   | 55/80 [04:58<02:13,  5.33s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=1.07e-6, train/loss_step=0.000288, global_step=813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  70%|███████   | 56/80 [05:18<02:14,  5.59s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=1.07e-6, train/loss_step=0.000288, global_step=813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  70%|███████   | 56/80 [05:18<02:14,  5.59s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=9.53e-6, train/loss_step=0.00278, global_step=813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  71%|███████▏  | 57/80 [05:42<02:16,  5.91s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=9.53e-6, train/loss_step=0.00278, global_step=813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  71%|███████▏  | 57/80 [05:42<02:16,  5.91s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=7.84e-6, train/loss_step=0.00111, global_step=814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  72%|███████▎  | 58/80 [05:43<02:08,  5.82s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=7.84e-6, train/loss_step=0.00111, global_step=814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  72%|███████▎  | 58/80 [05:43<02:08,  5.82s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=8.74e-5, train/loss_step=0.0105, global_step=814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  74%|███████▍  | 59/80 [05:43<02:00,  5.73s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=8.74e-5, train/loss_step=0.0105, global_step=814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  74%|███████▍  | 59/80 [05:43<02:00,  5.73s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.42e-6, train/loss_step=0.00117, global_step=814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  75%|███████▌  | 60/80 [05:44<01:52,  5.65s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.42e-6, train/loss_step=0.00117, global_step=814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  75%|███████▌  | 60/80 [05:44<01:52,  5.65s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.6e-6, train/loss_step=0.00105, global_step=814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445] Epoch 40:  76%|███████▋  | 61/80 [05:45<01:45,  5.57s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.6e-6, train/loss_step=0.00105, global_step=814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  76%|███████▋  | 61/80 [05:45<01:45,  5.57s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.29e-5, train/loss_step=0.0052, global_step=815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445] Epoch 40:  78%|███████▊  | 62/80 [05:45<01:38,  5.49s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.29e-5, train/loss_step=0.0052, global_step=815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  78%|███████▊  | 62/80 [05:45<01:38,  5.49s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=7.88e-7, train/loss_step=0.000195, global_step=815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  79%|███████▉  | 63/80 [05:46<01:31,  5.41s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=7.88e-7, train/loss_step=0.000195, global_step=815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  79%|███████▉  | 63/80 [05:46<01:31,  5.41s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=9.45e-6, train/loss_step=0.000615, global_step=815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445] Epoch 40:  80%|████████  | 64/80 [06:01<01:29,  5.57s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=9.45e-6, train/loss_step=0.000615, global_step=815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  80%|████████  | 64/80 [06:01<01:29,  5.57s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=3.97e-5, train/loss_step=0.0104, global_step=815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]   Epoch 40:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=3.97e-5, train/loss_step=0.0104, global_step=815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000542, train/loss_vlb_step=5.53e-6, train/loss_step=0.000542, global_step=816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  82%|████████▎ | 66/80 [06:19<01:19,  5.67s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000542, train/loss_vlb_step=5.53e-6, train/loss_step=0.000542, global_step=816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  82%|████████▎ | 66/80 [06:19<01:19,  5.67s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000687, train/loss_vlb_step=5.78e-6, train/loss_step=0.000687, global_step=816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  84%|████████▍ | 67/80 [06:23<01:13,  5.64s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000687, train/loss_vlb_step=5.78e-6, train/loss_step=0.000687, global_step=816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  84%|████████▍ | 67/80 [06:23<01:13,  5.64s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=3.99e-6, train/loss_step=0.000737, global_step=816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  85%|████████▌ | 68/80 [06:24<01:06,  5.57s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=3.99e-6, train/loss_step=0.000737, global_step=816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  85%|████████▌ | 68/80 [06:24<01:06,  5.57s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000954, train/loss_vlb_step=2.64e-5, train/loss_step=0.000954, global_step=816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  86%|████████▋ | 69/80 [06:24<01:00,  5.49s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000954, train/loss_vlb_step=2.64e-5, train/loss_step=0.000954, global_step=816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  86%|████████▋ | 69/80 [06:24<01:00,  5.49s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=2.52e-5, train/loss_step=0.00729, global_step=817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  88%|████████▊ | 70/80 [06:25<00:54,  5.42s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00729, train/loss_vlb_step=2.52e-5, train/loss_step=0.00729, global_step=817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  88%|████████▊ | 70/80 [06:25<00:54,  5.42s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=8.37e-6, train/loss_step=0.00198, global_step=817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  89%|████████▉ | 71/80 [06:25<00:48,  5.35s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=8.37e-6, train/loss_step=0.00198, global_step=817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  89%|████████▉ | 71/80 [06:25<00:48,  5.35s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=1.32e-5, train/loss_step=0.00391, global_step=817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  90%|█████████ | 72/80 [06:39<00:43,  5.48s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=1.32e-5, train/loss_step=0.00391, global_step=817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  90%|█████████ | 72/80 [06:39<00:43,  5.48s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000616, train/loss_vlb_step=3.15e-6, train/loss_step=0.000616, global_step=817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  91%|█████████▏| 73/80 [06:53<00:39,  5.58s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000616, train/loss_vlb_step=3.15e-6, train/loss_step=0.000616, global_step=817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  91%|█████████▏| 73/80 [06:53<00:39,  5.58s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.5e-5, train/loss_step=0.010, global_step=818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]       Epoch 40:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.5e-5, train/loss_step=0.010, global_step=818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.49e-5, train/loss_step=0.00341, global_step=818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  94%|█████████▍| 75/80 [07:04<00:27,  5.58s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.49e-5, train/loss_step=0.00341, global_step=818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  94%|█████████▍| 75/80 [07:04<00:27,  5.58s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.86e-5, train/loss_step=0.00114, global_step=818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  95%|█████████▌| 76/80 [07:04<00:22,  5.52s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.86e-5, train/loss_step=0.00114, global_step=818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  95%|█████████▌| 76/80 [07:04<00:22,  5.52s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=3.2e-5, train/loss_step=0.00903, global_step=818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445] Epoch 40:  96%|█████████▋| 77/80 [07:05<00:16,  5.45s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=3.2e-5, train/loss_step=0.00903, global_step=818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  96%|█████████▋| 77/80 [07:05<00:16,  5.45s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=1.24e-6, train/loss_step=0.000322, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  98%|█████████▊| 78/80 [07:05<00:10,  5.39s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=1.24e-6, train/loss_step=0.000322, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  98%|█████████▊| 78/80 [07:05<00:10,  5.39s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=5.81e-5, train/loss_step=0.00992, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 40:  99%|█████████▉| 79/80 [07:06<00:05,  5.33s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=5.81e-5, train/loss_step=0.00992, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40:  99%|█████████▉| 79/80 [07:06<00:05,  5.33s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=8.01e-5, train/loss_step=0.00182, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40: 100%|██████████| 80/80 [07:06<00:00,  5.27s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=8.01e-5, train/loss_step=0.00182, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 40: 100%|██████████| 80/80 [07:06<00:00,  5.27s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=3.97e-6, train/loss_step=0.000852, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Average Epoch time: 426.67 seconds
+Average Peak memory 29565.88MiB
+Epoch 40:   0%|          | 0/80 [00:00<00:00, 3563.55it/s, loss=0.00348, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=3.97e-6, train/loss_step=0.000852, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 41:   0%|          | 0/80 [00:00<00:00, 1504.41it/s, loss=0.00348, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=3.97e-6, train/loss_step=0.000852, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]Epoch 41:   1%|▏         | 1/80 [00:48<31:54, 24.24s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=3.97e-6, train/loss_step=0.000852, global_step=819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00445, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00445]  Epoch 41:   1%|▏         | 1/80 [00:48<31:54, 24.24s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000685, train/loss_vlb_step=3.39e-6, train/loss_step=0.000685, global_step=820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:   2%|▎         | 2/80 [00:48<21:12, 16.32s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000685, train/loss_vlb_step=3.39e-6, train/loss_step=0.000685, global_step=820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:   2%|▎         | 2/80 [00:48<21:12, 16.32s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.18e-5, train/loss_step=0.00322, global_step=820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:   4%|▍         | 3/80 [00:49<15:51, 12.36s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.18e-5, train/loss_step=0.00322, global_step=820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:   4%|▍         | 3/80 [00:49<15:51, 12.36s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=2.79e-5, train/loss_step=0.00807, global_step=820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:   5%|▌         | 4/80 [00:49<12:39, 10.00s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=2.79e-5, train/loss_step=0.00807, global_step=820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:   5%|▌         | 4/80 [00:49<12:39, 10.00s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=4.99e-6, train/loss_step=0.000497, global_step=820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:   6%|▋         | 5/80 [00:50<10:31,  8.41s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=4.99e-6, train/loss_step=0.000497, global_step=820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:   6%|▋         | 5/80 [00:50<10:31,  8.41s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=5.93e-5, train/loss_step=0.00734, global_step=821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:   8%|▊         | 6/80 [00:50<08:58,  7.28s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=5.93e-5, train/loss_step=0.00734, global_step=821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:   8%|▊         | 6/80 [00:50<08:58,  7.28s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.48e-5, train/loss_step=0.0102, global_step=821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]   Epoch 41:   9%|▉         | 7/80 [00:51<07:49,  6.43s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4.48e-5, train/loss_step=0.0102, global_step=821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:   9%|▉         | 7/80 [00:51<07:49,  6.43s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.51e-5, train/loss_step=0.00687, global_step=821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  10%|█         | 8/80 [01:32<12:19, 10.28s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=3.51e-5, train/loss_step=0.00687, global_step=821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  10%|█         | 8/80 [01:32<12:19, 10.28s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=2.21e-5, train/loss_step=0.0061, global_step=821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  11%|█▏        | 9/80 [01:33<11:00,  9.30s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=2.21e-5, train/loss_step=0.0061, global_step=821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  11%|█▏        | 9/80 [01:33<11:00,  9.30s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000985, train/loss_vlb_step=4.51e-6, train/loss_step=0.000985, global_step=822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  12%|█▎        | 10/80 [01:33<09:54,  8.50s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000985, train/loss_vlb_step=4.51e-6, train/loss_step=0.000985, global_step=822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  12%|█▎        | 10/80 [01:33<09:54,  8.50s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.25e-6, train/loss_step=0.000573, global_step=822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  14%|█▍        | 11/80 [01:33<09:00,  7.83s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.25e-6, train/loss_step=0.000573, global_step=822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  14%|█▍        | 11/80 [01:33<09:00,  7.83s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=8.47e-5, train/loss_step=0.00151, global_step=822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  15%|█▌        | 12/80 [01:34<08:14,  7.27s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=8.47e-5, train/loss_step=0.00151, global_step=822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  15%|█▌        | 12/80 [01:34<08:14,  7.27s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.83e-6, train/loss_step=0.00135, global_step=822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431] Epoch 41:  16%|█▋        | 13/80 [01:35<07:34,  6.79s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.83e-6, train/loss_step=0.00135, global_step=822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  16%|█▋        | 13/80 [01:35<07:34,  6.79s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=7.34e-6, train/loss_step=0.0015, global_step=823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431] Epoch 41:  18%|█▊        | 14/80 [01:35<07:00,  6.37s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=7.34e-6, train/loss_step=0.0015, global_step=823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  18%|█▊        | 14/80 [01:35<07:00,  6.37s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.00192, train/loss_step=0.024, global_step=823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]   Epoch 41:  19%|█▉        | 15/80 [01:36<06:30,  6.00s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.00192, train/loss_step=0.024, global_step=823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  19%|█▉        | 15/80 [01:36<06:30,  6.00s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=3.6e-6, train/loss_step=0.000928, global_step=823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  20%|██        | 16/80 [02:16<08:34,  8.05s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=3.6e-6, train/loss_step=0.000928, global_step=823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  20%|██        | 16/80 [02:16<08:34,  8.05s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.68e-6, train/loss_step=0.00102, global_step=823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431] Epoch 41:  21%|██▏       | 17/80 [02:17<08:00,  7.63s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.68e-6, train/loss_step=0.00102, global_step=823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  21%|██▏       | 17/80 [02:17<08:00,  7.63s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=4.62e-6, train/loss_step=0.00112, global_step=824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  22%|██▎       | 18/80 [02:17<07:29,  7.25s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=4.62e-6, train/loss_step=0.00112, global_step=824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  22%|██▎       | 18/80 [02:17<07:29,  7.25s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=2.1e-5, train/loss_step=0.00207, global_step=824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431] Epoch 41:  24%|██▍       | 19/80 [02:18<07:01,  6.91s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=2.1e-5, train/loss_step=0.00207, global_step=824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  24%|██▍       | 19/80 [02:18<07:01,  6.91s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.00124, train/loss_step=0.0205, global_step=824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431] Epoch 41:  25%|██▌       | 20/80 [02:18<06:36,  6.61s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.00124, train/loss_step=0.0205, global_step=824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  25%|██▌       | 20/80 [02:18<06:36,  6.61s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=9.35e-6, train/loss_step=0.00224, global_step=824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  26%|██▋       | 21/80 [02:19<06:13,  6.33s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=9.35e-6, train/loss_step=0.00224, global_step=824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  26%|██▋       | 21/80 [02:19<06:13,  6.33s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.32e-5, train/loss_step=0.0112, global_step=825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.32e-5, train/loss_step=0.0112, global_step=825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.98e-6, train/loss_step=0.00155, global_step=825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.98e-6, train/loss_step=0.00155, global_step=825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000789, train/loss_vlb_step=3.45e-6, train/loss_step=0.000789, global_step=825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  30%|███       | 24/80 [03:03<06:50,  7.34s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000789, train/loss_vlb_step=3.45e-6, train/loss_step=0.000789, global_step=825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  30%|███       | 24/80 [03:03<06:50,  7.34s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.14e-5, train/loss_step=0.00236, global_step=825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  31%|███▏      | 25/80 [03:03<06:29,  7.08s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.14e-5, train/loss_step=0.00236, global_step=825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  31%|███▏      | 25/80 [03:03<06:29,  7.08s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=6.64e-6, train/loss_step=0.000662, global_step=826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  32%|███▎      | 26/80 [03:04<06:08,  6.83s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=6.64e-6, train/loss_step=0.000662, global_step=826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  32%|███▎      | 26/80 [03:04<06:08,  6.83s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=9.17e-6, train/loss_step=0.000883, global_step=826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  34%|███▍      | 27/80 [03:04<05:50,  6.61s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=9.17e-6, train/loss_step=0.000883, global_step=826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  34%|███▍      | 27/80 [03:04<05:50,  6.61s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=5.83e-5, train/loss_step=0.00206, global_step=826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  35%|███▌      | 28/80 [03:05<05:32,  6.40s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=5.83e-5, train/loss_step=0.00206, global_step=826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  35%|███▌      | 28/80 [03:05<05:32,  6.40s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.000255, train/loss_step=0.0229, global_step=826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431] Epoch 41:  36%|███▋      | 29/80 [03:06<05:16,  6.20s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.0229, train/loss_vlb_step=0.000255, train/loss_step=0.0229, global_step=826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  36%|███▋      | 29/80 [03:06<05:16,  6.20s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.39e-6, train/loss_step=0.000339, global_step=827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  38%|███▊      | 30/80 [03:06<05:00,  6.02s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.39e-6, train/loss_step=0.000339, global_step=827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  38%|███▊      | 30/80 [03:06<05:00,  6.02s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=2.47e-5, train/loss_step=0.00598, global_step=827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  39%|███▉      | 31/80 [03:06<04:46,  5.84s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.00598, train/loss_vlb_step=2.47e-5, train/loss_step=0.00598, global_step=827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  39%|███▉      | 31/80 [03:06<04:46,  5.84s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.000415, train/loss_vlb_step=2.52e-6, train/loss_step=0.000415, global_step=827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  40%|████      | 32/80 [03:52<05:38,  7.05s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.000415, train/loss_vlb_step=2.52e-6, train/loss_step=0.000415, global_step=827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  40%|████      | 32/80 [03:52<05:38,  7.05s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000101, train/loss_step=0.0125, global_step=827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]   Epoch 41:  41%|████▏     | 33/80 [03:53<05:22,  6.86s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000101, train/loss_step=0.0125, global_step=827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  41%|████▏     | 33/80 [03:53<05:22,  6.86s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=9.77e-6, train/loss_step=0.00104, global_step=828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  42%|████▎     | 34/80 [03:53<05:07,  6.68s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=9.77e-6, train/loss_step=0.00104, global_step=828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  42%|████▎     | 34/80 [03:53<05:07,  6.68s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.16e-6, train/loss_step=0.000455, global_step=828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  44%|████▍     | 35/80 [03:54<04:52,  6.51s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.16e-6, train/loss_step=0.000455, global_step=828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  44%|████▍     | 35/80 [03:54<04:52,  6.51s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.00013, train/loss_step=0.0144, global_step=828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]    Epoch 41:  45%|████▌     | 36/80 [03:54<04:39,  6.35s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.00013, train/loss_step=0.0144, global_step=828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  45%|████▌     | 36/80 [03:54<04:39,  6.35s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.000485, train/loss_vlb_step=2.24e-6, train/loss_step=0.000485, global_step=828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  46%|████▋     | 37/80 [03:55<04:26,  6.19s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.000485, train/loss_vlb_step=2.24e-6, train/loss_step=0.000485, global_step=828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  46%|████▋     | 37/80 [03:55<04:26,  6.19s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=1.07e-5, train/loss_step=0.00109, global_step=829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  48%|████▊     | 38/80 [03:55<04:13,  6.05s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=1.07e-5, train/loss_step=0.00109, global_step=829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  48%|████▊     | 38/80 [03:55<04:13,  6.05s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.7e-6, train/loss_step=0.000348, global_step=829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  49%|████▉     | 39/80 [03:56<04:02,  5.91s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.7e-6, train/loss_step=0.000348, global_step=829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  49%|████▉     | 39/80 [03:56<04:02,  5.91s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=8.86e-5, train/loss_step=0.0131, global_step=829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]   Epoch 41:  50%|█████     | 40/80 [04:41<04:35,  6.88s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=8.86e-5, train/loss_step=0.0131, global_step=829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  50%|█████     | 40/80 [04:41<04:35,  6.88s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=2.79e-5, train/loss_step=0.00156, global_step=829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  51%|█████▏    | 41/80 [04:42<04:22,  6.73s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=2.79e-5, train/loss_step=0.00156, global_step=829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  51%|█████▏    | 41/80 [04:42<04:22,  6.73s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=9.59e-6, train/loss_step=0.00257, global_step=830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  52%|█████▎    | 42/80 [04:43<04:10,  6.58s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=9.59e-6, train/loss_step=0.00257, global_step=830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  52%|█████▎    | 42/80 [04:43<04:10,  6.58s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.31e-6, train/loss_step=0.00119, global_step=830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  54%|█████▍    | 43/80 [04:43<03:58,  6.45s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.31e-6, train/loss_step=0.00119, global_step=830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  54%|█████▍    | 43/80 [04:43<03:58,  6.45s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=1.46e-6, train/loss_step=0.000373, global_step=830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  55%|█████▌    | 44/80 [04:44<03:47,  6.31s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=1.46e-6, train/loss_step=0.000373, global_step=830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  55%|█████▌    | 44/80 [04:44<03:47,  6.31s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000836, train/loss_vlb_step=1.3e-5, train/loss_step=0.000836, global_step=830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431] Epoch 41:  56%|█████▋    | 45/80 [04:44<03:36,  6.19s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000836, train/loss_vlb_step=1.3e-5, train/loss_step=0.000836, global_step=830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  56%|█████▋    | 45/80 [04:44<03:36,  6.19s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000585, train/loss_vlb_step=7.09e-6, train/loss_step=0.000585, global_step=831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  57%|█████▊    | 46/80 [04:45<03:26,  6.07s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000585, train/loss_vlb_step=7.09e-6, train/loss_step=0.000585, global_step=831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  57%|█████▊    | 46/80 [04:45<03:26,  6.07s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=0.000158, train/loss_step=0.0108, global_step=831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]   Epoch 41:  59%|█████▉    | 47/80 [04:45<03:16,  5.95s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=0.000158, train/loss_step=0.0108, global_step=831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  59%|█████▉    | 47/80 [04:45<03:16,  5.95s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=9.49e-5, train/loss_step=0.00703, global_step=831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  60%|██████    | 48/80 [05:33<03:38,  6.81s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=9.49e-5, train/loss_step=0.00703, global_step=831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  60%|██████    | 48/80 [05:33<03:38,  6.81s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=2.8e-5, train/loss_step=0.00688, global_step=831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  61%|██████▏   | 49/80 [05:34<03:27,  6.69s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=2.8e-5, train/loss_step=0.00688, global_step=831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  61%|██████▏   | 49/80 [05:34<03:27,  6.69s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=7.02e-5, train/loss_step=0.00786, global_step=832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  62%|██████▎   | 50/80 [05:34<03:17,  6.57s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=7.02e-5, train/loss_step=0.00786, global_step=832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  62%|██████▎   | 50/80 [05:34<03:17,  6.57s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=0.00119, train/loss_step=0.0028, global_step=832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  64%|██████▍   | 51/80 [05:35<03:07,  6.45s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=0.00119, train/loss_step=0.0028, global_step=832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  64%|██████▍   | 51/80 [05:35<03:07,  6.45s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000352, train/loss_vlb_step=1.78e-6, train/loss_step=0.000352, global_step=832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  65%|██████▌   | 52/80 [05:35<02:57,  6.34s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000352, train/loss_vlb_step=1.78e-6, train/loss_step=0.000352, global_step=832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  65%|██████▌   | 52/80 [05:35<02:57,  6.34s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=4.63e-6, train/loss_step=0.000637, global_step=832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  66%|██████▋   | 53/80 [05:36<02:48,  6.23s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=4.63e-6, train/loss_step=0.000637, global_step=832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  66%|██████▋   | 53/80 [05:36<02:48,  6.23s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=7.54e-6, train/loss_step=0.000613, global_step=833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431] Epoch 41:  68%|██████▊   | 54/80 [05:36<02:39,  6.13s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=7.54e-6, train/loss_step=0.000613, global_step=833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  68%|██████▊   | 54/80 [05:36<02:39,  6.13s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=1.09e-5, train/loss_step=0.0015, global_step=833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]   Epoch 41:  69%|██████▉   | 55/80 [05:37<02:30,  6.03s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=1.09e-5, train/loss_step=0.0015, global_step=833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  69%|██████▉   | 55/80 [05:37<02:30,  6.03s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=2.67e-5, train/loss_step=0.00739, global_step=833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  70%|███████   | 56/80 [06:16<02:38,  6.61s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=2.67e-5, train/loss_step=0.00739, global_step=833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  70%|███████   | 56/80 [06:16<02:38,  6.61s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.43e-5, train/loss_step=0.011, global_step=833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]   Epoch 41:  71%|███████▏  | 57/80 [06:17<02:29,  6.50s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.43e-5, train/loss_step=0.011, global_step=833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  71%|███████▏  | 57/80 [06:17<02:29,  6.50s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=1.7e-6, train/loss_step=0.000338, global_step=834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  72%|███████▎  | 58/80 [06:17<02:20,  6.40s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=1.7e-6, train/loss_step=0.000338, global_step=834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  72%|███████▎  | 58/80 [06:17<02:20,  6.40s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=3.07e-5, train/loss_step=0.0093, global_step=834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]   Epoch 41:  74%|███████▍  | 59/80 [06:18<02:12,  6.30s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=3.07e-5, train/loss_step=0.0093, global_step=834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  74%|███████▍  | 59/80 [06:18<02:12,  6.30s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000503, train/loss_vlb_step=3.17e-6, train/loss_step=0.000503, global_step=834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  75%|███████▌  | 60/80 [06:18<02:04,  6.21s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000503, train/loss_vlb_step=3.17e-6, train/loss_step=0.000503, global_step=834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  75%|███████▌  | 60/80 [06:18<02:04,  6.21s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=1.9e-5, train/loss_step=0.0057, global_step=834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]     Epoch 41:  76%|███████▋  | 61/80 [06:19<01:56,  6.12s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=1.9e-5, train/loss_step=0.0057, global_step=834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  76%|███████▋  | 61/80 [06:19<01:56,  6.12s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=7.78e-6, train/loss_step=0.000605, global_step=835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  78%|███████▊  | 62/80 [06:19<01:48,  6.03s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=7.78e-6, train/loss_step=0.000605, global_step=835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  78%|███████▊  | 62/80 [06:19<01:48,  6.03s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=1.25e-6, train/loss_step=0.000316, global_step=835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  79%|███████▉  | 63/80 [06:20<01:40,  5.94s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=1.25e-6, train/loss_step=0.000316, global_step=835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  79%|███████▉  | 63/80 [06:20<01:40,  5.94s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000708, train/loss_vlb_step=4.18e-6, train/loss_step=0.000708, global_step=835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  80%|████████  | 64/80 [07:02<01:43,  6.50s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000708, train/loss_vlb_step=4.18e-6, train/loss_step=0.000708, global_step=835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  80%|████████  | 64/80 [07:02<01:43,  6.50s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000907, train/loss_vlb_step=5.46e-6, train/loss_step=0.000907, global_step=835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  81%|████████▏ | 65/80 [07:02<01:36,  6.41s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000907, train/loss_vlb_step=5.46e-6, train/loss_step=0.000907, global_step=835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  81%|████████▏ | 65/80 [07:02<01:36,  6.41s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.57e-6, train/loss_step=0.00116, global_step=836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  82%|████████▎ | 66/80 [07:03<01:28,  6.32s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.57e-6, train/loss_step=0.00116, global_step=836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  82%|████████▎ | 66/80 [07:03<01:28,  6.32s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000295, train/loss_step=0.0146, global_step=836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431] Epoch 41:  84%|████████▍ | 67/80 [07:03<01:21,  6.23s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000295, train/loss_step=0.0146, global_step=836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  84%|████████▍ | 67/80 [07:03<01:21,  6.23s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.18e-6, train/loss_step=0.00028, global_step=836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  85%|████████▌ | 68/80 [07:04<01:13,  6.15s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.18e-6, train/loss_step=0.00028, global_step=836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  85%|████████▌ | 68/80 [07:04<01:13,  6.15s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=3.86e-6, train/loss_step=0.000494, global_step=836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  86%|████████▋ | 69/80 [07:04<01:06,  6.07s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=3.86e-6, train/loss_step=0.000494, global_step=836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  86%|████████▋ | 69/80 [07:04<01:06,  6.07s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.0163, train/loss_step=0.035, global_step=837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]       Epoch 41:  88%|████████▊ | 70/80 [07:05<00:59,  5.99s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.035, train/loss_vlb_step=0.0163, train/loss_step=0.035, global_step=837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  88%|████████▊ | 70/80 [07:05<00:59,  5.99s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000721, train/loss_vlb_step=2.83e-6, train/loss_step=0.000721, global_step=837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  89%|████████▉ | 71/80 [07:05<00:53,  5.91s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000721, train/loss_vlb_step=2.83e-6, train/loss_step=0.000721, global_step=837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  89%|████████▉ | 71/80 [07:05<00:53,  5.91s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=8.55e-5, train/loss_step=0.0116, global_step=837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]    Epoch 41:  90%|█████████ | 72/80 [07:27<00:49,  6.13s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=8.55e-5, train/loss_step=0.0116, global_step=837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  90%|█████████ | 72/80 [07:27<00:49,  6.13s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00686, train/loss_vlb_step=2.31e-5, train/loss_step=0.00686, global_step=837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  91%|█████████▏| 73/80 [07:27<00:42,  6.05s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00686, train/loss_vlb_step=2.31e-5, train/loss_step=0.00686, global_step=837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  91%|█████████▏| 73/80 [07:27<00:42,  6.05s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=2.77e-5, train/loss_step=0.0074, global_step=838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 41:  92%|█████████▎| 74/80 [07:28<00:35,  5.98s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=2.77e-5, train/loss_step=0.0074, global_step=838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  92%|█████████▎| 74/80 [07:28<00:35,  5.98s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=3.3e-5, train/loss_step=0.00467, global_step=838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  94%|█████████▍| 75/80 [07:28<00:29,  5.90s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=3.3e-5, train/loss_step=0.00467, global_step=838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  94%|█████████▍| 75/80 [07:28<00:29,  5.90s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=9.32e-5, train/loss_step=0.00185, global_step=838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  95%|█████████▌| 76/80 [07:29<00:23,  5.83s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=9.32e-5, train/loss_step=0.00185, global_step=838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  95%|█████████▌| 76/80 [07:29<00:23,  5.83s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=3.18e-6, train/loss_step=0.000778, global_step=838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  96%|█████████▋| 77/80 [07:29<00:17,  5.77s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=3.18e-6, train/loss_step=0.000778, global_step=838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  96%|█████████▋| 77/80 [07:29<00:17,  5.77s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=1.12e-6, train/loss_step=0.000245, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  98%|█████████▊| 78/80 [07:30<00:11,  5.70s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=1.12e-6, train/loss_step=0.000245, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  98%|█████████▊| 78/80 [07:30<00:11,  5.70s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000512, train/loss_vlb_step=2.19e-6, train/loss_step=0.000512, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  99%|█████████▉| 79/80 [07:30<00:05,  5.63s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000512, train/loss_vlb_step=2.19e-6, train/loss_step=0.000512, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41:  99%|█████████▉| 79/80 [07:30<00:05,  5.63s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=2.42e-6, train/loss_step=0.000701, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41: 100%|██████████| 80/80 [07:31<00:00,  5.57s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=2.42e-6, train/loss_step=0.000701, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 41: 100%|██████████| 80/80 [07:31<00:00,  5.57s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000269, train/loss_step=0.0282, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]   Average Epoch time: 451.19 seconds
+Average Peak memory 29565.16MiB
+Epoch 41:   0%|          | 0/80 [00:00<00:00, 4696.87it/s, loss=0.00588, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000269, train/loss_step=0.0282, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 42:   0%|          | 0/80 [00:00<00:00, 1938.22it/s, loss=0.00588, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000269, train/loss_step=0.0282, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]Epoch 42:   1%|▏         | 1/80 [00:37<24:56, 18.95s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000269, train/loss_step=0.0282, global_step=839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=6.28e-5, train/loss_epoch=0.00431]  Epoch 42:   1%|▏         | 1/80 [00:37<24:56, 18.95s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.48e-6, train/loss_step=0.000324, global_step=840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   2%|▎         | 2/80 [00:42<18:30, 14.24s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.48e-6, train/loss_step=0.000324, global_step=840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   2%|▎         | 2/80 [00:42<18:30, 14.24s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.04e-5, train/loss_step=0.0055, global_step=840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]    Epoch 42:   4%|▍         | 3/80 [00:43<13:51, 10.80s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0055, train/loss_vlb_step=2.04e-5, train/loss_step=0.0055, global_step=840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   4%|▍         | 3/80 [00:43<13:51, 10.80s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=8.65e-6, train/loss_step=0.00237, global_step=840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   5%|▌         | 4/80 [00:43<11:04,  8.75s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=8.65e-6, train/loss_step=0.00237, global_step=840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   5%|▌         | 4/80 [00:43<11:04,  8.75s/it, loss=0.00617, v_num=0, train/loss_simple_step=0.000136, train/loss_vlb_step=5.74e-7, train/loss_step=0.000136, global_step=840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   6%|▋         | 5/80 [00:44<09:13,  7.37s/it, loss=0.00617, v_num=0, train/loss_simple_step=0.000136, train/loss_vlb_step=5.74e-7, train/loss_step=0.000136, global_step=840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   6%|▋         | 5/80 [00:44<09:13,  7.37s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=2.66e-6, train/loss_step=0.000555, global_step=841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   8%|▊         | 6/80 [00:44<07:52,  6.39s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=2.66e-6, train/loss_step=0.000555, global_step=841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   8%|▊         | 6/80 [00:44<07:52,  6.39s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=2.57e-6, train/loss_step=0.000436, global_step=841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   9%|▉         | 7/80 [00:45<06:52,  5.65s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=2.57e-6, train/loss_step=0.000436, global_step=841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:   9%|▉         | 7/80 [00:45<06:52,  5.65s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=9.63e-6, train/loss_step=0.00225, global_step=841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  10%|█         | 8/80 [01:14<09:53,  8.24s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=9.63e-6, train/loss_step=0.00225, global_step=841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  10%|█         | 8/80 [01:14<09:53,  8.24s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=5.49e-6, train/loss_step=0.000637, global_step=841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  11%|█▏        | 9/80 [01:18<09:15,  7.82s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=5.49e-6, train/loss_step=0.000637, global_step=841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  11%|█▏        | 9/80 [01:18<09:15,  7.82s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=1.98e-6, train/loss_step=0.000524, global_step=842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  12%|█▎        | 10/80 [01:19<08:27,  7.24s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=1.98e-6, train/loss_step=0.000524, global_step=842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  12%|█▎        | 10/80 [01:19<08:27,  7.24s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=8.8e-6, train/loss_step=0.000711, global_step=842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421] Epoch 42:  14%|█▍        | 11/80 [01:20<07:41,  6.68s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=8.8e-6, train/loss_step=0.000711, global_step=842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  14%|█▍        | 11/80 [01:20<07:41,  6.68s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=1.89e-5, train/loss_step=0.000969, global_step=842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  15%|█▌        | 12/80 [01:20<07:02,  6.21s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=1.89e-5, train/loss_step=0.000969, global_step=842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  15%|█▌        | 12/80 [01:20<07:02,  6.21s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.32e-5, train/loss_step=0.00454, global_step=842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  16%|█▋        | 13/80 [01:21<06:28,  5.80s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=2.32e-5, train/loss_step=0.00454, global_step=842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  16%|█▋        | 13/80 [01:21<06:28,  5.80s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=8.75e-6, train/loss_step=0.00229, global_step=843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  18%|█▊        | 14/80 [01:28<06:27,  5.87s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=8.75e-6, train/loss_step=0.00229, global_step=843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  18%|█▊        | 14/80 [01:28<06:27,  5.87s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=8.37e-6, train/loss_step=0.000661, global_step=843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  19%|█▉        | 15/80 [01:28<05:59,  5.53s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=8.37e-6, train/loss_step=0.000661, global_step=843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  19%|█▉        | 15/80 [01:28<05:59,  5.53s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.21e-5, train/loss_step=0.00277, global_step=843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  20%|██        | 16/80 [01:59<07:28,  7.01s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.21e-5, train/loss_step=0.00277, global_step=843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  20%|██        | 16/80 [01:59<07:28,  7.01s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=5.76e-6, train/loss_step=0.00107, global_step=843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  21%|██▏       | 17/80 [01:59<06:58,  6.65s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=5.76e-6, train/loss_step=0.00107, global_step=843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  21%|██▏       | 17/80 [01:59<06:58,  6.65s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=0.000558, train/loss_step=0.00164, global_step=844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  22%|██▎       | 18/80 [02:00<06:32,  6.33s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=0.000558, train/loss_step=0.00164, global_step=844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  22%|██▎       | 18/80 [02:00<06:32,  6.33s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=5.48e-5, train/loss_step=0.00781, global_step=844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  24%|██▍       | 19/80 [02:00<06:08,  6.04s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00781, train/loss_vlb_step=5.48e-5, train/loss_step=0.00781, global_step=844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  24%|██▍       | 19/80 [02:00<06:08,  6.04s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=0.000136, train/loss_step=0.00106, global_step=844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  25%|██▌       | 20/80 [02:01<05:47,  5.79s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=0.000136, train/loss_step=0.00106, global_step=844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  25%|██▌       | 20/80 [02:01<05:47,  5.79s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=3.41e-6, train/loss_step=0.000579, global_step=844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  26%|██▋       | 21/80 [02:07<05:43,  5.82s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=3.41e-6, train/loss_step=0.000579, global_step=844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  26%|██▋       | 21/80 [02:07<05:43,  5.82s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000856, train/loss_vlb_step=4.34e-5, train/loss_step=0.000856, global_step=845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  28%|██▊       | 22/80 [02:08<05:23,  5.59s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000856, train/loss_vlb_step=4.34e-5, train/loss_step=0.000856, global_step=845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  28%|██▊       | 22/80 [02:08<05:23,  5.59s/it, loss=0.00162, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=3.36e-6, train/loss_step=0.000488, global_step=845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  29%|██▉       | 23/80 [02:08<05:06,  5.37s/it, loss=0.00162, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=3.36e-6, train/loss_step=0.000488, global_step=845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  29%|██▉       | 23/80 [02:08<05:06,  5.37s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.000372, train/loss_vlb_step=2.37e-6, train/loss_step=0.000372, global_step=845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  30%|███       | 24/80 [02:39<05:56,  6.37s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.000372, train/loss_vlb_step=2.37e-6, train/loss_step=0.000372, global_step=845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  30%|███       | 24/80 [02:39<05:56,  6.37s/it, loss=0.00175, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=1.92e-5, train/loss_step=0.00473, global_step=845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  31%|███▏      | 25/80 [02:41<05:41,  6.21s/it, loss=0.00175, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=1.92e-5, train/loss_step=0.00473, global_step=845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  31%|███▏      | 25/80 [02:41<05:41,  6.21s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.21e-6, train/loss_step=0.000326, global_step=846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  32%|███▎      | 26/80 [02:41<05:23,  5.99s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.21e-6, train/loss_step=0.000326, global_step=846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  32%|███▎      | 26/80 [02:41<05:23,  5.99s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000935, train/loss_step=0.0347, global_step=846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]   Epoch 42:  34%|███▍      | 27/80 [02:42<05:07,  5.80s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0347, train/loss_vlb_step=0.000935, train/loss_step=0.0347, global_step=846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  34%|███▍      | 27/80 [02:42<05:07,  5.80s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.08e-5, train/loss_step=0.0131, global_step=846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421] Epoch 42:  35%|███▌      | 28/80 [02:43<04:52,  5.63s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=6.08e-5, train/loss_step=0.0131, global_step=846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  35%|███▌      | 28/80 [02:43<04:52,  5.63s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=3.14e-5, train/loss_step=0.00142, global_step=846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  36%|███▋      | 29/80 [03:03<05:11,  6.12s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=3.14e-5, train/loss_step=0.00142, global_step=846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  36%|███▋      | 29/80 [03:03<05:11,  6.12s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=7.72e-7, train/loss_step=0.000201, global_step=847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=7.72e-7, train/loss_step=0.000201, global_step=847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=7.28e-6, train/loss_step=0.0017, global_step=847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]    Epoch 42:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=7.28e-6, train/loss_step=0.0017, global_step=847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=0.00146, train/loss_step=0.00443, global_step=847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  40%|████      | 32/80 [03:14<04:43,  5.90s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=0.00146, train/loss_step=0.00443, global_step=847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  40%|████      | 32/80 [03:14<04:43,  5.90s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=3.01e-5, train/loss_step=0.00866, global_step=847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  41%|████▏     | 33/80 [03:28<04:48,  6.14s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=3.01e-5, train/loss_step=0.00866, global_step=847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  41%|████▏     | 33/80 [03:28<04:48,  6.14s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=0.000889, train/loss_step=0.00213, global_step=848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  42%|████▎     | 34/80 [03:29<04:34,  5.98s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=0.000889, train/loss_step=0.00213, global_step=848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  42%|████▎     | 34/80 [03:29<04:34,  5.98s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.19e-5, train/loss_step=0.00802, global_step=848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  44%|████▍     | 35/80 [03:29<04:22,  5.82s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.19e-5, train/loss_step=0.00802, global_step=848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  44%|████▍     | 35/80 [03:29<04:22,  5.82s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.2e-5, train/loss_step=0.00341, global_step=848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  45%|████▌     | 36/80 [03:30<04:10,  5.68s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.2e-5, train/loss_step=0.00341, global_step=848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  45%|████▌     | 36/80 [03:30<04:10,  5.68s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000403, train/loss_vlb_step=1.77e-6, train/loss_step=0.000403, global_step=848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  46%|████▋     | 37/80 [03:43<04:12,  5.88s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000403, train/loss_vlb_step=1.77e-6, train/loss_step=0.000403, global_step=848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  46%|████▋     | 37/80 [03:43<04:12,  5.88s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=7.86e-6, train/loss_step=0.0019, global_step=849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]   Epoch 42:  48%|████▊     | 38/80 [03:43<04:01,  5.74s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=7.86e-6, train/loss_step=0.0019, global_step=849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  48%|████▊     | 38/80 [03:43<04:01,  5.74s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.00017, train/loss_step=0.0124, global_step=849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  49%|████▉     | 39/80 [03:44<03:49,  5.61s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.00017, train/loss_step=0.0124, global_step=849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  49%|████▉     | 39/80 [03:44<03:49,  5.61s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=9.64e-6, train/loss_step=0.0028, global_step=849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  50%|█████     | 40/80 [04:07<04:01,  6.04s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=9.64e-6, train/loss_step=0.0028, global_step=849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  50%|█████     | 40/80 [04:07<04:01,  6.04s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.45e-5, train/loss_step=0.00119, global_step=849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  51%|█████▏    | 41/80 [04:15<03:57,  6.09s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.45e-5, train/loss_step=0.00119, global_step=849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  51%|█████▏    | 41/80 [04:15<03:57,  6.09s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=2.77e-5, train/loss_step=0.00784, global_step=850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  52%|█████▎    | 42/80 [04:16<03:46,  5.96s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=2.77e-5, train/loss_step=0.00784, global_step=850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  52%|█████▎    | 42/80 [04:16<03:46,  5.96s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=2.38e-6, train/loss_step=0.000399, global_step=850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  54%|█████▍    | 43/80 [04:16<03:36,  5.84s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=2.38e-6, train/loss_step=0.000399, global_step=850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  54%|█████▍    | 43/80 [04:16<03:36,  5.84s/it, loss=0.00628, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.92e-5, train/loss_step=0.0159, global_step=850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]    Epoch 42:  55%|█████▌    | 44/80 [04:17<03:25,  5.72s/it, loss=0.00628, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=7.92e-5, train/loss_step=0.0159, global_step=850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  55%|█████▌    | 44/80 [04:17<03:25,  5.72s/it, loss=0.00713, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.00156, train/loss_step=0.0217, global_step=850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  56%|█████▋    | 45/80 [04:31<03:26,  5.90s/it, loss=0.00713, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.00156, train/loss_step=0.0217, global_step=850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  56%|█████▋    | 45/80 [04:31<03:26,  5.90s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=3.7e-5, train/loss_step=0.00234, global_step=851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  57%|█████▊    | 46/80 [04:32<03:16,  5.79s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=3.7e-5, train/loss_step=0.00234, global_step=851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  57%|█████▊    | 46/80 [04:32<03:16,  5.79s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.24e-6, train/loss_step=0.000299, global_step=851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  59%|█████▉    | 47/80 [04:32<03:07,  5.68s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.24e-6, train/loss_step=0.000299, global_step=851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  59%|█████▉    | 47/80 [04:32<03:07,  5.68s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.66e-5, train/loss_step=0.0103, global_step=851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]    Epoch 42:  60%|██████    | 48/80 [04:50<03:09,  5.93s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.66e-5, train/loss_step=0.0103, global_step=851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  60%|██████    | 48/80 [04:50<03:09,  5.93s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.34e-6, train/loss_step=0.000551, global_step=851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  61%|██████▏   | 49/80 [04:51<03:00,  5.82s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.34e-6, train/loss_step=0.000551, global_step=851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  61%|██████▏   | 49/80 [04:51<03:00,  5.82s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000512, train/loss_vlb_step=2.13e-6, train/loss_step=0.000512, global_step=852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  62%|██████▎   | 50/80 [05:01<02:57,  5.92s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000512, train/loss_vlb_step=2.13e-6, train/loss_step=0.000512, global_step=852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  62%|██████▎   | 50/80 [05:01<02:57,  5.92s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.17e-5, train/loss_step=0.00343, global_step=852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  64%|██████▍   | 51/80 [05:02<02:48,  5.82s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.17e-5, train/loss_step=0.00343, global_step=852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  64%|██████▍   | 51/80 [05:02<02:48,  5.82s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=6.95e-6, train/loss_step=0.00103, global_step=852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  65%|██████▌   | 52/80 [05:02<02:40,  5.72s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=6.95e-6, train/loss_step=0.00103, global_step=852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  65%|██████▌   | 52/80 [05:02<02:40,  5.72s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=0.00104, train/loss_step=0.00357, global_step=852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  66%|██████▋   | 53/80 [05:11<02:35,  5.77s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=0.00104, train/loss_step=0.00357, global_step=852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  66%|██████▋   | 53/80 [05:11<02:35,  5.77s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=5.47e-6, train/loss_step=0.000574, global_step=853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  68%|██████▊   | 54/80 [05:12<02:27,  5.68s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=5.47e-6, train/loss_step=0.000574, global_step=853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  68%|██████▊   | 54/80 [05:12<02:27,  5.68s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=2.03e-6, train/loss_step=0.000421, global_step=853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  69%|██████▉   | 55/80 [05:12<02:19,  5.58s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=2.03e-6, train/loss_step=0.000421, global_step=853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  69%|██████▉   | 55/80 [05:12<02:19,  5.58s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=8.8e-6, train/loss_step=0.00242, global_step=853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]    Epoch 42:  70%|███████   | 56/80 [05:30<02:19,  5.80s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=8.8e-6, train/loss_step=0.00242, global_step=853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  70%|███████   | 56/80 [05:30<02:19,  5.80s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=2.24e-6, train/loss_step=0.000448, global_step=853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  71%|███████▏  | 57/80 [05:31<02:11,  5.71s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=2.24e-6, train/loss_step=0.000448, global_step=853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  71%|███████▏  | 57/80 [05:31<02:11,  5.71s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000327, train/loss_vlb_step=2.57e-6, train/loss_step=0.000327, global_step=854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  72%|███████▎  | 58/80 [05:47<02:09,  5.88s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000327, train/loss_vlb_step=2.57e-6, train/loss_step=0.000327, global_step=854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  72%|███████▎  | 58/80 [05:47<02:09,  5.88s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.3e-6, train/loss_step=0.00256, global_step=854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]   Epoch 42:  74%|███████▍  | 59/80 [05:47<02:01,  5.80s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.3e-6, train/loss_step=0.00256, global_step=854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  74%|███████▍  | 59/80 [05:47<02:01,  5.80s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.5e-6, train/loss_step=0.000599, global_step=854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  75%|███████▌  | 60/80 [05:48<01:54,  5.71s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.5e-6, train/loss_step=0.000599, global_step=854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  75%|███████▌  | 60/80 [05:48<01:54,  5.71s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=6.96e-6, train/loss_step=0.00178, global_step=854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421] Epoch 42:  76%|███████▋  | 61/80 [05:55<01:48,  5.73s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=6.96e-6, train/loss_step=0.00178, global_step=854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  76%|███████▋  | 61/80 [05:55<01:48,  5.73s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=5.11e-5, train/loss_step=0.0102, global_step=855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  78%|███████▊  | 62/80 [05:55<01:41,  5.65s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=5.11e-5, train/loss_step=0.0102, global_step=855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  78%|███████▊  | 62/80 [05:55<01:41,  5.65s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=1.35e-6, train/loss_step=0.000338, global_step=855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  79%|███████▉  | 63/80 [05:56<01:34,  5.57s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=1.35e-6, train/loss_step=0.000338, global_step=855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  79%|███████▉  | 63/80 [05:56<01:34,  5.57s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=1.52e-5, train/loss_step=0.00432, global_step=855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  80%|████████  | 64/80 [06:12<01:31,  5.73s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=1.52e-5, train/loss_step=0.00432, global_step=855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  80%|████████  | 64/80 [06:12<01:31,  5.73s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=6.46e-6, train/loss_step=0.000828, global_step=855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  81%|████████▏ | 65/80 [06:15<01:25,  5.68s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=6.46e-6, train/loss_step=0.000828, global_step=855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  81%|████████▏ | 65/80 [06:15<01:25,  5.68s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.58e-5, train/loss_step=0.0136, global_step=856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]    Epoch 42:  82%|████████▎ | 66/80 [06:32<01:21,  5.85s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.58e-5, train/loss_step=0.0136, global_step=856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  82%|████████▎ | 66/80 [06:32<01:21,  5.85s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.32e-6, train/loss_step=0.000377, global_step=856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  84%|████████▍ | 67/80 [06:32<01:15,  5.77s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.32e-6, train/loss_step=0.000377, global_step=856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  84%|████████▍ | 67/80 [06:32<01:15,  5.77s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.91e-6, train/loss_step=0.000377, global_step=856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  85%|████████▌ | 68/80 [06:33<01:08,  5.70s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.91e-6, train/loss_step=0.000377, global_step=856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  85%|████████▌ | 68/80 [06:33<01:08,  5.70s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=2.41e-5, train/loss_step=0.00171, global_step=856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 42:  86%|████████▋ | 69/80 [06:33<01:01,  5.62s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=2.41e-5, train/loss_step=0.00171, global_step=856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  86%|████████▋ | 69/80 [06:33<01:01,  5.62s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.45e-5, train/loss_step=0.00965, global_step=857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00965, train/loss_vlb_step=4.45e-5, train/loss_step=0.00965, global_step=857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=9.96e-5, train/loss_step=0.00282, global_step=857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421] Epoch 42:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=9.96e-5, train/loss_step=0.00282, global_step=857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=1.84e-5, train/loss_step=0.0044, global_step=857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421] Epoch 42:  90%|█████████ | 72/80 [06:53<00:45,  5.66s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=1.84e-5, train/loss_step=0.0044, global_step=857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  90%|█████████ | 72/80 [06:53<00:45,  5.66s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=2.53e-5, train/loss_step=0.00657, global_step=857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  91%|█████████▏| 73/80 [06:53<00:39,  5.59s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=2.53e-5, train/loss_step=0.00657, global_step=857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  91%|█████████▏| 73/80 [06:53<00:39,  5.59s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000465, train/loss_vlb_step=2.47e-6, train/loss_step=0.000465, global_step=858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  92%|█████████▎| 74/80 [07:14<00:34,  5.79s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000465, train/loss_vlb_step=2.47e-6, train/loss_step=0.000465, global_step=858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  92%|█████████▎| 74/80 [07:14<00:34,  5.79s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=7e-5, train/loss_step=0.0109, global_step=858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]       Epoch 42:  94%|█████████▍| 75/80 [07:14<00:28,  5.72s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=7e-5, train/loss_step=0.0109, global_step=858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  94%|█████████▍| 75/80 [07:14<00:28,  5.72s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.3e-5, train/loss_step=0.00354, global_step=858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  95%|█████████▌| 76/80 [07:15<00:22,  5.65s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.3e-5, train/loss_step=0.00354, global_step=858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  95%|█████████▌| 76/80 [07:15<00:22,  5.65s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=6.83e-5, train/loss_step=0.00502, global_step=858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  96%|█████████▋| 77/80 [07:15<00:16,  5.58s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=6.83e-5, train/loss_step=0.00502, global_step=858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  96%|█████████▋| 77/80 [07:15<00:16,  5.58s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=1.51e-5, train/loss_step=0.00427, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  98%|█████████▊| 78/80 [07:15<00:11,  5.52s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=1.51e-5, train/loss_step=0.00427, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  98%|█████████▊| 78/80 [07:15<00:11,  5.52s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.22e-5, train/loss_step=0.00877, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  99%|█████████▉| 79/80 [07:16<00:05,  5.46s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=4.22e-5, train/loss_step=0.00877, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42:  99%|█████████▉| 79/80 [07:16<00:05,  5.46s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000982, train/loss_vlb_step=5.12e-6, train/loss_step=0.000982, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000982, train/loss_vlb_step=5.12e-6, train/loss_step=0.000982, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 42: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00093, train/loss_vlb_step=5.55e-6, train/loss_step=0.00093, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Average Epoch time: 436.99 seconds
+Average Peak memory 29568.94MiB
+Epoch 42:   0%|          | 0/80 [00:00<00:00, 5825.42it/s, loss=0.00451, v_num=0, train/loss_simple_step=0.00093, train/loss_vlb_step=5.55e-6, train/loss_step=0.00093, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 43:   0%|          | 0/80 [00:00<00:00, 2208.69it/s, loss=0.00451, v_num=0, train/loss_simple_step=0.00093, train/loss_vlb_step=5.55e-6, train/loss_step=0.00093, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]Epoch 43:   1%|▏         | 1/80 [00:45<29:43, 22.57s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00093, train/loss_vlb_step=5.55e-6, train/loss_step=0.00093, global_step=859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00421, train/loss_vlb_epoch=9.06e-5, train/loss_epoch=0.00421]  Epoch 43:   1%|▏         | 1/80 [00:45<29:43, 22.58s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=4.8e-6, train/loss_step=0.000934, global_step=860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   2%|▎         | 2/80 [00:45<19:46, 15.21s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=4.8e-6, train/loss_step=0.000934, global_step=860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   2%|▎         | 2/80 [00:45<19:46, 15.21s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=5.13e-6, train/loss_step=0.00103, global_step=860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:   4%|▍         | 3/80 [00:46<14:47, 11.53s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=5.13e-6, train/loss_step=0.00103, global_step=860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   4%|▍         | 3/80 [00:46<14:47, 11.53s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.15e-5, train/loss_step=0.00557, global_step=860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   5%|▌         | 4/80 [00:46<11:51,  9.37s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.15e-5, train/loss_step=0.00557, global_step=860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   5%|▌         | 4/80 [00:46<11:51,  9.37s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.08e-5, train/loss_step=0.00303, global_step=860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   6%|▋         | 5/80 [00:47<09:51,  7.89s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.08e-5, train/loss_step=0.00303, global_step=860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   6%|���         | 5/80 [00:47<09:51,  7.89s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000703, train/loss_vlb_step=3.42e-6, train/loss_step=0.000703, global_step=861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   8%|▊         | 6/80 [00:47<08:25,  6.83s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000703, train/loss_vlb_step=3.42e-6, train/loss_step=0.000703, global_step=861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   8%|▊         | 6/80 [00:47<08:25,  6.83s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=2.33e-6, train/loss_step=0.000476, global_step=861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   9%|▉         | 7/80 [00:48<07:20,  6.04s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=2.33e-6, train/loss_step=0.000476, global_step=861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:   9%|▉         | 7/80 [00:48<07:20,  6.04s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00067, train/loss_vlb_step=9.51e-6, train/loss_step=0.00067, global_step=861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  10%|█         | 8/80 [01:10<09:22,  7.82s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00067, train/loss_vlb_step=9.51e-6, train/loss_step=0.00067, global_step=861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  10%|█         | 8/80 [01:10<09:22,  7.82s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.51e-5, train/loss_step=0.0121, global_step=861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  11%|█▏        | 9/80 [01:26<10:14,  8.66s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.51e-5, train/loss_step=0.0121, global_step=861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  11%|█▏        | 9/80 [01:26<10:14,  8.66s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=2.63e-5, train/loss_step=0.00717, global_step=862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  12%|█▎        | 10/80 [01:27<09:14,  7.92s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=2.63e-5, train/loss_step=0.00717, global_step=862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  12%|█▎        | 10/80 [01:27<09:14,  7.92s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.45e-5, train/loss_step=0.00522, global_step=862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  14%|█▍        | 11/80 [01:27<08:23,  7.30s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.45e-5, train/loss_step=0.00522, global_step=862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  14%|█▍        | 11/80 [01:27<08:23,  7.30s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=9.94e-7, train/loss_step=0.000226, global_step=862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  15%|█▌        | 12/80 [01:29<07:49,  6.90s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=9.94e-7, train/loss_step=0.000226, global_step=862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  15%|█▌        | 12/80 [01:29<07:49,  6.90s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.54e-6, train/loss_step=0.000344, global_step=862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  16%|█▋        | 13/80 [01:30<07:11,  6.45s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.54e-6, train/loss_step=0.000344, global_step=862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  16%|█▋        | 13/80 [01:30<07:11,  6.45s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000844, train/loss_vlb_step=1.76e-5, train/loss_step=0.000844, global_step=863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  18%|█▊        | 14/80 [01:30<06:39,  6.05s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000844, train/loss_vlb_step=1.76e-5, train/loss_step=0.000844, global_step=863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  18%|█▊        | 14/80 [01:30<06:39,  6.05s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.94e-5, train/loss_step=0.00918, global_step=863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  19%|█▉        | 15/80 [01:31<06:10,  5.70s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=4.94e-5, train/loss_step=0.00918, global_step=863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  19%|█▉        | 15/80 [01:31<06:10,  5.70s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=7.68e-5, train/loss_step=0.0147, global_step=863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  20%|██        | 16/80 [01:56<07:20,  6.88s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=7.68e-5, train/loss_step=0.0147, global_step=863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  20%|██        | 16/80 [01:56<07:20,  6.88s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.72e-6, train/loss_step=0.000312, global_step=863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  21%|██▏       | 17/80 [02:07<07:26,  7.09s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.72e-6, train/loss_step=0.000312, global_step=863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  21%|██▏       | 17/80 [02:07<07:26,  7.09s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.72e-5, train/loss_step=0.00499, global_step=864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  22%|██▎       | 18/80 [02:11<07:07,  6.90s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.72e-5, train/loss_step=0.00499, global_step=864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  22%|██▎       | 18/80 [02:11<07:07,  6.90s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000188, train/loss_vlb_step=7.15e-7, train/loss_step=0.000188, global_step=864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  24%|██▍       | 19/80 [02:11<06:41,  6.58s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000188, train/loss_vlb_step=7.15e-7, train/loss_step=0.000188, global_step=864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  24%|██▍       | 19/80 [02:11<06:41,  6.58s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.73e-5, train/loss_step=0.0103, global_step=864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]    Epoch 43:  25%|██▌       | 20/80 [02:12<06:17,  6.29s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.73e-5, train/loss_step=0.0103, global_step=864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  25%|██▌       | 20/80 [02:12<06:17,  6.29s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=5.57e-5, train/loss_step=0.00979, global_step=864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  26%|██▋       | 21/80 [02:12<05:55,  6.03s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=5.57e-5, train/loss_step=0.00979, global_step=864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  26%|██▋       | 21/80 [02:12<05:55,  6.03s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.84e-5, train/loss_step=0.00859, global_step=865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  28%|██▊       | 22/80 [02:13<05:35,  5.78s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.84e-5, train/loss_step=0.00859, global_step=865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  28%|██▊       | 22/80 [02:13<05:35,  5.78s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=1.98e-5, train/loss_step=0.00576, global_step=865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  29%|██▉       | 23/80 [02:13<05:17,  5.56s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=1.98e-5, train/loss_step=0.00576, global_step=865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  29%|██▉       | 23/80 [02:13<05:17,  5.56s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.02e-5, train/loss_step=0.00249, global_step=865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  30%|███       | 24/80 [02:35<05:48,  6.22s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.02e-5, train/loss_step=0.00249, global_step=865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  30%|███       | 24/80 [02:35<05:48,  6.22s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=0.000199, train/loss_step=0.0186, global_step=865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:  31%|███▏      | 25/80 [02:48<05:56,  6.47s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=0.000199, train/loss_step=0.0186, global_step=865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  31%|███▏      | 25/80 [02:48<05:56,  6.47s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.62e-6, train/loss_step=0.000296, global_step=866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  32%|███▎      | 26/80 [02:58<05:57,  6.62s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.62e-6, train/loss_step=0.000296, global_step=866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  32%|███▎      | 26/80 [02:58<05:57,  6.62s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000492, train/loss_vlb_step=2.68e-6, train/loss_step=0.000492, global_step=866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  34%|███▍      | 27/80 [02:59<05:39,  6.40s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000492, train/loss_vlb_step=2.68e-6, train/loss_step=0.000492, global_step=866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  34%|███▍      | 27/80 [02:59<05:39,  6.40s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.000924, train/loss_vlb_step=2.41e-5, train/loss_step=0.000924, global_step=866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  35%|███▌      | 28/80 [02:59<05:22,  6.20s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.000924, train/loss_vlb_step=2.41e-5, train/loss_step=0.000924, global_step=866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  35%|███▌      | 28/80 [02:59<05:22,  6.20s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=6.42e-5, train/loss_step=0.011, global_step=866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]      Epoch 43:  36%|███▋      | 29/80 [03:00<05:06,  6.01s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=6.42e-5, train/loss_step=0.011, global_step=866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  36%|███▋      | 29/80 [03:00<05:06,  6.01s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=6.77e-6, train/loss_step=0.00132, global_step=867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  38%|███▊      | 30/80 [03:00<04:51,  5.83s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=6.77e-6, train/loss_step=0.00132, global_step=867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  38%|███▊      | 30/80 [03:00<04:51,  5.83s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7e-6, train/loss_step=0.0016, global_step=867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]      Epoch 43:  39%|███▉      | 31/80 [03:01<04:37,  5.66s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7e-6, train/loss_step=0.0016, global_step=867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  39%|███▉      | 31/80 [03:01<04:37,  5.66s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=1.8e-6, train/loss_step=0.000409, global_step=867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  40%|████      | 32/80 [03:06<04:31,  5.65s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=1.8e-6, train/loss_step=0.000409, global_step=867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  40%|████      | 32/80 [03:06<04:31,  5.65s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=7.05e-6, train/loss_step=0.0017, global_step=867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]   Epoch 43:  41%|████▏     | 33/80 [03:33<04:54,  6.28s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=7.05e-6, train/loss_step=0.0017, global_step=867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  41%|████▏     | 33/80 [03:33<04:54,  6.28s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=9.17e-7, train/loss_step=0.000222, global_step=868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  42%|████▎     | 34/80 [03:38<04:46,  6.23s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=9.17e-7, train/loss_step=0.000222, global_step=868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  42%|████▎     | 34/80 [03:38<04:46,  6.23s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.46e-6, train/loss_step=0.00102, global_step=868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  44%|████▍     | 35/80 [03:38<04:33,  6.07s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.46e-6, train/loss_step=0.00102, global_step=868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  44%|████▍     | 35/80 [03:38<04:33,  6.07s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=5.84e-5, train/loss_step=0.0159, global_step=868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  45%|████▌     | 36/80 [03:43<04:26,  6.05s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=5.84e-5, train/loss_step=0.0159, global_step=868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  45%|████▌     | 36/80 [03:43<04:26,  6.05s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=1.04e-6, train/loss_step=0.000209, global_step=868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  46%|████▋     | 37/80 [03:44<04:13,  5.90s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=1.04e-6, train/loss_step=0.000209, global_step=868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  46%|████▋     | 37/80 [03:44<04:13,  5.90s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.15e-6, train/loss_step=0.000256, global_step=869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  48%|████▊     | 38/80 [03:44<04:02,  5.76s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.15e-6, train/loss_step=0.000256, global_step=869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  48%|████▊     | 38/80 [03:44<04:02,  5.76s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000167, train/loss_step=0.0121, global_step=869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]   Epoch 43:  49%|████▉     | 39/80 [03:45<03:50,  5.63s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000167, train/loss_step=0.0121, global_step=869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  49%|████▉     | 39/80 [03:45<03:50,  5.63s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=9.99e-5, train/loss_step=0.0141, global_step=869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:  50%|█████     | 40/80 [03:47<03:42,  5.56s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=9.99e-5, train/loss_step=0.0141, global_step=869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  50%|█████     | 40/80 [03:47<03:42,  5.56s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=2.61e-6, train/loss_step=0.000264, global_step=869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  51%|█████▏    | 41/80 [04:24<04:05,  6.29s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=2.61e-6, train/loss_step=0.000264, global_step=869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  51%|█████▏    | 41/80 [04:24<04:05,  6.29s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000785, train/loss_vlb_step=7.05e-6, train/loss_step=0.000785, global_step=870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  52%|█████▎    | 42/80 [04:24<03:53,  6.15s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000785, train/loss_vlb_step=7.05e-6, train/loss_step=0.000785, global_step=870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  52%|█████▎    | 42/80 [04:24<03:53,  6.15s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00039, train/loss_vlb_step=2.73e-6, train/loss_step=0.00039, global_step=870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]   Epoch 43:  54%|█████▍    | 43/80 [04:25<03:42,  6.02s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00039, train/loss_vlb_step=2.73e-6, train/loss_step=0.00039, global_step=870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  54%|█████▍    | 43/80 [04:25<03:42,  6.02s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=7.09e-5, train/loss_step=0.0134, global_step=870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:  55%|█████▌    | 44/80 [04:25<03:32,  5.91s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=7.09e-5, train/loss_step=0.0134, global_step=870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  55%|█████▌    | 44/80 [04:25<03:32,  5.91s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=3.82e-5, train/loss_step=0.00977, global_step=870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  56%|█████▋    | 45/80 [04:26<03:22,  5.79s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=3.82e-5, train/loss_step=0.00977, global_step=870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  56%|█████▋    | 45/80 [04:26<03:22,  5.79s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=9.04e-6, train/loss_step=0.00238, global_step=871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  57%|█████▊    | 46/80 [04:26<03:13,  5.68s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=9.04e-6, train/loss_step=0.00238, global_step=871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  57%|█████▊    | 46/80 [04:26<03:13,  5.68s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.23e-5, train/loss_step=0.00654, global_step=871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  59%|█████▉    | 47/80 [04:27<03:03,  5.57s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.23e-5, train/loss_step=0.00654, global_step=871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  59%|█████▉    | 47/80 [04:27<03:03,  5.57s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=1.62e-6, train/loss_step=0.000332, global_step=871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  60%|██████    | 48/80 [04:27<02:54,  5.47s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=1.62e-6, train/loss_step=0.000332, global_step=871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  60%|██████    | 48/80 [04:27<02:54,  5.47s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=0.00101, train/loss_step=0.003, global_step=871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]      Epoch 43:  61%|██████▏   | 49/80 [05:05<03:09,  6.11s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=0.00101, train/loss_step=0.003, global_step=871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  61%|██████▏   | 49/80 [05:05<03:09,  6.11s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=8.33e-5, train/loss_step=0.00608, global_step=872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  62%|██████▎   | 50/80 [05:08<03:01,  6.05s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=8.33e-5, train/loss_step=0.00608, global_step=872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  62%|██████▎   | 50/80 [05:08<03:01,  6.05s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000913, train/loss_vlb_step=3.48e-6, train/loss_step=0.000913, global_step=872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  64%|██████▍   | 51/80 [05:09<02:52,  5.95s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000913, train/loss_vlb_step=3.48e-6, train/loss_step=0.000913, global_step=872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  64%|██████▍   | 51/80 [05:09<02:52,  5.95s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000896, train/loss_vlb_step=4.31e-6, train/loss_step=0.000896, global_step=872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  65%|██████▌   | 52/80 [05:09<02:43,  5.84s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000896, train/loss_vlb_step=4.31e-6, train/loss_step=0.000896, global_step=872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  65%|██████▌   | 52/80 [05:09<02:43,  5.84s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=0.000143, train/loss_step=0.00401, global_step=872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:  66%|██████▋   | 53/80 [05:10<02:35,  5.75s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00401, train/loss_vlb_step=0.000143, train/loss_step=0.00401, global_step=872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  66%|██████▋   | 53/80 [05:10<02:35,  5.75s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=5.12e-5, train/loss_step=0.00812, global_step=873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:  68%|██████▊   | 54/80 [05:10<02:26,  5.65s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=5.12e-5, train/loss_step=0.00812, global_step=873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  68%|██████▊   | 54/80 [05:10<02:26,  5.65s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=6.69e-5, train/loss_step=0.0111, global_step=873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  69%|██████▉   | 55/80 [05:11<02:18,  5.56s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=6.69e-5, train/loss_step=0.0111, global_step=873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  69%|██████▉   | 55/80 [05:11<02:18,  5.56s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=8.98e-6, train/loss_step=0.00175, global_step=873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  70%|███████   | 56/80 [05:20<02:14,  5.61s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=8.98e-6, train/loss_step=0.00175, global_step=873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  70%|███████   | 56/80 [05:20<02:14,  5.61s/it, loss=0.00712, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.0024, train/loss_step=0.0462, global_step=873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]   Epoch 43:  71%|███████▏  | 57/80 [05:48<02:18,  6.01s/it, loss=0.00712, v_num=0, train/loss_simple_step=0.0462, train/loss_vlb_step=0.0024, train/loss_step=0.0462, global_step=873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  71%|███████▏  | 57/80 [05:48<02:18,  6.01s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.12e-5, train/loss_step=0.00328, global_step=874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  72%|███████▎  | 58/80 [05:53<02:11,  5.99s/it, loss=0.00727, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.12e-5, train/loss_step=0.00328, global_step=874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  72%|███████▎  | 58/80 [05:53<02:11,  5.99s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=1.05e-5, train/loss_step=0.000735, global_step=874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  74%|███████▍  | 59/80 [05:53<02:03,  5.89s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=1.05e-5, train/loss_step=0.000735, global_step=874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  74%|███████▍  | 59/80 [05:53<02:03,  5.89s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.76e-5, train/loss_step=0.00428, global_step=874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:  75%|███████▌  | 60/80 [05:54<01:56,  5.81s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.76e-5, train/loss_step=0.00428, global_step=874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  75%|███████▌  | 60/80 [05:54<01:56,  5.81s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=2.33e-5, train/loss_step=0.00653, global_step=874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  76%|███████▋  | 61/80 [05:54<01:48,  5.72s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.00653, train/loss_vlb_step=2.33e-5, train/loss_step=0.00653, global_step=874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  76%|███████▋  | 61/80 [05:54<01:48,  5.72s/it, loss=0.00697, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.95e-5, train/loss_step=0.00967, global_step=875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00697, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=4.95e-5, train/loss_step=0.00967, global_step=875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000107, train/loss_step=0.0138, global_step=875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:  79%|███████▉  | 63/80 [05:55<01:34,  5.56s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000107, train/loss_step=0.0138, global_step=875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  79%|███████▉  | 63/80 [05:55<01:34,  5.56s/it, loss=0.00699, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.32e-6, train/loss_step=0.000453, global_step=875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  80%|████████  | 64/80 [06:03<01:29,  5.59s/it, loss=0.00699, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.32e-6, train/loss_step=0.000453, global_step=875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  80%|████████  | 64/80 [06:03<01:29,  5.59s/it, loss=0.00703, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.28e-5, train/loss_step=0.0105, global_step=875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]    Epoch 43:  81%|███████���▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00703, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.28e-5, train/loss_step=0.0105, global_step=875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.000657, train/loss_vlb_step=2.05e-5, train/loss_step=0.000657, global_step=876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  82%|████████▎ | 66/80 [06:27<01:20,  5.78s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.000657, train/loss_vlb_step=2.05e-5, train/loss_step=0.000657, global_step=876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  82%|████████▎ | 66/80 [06:27<01:20,  5.78s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.000989, train/loss_vlb_step=4.94e-6, train/loss_step=0.000989, global_step=876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  84%|████████▍ | 67/80 [06:27<01:14,  5.70s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.000989, train/loss_vlb_step=4.94e-6, train/loss_step=0.000989, global_step=876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  84%|████████▍ | 67/80 [06:27<01:14,  5.70s/it, loss=0.00671, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.97e-6, train/loss_step=0.00119, global_step=876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.00671, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.97e-6, train/loss_step=0.00119, global_step=876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=3.11e-6, train/loss_step=0.000673, global_step=876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  86%|████████▋ | 69/80 [06:28<01:01,  5.55s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=3.11e-6, train/loss_step=0.000673, global_step=876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  86%|████████▋ | 69/80 [06:28<01:01,  5.55s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=3.3e-6, train/loss_step=0.000472, global_step=877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:  88%|████████▊ | 70/80 [06:29<00:54,  5.48s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=3.3e-6, train/loss_step=0.000472, global_step=877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  88%|████████▊ | 70/80 [06:29<00:54,  5.48s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=0.000294, train/loss_step=0.00854, global_step=877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  89%|████████▉ | 71/80 [06:29<00:48,  5.41s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=0.000294, train/loss_step=0.00854, global_step=877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  89%|████████▉ | 71/80 [06:29<00:48,  5.41s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.000745, train/loss_vlb_step=3.38e-6, train/loss_step=0.000745, global_step=877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  90%|█████████ | 72/80 [06:46<00:44,  5.56s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.000745, train/loss_vlb_step=3.38e-6, train/loss_step=0.000745, global_step=877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  90%|█████████ | 72/80 [06:46<00:44,  5.56s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=1.39e-5, train/loss_step=0.000696, global_step=877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  91%|█████████▏| 73/80 [06:54<00:39,  5.60s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=1.39e-5, train/loss_step=0.000696, global_step=877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  91%|█████████▏| 73/80 [06:54<00:39,  5.60s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000151, train/loss_vlb_step=5.65e-7, train/loss_step=0.000151, global_step=878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  92%|█████████▎| 74/80 [06:59<00:33,  5.60s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000151, train/loss_vlb_step=5.65e-7, train/loss_step=0.000151, global_step=878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  92%|█████████▎| 74/80 [06:59<00:33,  5.60s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000469, train/loss_vlb_step=2.24e-6, train/loss_step=0.000469, global_step=878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  94%|█████████▍| 75/80 [07:00<00:27,  5.53s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000469, train/loss_vlb_step=2.24e-6, train/loss_step=0.000469, global_step=878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  94%|█████████▍| 75/80 [07:00<00:27,  5.53s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.22e-5, train/loss_step=0.00166, global_step=878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 43:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.22e-5, train/loss_step=0.00166, global_step=878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=0.000151, train/loss_step=0.0102, global_step=878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Epoch 43:  96%|█████████▋| 77/80 [07:01<00:16,  5.40s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=0.000151, train/loss_step=0.0102, global_step=878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  96%|█████████▋| 77/80 [07:01<00:16,  5.40s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=1.35e-5, train/loss_step=0.004, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]   Epoch 43:  98%|█████████▊| 78/80 [07:01<00:10,  5.34s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=1.35e-5, train/loss_step=0.004, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  98%|█████████▊| 78/80 [07:01<00:10,  5.34s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.83e-6, train/loss_step=0.000246, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  99%|█████████▉| 79/80 [07:02<00:05,  5.28s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.83e-6, train/loss_step=0.000246, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43:  99%|█████████▉| 79/80 [07:02<00:05,  5.28s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.67e-6, train/loss_step=0.000248, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43: 100%|██████████| 80/80 [07:02<00:00,  5.22s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.67e-6, train/loss_step=0.000248, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 43: 100%|██████████| 80/80 [07:02<00:00,  5.22s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=4.89e-6, train/loss_step=0.00043, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417] Average Epoch time: 422.69 seconds
+Average Peak memory 29565.92MiB
+Epoch 43:   0%|          | 0/80 [00:00<00:00, 5866.16it/s, loss=0.00329, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=4.89e-6, train/loss_step=0.00043, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 44:   0%|          | 0/80 [00:00<00:00, 2082.57it/s, loss=0.00329, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=4.89e-6, train/loss_step=0.00043, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]Epoch 44:   1%|▏         | 1/80 [00:42<28:07, 21.37s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=4.89e-6, train/loss_step=0.00043, global_step=879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00417]  Epoch 44:   1%|▏         | 1/80 [00:42<28:07, 21.37s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.27e-6, train/loss_step=0.00126, global_step=880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:   2%|▎         | 2/80 [00:43<18:43, 14.40s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.27e-6, train/loss_step=0.00126, global_step=880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:   2%|▎         | 2/80 [00:43<18:43, 14.41s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=2.6e-5, train/loss_step=0.00731, global_step=880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434] Epoch 44:   4%|▍         | 3/80 [00:43<14:01, 10.93s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00731, train/loss_vlb_step=2.6e-5, train/loss_step=0.00731, global_step=880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:   4%|▍         | 3/80 [00:43<14:01, 10.93s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=2.79e-5, train/loss_step=0.0013, global_step=880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434] Epoch 44:   5%|▌         | 4/80 [00:44<11:12,  8.85s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=2.79e-5, train/loss_step=0.0013, global_step=880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:   5%|▌         | 4/80 [00:44<11:12,  8.85s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=1.51e-5, train/loss_step=0.00429, global_step=880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:   6%|▋         | 5/80 [00:44<09:19,  7.46s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.00429, train/loss_vlb_step=1.51e-5, train/loss_step=0.00429, global_step=880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:   6%|▋         | 5/80 [00:44<09:19,  7.46s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.26e-6, train/loss_step=0.00115, global_step=881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434] Epoch 44:   8%|▊         | 6/80 [00:45<07:58,  6.46s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.26e-6, train/loss_step=0.00115, global_step=881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:   8%|▊         | 6/80 [00:45<07:58,  6.46s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=0.000541, train/loss_step=0.00457, global_step=881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:   9%|▉         | 7/80 [00:45<06:57,  5.72s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=0.000541, train/loss_step=0.00457, global_step=881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:   9%|▉         | 7/80 [00:45<06:57,  5.72s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=1.76e-6, train/loss_step=0.000359, global_step=881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  10%|█         | 8/80 [01:17<10:16,  8.57s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=1.76e-6, train/loss_step=0.000359, global_step=881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  10%|█         | 8/80 [01:17<10:16,  8.57s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000156, train/loss_step=0.014, global_step=881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]      Epoch 44:  11%|█▏        | 9/80 [01:22<09:44,  8.23s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000156, train/loss_step=0.014, global_step=881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  11%|█▏        | 9/80 [01:22<09:44,  8.23s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=8.77e-6, train/loss_step=0.00192, global_step=882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  12%|█▎        | 10/80 [01:22<08:47,  7.53s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=8.77e-6, train/loss_step=0.00192, global_step=882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  12%|█▎        | 10/80 [01:22<08:47,  7.53s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.73e-6, train/loss_step=0.000444, global_step=882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  14%|█▍        | 11/80 [01:23<07:59,  6.94s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.73e-6, train/loss_step=0.000444, global_step=882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  14%|█▍        | 11/80 [01:23<07:59,  6.94s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.99e-6, train/loss_step=0.000573, global_step=882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  15%|█▌        | 12/80 [01:23<07:18,  6.45s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.99e-6, train/loss_step=0.000573, global_step=882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  15%|█▌        | 12/80 [01:23<07:18,  6.45s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=6.33e-5, train/loss_step=0.00342, global_step=882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]   Epoch 44:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=6.33e-5, train/loss_step=0.00342, global_step=882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=4.73e-6, train/loss_step=0.000787, global_step=883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  18%|█▊        | 14/80 [01:30<06:40,  6.06s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=4.73e-6, train/loss_step=0.000787, global_step=883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  18%|█▊        | 14/80 [01:30<06:40,  6.06s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.59e-5, train/loss_step=0.00128, global_step=883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  19%|█▉        | 15/80 [01:31<06:11,  5.71s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.59e-5, train/loss_step=0.00128, global_step=883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  19%|█▉        | 15/80 [01:31<06:11,  5.71s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000679, train/loss_vlb_step=2.88e-6, train/loss_step=0.000679, global_step=883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  20%|██        | 16/80 [02:02<07:41,  7.20s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000679, train/loss_vlb_step=2.88e-6, train/loss_step=0.000679, global_step=883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  20%|██        | 16/80 [02:02<07:41,  7.20s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.28e-5, train/loss_step=0.0018, global_step=883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]     Epoch 44:  21%|██▏       | 17/80 [02:05<07:19,  6.97s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=1.28e-5, train/loss_step=0.0018, global_step=883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  21%|██▏       | 17/80 [02:05<07:19,  6.97s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=7.54e-6, train/loss_step=0.000852, global_step=884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  22%|██▎       | 18/80 [02:05<06:50,  6.63s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=7.54e-6, train/loss_step=0.000852, global_step=884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  22%|██▎       | 18/80 [02:05<06:50,  6.63s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=8.72e-6, train/loss_step=0.0018, global_step=884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]    Epoch 44:  24%|██▍       | 19/80 [02:06<06:25,  6.32s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=8.72e-6, train/loss_step=0.0018, global_step=884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  24%|██▍       | 19/80 [02:06<06:25,  6.32s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=2.28e-5, train/loss_step=0.00176, global_step=884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  25%|██▌       | 20/80 [02:07<06:03,  6.06s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=2.28e-5, train/loss_step=0.00176, global_step=884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  25%|██▌       | 20/80 [02:07<06:03,  6.06s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=2.67e-6, train/loss_step=0.000601, global_step=884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  26%|██▋       | 21/80 [02:07<05:42,  5.81s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=2.67e-6, train/loss_step=0.000601, global_step=884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  26%|██▋       | 21/80 [02:07<05:42,  5.81s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=2.83e-5, train/loss_step=0.00677, global_step=885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  28%|██▊       | 22/80 [02:08<05:23,  5.57s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00677, train/loss_vlb_step=2.83e-5, train/loss_step=0.00677, global_step=885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  28%|██▊       | 22/80 [02:08<05:23,  5.58s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.11e-6, train/loss_step=0.000426, global_step=885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  29%|██▉       | 23/80 [02:08<05:05,  5.36s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.11e-6, train/loss_step=0.000426, global_step=885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  29%|██▉       | 23/80 [02:08<05:05,  5.36s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=3.09e-5, train/loss_step=0.00834, global_step=885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  30%|███       | 24/80 [02:50<06:21,  6.82s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=3.09e-5, train/loss_step=0.00834, global_step=885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  30%|███       | 24/80 [02:50<06:21,  6.82s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.63e-6, train/loss_step=0.000422, global_step=885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  31%|███▏      | 25/80 [02:51<06:01,  6.58s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.63e-6, train/loss_step=0.000422, global_step=885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  31%|███▏      | 25/80 [02:51<06:01,  6.58s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.18e-5, train/loss_step=0.00873, global_step=886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434] Epoch 44:  32%|███▎      | 26/80 [02:51<05:43,  6.35s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.18e-5, train/loss_step=0.00873, global_step=886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  32%|███▎      | 26/80 [02:51<05:43,  6.35s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00098, train/loss_vlb_step=4.88e-6, train/loss_step=0.00098, global_step=886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434] Epoch 44:  34%|███▍      | 27/80 [02:52<05:25,  6.14s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00098, train/loss_vlb_step=4.88e-6, train/loss_step=0.00098, global_step=886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  34%|███▍      | 27/80 [02:52<05:25,  6.14s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.48e-6, train/loss_step=0.000367, global_step=886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  35%|███▌      | 28/80 [02:52<05:09,  5.95s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.48e-6, train/loss_step=0.000367, global_step=886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  35%|███▌      | 28/80 [02:52<05:09,  5.95s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000481, train/loss_vlb_step=1.69e-6, train/loss_step=0.000481, global_step=886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  36%|███▋      | 29/80 [02:53<04:54,  5.77s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000481, train/loss_vlb_step=1.69e-6, train/loss_step=0.000481, global_step=886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  36%|███▋      | 29/80 [02:53<04:54,  5.77s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=1.85e-5, train/loss_step=0.00545, global_step=887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]   Epoch 44:  38%|███▊      | 30/80 [02:53<04:39,  5.60s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=1.85e-5, train/loss_step=0.00545, global_step=887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  38%|███▊      | 30/80 [02:53<04:39,  5.60s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=3.98e-6, train/loss_step=0.000727, global_step=887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  39%|███▉      | 31/80 [02:54<04:26,  5.44s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=3.98e-6, train/loss_step=0.000727, global_step=887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  39%|███▉      | 31/80 [02:54<04:26,  5.44s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=8.91e-6, train/loss_step=0.00252, global_step=887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  40%|████      | 32/80 [03:43<05:25,  6.79s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=8.91e-6, train/loss_step=0.00252, global_step=887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  40%|████      | 32/80 [03:43<05:25,  6.79s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.29e-5, train/loss_step=0.0101, global_step=887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  41%|████▏     | 33/80 [03:44<05:10,  6.60s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.29e-5, train/loss_step=0.0101, global_step=887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  41%|████▏     | 33/80 [03:44<05:10,  6.60s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=1.75e-6, train/loss_step=0.000451, global_step=888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  42%|████▎     | 34/80 [03:44<04:55,  6.43s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=1.75e-6, train/loss_step=0.000451, global_step=888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  42%|████▎     | 34/80 [03:44<04:55,  6.43s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=5.32e-5, train/loss_step=0.00962, global_step=888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  44%|████▍     | 35/80 [03:45<04:41,  6.26s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00962, train/loss_vlb_step=5.32e-5, train/loss_step=0.00962, global_step=888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  44%|████▍     | 35/80 [03:45<04:41,  6.26s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000632, train/loss_step=0.0254, global_step=888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434] Epoch 44:  45%|████▌     | 36/80 [03:46<04:28,  6.11s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000632, train/loss_step=0.0254, global_step=888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  45%|████▌     | 36/80 [03:46<04:28,  6.11s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.87e-6, train/loss_step=0.000523, global_step=888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  46%|████▋     | 37/80 [03:46<04:16,  5.96s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.87e-6, train/loss_step=0.000523, global_step=888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  46%|████▋     | 37/80 [03:46<04:16,  5.96s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.57e-5, train/loss_step=0.0104, global_step=889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]    Epoch 44:  48%|████▊     | 38/80 [03:47<04:04,  5.82s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.57e-5, train/loss_step=0.0104, global_step=889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  48%|████▊     | 38/80 [03:47<04:04,  5.82s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=1.11e-5, train/loss_step=0.000637, global_step=889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  49%|████▉     | 39/80 [03:47<03:53,  5.69s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=1.11e-5, train/loss_step=0.000637, global_step=889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  49%|████▉     | 39/80 [03:47<03:53,  5.69s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=8.59e-6, train/loss_step=0.00224, global_step=889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  50%|█████     | 40/80 [04:19<04:13,  6.33s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=8.59e-6, train/loss_step=0.00224, global_step=889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  50%|█████     | 40/80 [04:19<04:13,  6.33s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000738, train/loss_vlb_step=2.98e-6, train/loss_step=0.000738, global_step=889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  51%|█████▏    | 41/80 [04:20<04:01,  6.19s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000738, train/loss_vlb_step=2.98e-6, train/loss_step=0.000738, global_step=889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  51%|█████▏    | 41/80 [04:20<04:01,  6.19s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.74e-6, train/loss_step=0.00152, global_step=890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]   Epoch 44:  52%|█████▎    | 42/80 [04:20<03:50,  6.06s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.74e-6, train/loss_step=0.00152, global_step=890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  52%|█████▎    | 42/80 [04:20<03:50,  6.06s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=2.53e-6, train/loss_step=0.000476, global_step=890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  54%|█████▍    | 43/80 [04:21<03:39,  5.93s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=2.53e-6, train/loss_step=0.000476, global_step=890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  54%|█████▍    | 43/80 [04:21<03:39,  5.93s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.64e-5, train/loss_step=0.00706, global_step=890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  55%|█████▌    | 44/80 [04:21<03:29,  5.81s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.64e-5, train/loss_step=0.00706, global_step=890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  55%|█████▌    | 44/80 [04:21<03:29,  5.81s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.64e-5, train/loss_step=0.00809, global_step=890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  56%|█████▋    | 45/80 [04:22<03:19,  5.70s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.64e-5, train/loss_step=0.00809, global_step=890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  56%|█████▋    | 45/80 [04:22<03:19,  5.70s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.01e-6, train/loss_step=0.00112, global_step=891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  57%|█████▊    | 46/80 [04:22<03:10,  5.59s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.01e-6, train/loss_step=0.00112, global_step=891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  57%|█████▊    | 46/80 [04:22<03:10,  5.59s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.87e-6, train/loss_step=0.000551, global_step=891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  59%|█████▉    | 47/80 [04:23<03:00,  5.48s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.87e-6, train/loss_step=0.000551, global_step=891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  59%|█████▉    | 47/80 [04:23<03:00,  5.48s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=1.41e-5, train/loss_step=0.0041, global_step=891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]    Epoch 44:  60%|██████    | 48/80 [05:06<03:20,  6.26s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=1.41e-5, train/loss_step=0.0041, global_step=891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  60%|██████    | 48/80 [05:06<03:20,  6.26s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=2.04e-6, train/loss_step=0.000424, global_step=891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=2.04e-6, train/loss_step=0.000424, global_step=891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.23e-5, train/loss_step=0.00339, global_step=892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]   Epoch 44:  62%|██████▎   | 50/80 [05:07<03:01,  6.04s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.23e-5, train/loss_step=0.00339, global_step=892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  62%|██████▎   | 50/80 [05:07<03:01,  6.04s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=5.79e-6, train/loss_step=0.00126, global_step=892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  64%|██████▍   | 51/80 [05:08<02:51,  5.93s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=5.79e-6, train/loss_step=0.00126, global_step=892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  64%|██████▍   | 51/80 [05:08<02:51,  5.93s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=8.76e-5, train/loss_step=0.00113, global_step=892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  65%|██████▌   | 52/80 [05:09<02:43,  5.83s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=8.76e-5, train/loss_step=0.00113, global_step=892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  65%|██████▌   | 52/80 [05:09<02:43,  5.83s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=1.82e-6, train/loss_step=0.000342, global_step=892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=1.82e-6, train/loss_step=0.000342, global_step=892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.03e-5, train/loss_step=0.00959, global_step=893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00959, train/loss_vlb_step=4.03e-5, train/loss_step=0.00959, global_step=893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.57e-5, train/loss_step=0.00235, global_step=893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=1.57e-5, train/loss_step=0.00235, global_step=893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000408, train/loss_vlb_step=1.89e-6, train/loss_step=0.000408, global_step=893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  70%|███████   | 56/80 [05:45<02:25,  6.06s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000408, train/loss_vlb_step=1.89e-6, train/loss_step=0.000408, global_step=893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  70%|███████   | 56/80 [05:45<02:25,  6.06s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000656, train/loss_vlb_step=1.45e-5, train/loss_step=0.000656, global_step=893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  71%|███████▏  | 57/80 [05:49<02:18,  6.03s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000656, train/loss_vlb_step=1.45e-5, train/loss_step=0.000656, global_step=893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  71%|███████▏  | 57/80 [05:49<02:18,  6.03s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000235, train/loss_step=0.0158, global_step=894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]    Epoch 44:  72%|███████▎  | 58/80 [05:50<02:10,  5.93s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000235, train/loss_step=0.0158, global_step=894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  72%|███████▎  | 58/80 [05:50<02:10,  5.93s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.06e-5, train/loss_step=0.00308, global_step=894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  74%|███████▍  | 59/80 [05:50<02:02,  5.84s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.06e-5, train/loss_step=0.00308, global_step=894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  74%|███████▍  | 59/80 [05:50<02:02,  5.84s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.19e-6, train/loss_step=0.000315, global_step=894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  75%|███████▌  | 60/80 [05:51<01:55,  5.76s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.19e-6, train/loss_step=0.000315, global_step=894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  75%|███████▌  | 60/80 [05:51<01:55,  5.76s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=8.14e-5, train/loss_step=0.0135, global_step=894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]    Epoch 44:  76%|███████▋  | 61/80 [05:51<01:47,  5.67s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=8.14e-5, train/loss_step=0.0135, global_step=894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  76%|███████▋  | 61/80 [05:51<01:47,  5.67s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=3.83e-5, train/loss_step=0.00922, global_step=895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  78%|███████▊  | 62/80 [05:52<01:40,  5.59s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=3.83e-5, train/loss_step=0.00922, global_step=895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  78%|███████▊  | 62/80 [05:52<01:40,  5.59s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000519, train/loss_vlb_step=2.57e-6, train/loss_step=0.000519, global_step=895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  79%|███████▉  | 63/80 [05:52<01:33,  5.51s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000519, train/loss_vlb_step=2.57e-6, train/loss_step=0.000519, global_step=895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  79%|███████▉  | 63/80 [05:52<01:33,  5.51s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00027, train/loss_vlb_step=1.16e-6, train/loss_step=0.00027, global_step=895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  80%|████████  | 64/80 [06:30<01:36,  6.01s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00027, train/loss_vlb_step=1.16e-6, train/loss_step=0.00027, global_step=895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  80%|████████  | 64/80 [06:30<01:36,  6.01s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000104, train/loss_step=0.0124, global_step=895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434] Epoch 44:  81%|████████▏ | 65/80 [06:31<01:28,  5.92s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000104, train/loss_step=0.0124, global_step=895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  81%|████████▏ | 65/80 [06:31<01:28,  5.92s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=1.74e-6, train/loss_step=0.000363, global_step=896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  82%|████████▎ | 66/80 [06:31<01:21,  5.84s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=1.74e-6, train/loss_step=0.000363, global_step=896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  82%|████████▎ | 66/80 [06:31<01:21,  5.84s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000669, train/loss_vlb_step=6.21e-6, train/loss_step=0.000669, global_step=896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  84%|████████▍ | 67/80 [06:32<01:14,  5.77s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000669, train/loss_vlb_step=6.21e-6, train/loss_step=0.000669, global_step=896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  84%|████████▍ | 67/80 [06:32<01:14,  5.77s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00741, train/loss_vlb_step=3e-5, train/loss_step=0.00741, global_step=896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]     Epoch 44:  85%|████████▌ | 68/80 [06:32<01:08,  5.69s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00741, train/loss_vlb_step=3e-5, train/loss_step=0.00741, global_step=896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  85%|████████▌ | 68/80 [06:32<01:08,  5.69s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=2.19e-5, train/loss_step=0.00643, global_step=896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  86%|████████▋ | 69/80 [06:33<01:01,  5.62s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=2.19e-5, train/loss_step=0.00643, global_step=896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  86%|████████▋ | 69/80 [06:33<01:01,  5.62s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=0.000177, train/loss_step=0.00982, global_step=897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00982, train/loss_vlb_step=0.000177, train/loss_step=0.00982, global_step=897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=8.24e-6, train/loss_step=0.00198, global_step=897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434] Epoch 44:  89%|████████▉ | 71/80 [06:34<00:49,  5.47s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=8.24e-6, train/loss_step=0.00198, global_step=897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  89%|████████▉ | 71/80 [06:34<00:49,  5.47s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=3.19e-5, train/loss_step=0.00239, global_step=897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  90%|█████████ | 72/80 [06:56<00:45,  5.70s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=3.19e-5, train/loss_step=0.00239, global_step=897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  90%|█████████ | 72/80 [06:56<00:45,  5.70s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=2.25e-6, train/loss_step=0.000615, global_step=897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  91%|█████████▏| 73/80 [07:07<00:40,  5.78s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=2.25e-6, train/loss_step=0.000615, global_step=897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  91%|█████████▏| 73/80 [07:07<00:40,  5.78s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=3.54e-6, train/loss_step=0.000726, global_step=898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  92%|█████████▎| 74/80 [07:08<00:34,  5.71s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=3.54e-6, train/loss_step=0.000726, global_step=898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  92%|█████████▎| 74/80 [07:08<00:34,  5.71s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=1.65e-5, train/loss_step=0.00396, global_step=898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 44:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00396, train/loss_vlb_step=1.65e-5, train/loss_step=0.00396, global_step=898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=1.79e-5, train/loss_step=0.00482, global_step=898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=1.79e-5, train/loss_step=0.00482, global_step=898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.13e-5, train/loss_step=0.00156, global_step=898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.13e-5, train/loss_step=0.00156, global_step=898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=8.98e-7, train/loss_step=0.00021, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  98%|█████████▊| 78/80 [07:10<00:10,  5.44s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=8.98e-7, train/loss_step=0.00021, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  98%|█████████▊| 78/80 [07:10<00:10,  5.44s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000151, train/loss_vlb_step=5.78e-7, train/loss_step=0.000151, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000151, train/loss_vlb_step=5.78e-7, train/loss_step=0.000151, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.84e-6, train/loss_step=0.000273, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44: 100%|██████████| 80/80 [07:11<00:00,  5.32s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.84e-6, train/loss_step=0.000273, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 44: 100%|██████████| 80/80 [07:11<00:00,  5.32s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000132, train/loss_vlb_step=4.59e-7, train/loss_step=0.000132, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Average Epoch time: 431.20 seconds
+Average Peak memory 29565.06MiB
+Epoch 44:   0%|          | 0/80 [00:00<00:00, 5599.87it/s, loss=0.00319, v_num=0, train/loss_simple_step=0.000132, train/loss_vlb_step=4.59e-7, train/loss_step=0.000132, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 45:   0%|          | 0/80 [00:00<00:00, 2360.33it/s, loss=0.00319, v_num=0, train/loss_simple_step=0.000132, train/loss_vlb_step=4.59e-7, train/loss_step=0.000132, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]Epoch 45:   1%|▏         | 1/80 [00:40<26:45, 20.32s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000132, train/loss_vlb_step=4.59e-7, train/loss_step=0.000132, global_step=899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00434, train/loss_vlb_epoch=0.000117, train/loss_epoch=0.00434]  Epoch 45:   1%|▏         | 1/80 [00:40<26:45, 20.32s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=7.75e-7, train/loss_step=0.00021, global_step=900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]   Epoch 45:   2%|▎         | 2/80 [00:44<19:08, 14.73s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=7.75e-7, train/loss_step=0.00021, global_step=900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:   2%|▎         | 2/80 [00:44<19:08, 14.73s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.08e-6, train/loss_step=0.000256, global_step=900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:   4%|▍         | 3/80 [00:46<14:58, 11.67s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.08e-6, train/loss_step=0.000256, global_step=900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:   4%|▍         | 3/80 [00:46<14:58, 11.67s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=4.33e-5, train/loss_step=0.00568, global_step=900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]    Epoch 45:   5%|��         | 4/80 [00:47<11:57,  9.44s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=4.33e-5, train/loss_step=0.00568, global_step=900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:   5%|▌         | 4/80 [00:47<11:57,  9.44s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=0.000129, train/loss_step=0.013, global_step=900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416] Epoch 45:   6%|▋         | 5/80 [00:51<10:49,  8.67s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=0.000129, train/loss_step=0.013, global_step=900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:   6%|▋         | 5/80 [00:51<10:49,  8.67s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.4e-5, train/loss_step=0.0112, global_step=901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:   8%|▊         | 6/80 [00:52<09:14,  7.50s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.4e-5, train/loss_step=0.0112, global_step=901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:   8%|▊         | 6/80 [00:52<09:14,  7.50s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000369, train/loss_vlb_step=1.94e-6, train/loss_step=0.000369, global_step=901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:   9%|▉         | 7/80 [00:52<08:03,  6.62s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000369, train/loss_vlb_step=1.94e-6, train/loss_step=0.000369, global_step=901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:   9%|▉         | 7/80 [00:52<08:03,  6.62s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=2.7e-6, train/loss_step=0.000678, global_step=901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416] Epoch 45:  10%|█         | 8/80 [01:24<11:12,  9.34s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=2.7e-6, train/loss_step=0.000678, global_step=901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  10%|█         | 8/80 [01:24<11:12,  9.34s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000465, train/loss_step=0.0281, global_step=901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 45:  11%|█▏        | 9/80 [01:24<10:00,  8.46s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0281, train/loss_vlb_step=0.000465, train/loss_step=0.0281, global_step=901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  11%|█▏        | 9/80 [01:24<10:00,  8.46s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000639, train/loss_vlb_step=3.34e-6, train/loss_step=0.000639, global_step=902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  12%|█▎        | 10/80 [01:25<09:01,  7.73s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000639, train/loss_vlb_step=3.34e-6, train/loss_step=0.000639, global_step=902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  12%|█▎        | 10/80 [01:25<09:01,  7.73s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=0.00013, train/loss_step=0.0173, global_step=902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]    Epoch 45:  14%|█▍        | 11/80 [01:25<08:12,  7.13s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=0.00013, train/loss_step=0.0173, global_step=902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  14%|█▍        | 11/80 [01:25<08:12,  7.13s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=3.85e-6, train/loss_step=0.000545, global_step=902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  15%|█▌        | 12/80 [01:35<08:21,  7.37s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=3.85e-6, train/loss_step=0.000545, global_step=902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  15%|█▌        | 12/80 [01:35<08:21,  7.37s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=5.46e-5, train/loss_step=0.0145, global_step=902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]    Epoch 45:  16%|█▋        | 13/80 [01:42<08:11,  7.34s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=5.46e-5, train/loss_step=0.0145, global_step=902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  16%|█▋        | 13/80 [01:42<08:11,  7.34s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=2.75e-6, train/loss_step=0.000623, global_step=903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  18%|█▊        | 14/80 [01:43<07:34,  6.88s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=2.75e-6, train/loss_step=0.000623, global_step=903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  18%|█▊        | 14/80 [01:43<07:34,  6.88s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=3.38e-6, train/loss_step=0.000426, global_step=903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  19%|█▉        | 15/80 [01:43<07:01,  6.48s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=3.38e-6, train/loss_step=0.000426, global_step=903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  19%|█▉        | 15/80 [01:43<07:01,  6.48s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=6.15e-6, train/loss_step=0.0016, global_step=903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]    Epoch 45:  20%|██        | 16/80 [01:55<07:13,  6.78s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=6.15e-6, train/loss_step=0.0016, global_step=903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  20%|██        | 16/80 [01:55<07:13,  6.78s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.13e-5, train/loss_step=0.0053, global_step=903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  21%|██▏       | 17/80 [01:56<06:48,  6.48s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=2.13e-5, train/loss_step=0.0053, global_step=903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  21%|██▏       | 17/80 [01:56<06:48,  6.48s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000955, train/loss_vlb_step=4.66e-6, train/loss_step=0.000955, global_step=904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  22%|██▎       | 18/80 [01:57<06:22,  6.16s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000955, train/loss_vlb_step=4.66e-6, train/loss_step=0.000955, global_step=904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  22%|██▎       | 18/80 [01:57<06:22,  6.16s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.06e-7, train/loss_step=0.000139, global_step=904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  24%|██▍       | 19/80 [01:57<05:58,  5.88s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.06e-7, train/loss_step=0.000139, global_step=904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  24%|██▍       | 19/80 [01:57<05:58,  5.88s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000419, train/loss_vlb_step=2.1e-6, train/loss_step=0.000419, global_step=904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416] Epoch 45:  25%|██▌       | 20/80 [02:18<06:34,  6.57s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000419, train/loss_vlb_step=2.1e-6, train/loss_step=0.000419, global_step=904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  25%|██▌       | 20/80 [02:18<06:34,  6.57s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=7.16e-5, train/loss_step=0.00624, global_step=904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  26%|██▋       | 21/80 [02:28<06:38,  6.75s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=7.16e-5, train/loss_step=0.00624, global_step=904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  26%|██▋       | 21/80 [02:28<06:38,  6.75s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=2.36e-5, train/loss_step=0.00664, global_step=905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  28%|██▊       | 22/80 [02:29<06:15,  6.48s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=2.36e-5, train/loss_step=0.00664, global_step=905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  28%|██▊       | 22/80 [02:29<06:15,  6.48s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000419, train/loss_vlb_step=1.74e-6, train/loss_step=0.000419, global_step=905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  29%|██▉       | 23/80 [02:29<05:55,  6.23s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000419, train/loss_vlb_step=1.74e-6, train/loss_step=0.000419, global_step=905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  29%|██▉       | 23/80 [02:29<05:55,  6.23s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.5e-6, train/loss_step=0.000339, global_step=905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416] Epoch 45:  30%|███       | 24/80 [02:34<05:46,  6.19s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.5e-6, train/loss_step=0.000339, global_step=905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  30%|███       | 24/80 [02:34<05:46,  6.19s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=1.12e-6, train/loss_step=0.000204, global_step=905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  31%|███▏      | 25/80 [02:45<05:50,  6.36s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=1.12e-6, train/loss_step=0.000204, global_step=905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  31%|███▏      | 25/80 [02:45<05:50,  6.36s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=5.58e-5, train/loss_step=0.00862, global_step=906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]   Epoch 45:  32%|███▎      | 26/80 [02:45<05:31,  6.15s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=5.58e-5, train/loss_step=0.00862, global_step=906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  32%|███▎      | 26/80 [02:45<05:31,  6.15s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.68e-6, train/loss_step=0.000348, global_step=906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  34%|███▍      | 27/80 [02:46<05:15,  5.94s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.68e-6, train/loss_step=0.000348, global_step=906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  34%|███▍      | 27/80 [02:46<05:15,  5.94s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=8.54e-5, train/loss_step=0.0142, global_step=906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]   Epoch 45:  35%|███▌      | 28/80 [03:06<05:34,  6.44s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=8.54e-5, train/loss_step=0.0142, global_step=906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  35%|███▌      | 28/80 [03:06<05:34,  6.44s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=2.37e-5, train/loss_step=0.00678, global_step=906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  36%|███▋      | 29/80 [03:09<05:21,  6.30s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=2.37e-5, train/loss_step=0.00678, global_step=906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  36%|███▋      | 29/80 [03:09<05:21,  6.30s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=6.88e-6, train/loss_step=0.00178, global_step=907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  38%|███���      | 30/80 [03:09<05:05,  6.11s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=6.88e-6, train/loss_step=0.00178, global_step=907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  38%|███▊      | 30/80 [03:09<05:05,  6.11s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.26e-5, train/loss_step=0.00544, global_step=907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  39%|███▉      | 31/80 [03:09<04:50,  5.94s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=2.26e-5, train/loss_step=0.00544, global_step=907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  39%|███▉      | 31/80 [03:09<04:50,  5.94s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=5.09e-5, train/loss_step=0.0099, global_step=907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 45:  40%|████      | 32/80 [03:19<04:49,  6.03s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=5.09e-5, train/loss_step=0.0099, global_step=907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  40%|████      | 32/80 [03:19<04:49,  6.03s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=2.08e-6, train/loss_step=0.000505, global_step=907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  41%|████▏     | 33/80 [03:39<05:03,  6.45s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=2.08e-6, train/loss_step=0.000505, global_step=907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  41%|████▏     | 33/80 [03:39<05:03,  6.45s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000507, train/loss_vlb_step=2.63e-6, train/loss_step=0.000507, global_step=908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  42%|████▎     | 34/80 [03:39<04:49,  6.28s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000507, train/loss_vlb_step=2.63e-6, train/loss_step=0.000507, global_step=908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  42%|████▎     | 34/80 [03:39<04:49,  6.28s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=7.45e-5, train/loss_step=0.0106, global_step=908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]    Epoch 45:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=7.45e-5, train/loss_step=0.0106, global_step=908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.52e-6, train/loss_step=0.000271, global_step=908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  45%|████▌     | 36/80 [03:54<04:38,  6.33s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.52e-6, train/loss_step=0.000271, global_step=908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  45%|████▌     | 36/80 [03:54<04:38,  6.33s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000194, train/loss_vlb_step=9.42e-7, train/loss_step=0.000194, global_step=908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  46%|████▋     | 37/80 [03:54<04:25,  6.18s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000194, train/loss_vlb_step=9.42e-7, train/loss_step=0.000194, global_step=908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  46%|████▋     | 37/80 [03:54<04:25,  6.18s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.63e-5, train/loss_step=0.0101, global_step=909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]    Epoch 45:  48%|████▊     | 38/80 [03:55<04:13,  6.03s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.63e-5, train/loss_step=0.0101, global_step=909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  48%|████▊     | 38/80 [03:55<04:13,  6.03s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=0.000114, train/loss_step=0.00148, global_step=909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  49%|████▉     | 39/80 [03:55<04:01,  5.89s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=0.000114, train/loss_step=0.00148, global_step=909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  49%|████▉     | 39/80 [03:55<04:01,  5.89s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=4.23e-6, train/loss_step=0.000865, global_step=909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  50%|█████     | 40/80 [04:05<03:59,  5.98s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=4.23e-6, train/loss_step=0.000865, global_step=909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  50%|█████     | 40/80 [04:05<03:59,  5.98s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.44e-5, train/loss_step=0.0043, global_step=909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]    Epoch 45:  51%|█████▏    | 41/80 [04:21<04:02,  6.23s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.44e-5, train/loss_step=0.0043, global_step=909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  51%|█████▏    | 41/80 [04:21<04:02,  6.23s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=2.11e-6, train/loss_step=0.000531, global_step=910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  52%|█████▎    | 42/80 [04:22<03:51,  6.09s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=2.11e-6, train/loss_step=0.000531, global_step=910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  52%|█████▎    | 42/80 [04:22<03:51,  6.09s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=1.95e-5, train/loss_step=0.00569, global_step=910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 45:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=1.95e-5, train/loss_step=0.00569, global_step=910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.19e-5, train/loss_step=0.00296, global_step=910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  55%|█████▌    | 44/80 [04:29<03:35,  6.00s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.19e-5, train/loss_step=0.00296, global_step=910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  55%|█████▌    | 44/80 [04:29<03:35,  6.00s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000197, train/loss_vlb_step=1.33e-6, train/loss_step=0.000197, global_step=910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000197, train/loss_vlb_step=1.33e-6, train/loss_step=0.000197, global_step=910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00016, train/loss_vlb_step=6.35e-7, train/loss_step=0.00016, global_step=911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 45:  57%|█████▊    | 46/80 [04:31<03:16,  5.77s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00016, train/loss_vlb_step=6.35e-7, train/loss_step=0.00016, global_step=911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  57%|█████▊    | 46/80 [04:31<03:16,  5.77s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.56e-6, train/loss_step=0.00031, global_step=911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  59%|█████▉    | 47/80 [04:31<03:06,  5.66s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.56e-6, train/loss_step=0.00031, global_step=911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  59%|█████▉    | 47/80 [04:31<03:06,  5.66s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.14e-6, train/loss_step=0.000308, global_step=911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  60%|██████    | 48/80 [05:00<03:16,  6.13s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.14e-6, train/loss_step=0.000308, global_step=911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  60%|██████    | 48/80 [05:00<03:16,  6.13s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=2.65e-5, train/loss_step=0.00734, global_step=911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 45:  61%|██████▏   | 49/80 [05:05<03:09,  6.12s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=2.65e-5, train/loss_step=0.00734, global_step=911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  61%|██████▏   | 49/80 [05:05<03:09,  6.12s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000216, train/loss_vlb_step=9.71e-7, train/loss_step=0.000216, global_step=912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  62%|██████▎   | 50/80 [05:06<03:00,  6.01s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000216, train/loss_vlb_step=9.71e-7, train/loss_step=0.000216, global_step=912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  62%|██████▎   | 50/80 [05:06<03:00,  6.01s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.53e-5, train/loss_step=0.00458, global_step=912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 45:  64%|██████▍   | 51/80 [05:06<02:51,  5.90s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.53e-5, train/loss_step=0.00458, global_step=912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  64%|██████▍   | 51/80 [05:06<02:51,  5.90s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000602, train/loss_vlb_step=2.39e-6, train/loss_step=0.000602, global_step=912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  65%|██████▌   | 52/80 [05:15<02:46,  5.96s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000602, train/loss_vlb_step=2.39e-6, train/loss_step=0.000602, global_step=912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  65%|██████▌   | 52/80 [05:15<02:46,  5.96s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=8.6e-6, train/loss_step=0.00237, global_step=912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]   Epoch 45:  66%|██████▋   | 53/80 [05:16<02:38,  5.86s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.00237, train/loss_vlb_step=8.6e-6, train/loss_step=0.00237, global_step=912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  66%|██████▋   | 53/80 [05:16<02:38,  5.86s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000611, train/loss_vlb_step=3.08e-6, train/loss_step=0.000611, global_step=913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  68%|██████▊   | 54/80 [05:17<02:29,  5.76s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000611, train/loss_vlb_step=3.08e-6, train/loss_step=0.000611, global_step=913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  68%|██████▊   | 54/80 [05:17<02:29,  5.76s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.08e-5, train/loss_step=0.00221, global_step=913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 45:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.08e-5, train/loss_step=0.00221, global_step=913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=3.43e-6, train/loss_step=0.000472, global_step=913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  70%|███████   | 56/80 [05:39<02:22,  5.95s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=3.43e-6, train/loss_step=0.000472, global_step=913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  70%|███████   | 56/80 [05:39<02:22,  5.95s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=2.18e-5, train/loss_step=0.00622, global_step=913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 45:  71%|███████▏  | 57/80 [05:52<02:19,  6.08s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=2.18e-5, train/loss_step=0.00622, global_step=913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  71%|███████▏  | 57/80 [05:52<02:19,  6.08s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=2.35e-6, train/loss_step=0.000406, global_step=914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  72%|███████▎  | 58/80 [05:53<02:11,  5.98s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=2.35e-6, train/loss_step=0.000406, global_step=914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  72%|███████▎  | 58/80 [05:53<02:11,  5.98s/it, loss=0.00207, v_num=0, train/loss_simple_step=0.000982, train/loss_vlb_step=4.27e-6, train/loss_step=0.000982, global_step=914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  74%|███████▍  | 59/80 [05:53<02:03,  5.89s/it, loss=0.00207, v_num=0, train/loss_simple_step=0.000982, train/loss_vlb_step=4.27e-6, train/loss_step=0.000982, global_step=914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  74%|███████▍  | 59/80 [05:53<02:03,  5.89s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=3.95e-5, train/loss_step=0.0107, global_step=914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]    Epoch 45:  75%|███████▌  | 60/80 [05:56<01:56,  5.85s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=3.95e-5, train/loss_step=0.0107, global_step=914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  75%|███████▌  | 60/80 [05:56<01:56,  5.85s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.08e-5, train/loss_step=0.0071, global_step=914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416] Epoch 45:  76%|███████▋  | 61/80 [05:57<01:49,  5.76s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0071, train/loss_vlb_step=3.08e-5, train/loss_step=0.0071, global_step=914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  76%|███████▋  | 61/80 [05:57<01:49,  5.76s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=0.000109, train/loss_step=0.0132, global_step=915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  78%|███████▊  | 62/80 [05:57<01:42,  5.68s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=0.000109, train/loss_step=0.0132, global_step=915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  78%|███████▊  | 62/80 [05:57<01:42,  5.68s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=8.05e-5, train/loss_step=0.0112, global_step=915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416] Epoch 45:  79%|███████▉  | 63/80 [05:58<01:35,  5.60s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=8.05e-5, train/loss_step=0.0112, global_step=915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  79%|███████▉  | 63/80 [05:58<01:35,  5.60s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=0.00077, train/loss_step=0.00479, global_step=915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  80%|████████  | 64/80 [06:21<01:33,  5.86s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=0.00077, train/loss_step=0.00479, global_step=915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  80%|████████  | 64/80 [06:21<01:33,  5.86s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=0.00122, train/loss_step=0.0225, global_step=915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416] Epoch 45:  81%|████████▏ | 65/80 [06:28<01:28,  5.88s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=0.00122, train/loss_step=0.0225, global_step=915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  81%|████████▏ | 65/80 [06:28<01:28,  5.88s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=0.000351, train/loss_step=0.019, global_step=916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416] Epoch 45:  82%|████████▎ | 66/80 [06:28<01:21,  5.80s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=0.000351, train/loss_step=0.019, global_step=916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  82%|████████▎ | 66/80 [06:28<01:21,  5.80s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=2.7e-6, train/loss_step=0.000442, global_step=916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  84%|████████▍ | 67/80 [06:29<01:14,  5.72s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=2.7e-6, train/loss_step=0.000442, global_step=916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  84%|████████▍ | 67/80 [06:29<01:14,  5.72s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.47e-5, train/loss_step=0.00298, global_step=916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 45:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.47e-5, train/loss_step=0.00298, global_step=916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000526, train/loss_vlb_step=3.02e-6, train/loss_step=0.000526, global_step=916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  86%|████████▋ | 69/80 [06:39<01:02,  5.70s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000526, train/loss_vlb_step=3.02e-6, train/loss_step=0.000526, global_step=916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  86%|████████▋ | 69/80 [06:39<01:02,  5.70s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=4.07e-6, train/loss_step=0.000541, global_step=917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=4.07e-6, train/loss_step=0.000541, global_step=917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.71e-6, train/loss_step=0.000552, global_step=917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.71e-6, train/loss_step=0.000552, global_step=917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.13e-6, train/loss_step=0.0003, global_step=917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]    Epoch 45:  90%|█████████ | 72/80 [06:52<00:45,  5.65s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.13e-6, train/loss_step=0.0003, global_step=917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  90%|█████████ | 72/80 [06:52<00:45,  5.65s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000128, train/loss_step=0.0141, global_step=917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  91%|█████████▏| 73/80 [07:06<00:40,  5.76s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000128, train/loss_step=0.0141, global_step=917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  91%|█████████▏| 73/80 [07:06<00:40,  5.76s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.000543, train/loss_vlb_step=3.81e-6, train/loss_step=0.000543, global_step=918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  92%|█████████▎| 74/80 [07:06<00:34,  5.69s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.000543, train/loss_vlb_step=3.81e-6, train/loss_step=0.000543, global_step=918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  92%|█████████▎| 74/80 [07:06<00:34,  5.69s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=9.69e-6, train/loss_step=0.000819, global_step=918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  94%|█████████▍| 75/80 [07:07<00:28,  5.62s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=9.69e-6, train/loss_step=0.000819, global_step=918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  94%|█████████▍| 75/80 [07:07<00:28,  5.62s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.000683, train/loss_vlb_step=3.38e-6, train/loss_step=0.000683, global_step=918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  95%|█████████▌| 76/80 [07:07<00:22,  5.56s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.000683, train/loss_vlb_step=3.38e-6, train/loss_step=0.000683, global_step=918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  95%|█████████▌| 76/80 [07:07<00:22,  5.56s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=9.15e-6, train/loss_step=0.000702, global_step=918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  96%|█████████▋| 77/80 [07:08<00:16,  5.49s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=9.15e-6, train/loss_step=0.000702, global_step=918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  96%|█████████▋| 77/80 [07:08<00:16,  5.49s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=5e-6, train/loss_step=0.001, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]         Epoch 45:  98%|█████████▊| 78/80 [07:08<00:10,  5.43s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=5e-6, train/loss_step=0.001, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  98%|█████████▊| 78/80 [07:08<00:10,  5.43s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=4.71e-5, train/loss_step=0.0132, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  99%|█████████▉| 79/80 [07:09<00:05,  5.37s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=4.71e-5, train/loss_step=0.0132, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45:  99%|█████████▉| 79/80 [07:09<00:05,  5.37s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=3.78e-5, train/loss_step=0.00925, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45: 100%|██████████| 80/80 [07:09<00:00,  5.31s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=3.78e-5, train/loss_step=0.00925, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 45: 100%|██████████| 80/80 [07:09<00:00,  5.31s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=4.68e-5, train/loss_step=0.0136, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Average Epoch time: 429.73 seconds
+Average Peak memory 29565.21MiB
+Epoch 45:   0%|          | 0/80 [00:00<00:00, 3883.61it/s, loss=0.00651, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=4.68e-5, train/loss_step=0.0136, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 46:   0%|          | 0/80 [00:00<00:00, 1642.25it/s, loss=0.00651, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=4.68e-5, train/loss_step=0.0136, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]Epoch 46:   1%|▏         | 1/80 [00:43<28:53, 21.94s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=4.68e-5, train/loss_step=0.0136, global_step=919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=8.46e-5, train/loss_epoch=0.00416]  Epoch 46:   1%|▏         | 1/80 [00:43<28:53, 21.94s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.67e-6, train/loss_step=0.00133, global_step=920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   2%|▎         | 2/80 [00:44<19:13, 14.79s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.67e-6, train/loss_step=0.00133, global_step=920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   2%|▎         | 2/80 [00:44<19:13, 14.79s/it, loss=0.00611, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.00113, train/loss_step=0.0153, global_step=920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:   4%|▍         | 3/80 [00:44<14:23, 11.21s/it, loss=0.00611, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.00113, train/loss_step=0.0153, global_step=920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   4%|▍         | 3/80 [00:44<14:23, 11.21s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=1.88e-5, train/loss_step=0.00495, global_step=920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   5%|▌         | 4/80 [00:45<11:29,  9.07s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=1.88e-5, train/loss_step=0.00495, global_step=920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   5%|▌         | 4/80 [00:45<11:29,  9.07s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=2.82e-5, train/loss_step=0.00747, global_step=920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   6%|▋         | 5/80 [00:45<09:33,  7.65s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=2.82e-5, train/loss_step=0.00747, global_step=920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   6%|▋         | 5/80 [00:45<09:33,  7.65s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=1.91e-6, train/loss_step=0.000459, global_step=921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   8%|▊         | 6/80 [00:46<08:10,  6.62s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=1.91e-6, train/loss_step=0.000459, global_step=921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   8%|▊         | 6/80 [00:46<08:10,  6.62s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000839, train/loss_vlb_step=4.38e-6, train/loss_step=0.000839, global_step=921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   9%|▉         | 7/80 [00:46<07:07,  5.86s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000839, train/loss_vlb_step=4.38e-6, train/loss_step=0.000839, global_step=921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:   9%|▉         | 7/80 [00:46<07:07,  5.86s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.59e-5, train/loss_step=0.00516, global_step=921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  10%|█         | 8/80 [01:14<09:56,  8.28s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=2.59e-5, train/loss_step=0.00516, global_step=921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  10%|█         | 8/80 [01:14<09:56,  8.28s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=2.04e-6, train/loss_step=0.000536, global_step=921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  11%|█▏        | 9/80 [01:28<10:28,  8.86s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=2.04e-6, train/loss_step=0.000536, global_step=921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  11%|█▏        | 9/80 [01:28<10:28,  8.86s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=3.37e-5, train/loss_step=0.00854, global_step=922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  12%|█▎        | 10/80 [01:29<09:26,  8.10s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00854, train/loss_vlb_step=3.37e-5, train/loss_step=0.00854, global_step=922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  12%|█▎        | 10/80 [01:29<09:26,  8.10s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=5.81e-6, train/loss_step=0.00139, global_step=922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  14%|█▍        | 11/80 [01:29<08:34,  7.46s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=5.81e-6, train/loss_step=0.00139, global_step=922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  14%|█▍        | 11/80 [01:29<08:34,  7.46s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=0.000263, train/loss_step=0.00136, global_step=922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  15%|█▌        | 12/80 [01:30<07:51,  6.93s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=0.000263, train/loss_step=0.00136, global_step=922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  15%|█▌        | 12/80 [01:30<07:51,  6.93s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=0.000369, train/loss_step=0.00531, global_step=922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  16%|█▋        | 13/80 [01:32<07:22,  6.60s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=0.000369, train/loss_step=0.00531, global_step=922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  16%|█▋        | 13/80 [01:32<07:22,  6.60s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.04e-6, train/loss_step=0.000409, global_step=923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  18%|█▊        | 14/80 [01:32<06:48,  6.19s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.04e-6, train/loss_step=0.000409, global_step=923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  18%|█▊        | 14/80 [01:32<06:48,  6.19s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000135, train/loss_step=0.0125, global_step=923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]    Epoch 46:  19%|█▉        | 15/80 [01:33<06:19,  5.84s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000135, train/loss_step=0.0125, global_step=923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  19%|█▉        | 15/80 [01:33<06:19,  5.84s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000126, train/loss_step=0.0125, global_step=923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  20%|██        | 16/80 [02:06<07:56,  7.44s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000126, train/loss_step=0.0125, global_step=923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  20%|██        | 16/80 [02:06<07:56,  7.44s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=9.49e-7, train/loss_step=0.000226, global_step=923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  21%|██▏       | 17/80 [02:07<07:25,  7.07s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=9.49e-7, train/loss_step=0.000226, global_step=923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  21%|██▏       | 17/80 [02:07<07:25,  7.07s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.31e-6, train/loss_step=0.000336, global_step=924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  22%|██▎       | 18/80 [02:07<06:56,  6.72s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.31e-6, train/loss_step=0.000336, global_step=924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  22%|██▎       | 18/80 [02:07<06:56,  6.72s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=1.35e-5, train/loss_step=0.00406, global_step=924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  24%|██▍       | 19/80 [02:08<06:31,  6.41s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=1.35e-5, train/loss_step=0.00406, global_step=924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  24%|██▍       | 19/80 [02:08<06:31,  6.41s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000628, train/loss_vlb_step=1.21e-5, train/loss_step=0.000628, global_step=924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  25%|██▌       | 20/80 [02:08<06:08,  6.14s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000628, train/loss_vlb_step=1.21e-5, train/loss_step=0.000628, global_step=924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  25%|██▌       | 20/80 [02:08<06:08,  6.14s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=2.3e-5, train/loss_step=0.00663, global_step=924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]    Epoch 46:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=2.3e-5, train/loss_step=0.00663, global_step=924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=8.26e-6, train/loss_step=0.00197, global_step=925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  28%|██▊       | 22/80 [02:14<05:40,  5.87s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=8.26e-6, train/loss_step=0.00197, global_step=925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  28%|██▊       | 22/80 [02:14<05:40,  5.87s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.25e-5, train/loss_step=0.00788, global_step=925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  29%|██▉       | 23/80 [02:15<05:21,  5.64s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.25e-5, train/loss_step=0.00788, global_step=925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  29%|██▉       | 23/80 [02:15<05:21,  5.64s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=1.51e-6, train/loss_step=0.000258, global_step=925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  30%|███       | 24/80 [02:50<06:22,  6.83s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=1.51e-6, train/loss_step=0.000258, global_step=925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  30%|███       | 24/80 [02:50<06:22,  6.83s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=0.000138, train/loss_step=0.0126, global_step=925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]   Epoch 46:  31%|███▏      | 25/80 [03:04<06:31,  7.11s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=0.000138, train/loss_step=0.0126, global_step=925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  31%|███▏      | 25/80 [03:04<06:31,  7.11s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000881, train/loss_vlb_step=3.1e-5, train/loss_step=0.000881, global_step=926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  32%|███▎      | 26/80 [03:05<06:10,  6.87s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000881, train/loss_vlb_step=3.1e-5, train/loss_step=0.000881, global_step=926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  32%|███▎      | 26/80 [03:05<06:10,  6.87s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=2.57e-5, train/loss_step=0.00746, global_step=926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  34%|███▍      | 27/80 [03:05<05:51,  6.64s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=2.57e-5, train/loss_step=0.00746, global_step=926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  34%|███▍      | 27/80 [03:05<05:51,  6.64s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=0.000407, train/loss_step=0.0218, global_step=926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398] Epoch 46:  35%|███▌      | 28/80 [03:06<05:34,  6.43s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=0.000407, train/loss_step=0.0218, global_step=926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  35%|███▌      | 28/80 [03:06<05:34,  6.43s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.000786, train/loss_vlb_step=5.69e-6, train/loss_step=0.000786, global_step=926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  36%|███▋      | 29/80 [03:06<05:17,  6.23s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.000786, train/loss_vlb_step=5.69e-6, train/loss_step=0.000786, global_step=926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  36%|███▋      | 29/80 [03:06<05:17,  6.23s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=2.21e-6, train/loss_step=0.000579, global_step=927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  38%|███▊      | 30/80 [03:07<05:02,  6.05s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=2.21e-6, train/loss_step=0.000579, global_step=927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  38%|███▊      | 30/80 [03:07<05:02,  6.05s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000132, train/loss_vlb_step=5.22e-7, train/loss_step=0.000132, global_step=927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  39%|███▉      | 31/80 [03:07<04:47,  5.87s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000132, train/loss_vlb_step=5.22e-7, train/loss_step=0.000132, global_step=927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  39%|███▉      | 31/80 [03:07<04:47,  5.87s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=0.000695, train/loss_step=0.00156, global_step=927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398] Epoch 46:  40%|████      | 32/80 [03:34<05:12,  6.50s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=0.000695, train/loss_step=0.00156, global_step=927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  40%|████      | 32/80 [03:34<05:12,  6.50s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.46e-5, train/loss_step=0.0136, global_step=927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]   Epoch 46:  41%|████▏     | 33/80 [03:36<04:58,  6.35s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.46e-5, train/loss_step=0.0136, global_step=927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  41%|████▏     | 33/80 [03:36<04:58,  6.35s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=1.79e-5, train/loss_step=0.00516, global_step=928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  42%|████▎     | 34/80 [03:36<04:44,  6.19s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=1.79e-5, train/loss_step=0.00516, global_step=928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  42%|████▎     | 34/80 [03:36<04:44,  6.19s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=3.48e-6, train/loss_step=0.000355, global_step=928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  44%|████▍     | 35/80 [03:37<04:31,  6.03s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=3.48e-6, train/loss_step=0.000355, global_step=928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  44%|████▍     | 35/80 [03:37<04:31,  6.03s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.59e-5, train/loss_step=0.00424, global_step=928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  45%|████▌     | 36/80 [03:37<04:18,  5.88s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=2.59e-5, train/loss_step=0.00424, global_step=928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  45%|████▌     | 36/80 [03:37<04:18,  5.88s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000519, train/loss_step=0.0246, global_step=928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398] Epoch 46:  46%|████▋     | 37/80 [03:38<04:06,  5.74s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000519, train/loss_step=0.0246, global_step=928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  46%|████▋     | 37/80 [03:38<04:06,  5.74s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.00182, train/loss_step=0.0241, global_step=929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398] Epoch 46:  48%|████▊     | 38/80 [03:38<03:55,  5.61s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.00182, train/loss_step=0.0241, global_step=929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  48%|████▊     | 38/80 [03:38<03:55,  5.61s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.35e-5, train/loss_step=0.00375, global_step=929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  49%|████▉     | 39/80 [03:39<03:44,  5.48s/it, loss=0.00695, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.35e-5, train/loss_step=0.00375, global_step=929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  49%|████▉     | 39/80 [03:39<03:44,  5.48s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=1.67e-5, train/loss_step=0.00475, global_step=929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  50%|█████     | 40/80 [04:23<04:16,  6.42s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=1.67e-5, train/loss_step=0.00475, global_step=929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  50%|█████     | 40/80 [04:23<04:16,  6.42s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.49e-6, train/loss_step=0.000317, global_step=929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  51%|█████▏    | 41/80 [04:23<04:05,  6.28s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.49e-6, train/loss_step=0.000317, global_step=929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  51%|█████▏    | 41/80 [04:23<04:05,  6.28s/it, loss=0.00691, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.42e-5, train/loss_step=0.00343, global_step=930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  52%|█████▎    | 42/80 [04:24<03:53,  6.15s/it, loss=0.00691, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.42e-5, train/loss_step=0.00343, global_step=930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  52%|█████▎    | 42/80 [04:24<03:53,  6.15s/it, loss=0.00654, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.54e-6, train/loss_step=0.000455, global_step=930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  54%|█████▍    | 43/80 [04:24<03:42,  6.02s/it, loss=0.00654, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.54e-6, train/loss_step=0.000455, global_step=930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  54%|█████▍    | 43/80 [04:24<03:42,  6.02s/it, loss=0.00677, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.85e-5, train/loss_step=0.00484, global_step=930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  55%|█████▌    | 44/80 [04:25<03:32,  5.90s/it, loss=0.00677, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.85e-5, train/loss_step=0.00484, global_step=930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  55%|█████▌    | 44/80 [04:25<03:32,  5.90s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=1.99e-5, train/loss_step=0.00567, global_step=930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  56%|█████▋    | 45/80 [04:30<03:26,  5.89s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=1.99e-5, train/loss_step=0.00567, global_step=930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  56%|█████▋    | 45/80 [04:30<03:26,  5.89s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.33e-6, train/loss_step=0.000464, global_step=931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  57%|█████▊    | 46/80 [04:31<03:16,  5.77s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.33e-6, train/loss_step=0.000464, global_step=931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  57%|█████▊    | 46/80 [04:31<03:16,  5.77s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=1.8e-5, train/loss_step=0.00478, global_step=931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  59%|█████▉    | 47/80 [04:31<03:06,  5.66s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=1.8e-5, train/loss_step=0.00478, global_step=931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  59%|█████▉    | 47/80 [04:31<03:06,  5.66s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=1.54e-5, train/loss_step=0.0044, global_step=931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  60%|██████    | 48/80 [05:12<03:23,  6.37s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0044, train/loss_vlb_step=1.54e-5, train/loss_step=0.0044, global_step=931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  60%|██████    | 48/80 [05:12<03:23,  6.37s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.41e-6, train/loss_step=0.00106, global_step=931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  61%|██████▏   | 49/80 [05:12<03:13,  6.26s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.41e-6, train/loss_step=0.00106, global_step=931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  61%|██████▏   | 49/80 [05:12<03:13,  6.26s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.41e-5, train/loss_step=0.0117, global_step=932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  62%|██████▎   | 50/80 [05:13<03:04,  6.14s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.41e-5, train/loss_step=0.0117, global_step=932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  62%|██████▎   | 50/80 [05:13<03:04,  6.14s/it, loss=0.00649, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=0.000114, train/loss_step=0.0104, global_step=932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  64%|██████▍   | 51/80 [05:13<02:55,  6.03s/it, loss=0.00649, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=0.000114, train/loss_step=0.0104, global_step=932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  64%|██████▍   | 51/80 [05:13<02:55,  6.03s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.48e-6, train/loss_step=0.000317, global_step=932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  65%|██████▌   | 52/80 [05:14<02:46,  5.93s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.48e-6, train/loss_step=0.000317, global_step=932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  65%|██████▌   | 52/80 [05:14<02:46,  5.93s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.98e-6, train/loss_step=0.000641, global_step=932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  66%|██████▋   | 53/80 [05:14<02:37,  5.83s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.98e-6, train/loss_step=0.000641, global_step=932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  66%|██████▋   | 53/80 [05:14<02:37,  5.83s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=5.72e-6, train/loss_step=0.00148, global_step=933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  68%|██████▊   | 54/80 [05:15<02:29,  5.73s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=5.72e-6, train/loss_step=0.00148, global_step=933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  68%|██████▊   | 54/80 [05:15<02:29,  5.73s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.59e-6, train/loss_step=0.00136, global_step=933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  69%|██████▉   | 55/80 [05:15<02:21,  5.64s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=6.59e-6, train/loss_step=0.00136, global_step=933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  69%|██████▉   | 55/80 [05:15<02:21,  5.64s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.24e-6, train/loss_step=0.000418, global_step=933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  70%|███████   | 56/80 [05:49<02:27,  6.14s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.24e-6, train/loss_step=0.000418, global_step=933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  70%|███████   | 56/80 [05:49<02:27,  6.14s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.56e-6, train/loss_step=0.00168, global_step=933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  71%|███████▏  | 57/80 [05:50<02:18,  6.04s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.56e-6, train/loss_step=0.00168, global_step=933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  71%|███████▏  | 57/80 [05:50<02:18,  6.04s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000625, train/loss_vlb_step=1.83e-5, train/loss_step=0.000625, global_step=934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  72%|███████▎  | 58/80 [05:50<02:10,  5.94s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000625, train/loss_vlb_step=1.83e-5, train/loss_step=0.000625, global_step=934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  72%|███████▎  | 58/80 [05:50<02:10,  5.94s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=0.000232, train/loss_step=0.00615, global_step=934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398] Epoch 46:  74%|███████▍  | 59/80 [05:51<02:02,  5.85s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=0.000232, train/loss_step=0.00615, global_step=934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  74%|███████▍  | 59/80 [05:51<02:02,  5.85s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.65e-5, train/loss_step=0.00186, global_step=934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398] Epoch 46:  75%|███████▌  | 60/80 [05:51<01:55,  5.77s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.65e-5, train/loss_step=0.00186, global_step=934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  75%|███████▌  | 60/80 [05:51<01:55,  5.77s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.81e-6, train/loss_step=0.00137, global_step=934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  76%|███████▋  | 61/80 [05:52<01:48,  5.68s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.81e-6, train/loss_step=0.00137, global_step=934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  76%|███████▋  | 61/80 [05:52<01:48,  5.68s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=3.14e-5, train/loss_step=0.00545, global_step=935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  78%|███████▊  | 62/80 [05:52<01:40,  5.60s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=3.14e-5, train/loss_step=0.00545, global_step=935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  78%|███████▊  | 62/80 [05:52<01:40,  5.60s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00064, train/loss_vlb_step=7.29e-6, train/loss_step=0.00064, global_step=935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  79%|███████▉  | 63/80 [05:53<01:33,  5.52s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00064, train/loss_vlb_step=7.29e-6, train/loss_step=0.00064, global_step=935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  79%|███████▉  | 63/80 [05:53<01:33,  5.52s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=9.39e-5, train/loss_step=0.0136, global_step=935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  80%|████████  | 64/80 [06:27<01:35,  5.95s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=9.39e-5, train/loss_step=0.0136, global_step=935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  80%|████████  | 64/80 [06:27<01:35,  5.95s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.01e-6, train/loss_step=0.00166, global_step=935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  81%|████████▏ | 65/80 [06:27<01:28,  5.87s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.01e-6, train/loss_step=0.00166, global_step=935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  81%|████████▏ | 65/80 [06:27<01:28,  5.87s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000636, train/loss_vlb_step=2.91e-6, train/loss_step=0.000636, global_step=936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  82%|████████▎ | 66/80 [06:28<01:21,  5.79s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000636, train/loss_vlb_step=2.91e-6, train/loss_step=0.000636, global_step=936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  82%|████████▎ | 66/80 [06:28<01:21,  5.79s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.1e-6, train/loss_step=0.000275, global_step=936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398] Epoch 46:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.1e-6, train/loss_step=0.000275, global_step=936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=7.59e-6, train/loss_step=0.00193, global_step=936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398] Epoch 46:  85%|████████▌ | 68/80 [06:29<01:07,  5.65s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=7.59e-6, train/loss_step=0.00193, global_step=936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  85%|████████▌ | 68/80 [06:29<01:07,  5.65s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000362, train/loss_vlb_step=1.36e-6, train/loss_step=0.000362, global_step=936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  86%|████████▋ | 69/80 [06:30<01:01,  5.57s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000362, train/loss_vlb_step=1.36e-6, train/loss_step=0.000362, global_step=936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  86%|████████▋ | 69/80 [06:30<01:01,  5.57s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000782, train/loss_vlb_step=4.2e-6, train/loss_step=0.000782, global_step=937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398] Epoch 46:  88%|████████▊ | 70/80 [06:30<00:55,  5.50s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000782, train/loss_vlb_step=4.2e-6, train/loss_step=0.000782, global_step=937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  88%|████████▊ | 70/80 [06:30<00:55,  5.50s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.07e-5, train/loss_step=0.00281, global_step=937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 46:  89%|████████▉ | 71/80 [06:31<00:48,  5.43s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.07e-5, train/loss_step=0.00281, global_step=937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  89%|████████▉ | 71/80 [06:31<00:48,  5.43s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.2e-5, train/loss_step=0.00265, global_step=937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.2e-5, train/loss_step=0.00265, global_step=937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.000685, train/loss_vlb_step=1.21e-5, train/loss_step=0.000685, global_step=937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  91%|█████████▏| 73/80 [07:01<00:39,  5.69s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.000685, train/loss_vlb_step=1.21e-5, train/loss_step=0.000685, global_step=937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  91%|█████████▏| 73/80 [07:01<00:39,  5.69s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.47e-5, train/loss_step=0.0116, global_step=938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]    Epoch 46:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=5.47e-5, train/loss_step=0.0116, global_step=938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=5.86e-6, train/loss_step=0.000518, global_step=938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  94%|█████████▍| 75/80 [07:02<00:27,  5.56s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=5.86e-6, train/loss_step=0.000518, global_step=938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  94%|█████████▍| 75/80 [07:02<00:27,  5.56s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.23e-6, train/loss_step=0.000273, global_step=938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.23e-6, train/loss_step=0.000273, global_step=938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000897, train/loss_vlb_step=9.75e-5, train/loss_step=0.000897, global_step=938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  96%|█████████▋| 77/80 [07:03<00:16,  5.43s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000897, train/loss_vlb_step=9.75e-5, train/loss_step=0.000897, global_step=938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  96%|█████████▋| 77/80 [07:03<00:16,  5.43s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=3.82e-6, train/loss_step=0.000761, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=3.82e-6, train/loss_step=0.000761, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.21e-5, train/loss_step=0.0073, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]     Epoch 46:  99%|█████████▉| 79/80 [07:04<00:05,  5.30s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=3.21e-5, train/loss_step=0.0073, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46:  99%|█████████▉| 79/80 [07:04<00:05,  5.30s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4e-6, train/loss_step=0.00107, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4e-6, train/loss_step=0.00107, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 46: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=4.95e-5, train/loss_step=0.0147, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Average Epoch time: 424.82 seconds
+Average Peak memory 29564.83MiB
+Epoch 46:   0%|          | 0/80 [00:00<00:00, 4359.98it/s, loss=0.00343, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=4.95e-5, train/loss_step=0.0147, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 47:   0%|          | 0/80 [00:00<00:00, 1850.16it/s, loss=0.00343, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=4.95e-5, train/loss_step=0.0147, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]Epoch 47:   1%|▏         | 1/80 [00:37<24:37, 18.71s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=4.95e-5, train/loss_step=0.0147, global_step=939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00398, train/loss_vlb_epoch=5.78e-5, train/loss_epoch=0.00398]  Epoch 47:   1%|▏         | 1/80 [00:37<24:37, 18.71s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=1.08e-6, train/loss_step=0.00029, global_step=940.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:   2%|▎         | 2/80 [00:37<16:25, 12.63s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=1.08e-6, train/loss_step=0.00029, global_step=940.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:   2%|▎         | 2/80 [00:37<16:25, 12.63s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=2.1e-6, train/loss_step=0.000456, global_step=940.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:   4%|▍         | 3/80 [00:38<12:18,  9.60s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=2.1e-6, train/loss_step=0.000456, global_step=940.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:   4%|▍         | 3/80 [00:38<12:18,  9.60s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=1.55e-5, train/loss_step=0.00391, global_step=940.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387] Epoch 47:   5%|▌         | 4/80 [00:41<10:36,  8.38s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=1.55e-5, train/loss_step=0.00391, global_step=940.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:   5%|▌         | 4/80 [00:41<10:36,  8.38s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=9.46e-6, train/loss_step=0.00234, global_step=940.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:   6%|▋         | 5/80 [00:47<09:54,  7.93s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=9.46e-6, train/loss_step=0.00234, global_step=940.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:   6%|▋         | 5/80 [00:47<09:54,  7.93s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.66e-6, train/loss_step=0.0011, global_step=941.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:   8%|▊         | 6/80 [00:48<08:28,  6.87s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.66e-6, train/loss_step=0.0011, global_step=941.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:   8%|▊         | 6/80 [00:48<08:28,  6.87s/it, loss=0.003, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.21e-5, train/loss_step=0.0056, global_step=941.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:   9%|▉         | 7/80 [00:48<07:23,  6.07s/it, loss=0.003, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.21e-5, train/loss_step=0.0056, global_step=941.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:   9%|▉         | 7/80 [00:48<07:23,  6.07s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=9.18e-6, train/loss_step=0.00223, global_step=941.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  10%|█         | 8/80 [01:13<09:49,  8.18s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=9.18e-6, train/loss_step=0.00223, global_step=941.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  10%|█         | 8/80 [01:13<09:49,  8.18s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.0006, train/loss_vlb_step=2.7e-6, train/loss_step=0.0006, global_step=941.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]   Epoch 47:  11%|█▏        | 9/80 [01:14<08:46,  7.42s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.0006, train/loss_vlb_step=2.7e-6, train/loss_step=0.0006, global_step=941.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  11%|█▏        | 9/80 [01:14<08:46,  7.42s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=5.59e-6, train/loss_step=0.000523, global_step=942.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  12%|█▎        | 10/80 [01:16<08:06,  6.95s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=5.59e-6, train/loss_step=0.000523, global_step=942.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  12%|█▎        | 10/80 [01:16<08:06,  6.96s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=0.00155, train/loss_step=0.0036, global_step=942.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]    Epoch 47:  14%|█▍        | 11/80 [01:17<07:22,  6.42s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=0.00155, train/loss_step=0.0036, global_step=942.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  14%|█▍        | 11/80 [01:17<07:22,  6.42s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000774, train/loss_vlb_step=3.27e-6, train/loss_step=0.000774, global_step=942.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  15%|█▌        | 12/80 [01:22<07:09,  6.32s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000774, train/loss_vlb_step=3.27e-6, train/loss_step=0.000774, global_step=942.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  15%|█▌        | 12/80 [01:22<07:10,  6.32s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=3.33e-5, train/loss_step=0.00857, global_step=942.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  16%|█▋        | 13/80 [01:23<06:39,  5.96s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=3.33e-5, train/loss_step=0.00857, global_step=942.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  16%|█▋        | 13/80 [01:23<06:39,  5.96s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.81e-6, train/loss_step=0.00113, global_step=943.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  18%|█▊        | 14/80 [01:24<06:09,  5.60s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.81e-6, train/loss_step=0.00113, global_step=943.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  18%|█▊        | 14/80 [01:24<06:09,  5.60s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=2.1e-6, train/loss_step=0.000531, global_step=943.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  19%|█▉        | 15/80 [01:24<05:43,  5.28s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=2.1e-6, train/loss_step=0.000531, global_step=943.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  19%|█▉        | 15/80 [01:24<05:43,  5.28s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=2.19e-5, train/loss_step=0.00106, global_step=943.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387] Epoch 47:  20%|██        | 16/80 [01:57<07:21,  6.89s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=2.19e-5, train/loss_step=0.00106, global_step=943.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  20%|██        | 16/80 [01:57<07:21,  6.89s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=2.93e-6, train/loss_step=0.000363, global_step=943.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  21%|██▏       | 17/80 [01:57<06:51,  6.54s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=2.93e-6, train/loss_step=0.000363, global_step=943.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  21%|██▏       | 17/80 [01:57<06:51,  6.54s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=5.13e-5, train/loss_step=0.00697, global_step=944.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  22%|██▎       | 18/80 [02:04<06:45,  6.55s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=5.13e-5, train/loss_step=0.00697, global_step=944.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  22%|██▎       | 18/80 [02:04<06:45,  6.55s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=4.81e-6, train/loss_step=0.000454, global_step=944.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  24%|██▍       | 19/80 [02:04<06:20,  6.24s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=4.81e-6, train/loss_step=0.000454, global_step=944.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  24%|██▍       | 19/80 [02:04<06:20,  6.24s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000744, train/loss_vlb_step=3.32e-6, train/loss_step=0.000744, global_step=944.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387] Epoch 47:  25%|██▌       | 20/80 [02:13<06:21,  6.36s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000744, train/loss_vlb_step=3.32e-6, train/loss_step=0.000744, global_step=944.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  25%|██▌       | 20/80 [02:13<06:21,  6.36s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.3e-5, train/loss_step=0.00335, global_step=944.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  26%|██▋       | 21/80 [02:14<05:59,  6.09s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.3e-5, train/loss_step=0.00335, global_step=944.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  26%|██▋       | 21/80 [02:14<05:59,  6.09s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.02e-6, train/loss_step=0.000268, global_step=945.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  28%|██▊       | 22/80 [02:14<05:39,  5.85s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.02e-6, train/loss_step=0.000268, global_step=945.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  28%|██▊       | 22/80 [02:14<05:39,  5.85s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=8.18e-6, train/loss_step=0.00188, global_step=945.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]   Epoch 47:  29%|██▉       | 23/80 [02:15<05:20,  5.63s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=8.18e-6, train/loss_step=0.00188, global_step=945.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  29%|██▉       | 23/80 [02:15<05:20,  5.63s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.16e-6, train/loss_step=0.000285, global_step=945.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  30%|███       | 24/80 [02:37<05:52,  6.30s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.16e-6, train/loss_step=0.000285, global_step=945.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  30%|███       | 24/80 [02:37<05:52,  6.30s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.00103, train/loss_step=0.0242, global_step=945.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]    Epoch 47:  31%|███▏      | 25/80 [02:37<05:34,  6.07s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.00103, train/loss_step=0.0242, global_step=945.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  31%|███▏      | 25/80 [02:37<05:34,  6.07s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=5.78e-6, train/loss_step=0.000563, global_step=946.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  32%|███▎      | 26/80 [02:45<05:30,  6.13s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=5.78e-6, train/loss_step=0.000563, global_step=946.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  32%|███▎      | 26/80 [02:45<05:30,  6.13s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.28e-5, train/loss_step=0.00334, global_step=946.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  34%|███▍      | 27/80 [02:45<05:14,  5.93s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.28e-5, train/loss_step=0.00334, global_step=946.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  34%|███▍      | 27/80 [02:45<05:14,  5.93s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=4.12e-5, train/loss_step=0.00621, global_step=946.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  35%|███▌      | 28/80 [02:46<04:58,  5.74s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=4.12e-5, train/loss_step=0.00621, global_step=946.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  35%|███▌      | 28/80 [02:46<04:58,  5.74s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=4.08e-5, train/loss_step=0.0028, global_step=946.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  36%|███▋      | 29/80 [02:50<04:49,  5.67s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=4.08e-5, train/loss_step=0.0028, global_step=946.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  36%|███▋      | 29/80 [02:50<04:49,  5.67s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=1.96e-5, train/loss_step=0.00123, global_step=947.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  38%|███▊      | 30/80 [02:50<04:35,  5.50s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=1.96e-5, train/loss_step=0.00123, global_step=947.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  38%|███▊      | 30/80 [02:50<04:35,  5.51s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.14e-6, train/loss_step=0.000295, global_step=947.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  39%|███▉      | 31/80 [02:51<04:22,  5.35s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.14e-6, train/loss_step=0.000295, global_step=947.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  39%|███▉      | 31/80 [02:51<04:22,  5.35s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=8.17e-6, train/loss_step=0.00136, global_step=947.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  40%|████      | 32/80 [03:18<04:48,  6.00s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=8.17e-6, train/loss_step=0.00136, global_step=947.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  40%|████      | 32/80 [03:18<04:48,  6.00s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=9.44e-6, train/loss_step=0.00259, global_step=947.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  41%|████▏     | 33/80 [03:18<04:34,  5.84s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=9.44e-6, train/loss_step=0.00259, global_step=947.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  41%|████▏     | 33/80 [03:18<04:34,  5.84s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=6.52e-5, train/loss_step=0.00956, global_step=948.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387] Epoch 47:  42%|████▎     | 34/80 [03:24<04:29,  5.86s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=6.52e-5, train/loss_step=0.00956, global_step=948.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  42%|████▎     | 34/80 [03:24<04:29,  5.86s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=3.99e-5, train/loss_step=0.00787, global_step=948.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  44%|████▍     | 35/80 [03:25<04:16,  5.71s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=3.99e-5, train/loss_step=0.00787, global_step=948.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  44%|████▍     | 35/80 [03:25<04:16,  5.71s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=2.13e-5, train/loss_step=0.000802, global_step=948.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  45%|████▌     | 36/80 [03:25<04:04,  5.57s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=2.13e-5, train/loss_step=0.000802, global_step=948.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  45%|████▌     | 36/80 [03:25<04:04,  5.57s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=4.24e-5, train/loss_step=0.0122, global_step=948.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]    Epoch 47:  46%|████▋     | 37/80 [03:40<04:08,  5.79s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=4.24e-5, train/loss_step=0.0122, global_step=948.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  46%|████▋     | 37/80 [03:40<04:08,  5.79s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=3.66e-6, train/loss_step=0.000851, global_step=949.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  48%|████▊     | 38/80 [03:40<03:57,  5.65s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=3.66e-6, train/loss_step=0.000851, global_step=949.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  48%|████▊     | 38/80 [03:40<03:57,  5.65s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=8.47e-5, train/loss_step=0.00197, global_step=949.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  49%|████▉     | 39/80 [03:41<03:46,  5.53s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=8.47e-5, train/loss_step=0.00197, global_step=949.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  49%|████▉     | 39/80 [03:41<03:46,  5.53s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.83e-5, train/loss_step=0.00654, global_step=949.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  50%|█████     | 40/80 [03:58<03:52,  5.81s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.83e-5, train/loss_step=0.00654, global_step=949.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  50%|█████     | 40/80 [03:58<03:52,  5.81s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=1.67e-6, train/loss_step=0.000441, global_step=949.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  51%|█████▏    | 41/80 [03:59<03:42,  5.70s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=1.67e-6, train/loss_step=0.000441, global_step=949.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  51%|█████▏    | 41/80 [03:59<03:42,  5.70s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=9.76e-5, train/loss_step=0.00621, global_step=950.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  52%|█████▎    | 42/80 [04:07<03:38,  5.75s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=9.76e-5, train/loss_step=0.00621, global_step=950.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  52%|█████▎    | 42/80 [04:07<03:38,  5.75s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=7.1e-5, train/loss_step=0.0124, global_step=950.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]   Epoch 47:  54%|█████▍    | 43/80 [04:10<03:30,  5.69s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=7.1e-5, train/loss_step=0.0124, global_step=950.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  54%|█████▍    | 43/80 [04:10<03:30,  5.69s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=7.74e-7, train/loss_step=0.000189, global_step=950.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  55%|█████▌    | 44/80 [04:10<03:20,  5.57s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=7.74e-7, train/loss_step=0.000189, global_step=950.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  55%|█████▌    | 44/80 [04:10<03:20,  5.57s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=1.33e-5, train/loss_step=0.00393, global_step=950.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  56%|█████▋    | 45/80 [04:17<03:15,  5.59s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=1.33e-5, train/loss_step=0.00393, global_step=950.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  56%|█████▋    | 45/80 [04:17<03:15,  5.59s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.18e-5, train/loss_step=0.0035, global_step=951.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  57%|█████▊    | 46/80 [04:17<03:06,  5.49s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.18e-5, train/loss_step=0.0035, global_step=951.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  57%|█████▊    | 46/80 [04:17<03:06,  5.49s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.47e-5, train/loss_step=0.00913, global_step=951.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  59%|█████▉    | 47/80 [04:18<02:57,  5.38s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=4.47e-5, train/loss_step=0.00913, global_step=951.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  59%|█████▉    | 47/80 [04:18<02:57,  5.38s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.28e-6, train/loss_step=0.00033, global_step=951.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  60%|██████    | 48/80 [04:51<03:10,  5.96s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.28e-6, train/loss_step=0.00033, global_step=951.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  60%|██████    | 48/80 [04:51<03:10,  5.96s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=0.000638, train/loss_step=0.00194, global_step=951.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  61%|██████▏   | 49/80 [04:55<03:02,  5.90s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=0.000638, train/loss_step=0.00194, global_step=951.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  61%|██████▏   | 49/80 [04:55<03:02,  5.90s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=3.86e-5, train/loss_step=0.00908, global_step=952.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387] Epoch 47:  62%|██████▎   | 50/80 [04:55<02:53,  5.79s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=3.86e-5, train/loss_step=0.00908, global_step=952.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  62%|██████▎   | 50/80 [04:55<02:53,  5.79s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=6.76e-5, train/loss_step=0.00144, global_step=952.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  64%|██████▍   | 51/80 [04:55<02:45,  5.69s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=6.76e-5, train/loss_step=0.00144, global_step=952.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  64%|██████▍   | 51/80 [04:55<02:45,  5.69s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=4.83e-6, train/loss_step=0.000619, global_step=952.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  65%|██████▌   | 52/80 [04:56<02:36,  5.60s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=4.83e-6, train/loss_step=0.000619, global_step=952.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  65%|██████▌   | 52/80 [04:56<02:36,  5.60s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=9.9e-5, train/loss_step=0.00907, global_step=952.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]    Epoch 47:  66%|██████▋   | 53/80 [04:59<02:29,  5.54s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00907, train/loss_vlb_step=9.9e-5, train/loss_step=0.00907, global_step=952.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  66%|██████▋   | 53/80 [04:59<02:29,  5.54s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=1.79e-6, train/loss_step=0.000428, global_step=953.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  68%|██████▊   | 54/80 [04:59<02:21,  5.45s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=1.79e-6, train/loss_step=0.000428, global_step=953.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  68%|██████▊   | 54/80 [04:59<02:21,  5.45s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=2.46e-6, train/loss_step=0.000399, global_step=953.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  69%|██████▉   | 55/80 [05:00<02:14,  5.36s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=2.46e-6, train/loss_step=0.000399, global_step=953.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  69%|██████▉   | 55/80 [05:00<02:14,  5.36s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=2.45e-5, train/loss_step=0.00674, global_step=953.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  70%|███████   | 56/80 [05:34<02:20,  5.86s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=2.45e-5, train/loss_step=0.00674, global_step=953.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  70%|███████   | 56/80 [05:34<02:20,  5.86s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=1.81e-5, train/loss_step=0.000747, global_step=953.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  71%|███████▏  | 57/80 [05:36<02:13,  5.80s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=1.81e-5, train/loss_step=0.000747, global_step=953.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  71%|███████▏  | 57/80 [05:36<02:13,  5.80s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000334, train/loss_vlb_step=1.4e-6, train/loss_step=0.000334, global_step=954.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000334, train/loss_vlb_step=1.4e-6, train/loss_step=0.000334, global_step=954.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.93e-5, train/loss_step=0.0106, global_step=954.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]    Epoch 47:  74%|███████▍  | 59/80 [05:37<01:58,  5.62s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.93e-5, train/loss_step=0.0106, global_step=954.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  74%|███████▍  | 59/80 [05:37<01:58,  5.62s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=1.91e-6, train/loss_step=0.000464, global_step=954.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  75%|███████▌  | 60/80 [05:38<01:51,  5.55s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=1.91e-6, train/loss_step=0.000464, global_step=954.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  75%|███████▌  | 60/80 [05:38<01:51,  5.55s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.11e-7, train/loss_step=0.000207, global_step=954.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  76%|███████▋  | 61/80 [05:44<01:45,  5.56s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.11e-7, train/loss_step=0.000207, global_step=954.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  76%|███████▋  | 61/80 [05:44<01:45,  5.56s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=6.75e-5, train/loss_step=0.0127, global_step=955.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]    Epoch 47:  78%|███████▊  | 62/80 [05:45<01:38,  5.48s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=6.75e-5, train/loss_step=0.0127, global_step=955.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  78%|███████▊  | 62/80 [05:45<01:38,  5.48s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.8e-5, train/loss_step=0.00447, global_step=955.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  79%|███████▉  | 63/80 [05:45<01:31,  5.40s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.8e-5, train/loss_step=0.00447, global_step=955.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  79%|███████▉  | 63/80 [05:45<01:31,  5.40s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=2.98e-5, train/loss_step=0.00839, global_step=955.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  80%|████████  | 64/80 [06:17<01:32,  5.80s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=2.98e-5, train/loss_step=0.00839, global_step=955.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  80%|████████  | 64/80 [06:17<01:32,  5.80s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=3.45e-6, train/loss_step=0.00052, global_step=955.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  81%|████████▏ | 65/80 [06:17<01:25,  5.72s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=3.45e-6, train/loss_step=0.00052, global_step=955.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  81%|████████▏ | 65/80 [06:17<01:25,  5.72s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000746, train/loss_vlb_step=3.71e-6, train/loss_step=0.000746, global_step=956.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  82%|████████▎ | 66/80 [06:18<01:19,  5.65s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000746, train/loss_vlb_step=3.71e-6, train/loss_step=0.000746, global_step=956.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  82%|████████▎ | 66/80 [06:18<01:19,  5.65s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=3.04e-5, train/loss_step=0.00817, global_step=956.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  84%|████████▍ | 67/80 [06:21<01:12,  5.62s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00817, train/loss_vlb_step=3.04e-5, train/loss_step=0.00817, global_step=956.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  84%|████████▍ | 67/80 [06:21<01:12,  5.62s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=0.000151, train/loss_step=0.00793, global_step=956.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  85%|████████▌ | 68/80 [06:25<01:07,  5.59s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=0.000151, train/loss_step=0.00793, global_step=956.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  85%|████████▌ | 68/80 [06:25<01:07,  5.59s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.87e-7, train/loss_step=0.000165, global_step=956.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.87e-7, train/loss_step=0.000165, global_step=956.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=0.000236, train/loss_step=0.00481, global_step=957.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387] Epoch 47:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=0.000236, train/loss_step=0.00481, global_step=957.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.92e-5, train/loss_step=0.00447, global_step=957.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.92e-5, train/loss_step=0.00447, global_step=957.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.26e-6, train/loss_step=0.000317, global_step=957.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  90%|█████████ | 72/80 [06:54<00:45,  5.67s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.26e-6, train/loss_step=0.000317, global_step=957.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  90%|█████████ | 72/80 [06:54<00:45,  5.67s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=1.44e-6, train/loss_step=0.000402, global_step=957.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  91%|█████████▏| 73/80 [06:54<00:39,  5.60s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=1.44e-6, train/loss_step=0.000402, global_step=957.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  91%|█████████▏| 73/80 [06:54<00:39,  5.60s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=0.000125, train/loss_step=0.00614, global_step=958.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387] Epoch 47:  92%|█████████▎| 74/80 [06:55<00:33,  5.54s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=0.000125, train/loss_step=0.00614, global_step=958.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  92%|█████████▎| 74/80 [06:55<00:33,  5.54s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.15e-5, train/loss_step=0.010, global_step=958.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]     Epoch 47:  94%|█████████▍| 75/80 [07:00<00:27,  5.54s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.15e-5, train/loss_step=0.010, global_step=958.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  94%|█████████▍| 75/80 [07:00<00:27,  5.54s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.000382, train/loss_vlb_step=2.54e-6, train/loss_step=0.000382, global_step=958.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  95%|█████████▌| 76/80 [07:08<00:22,  5.56s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.000382, train/loss_vlb_step=2.54e-6, train/loss_step=0.000382, global_step=958.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  95%|█████████▌| 76/80 [07:08<00:22,  5.56s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=2.21e-5, train/loss_step=0.00611, global_step=958.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387] Epoch 47:  96%|█████████▋| 77/80 [07:08<00:16,  5.50s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=2.21e-5, train/loss_step=0.00611, global_step=958.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  96%|█████████▋| 77/80 [07:08<00:16,  5.50s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=2.62e-6, train/loss_step=0.000621, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=2.62e-6, train/loss_step=0.000621, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.69e-5, train/loss_step=0.00447, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 47:  99%|█████████▉| 79/80 [07:09<00:05,  5.37s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.69e-5, train/loss_step=0.00447, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47:  99%|████��████▉| 79/80 [07:09<00:05,  5.37s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00777, train/loss_vlb_step=3.01e-5, train/loss_step=0.00777, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47: 100%|██████████| 80/80 [07:10<00:00,  5.31s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00777, train/loss_vlb_step=3.01e-5, train/loss_step=0.00777, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 47: 100%|██████████| 80/80 [07:10<00:00,  5.31s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=2.78e-6, train/loss_step=0.00041, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Average Epoch time: 430.45 seconds
+Average Peak memory 29562.74MiB
+Epoch 47:   0%|          | 0/80 [00:00<00:00, 4378.19it/s, loss=0.00445, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=2.78e-6, train/loss_step=0.00041, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 48:   0%|          | 0/80 [00:00<00:00, 1793.20it/s, loss=0.00445, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=2.78e-6, train/loss_step=0.00041, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]Epoch 48:   1%|▏         | 1/80 [00:43<28:21, 21.54s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=2.78e-6, train/loss_step=0.00041, global_step=959.0, lr_abs=0.0001, train/loss_simple_epoch=0.00387, train/loss_vlb_epoch=8.83e-5, train/loss_epoch=0.00387]  Epoch 48:   1%|▏         | 1/80 [00:43<28:21, 21.54s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.86e-5, train/loss_step=0.0101, global_step=960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:   2%|▎         | 2/80 [00:43<18:52, 14.52s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.86e-5, train/loss_step=0.0101, global_step=960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:   2%|▎         | 2/80 [00:43<18:52, 14.52s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=3.72e-6, train/loss_step=0.00059, global_step=960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:   4%|▍         | 3/80 [00:44<14:07, 11.01s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=3.72e-6, train/loss_step=0.00059, global_step=960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:   4%|▍         | 3/80 [00:44<14:07, 11.01s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000935, train/loss_vlb_step=6.64e-6, train/loss_step=0.000935, global_step=960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:   5%|▌         | 4/80 [00:44<11:17,  8.92s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000935, train/loss_vlb_step=6.64e-6, train/loss_step=0.000935, global_step=960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:   5%|▌         | 4/80 [00:44<11:17,  8.92s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.06e-5, train/loss_step=0.00302, global_step=960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:   6%|▋         | 5/80 [00:45<09:23,  7.51s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.06e-5, train/loss_step=0.00302, global_step=960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:   6%|▋         | 5/80 [00:45<09:23,  7.51s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=3.19e-6, train/loss_step=0.000642, global_step=961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:   8%|▊         | 6/80 [00:45<08:01,  6.51s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=3.19e-6, train/loss_step=0.000642, global_step=961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:   8%|▊         | 6/80 [00:45<08:01,  6.51s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=8.05e-5, train/loss_step=0.011, global_step=961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]      Epoch 48:   9%|▉         | 7/80 [00:46<07:00,  5.76s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=8.05e-5, train/loss_step=0.011, global_step=961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:   9%|▉         | 7/80 [00:46<07:00,  5.76s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=3.68e-6, train/loss_step=0.000409, global_step=961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  10%|█         | 8/80 [01:09<09:15,  7.71s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=3.68e-6, train/loss_step=0.000409, global_step=961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  10%|█         | 8/80 [01:09<09:15,  7.71s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=2.25e-5, train/loss_step=0.00596, global_step=961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  11%|█▏        | 9/80 [01:25<10:03,  8.50s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00596, train/loss_vlb_step=2.25e-5, train/loss_step=0.00596, global_step=961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  11%|█▏        | 9/80 [01:25<10:03,  8.50s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.76e-5, train/loss_step=0.0122, global_step=962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]   Epoch 48:  12%|█▎        | 10/80 [01:25<09:04,  7.77s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.76e-5, train/loss_step=0.0122, global_step=962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  12%|█▎        | 10/80 [01:25<09:04,  7.77s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.35e-6, train/loss_step=0.00119, global_step=962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  14%|█▍        | 11/80 [01:26<08:14,  7.17s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.35e-6, train/loss_step=0.00119, global_step=962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  14%|█▍        | 11/80 [01:26<08:14,  7.17s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=3.26e-6, train/loss_step=0.000662, global_step=962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  15%|█▌        | 12/80 [01:26<07:32,  6.66s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=3.26e-6, train/loss_step=0.000662, global_step=962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  15%|█▌        | 12/80 [01:26<07:32,  6.66s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.35e-6, train/loss_step=0.00028, global_step=962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  16%|█▋        | 13/80 [01:27<06:56,  6.22s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.35e-6, train/loss_step=0.00028, global_step=962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  16%|█▋        | 13/80 [01:27<06:56,  6.22s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00076, train/loss_vlb_step=1.97e-5, train/loss_step=0.00076, global_step=963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  18%|█▊        | 14/80 [01:27<06:25,  5.84s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00076, train/loss_vlb_step=1.97e-5, train/loss_step=0.00076, global_step=963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  18%|█▊        | 14/80 [01:27<06:25,  5.84s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.79e-5, train/loss_step=0.00229, global_step=963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  19%|█▉        | 15/80 [01:28<05:57,  5.50s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.79e-5, train/loss_step=0.00229, global_step=963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  19%|█▉        | 15/80 [01:28<05:57,  5.50s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=1.36e-5, train/loss_step=0.000514, global_step=963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  20%|██        | 16/80 [01:47<06:44,  6.32s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=1.36e-5, train/loss_step=0.000514, global_step=963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  20%|██        | 16/80 [01:47<06:44,  6.32s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.58e-5, train/loss_step=0.00725, global_step=963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419] Epoch 48:  21%|██▏       | 17/80 [02:05<07:20,  7.00s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.58e-5, train/loss_step=0.00725, global_step=963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  21%|██▏       | 17/80 [02:05<07:20,  7.00s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.18e-5, train/loss_step=0.00285, global_step=964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  22%|██▎       | 18/80 [02:09<07:02,  6.81s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00285, train/loss_vlb_step=1.18e-5, train/loss_step=0.00285, global_step=964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  22%|██▎       | 18/80 [02:09<07:02,  6.81s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=2.93e-5, train/loss_step=0.00745, global_step=964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  24%|██▍       | 19/80 [02:09<06:36,  6.49s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=2.93e-5, train/loss_step=0.00745, global_step=964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  24%|██▍       | 19/80 [02:09<06:36,  6.49s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.06e-5, train/loss_step=0.00296, global_step=964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  25%|██▌       | 20/80 [02:10<06:12,  6.21s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.06e-5, train/loss_step=0.00296, global_step=964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  25%|██▌       | 20/80 [02:10<06:12,  6.21s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.49e-5, train/loss_step=0.00226, global_step=964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  26%|██▋       | 21/80 [02:11<05:52,  5.97s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.49e-5, train/loss_step=0.00226, global_step=964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  26%|██▋       | 21/80 [02:11<05:52,  5.97s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=3.24e-6, train/loss_step=0.000442, global_step=965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  28%|██▊       | 22/80 [02:11<05:32,  5.73s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=3.24e-6, train/loss_step=0.000442, global_step=965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  28%|██▊       | 22/80 [02:11<05:32,  5.73s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000522, train/loss_vlb_step=2.9e-6, train/loss_step=0.000522, global_step=965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419] Epoch 48:  29%|██▉       | 23/80 [02:17<05:26,  5.72s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000522, train/loss_vlb_step=2.9e-6, train/loss_step=0.000522, global_step=965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  29%|██▉       | 23/80 [02:17<05:26,  5.72s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000432, train/loss_vlb_step=1.94e-6, train/loss_step=0.000432, global_step=965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  30%|███       | 24/80 [02:34<05:46,  6.18s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000432, train/loss_vlb_step=1.94e-6, train/loss_step=0.000432, global_step=965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  30%|███       | 24/80 [02:34<05:46,  6.18s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000593, train/loss_vlb_step=9.41e-6, train/loss_step=0.000593, global_step=965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  31%|███▏      | 25/80 [02:42<05:44,  6.26s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000593, train/loss_vlb_step=9.41e-6, train/loss_step=0.000593, global_step=965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  31%|███▏      | 25/80 [02:42<05:44,  6.26s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.64e-5, train/loss_step=0.0103, global_step=966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]    Epoch 48:  32%|███▎      | 26/80 [02:58<05:56,  6.61s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.64e-5, train/loss_step=0.0103, global_step=966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  32%|███▎      | 26/80 [02:58<05:56,  6.61s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000841, train/loss_vlb_step=3.82e-6, train/loss_step=0.000841, global_step=966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  34%|███▍      | 27/80 [02:58<05:38,  6.39s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000841, train/loss_vlb_step=3.82e-6, train/loss_step=0.000841, global_step=966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  34%|███▍      | 27/80 [02:58<05:38,  6.39s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=3.7e-5, train/loss_step=0.0086, global_step=966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]     Epoch 48:  35%|███▌      | 28/80 [02:59<05:21,  6.19s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=3.7e-5, train/loss_step=0.0086, global_step=966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  35%|███▌      | 28/80 [02:59<05:21,  6.19s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=1.47e-5, train/loss_step=0.00424, global_step=966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  36%|███▋      | 29/80 [03:00<05:06,  6.00s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=1.47e-5, train/loss_step=0.00424, global_step=966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  36%|███▋      | 29/80 [03:00<05:06,  6.00s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=2.11e-6, train/loss_step=0.000288, global_step=967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  38%|███▊      | 30/80 [03:00<04:51,  5.82s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=2.11e-6, train/loss_step=0.000288, global_step=967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  38%|███▊      | 30/80 [03:00<04:51,  5.82s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=6.49e-6, train/loss_step=0.00143, global_step=967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  39%|███▉      | 31/80 [03:01<04:37,  5.66s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=6.49e-6, train/loss_step=0.00143, global_step=967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  39%|███▉      | 31/80 [03:01<04:37,  5.66s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.25e-5, train/loss_step=0.006, global_step=967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]    Epoch 48:  40%|████      | 32/80 [03:22<04:54,  6.14s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.25e-5, train/loss_step=0.006, global_step=967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  40%|████      | 32/80 [03:22<04:54,  6.14s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.37e-5, train/loss_step=0.00346, global_step=967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  41%|███��▏     | 33/80 [03:25<04:44,  6.06s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00346, train/loss_vlb_step=1.37e-5, train/loss_step=0.00346, global_step=967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  41%|████▏     | 33/80 [03:25<04:44,  6.06s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.19e-5, train/loss_step=0.00333, global_step=968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419] Epoch 48:  42%|████▎     | 34/80 [03:43<04:54,  6.39s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.19e-5, train/loss_step=0.00333, global_step=968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  42%|████▎     | 34/80 [03:43<04:54,  6.39s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=2.8e-5, train/loss_step=0.00679, global_step=968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  44%|████▍     | 35/80 [03:44<04:40,  6.23s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00679, train/loss_vlb_step=2.8e-5, train/loss_step=0.00679, global_step=968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  44%|████▍     | 35/80 [03:44<04:40,  6.23s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000722, train/loss_vlb_step=1.39e-5, train/loss_step=0.000722, global_step=968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  45%|████▌     | 36/80 [03:44<04:27,  6.08s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000722, train/loss_vlb_step=1.39e-5, train/loss_step=0.000722, global_step=968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  45%|████▌     | 36/80 [03:44<04:27,  6.08s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000719, train/loss_vlb_step=2.74e-6, train/loss_step=0.000719, global_step=968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  46%|████▋     | 37/80 [03:45<04:14,  5.93s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000719, train/loss_vlb_step=2.74e-6, train/loss_step=0.000719, global_step=968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  46%|████▋     | 37/80 [03:45<04:14,  5.93s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=1.81e-5, train/loss_step=0.00536, global_step=969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  48%|████▊     | 38/80 [03:45<04:03,  5.79s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=1.81e-5, train/loss_step=0.00536, global_step=969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  48%|████▊     | 38/80 [03:45<04:03,  5.79s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.38e-5, train/loss_step=0.00676, global_step=969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419] Epoch 48:  49%|████▉     | 39/80 [03:46<03:52,  5.66s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.38e-5, train/loss_step=0.00676, global_step=969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  49%|████▉     | 39/80 [03:46<03:52,  5.66s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=8.77e-7, train/loss_step=0.00022, global_step=969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  50%|█████     | 40/80 [03:52<03:47,  5.68s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=8.77e-7, train/loss_step=0.00022, global_step=969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  50%|█████     | 40/80 [03:52<03:47,  5.68s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.37e-5, train/loss_step=0.00981, global_step=969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  51%|█████▏    | 41/80 [04:01<03:44,  5.75s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00981, train/loss_vlb_step=4.37e-5, train/loss_step=0.00981, global_step=969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  51%|█████▏    | 41/80 [04:01<03:44,  5.75s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2e-6, train/loss_step=0.000398, global_step=970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419] Epoch 48:  52%|█████▎    | 42/80 [04:12<03:42,  5.87s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2e-6, train/loss_step=0.000398, global_step=970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  52%|█████▎    | 42/80 [04:12<03:42,  5.87s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000185, train/loss_vlb_step=7.41e-7, train/loss_step=0.000185, global_step=970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  54%|█████▍    | 43/80 [04:12<03:32,  5.75s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000185, train/loss_vlb_step=7.41e-7, train/loss_step=0.000185, global_step=970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  54%|█████▍    | 43/80 [04:12<03:32,  5.75s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.13e-5, train/loss_step=0.00249, global_step=970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  55%|█████▌    | 44/80 [04:13<03:22,  5.63s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.13e-5, train/loss_step=0.00249, global_step=970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  55%|█████▌    | 44/80 [04:13<03:22,  5.63s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=5.44e-6, train/loss_step=0.000566, global_step=970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  56%|█████▋    | 45/80 [04:14<03:13,  5.53s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=5.44e-6, train/loss_step=0.000566, global_step=970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  56%|█████▋    | 45/80 [04:14<03:13,  5.53s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.28e-5, train/loss_step=0.0036, global_step=971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]    Epoch 48:  57%|█████▊    | 46/80 [04:14<03:04,  5.42s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.28e-5, train/loss_step=0.0036, global_step=971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  57%|█████▊    | 46/80 [04:14<03:04,  5.42s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=5.58e-6, train/loss_step=0.00105, global_step=971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  59%|█████▉    | 47/80 [04:36<03:09,  5.75s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=5.58e-6, train/loss_step=0.00105, global_step=971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  59%|█████▉    | 47/80 [04:36<03:09,  5.75s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=7.13e-6, train/loss_step=0.000533, global_step=971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  60%|██████    | 48/80 [04:40<03:03,  5.72s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=7.13e-6, train/loss_step=0.000533, global_step=971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  60%|██████    | 48/80 [04:40<03:03,  5.72s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000683, train/loss_vlb_step=2.42e-6, train/loss_step=0.000683, global_step=971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  61%|██████▏   | 49/80 [04:40<02:54,  5.62s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000683, train/loss_vlb_step=2.42e-6, train/loss_step=0.000683, global_step=971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  61%|██████▏   | 49/80 [04:40<02:54,  5.62s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=0.000194, train/loss_step=0.0148, global_step=972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]   Epoch 48:  62%|██████▎   | 50/80 [04:55<02:53,  5.79s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=0.000194, train/loss_step=0.0148, global_step=972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  62%|██████▎   | 50/80 [04:55<02:53,  5.79s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=7.37e-7, train/loss_step=0.000183, global_step=972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  64%|██████▍   | 51/80 [04:55<02:44,  5.68s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=7.37e-7, train/loss_step=0.000183, global_step=972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  64%|██████▍   | 51/80 [04:55<02:44,  5.68s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.04e-6, train/loss_step=0.00138, global_step=972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  65%|██████▌   | 52/80 [04:56<02:36,  5.59s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=8.04e-6, train/loss_step=0.00138, global_step=972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  65%|██████▌   | 52/80 [04:56<02:36,  5.59s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=5.58e-5, train/loss_step=0.00408, global_step=972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  66%|██████▋   | 53/80 [04:56<02:28,  5.50s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=5.58e-5, train/loss_step=0.00408, global_step=972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  66%|██████▋   | 53/80 [04:56<02:28,  5.50s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=3.49e-5, train/loss_step=0.0106, global_step=973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  68%|██████▊   | 54/80 [04:57<02:20,  5.41s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=3.49e-5, train/loss_step=0.0106, global_step=973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  68%|██████▊   | 54/80 [04:57<02:20,  5.41s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=1.62e-6, train/loss_step=0.000413, global_step=973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  69%|██████▉   | 55/80 [05:27<02:26,  5.85s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=1.62e-6, train/loss_step=0.000413, global_step=973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  69%|██████▉   | 55/80 [05:27<02:26,  5.85s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=3.15e-6, train/loss_step=0.000444, global_step=973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  70%|███████   | 56/80 [05:27<02:18,  5.75s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=3.15e-6, train/loss_step=0.000444, global_step=973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  70%|███████   | 56/80 [05:27<02:18,  5.75s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=3.91e-5, train/loss_step=0.00945, global_step=973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  71%|███████▏  | 57/80 [05:28<02:10,  5.66s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=3.91e-5, train/loss_step=0.00945, global_step=973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  71%|███████▏  | 57/80 [05:28<02:10,  5.66s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.02e-6, train/loss_step=0.000271, global_step=974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  72%|███████▎  | 58/80 [05:42<02:07,  5.80s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.02e-6, train/loss_step=0.000271, global_step=974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  72%|███████▎  | 58/80 [05:42<02:07,  5.80s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=6.68e-6, train/loss_step=0.00178, global_step=974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419] Epoch 48:  74%|███████▍  | 59/80 [05:42<01:59,  5.71s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=6.68e-6, train/loss_step=0.00178, global_step=974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  74%|███████▍  | 59/80 [05:42<01:59,  5.71s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=0.000138, train/loss_step=0.0115, global_step=974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419] Epoch 48:  75%|███████▌  | 60/80 [05:43<01:52,  5.62s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=0.000138, train/loss_step=0.0115, global_step=974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  75%|███████▌  | 60/80 [05:43<01:52,  5.62s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.00802, train/loss_step=0.0332, global_step=974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419] Epoch 48:  76%|███████▋  | 61/80 [05:43<01:45,  5.54s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.0332, train/loss_vlb_step=0.00802, train/loss_step=0.0332, global_step=974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  76%|███████▋  | 61/80 [05:43<01:45,  5.54s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.63e-6, train/loss_step=0.00155, global_step=975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  78%|███████▊  | 62/80 [05:44<01:38,  5.46s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.63e-6, train/loss_step=0.00155, global_step=975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  78%|███████▊  | 62/80 [05:44<01:38,  5.46s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.46e-5, train/loss_step=0.00323, global_step=975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  79%|███████▉  | 63/80 [06:07<01:37,  5.75s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.46e-5, train/loss_step=0.00323, global_step=975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  79%|███████▉  | 63/80 [06:07<01:37,  5.75s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.92e-6, train/loss_step=0.000344, global_step=975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  80%|████████  | 64/80 [06:08<01:30,  5.67s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.92e-6, train/loss_step=0.000344, global_step=975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  80%|████████  | 64/80 [06:08<01:30,  5.67s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=3.68e-6, train/loss_step=0.000407, global_step=975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  81%|████████▏ | 65/80 [06:15<01:25,  5.69s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=3.68e-6, train/loss_step=0.000407, global_step=975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  81%|████████▏ | 65/80 [06:15<01:25,  5.69s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=3.36e-5, train/loss_step=0.00937, global_step=976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  82%|████████▎ | 66/80 [06:16<01:18,  5.61s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=3.36e-5, train/loss_step=0.00937, global_step=976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  82%|████████▎ | 66/80 [06:16<01:18,  5.61s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=2.97e-6, train/loss_step=0.000831, global_step=976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  84%|████████▍ | 67/80 [06:22<01:13,  5.63s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=2.97e-6, train/loss_step=0.000831, global_step=976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  84%|████████▍ | 67/80 [06:22<01:13,  5.63s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=3.46e-5, train/loss_step=0.00176, global_step=976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  85%|████████▌ | 68/80 [06:23<01:06,  5.55s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=3.46e-5, train/loss_step=0.00176, global_step=976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  85%|████████▌ | 68/80 [06:23<01:06,  5.55s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.04e-5, train/loss_step=0.00191, global_step=976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  86%|████████▋ | 69/80 [06:23<01:00,  5.48s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.04e-5, train/loss_step=0.00191, global_step=976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  86%|████████▋ | 69/80 [06:23<01:00,  5.48s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=4.12e-5, train/loss_step=0.00783, global_step=977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  88%|████████▊ | 70/80 [06:24<00:54,  5.41s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=4.12e-5, train/loss_step=0.00783, global_step=977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  88%|████████▊ | 70/80 [06:24<00:54,  5.41s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.86e-6, train/loss_step=0.000454, global_step=977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  89%|████████▉ | 71/80 [06:50<00:51,  5.70s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.86e-6, train/loss_step=0.000454, global_step=977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  89%|████████▉ | 71/80 [06:50<00:51,  5.70s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.1e-5, train/loss_step=0.00166, global_step=977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]   Epoch 48:  90%|█████████ | 72/80 [06:50<00:45,  5.63s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=1.1e-5, train/loss_step=0.00166, global_step=977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  90%|█████████ | 72/80 [06:50<00:45,  5.63s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=2.19e-6, train/loss_step=0.000497, global_step=977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  91%|█████████▏| 73/80 [06:51<00:38,  5.56s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=2.19e-6, train/loss_step=0.000497, global_step=977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  91%|█████████▏| 73/80 [06:51<00:38,  5.56s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=3.49e-5, train/loss_step=0.00897, global_step=978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 48:  92%|█████████▎| 74/80 [06:51<00:32,  5.49s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=3.49e-5, train/loss_step=0.00897, global_step=978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  92%|█████████▎| 74/80 [06:51<00:32,  5.49s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000478, train/loss_vlb_step=3.92e-6, train/loss_step=0.000478, global_step=978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  94%|█████████▍| 75/80 [06:56<00:27,  5.47s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000478, train/loss_vlb_step=3.92e-6, train/loss_step=0.000478, global_step=978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  94%|█████████▍| 75/80 [06:56<00:27,  5.47s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=0.000613, train/loss_step=0.00163, global_step=978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  95%|█████████▌| 76/80 [06:56<00:21,  5.41s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=0.000613, train/loss_step=0.00163, global_step=978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  95%|█████████▌| 76/80 [06:56<00:21,  5.41s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.41e-6, train/loss_step=0.00117, global_step=978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419] Epoch 48:  96%|█████████▋| 77/80 [06:59<00:16,  5.38s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.41e-6, train/loss_step=0.00117, global_step=978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  96%|█████████▋| 77/80 [06:59<00:16,  5.38s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=7.68e-6, train/loss_step=0.00207, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  98%|█████████▊| 78/80 [07:00<00:10,  5.32s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=7.68e-6, train/loss_step=0.00207, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  98%|█████████▊| 78/80 [07:00<00:10,  5.32s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.93e-5, train/loss_step=0.012, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]    Epoch 48:  99%|█████████▉| 79/80 [07:00<00:05,  5.26s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.93e-5, train/loss_step=0.012, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48:  99%|█████████▉| 79/80 [07:00<00:05,  5.26s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000812, train/loss_vlb_step=3.19e-5, train/loss_step=0.000812, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48: 100%|██████████| 80/80 [07:01<00:00,  5.20s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000812, train/loss_vlb_step=3.19e-5, train/loss_step=0.000812, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 48: 100%|██████████| 80/80 [07:01<00:00,  5.20s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.12e-6, train/loss_step=0.000261, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Average Epoch time: 421.08 seconds
+Average Peak memory 29563.66MiB
+Epoch 48:   0%|          | 0/80 [00:00<00:00, 3971.88it/s, loss=0.00286, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.12e-6, train/loss_step=0.000261, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 49:   0%|          | 0/80 [00:00<00:00, 1752.01it/s, loss=0.00286, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.12e-6, train/loss_step=0.000261, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]Epoch 49:   1%|▏         | 1/80 [00:41<27:12, 20.67s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.12e-6, train/loss_step=0.000261, global_step=979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.00014, train/loss_epoch=0.00419]  Epoch 49:   1%|▏         | 1/80 [00:41<27:12, 20.67s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=5.99e-6, train/loss_step=0.00141, global_step=980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:   2%|▎         | 2/80 [00:46<20:02, 15.42s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=5.99e-6, train/loss_step=0.00141, global_step=980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   2%|▎         | 2/80 [00:46<20:02, 15.42s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=1.74e-5, train/loss_step=0.00507, global_step=980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   4%|▍         | 3/80 [00:54<17:34, 13.69s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=1.74e-5, train/loss_step=0.00507, global_step=980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   4%|▍         | 3/80 [00:54<17:34, 13.69s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.21e-5, train/loss_step=0.00674, global_step=980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   5%|▌         | 4/80 [00:55<14:00, 11.06s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=3.21e-5, train/loss_step=0.00674, global_step=980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   5%|▌         | 4/80 [00:55<14:00, 11.06s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.04e-6, train/loss_step=0.000273, global_step=980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   6%|▋         | 5/80 [00:59<12:28,  9.98s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.04e-6, train/loss_step=0.000273, global_step=980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   6%|▋         | 5/80 [00:59<12:28,  9.98s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.17e-5, train/loss_step=0.0034, global_step=981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]    Epoch 49:   8%|▊         | 6/80 [01:00<10:37,  8.62s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.17e-5, train/loss_step=0.0034, global_step=981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   8%|▊         | 6/80 [01:00<10:37,  8.62s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=8.74e-6, train/loss_step=0.0022, global_step=981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   9%|▉         | 7/80 [01:00<09:15,  7.61s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=8.74e-6, train/loss_step=0.0022, global_step=981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:   9%|▉         | 7/80 [01:00<09:15,  7.61s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=3.95e-5, train/loss_step=0.00906, global_step=981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  10%|█         | 8/80 [01:21<10:49,  9.02s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=3.95e-5, train/loss_step=0.00906, global_step=981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  10%|█         | 8/80 [01:21<10:49,  9.02s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000703, train/loss_vlb_step=2.74e-5, train/loss_step=0.000703, global_step=981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  11%|█▏        | 9/80 [01:21<09:40,  8.17s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000703, train/loss_vlb_step=2.74e-5, train/loss_step=0.000703, global_step=981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  11%|█▏        | 9/80 [01:21<09:40,  8.17s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=7.71e-7, train/loss_step=0.000181, global_step=982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  12%|█▎        | 10/80 [01:22<08:47,  7.54s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=7.71e-7, train/loss_step=0.000181, global_step=982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  12%|█▎        | 10/80 [01:22<08:47,  7.54s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=7.95e-6, train/loss_step=0.00205, global_step=982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  14%|█��        | 11/80 [01:31<08:45,  7.61s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=7.95e-6, train/loss_step=0.00205, global_step=982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  14%|█▍        | 11/80 [01:31<08:45,  7.61s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=2.14e-5, train/loss_step=0.00187, global_step=982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  15%|█▌        | 12/80 [01:31<08:00,  7.07s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=2.14e-5, train/loss_step=0.00187, global_step=982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  15%|█▌        | 12/80 [01:31<08:00,  7.07s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.09e-5, train/loss_step=0.00266, global_step=982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  16%|█▋        | 13/80 [01:42<08:10,  7.32s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=1.09e-5, train/loss_step=0.00266, global_step=982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  16%|█▋        | 13/80 [01:42<08:10,  7.32s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=8.67e-7, train/loss_step=0.000222, global_step=983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  18%|█▊        | 14/80 [01:42<07:33,  6.87s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=8.67e-7, train/loss_step=0.000222, global_step=983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  18%|█▊        | 14/80 [01:42<07:33,  6.87s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000134, train/loss_step=0.015, global_step=983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]     Epoch 49:  19%|█▉        | 15/80 [01:43<07:00,  6.47s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000134, train/loss_step=0.015, global_step=983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  19%|█▉        | 15/80 [01:43<07:00,  6.47s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000527, train/loss_vlb_step=3.07e-6, train/loss_step=0.000527, global_step=983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  20%|██        | 16/80 [02:03<07:44,  7.27s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000527, train/loss_vlb_step=3.07e-6, train/loss_step=0.000527, global_step=983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  20%|██        | 16/80 [02:03<07:44,  7.27s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=9.27e-6, train/loss_step=0.00133, global_step=983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  21%|██▏       | 17/80 [02:04<07:14,  6.89s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=9.27e-6, train/loss_step=0.00133, global_step=983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  21%|██▏       | 17/80 [02:04<07:14,  6.89s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000154, train/loss_step=0.0125, global_step=984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396] Epoch 49:  22%|██▎       | 18/80 [02:07<06:54,  6.69s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000154, train/loss_step=0.0125, global_step=984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  22%|██▎       | 18/80 [02:07<06:54,  6.69s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000214, train/loss_vlb_step=7.48e-7, train/loss_step=0.000214, global_step=984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  24%|██▍       | 19/80 [02:18<07:01,  6.91s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000214, train/loss_vlb_step=7.48e-7, train/loss_step=0.000214, global_step=984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  24%|██▍       | 19/80 [02:18<07:01,  6.91s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=9.65e-7, train/loss_step=0.000233, global_step=984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  25%|██▌       | 20/80 [02:18<06:36,  6.61s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=9.65e-7, train/loss_step=0.000233, global_step=984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  25%|██▌       | 20/80 [02:18<06:36,  6.61s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=9.7e-6, train/loss_step=0.0026, global_step=984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]     Epoch 49:  26%|██▋       | 21/80 [02:24<06:28,  6.59s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=9.7e-6, train/loss_step=0.0026, global_step=984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  26%|██▋       | 21/80 [02:24<06:28,  6.59s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=9.54e-6, train/loss_step=0.00261, global_step=985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  28%|██▊       | 22/80 [02:25<06:06,  6.32s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=9.54e-6, train/loss_step=0.00261, global_step=985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  28%|██▊       | 22/80 [02:25<06:06,  6.32s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=0.000105, train/loss_step=0.00262, global_step=985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  29%|██▉       | 23/80 [02:25<05:46,  6.08s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=0.000105, train/loss_step=0.00262, global_step=985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  29%|██▉       | 23/80 [02:25<05:46,  6.08s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.75e-5, train/loss_step=0.00226, global_step=985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396] Epoch 49:  30%|███       | 24/80 [02:40<05:59,  6.41s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.75e-5, train/loss_step=0.00226, global_step=985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  30%|███       | 24/80 [02:40<05:59,  6.41s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=2.39e-6, train/loss_step=0.000541, global_step=985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  31%|███▏      | 25/80 [02:40<05:40,  6.19s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=2.39e-6, train/loss_step=0.000541, global_step=985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  31%|███▏      | 25/80 [02:40<05:40,  6.19s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=1.46e-5, train/loss_step=0.00392, global_step=986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  32%|███▎      | 26/80 [02:41<05:22,  5.98s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=1.46e-5, train/loss_step=0.00392, global_step=986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  32%|███▎      | 26/80 [02:41<05:22,  5.98s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.02e-6, train/loss_step=0.000259, global_step=986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  34%|███▍      | 27/80 [02:50<05:23,  6.10s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.02e-6, train/loss_step=0.000259, global_step=986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  34%|███▍      | 27/80 [02:50<05:23,  6.10s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=4.73e-6, train/loss_step=0.000734, global_step=986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  35%|███▌      | 28/80 [02:52<05:09,  5.96s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=4.73e-6, train/loss_step=0.000734, global_step=986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  35%|███▌      | 28/80 [02:52<05:09,  5.96s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.49e-5, train/loss_step=0.00419, global_step=986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  36%|███▋      | 29/80 [03:02<05:09,  6.07s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.49e-5, train/loss_step=0.00419, global_step=986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  36%|███▋      | 29/80 [03:02<05:09,  6.07s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.43e-6, train/loss_step=0.000287, global_step=987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.43e-6, train/loss_step=0.000287, global_step=987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=9.41e-5, train/loss_step=0.0173, global_step=987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]    Epoch 49:  39%|███▉      | 31/80 [03:03<04:40,  5.72s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=9.41e-5, train/loss_step=0.0173, global_step=987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  39%|███▉      | 31/80 [03:03<04:40,  5.72s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.000128, train/loss_step=0.0203, global_step=987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  40%|████      | 32/80 [03:11<04:38,  5.80s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0203, train/loss_vlb_step=0.000128, train/loss_step=0.0203, global_step=987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  40%|████      | 32/80 [03:11<04:38,  5.80s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.26e-5, train/loss_step=0.00597, global_step=987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  41%|████▏     | 33/80 [03:16<04:32,  5.79s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=3.26e-5, train/loss_step=0.00597, global_step=987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  41%|████▏     | 33/80 [03:16<04:32,  5.79s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.00112, train/loss_step=0.0124, global_step=988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  42%|████▎     | 34/80 [03:32<04:39,  6.07s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.00112, train/loss_step=0.0124, global_step=988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  42%|████▎     | 34/80 [03:32<04:39,  6.07s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.75e-5, train/loss_step=0.00165, global_step=988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  44%|████▍     | 35/80 [03:33<04:26,  5.92s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.75e-5, train/loss_step=0.00165, global_step=988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  44%|████▍     | 35/80 [03:33<04:26,  5.92s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=4e-5, train/loss_step=0.00725, global_step=988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]   Epoch 49:  45%|████▌     | 36/80 [03:33<04:13,  5.77s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=4e-5, train/loss_step=0.00725, global_step=988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  45%|████▌     | 36/80 [03:33<04:14,  5.77s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.23e-5, train/loss_step=0.00599, global_step=988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  46%|████▋     | 37/80 [03:41<04:10,  5.83s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=3.23e-5, train/loss_step=0.00599, global_step=988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  46%|████▋     | 37/80 [03:41<04:10,  5.83s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=5.49e-6, train/loss_step=0.00051, global_step=989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  48%|████▊     | 38/80 [03:42<03:59,  5.69s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=5.49e-6, train/loss_step=0.00051, global_step=989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  48%|████▊     | 38/80 [03:42<03:59,  5.69s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.18e-6, train/loss_step=0.000237, global_step=989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  49%|████▉     | 39/80 [03:42<03:48,  5.56s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.18e-6, train/loss_step=0.000237, global_step=989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  49%|████▉     | 39/80 [03:42<03:48,  5.56s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=1.45e-5, train/loss_step=0.00438, global_step=989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]   Epoch 49:  50%|█████     | 40/80 [03:55<03:49,  5.74s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=1.45e-5, train/loss_step=0.00438, global_step=989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  50%|█████     | 40/80 [03:55<03:49,  5.74s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=2.28e-6, train/loss_step=0.000547, global_step=989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  51%|█████▏    | 41/80 [03:55<03:39,  5.62s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=2.28e-6, train/loss_step=0.000547, global_step=989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  51%|█████▏    | 41/80 [03:55<03:39,  5.62s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=1.91e-5, train/loss_step=0.00461, global_step=990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  52%|█████▎    | 42/80 [04:21<03:50,  6.07s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=1.91e-5, train/loss_step=0.00461, global_step=990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  52%|█████▎    | 42/80 [04:21<03:50,  6.07s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000342, train/loss_step=0.0165, global_step=990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  54%|█████▍    | 43/80 [04:21<03:40,  5.95s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000342, train/loss_step=0.0165, global_step=990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  54%|█████▍    | 43/80 [04:21<03:40,  5.95s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=2.82e-6, train/loss_step=0.000337, global_step=990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  55%|█████▌    | 44/80 [04:22<03:29,  5.83s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=2.82e-6, train/loss_step=0.000337, global_step=990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  55%|█████▌    | 44/80 [04:22<03:29,  5.83s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.000999, train/loss_step=0.0157, global_step=990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  56%|█████▋    | 45/80 [04:29<03:24,  5.85s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.000999, train/loss_step=0.0157, global_step=990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  56%|█████▋    | 45/80 [04:29<03:24,  5.85s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.23e-5, train/loss_step=0.00321, global_step=991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  57%|█████▊    | 46/80 [04:29<03:14,  5.74s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.23e-5, train/loss_step=0.00321, global_step=991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  57%|█████▊    | 46/80 [04:29<03:14,  5.74s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=8.05e-7, train/loss_step=0.000204, global_step=991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=8.05e-7, train/loss_step=0.000204, global_step=991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.36e-5, train/loss_step=0.00384, global_step=991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  60%|██████    | 48/80 [04:33<02:58,  5.58s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.36e-5, train/loss_step=0.00384, global_step=991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  60%|██████    | 48/80 [04:33<02:58,  5.58s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.00071, train/loss_vlb_step=4e-6, train/loss_step=0.00071, global_step=991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]    Epoch 49:  61%|██████▏   | 49/80 [04:42<02:54,  5.64s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.00071, train/loss_vlb_step=4e-6, train/loss_step=0.00071, global_step=991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  61%|██████▏   | 49/80 [04:42<02:54,  5.64s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=1.45e-5, train/loss_step=0.000702, global_step=992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  62%|██████▎   | 50/80 [05:13<03:04,  6.15s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=1.45e-5, train/loss_step=0.000702, global_step=992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  62%|██████▎   | 50/80 [05:13<03:04,  6.15s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.77e-6, train/loss_step=0.000339, global_step=992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  64%|██████▍   | 51/80 [05:14<02:55,  6.05s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.77e-6, train/loss_step=0.000339, global_step=992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  64%|██████▍   | 51/80 [05:14<02:55,  6.05s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=9.11e-5, train/loss_step=0.0125, global_step=992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]    Epoch 49:  65%|██████▌   | 52/80 [05:14<02:46,  5.94s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=9.11e-5, train/loss_step=0.0125, global_step=992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  65%|██████▌   | 52/80 [05:14<02:46,  5.94s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=0.000453, train/loss_step=0.0204, global_step=992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  66%|██████▋   | 53/80 [05:15<02:37,  5.84s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=0.000453, train/loss_step=0.0204, global_step=992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  66%|██████▋   | 53/80 [05:15<02:37,  5.84s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000532, train/loss_vlb_step=5.78e-6, train/loss_step=0.000532, global_step=993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000532, train/loss_vlb_step=5.78e-6, train/loss_step=0.000532, global_step=993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.00493, v_num=0, train/loss_simple_step=9.81e-5, train/loss_vlb_step=4.08e-7, train/loss_step=9.81e-5, global_step=993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  69%|██████▉   | 55/80 [05:16<02:21,  5.65s/it, loss=0.00493, v_num=0, train/loss_simple_step=9.81e-5, train/loss_vlb_step=4.08e-7, train/loss_step=9.81e-5, global_step=993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  69%|██████▉   | 55/80 [05:16<02:21,  5.65s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=5.45e-5, train/loss_step=0.014, global_step=993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]    Epoch 49:  70%|███████   | 56/80 [05:17<02:13,  5.56s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=5.45e-5, train/loss_step=0.014, global_step=993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  70%|███████   | 56/80 [05:17<02:13,  5.56s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.44e-5, train/loss_step=0.00409, global_step=993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  71%|███████▏  | 57/80 [05:36<02:13,  5.81s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.44e-5, train/loss_step=0.00409, global_step=993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  71%|███████▏  | 57/80 [05:36<02:13,  5.81s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=1.23e-5, train/loss_step=0.00153, global_step=994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  72%|███████▎  | 58/80 [05:51<02:11,  5.97s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=1.23e-5, train/loss_step=0.00153, global_step=994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  72%|███████▎  | 58/80 [05:51<02:11,  5.97s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=9.86e-6, train/loss_step=0.00296, global_step=994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  74%|███████▍  | 59/80 [05:52<02:03,  5.87s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=9.86e-6, train/loss_step=0.00296, global_step=994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  74%|███████▍  | 59/80 [05:52<02:03,  5.87s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=1.21e-5, train/loss_step=0.000825, global_step=994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  75%|███████▌  | 60/80 [05:52<01:55,  5.79s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=1.21e-5, train/loss_step=0.000825, global_step=994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  75%|███████▌  | 60/80 [05:52<01:55,  5.79s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=9.12e-6, train/loss_step=0.00262, global_step=994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=9.12e-6, train/loss_step=0.00262, global_step=994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=1.79e-6, train/loss_step=0.000322, global_step=995.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  78%|███████▊  | 62/80 [05:54<01:41,  5.62s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=1.79e-6, train/loss_step=0.000322, global_step=995.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  78%|███████▊  | 62/80 [05:54<01:41,  5.62s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000979, train/loss_vlb_step=5.24e-6, train/loss_step=0.000979, global_step=995.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  79%|███████▉  | 63/80 [05:54<01:34,  5.54s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000979, train/loss_vlb_step=5.24e-6, train/loss_step=0.000979, global_step=995.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  79%|███████▉  | 63/80 [05:54<01:34,  5.54s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=1.2e-5, train/loss_step=0.000494, global_step=995.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  80%|████████  | 64/80 [05:55<01:27,  5.46s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=1.2e-5, train/loss_step=0.000494, global_step=995.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  80%|████████  | 64/80 [05:55<01:27,  5.46s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.03e-5, train/loss_step=0.00234, global_step=995.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  81%|████████▏ | 65/80 [06:25<01:27,  5.84s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.03e-5, train/loss_step=0.00234, global_step=995.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  81%|████████▏ | 65/80 [06:25<01:27,  5.84s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=3.88e-5, train/loss_step=0.00937, global_step=996.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  82%|████████▎ | 66/80 [06:26<01:20,  5.76s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=3.88e-5, train/loss_step=0.00937, global_step=996.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  82%|████████▎ | 66/80 [06:26<01:20,  5.76s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.2e-5, train/loss_step=0.0104, global_step=996.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]   Epoch 49:  84%|████████▍ | 67/80 [06:26<01:13,  5.69s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.2e-5, train/loss_step=0.0104, global_step=996.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  84%|████████▍ | 67/80 [06:26<01:13,  5.69s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000272, train/loss_vlb_step=1.16e-6, train/loss_step=0.000272, global_step=996.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  85%|████████▌ | 68/80 [06:27<01:07,  5.61s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000272, train/loss_vlb_step=1.16e-6, train/loss_step=0.000272, global_step=996.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  85%|████████▌ | 68/80 [06:27<01:07,  5.61s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.71e-5, train/loss_step=0.00499, global_step=996.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.71e-5, train/loss_step=0.00499, global_step=996.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.07e-5, train/loss_step=0.00298, global_step=997.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396] Epoch 49:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.07e-5, train/loss_step=0.00298, global_step=997.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  88%|████████▊ | 70/80 [06:28<00:54,  5.47s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=1.61e-5, train/loss_step=0.00154, global_step=997.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=1.61e-5, train/loss_step=0.00154, global_step=997.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  89%|████████▉ | 71/80 [06:28<00:48,  5.40s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=9.23e-5, train/loss_step=0.00549, global_step=997.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  90%|█████████ | 72/80 [06:31<00:42,  5.36s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=9.23e-5, train/loss_step=0.00549, global_step=997.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  90%|█████████ | 72/80 [06:31<00:42,  5.36s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=5.86e-6, train/loss_step=0.00141, global_step=997.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  91%|█████████▏| 73/80 [06:53<00:39,  5.58s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=5.86e-6, train/loss_step=0.00141, global_step=997.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  91%|█████████▏| 73/80 [06:53<00:39,  5.58s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=2.97e-5, train/loss_step=0.00713, global_step=998.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  92%|█████████▎| 74/80 [06:56<00:33,  5.56s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=2.97e-5, train/loss_step=0.00713, global_step=998.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  92%|█████████▎| 74/80 [06:56<00:33,  5.56s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00066, train/loss_vlb_step=1.89e-5, train/loss_step=0.00066, global_step=998.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  94%|█████████▍| 75/80 [06:57<00:27,  5.49s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00066, train/loss_vlb_step=1.89e-5, train/loss_step=0.00066, global_step=998.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  94%|█████████▍| 75/80 [06:57<00:27,  5.49s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000196, train/loss_vlb_step=9.06e-7, train/loss_step=0.000196, global_step=998.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  95%|█████████▌| 76/80 [06:57<00:21,  5.42s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000196, train/loss_vlb_step=9.06e-7, train/loss_step=0.000196, global_step=998.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  95%|█████████▌| 76/80 [06:57<00:21,  5.42s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.94e-6, train/loss_step=0.000367, global_step=998.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  96%|█████████▋| 77/80 [07:03<00:16,  5.43s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.94e-6, train/loss_step=0.000367, global_step=998.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  96%|█████████▋| 77/80 [07:03<00:16,  5.43s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00078, train/loss_vlb_step=4.35e-6, train/loss_step=0.00078, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 49:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00078, train/loss_vlb_step=4.35e-6, train/loss_step=0.00078, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=6.67e-6, train/loss_step=0.00117, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  99%|█████████▉| 79/80 [07:19<00:05,  5.49s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=6.67e-6, train/loss_step=0.00117, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49:  99%|█████████▉| 79/80 [07:19<00:05,  5.49s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1e-5, train/loss_step=0.00274, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]   Epoch 49: 100%|██████████| 80/80 [07:19<00:00,  5.43s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1e-5, train/loss_step=0.00274, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 49: 100%|██████████| 80/80 [07:19<00:00,  5.43s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=6.02e-7, train/loss_step=0.00017, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Average Epoch time: 439.77 seconds
+Average Peak memory 29564.70MiB
+Epoch 49:   0%|          | 0/80 [00:00<00:00, 4702.13it/s, loss=0.00269, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=6.02e-7, train/loss_step=0.00017, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 50:   0%|          | 0/80 [00:00<00:00, 2023.30it/s, loss=0.00269, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=6.02e-7, train/loss_step=0.00017, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]Epoch 50:   1%|▏         | 1/80 [00:43<28:56, 21.99s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=6.02e-7, train/loss_step=0.00017, global_step=999.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=7.74e-5, train/loss_epoch=0.00396]  Epoch 50:   1%|▏         | 1/80 [00:43<28:56, 21.99s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=1.13e-5, train/loss_step=0.00125, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]    Epoch 50:   2%|▎         | 2/80 [00:52<22:39, 17.43s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=1.13e-5, train/loss_step=0.00125, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   2%|▎         | 2/80 [00:52<22:39, 17.43s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000605, train/loss_step=0.0307, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:   4%|▍         | 3/80 [00:52<16:55, 13.19s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.000605, train/loss_step=0.0307, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   4%|▍         | 3/80 [00:52<16:55, 13.19s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.62e-6, train/loss_step=0.000321, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   5%|▌         | 4/80 [00:53<13:30, 10.66s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.62e-6, train/loss_step=0.000321, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   5%|▌         | 4/80 [00:53<13:30, 10.66s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=6.45e-7, train/loss_step=0.000157, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   6%|▋         | 5/80 [00:53<11:12,  8.97s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=6.45e-7, train/loss_step=0.000157, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   6%|▋         | 5/80 [00:53<11:12,  8.97s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000156, train/loss_vlb_step=9.07e-7, train/loss_step=0.000156, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   8%|▊         | 6/80 [00:54<09:33,  7.76s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000156, train/loss_vlb_step=9.07e-7, train/loss_step=0.000156, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   8%|▊         | 6/80 [00:54<09:33,  7.76s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=1.33e-6, train/loss_step=0.000347, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   9%|▉         | 7/80 [00:54<08:19,  6.85s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=1.33e-6, train/loss_step=0.000347, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:   9%|▉         | 7/80 [00:54<08:19,  6.85s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=0.000131, train/loss_step=0.0118, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]   Epoch 50:  10%|█         | 8/80 [01:23<11:10,  9.31s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=0.000131, train/loss_step=0.0118, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  10%|█         | 8/80 [01:23<11:10,  9.31s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=7.53e-6, train/loss_step=0.00086, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  11%|█▏        | 9/80 [01:24<09:58,  8.43s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=7.53e-6, train/loss_step=0.00086, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  11%|█▏        | 9/80 [01:24<09:58,  8.43s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=6.55e-6, train/loss_step=0.00145, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  12%|█▎        | 10/80 [01:36<10:13,  8.76s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=6.55e-6, train/loss_step=0.00145, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  12%|█▎        | 10/80 [01:36<10:13,  8.76s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000147, train/loss_vlb_step=6.04e-7, train/loss_step=0.000147, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  14%|█▍        | 11/80 [01:36<09:16,  8.07s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000147, train/loss_vlb_step=6.04e-7, train/loss_step=0.000147, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  14%|█▍        | 11/80 [01:36<09:16,  8.07s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=6.23e-7, train/loss_step=0.00015, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]   Epoch 50:  15%|█▌        | 12/80 [01:37<08:29,  7.49s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=6.23e-7, train/loss_step=0.00015, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  15%|█▌        | 12/80 [01:37<08:29,  7.49s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=2.65e-5, train/loss_step=0.00724, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  16%|█▋        | 13/80 [01:37<07:48,  6.99s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=2.65e-5, train/loss_step=0.00724, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  16%|█▋        | 13/80 [01:37<07:48,  6.99s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=3.96e-6, train/loss_step=0.00109, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  18%|█▊        | 14/80 [01:38<07:12,  6.56s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=3.96e-6, train/loss_step=0.00109, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  18%|█▊        | 14/80 [01:38<07:12,  6.56s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=7.68e-6, train/loss_step=0.00135, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  19%|█▉        | 15/80 [01:38<06:41,  6.18s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=7.68e-6, train/loss_step=0.00135, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  19%|█▉        | 15/80 [01:38<06:41,  6.18s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=8.27e-6, train/loss_step=0.00195, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  20%|██        | 16/80 [02:08<08:04,  7.57s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=8.27e-6, train/loss_step=0.00195, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  20%|██        | 16/80 [02:08<08:04,  7.57s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000124, train/loss_step=0.0109, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  21%|██▏       | 17/80 [02:09<07:32,  7.18s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000124, train/loss_step=0.0109, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  21%|██▏       | 17/80 [02:09<07:32,  7.18s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.38e-5, train/loss_step=0.0113, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  22%|██▎       | 18/80 [02:09<07:03,  6.83s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.38e-5, train/loss_step=0.0113, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  22%|██▎       | 18/80 [02:09<07:03,  6.83s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=1.22e-5, train/loss_step=0.00074, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  24%|██▍       | 19/80 [02:14<06:50,  6.73s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=1.22e-5, train/loss_step=0.00074, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  24%|██▍       | 19/80 [02:14<06:50,  6.73s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000155, train/loss_step=0.0136, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  25%|██▌       | 20/80 [02:15<06:26,  6.43s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000155, train/loss_step=0.0136, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  25%|██▌       | 20/80 [02:15<06:26,  6.43s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.2e-5, train/loss_step=0.00291, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  26%|██▋       | 21/80 [02:15<06:03,  6.17s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00291, train/loss_vlb_step=1.2e-5, train/loss_step=0.00291, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  26%|██▋       | 21/80 [02:15<06:03,  6.17s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.46e-5, train/loss_step=0.00671, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  28%|██▊       | 22/80 [02:16<05:43,  5.92s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.46e-5, train/loss_step=0.00671, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  28%|██▊       | 22/80 [02:16<05:43,  5.92s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=1.57e-6, train/loss_step=0.000332, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  29%|██▉       | 23/80 [02:16<05:24,  5.69s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=1.57e-6, train/loss_step=0.000332, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  29%|██▉       | 23/80 [02:16<05:24,  5.69s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.28e-6, train/loss_step=0.00032, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  30%|███       | 24/80 [02:40<05:58,  6.41s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.28e-6, train/loss_step=0.00032, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  30%|███       | 24/80 [02:40<05:58,  6.41s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.55e-6, train/loss_step=0.00033, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  31%|███▏      | 25/80 [02:40<05:40,  6.18s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.55e-6, train/loss_step=0.00033, global_step=1e+3, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  31%|███▏      | 25/80 [02:40<05:40,  6.18s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=5.09e-5, train/loss_step=0.00714, global_step=1006.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  32%|███▎      | 26/80 [02:57<05:54,  6.56s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=5.09e-5, train/loss_step=0.00714, global_step=1006.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  32%|███▎      | 26/80 [02:57<05:54,  6.56s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000764, train/loss_vlb_step=3.56e-6, train/loss_step=0.000764, global_step=1006.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  34%|███▍      | 27/80 [02:57<05:36,  6.35s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000764, train/loss_vlb_step=3.56e-6, train/loss_step=0.000764, global_step=1006.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  34%|███▍      | 27/80 [02:57<05:36,  6.35s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=6.68e-6, train/loss_step=0.00135, global_step=1006.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  35%|███▌      | 28/80 [02:58<05:19,  6.15s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=6.68e-6, train/loss_step=0.00135, global_step=1006.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  35%|███▌      | 28/80 [02:58<05:19,  6.15s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.27e-5, train/loss_step=0.0037, global_step=1006.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  36%|███▋      | 29/80 [02:58<05:03,  5.96s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0037, train/loss_vlb_step=1.27e-5, train/loss_step=0.0037, global_step=1006.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  36%|███▋      | 29/80 [02:58<05:03,  5.96s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=4.57e-5, train/loss_step=0.00616, global_step=1007.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  38%|███▊      | 30/80 [02:59<04:49,  5.78s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00616, train/loss_vlb_step=4.57e-5, train/loss_step=0.00616, global_step=1007.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  38%|███▊      | 30/80 [02:59<04:49,  5.78s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.51e-5, train/loss_step=0.0043, global_step=1007.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  39%|███▉      | 31/80 [02:59<04:35,  5.62s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.51e-5, train/loss_step=0.0043, global_step=1007.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  39%|███▉      | 31/80 [02:59<04:35,  5.62s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=1.8e-6, train/loss_step=0.000417, global_step=1007.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  40%|████      | 32/80 [03:15<04:44,  5.93s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=1.8e-6, train/loss_step=0.000417, global_step=1007.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  40%|████      | 32/80 [03:15<04:44,  5.93s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00098, train/loss_vlb_step=7.02e-5, train/loss_step=0.00098, global_step=1007.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  41%|████▏     | 33/80 [03:26<04:45,  6.09s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00098, train/loss_vlb_step=7.02e-5, train/loss_step=0.00098, global_step=1007.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  41%|████▏     | 33/80 [03:26<04:45,  6.09s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=1.2e-5, train/loss_step=0.00088, global_step=1008.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  42%|████▎     | 34/80 [03:36<04:44,  6.18s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=1.2e-5, train/loss_step=0.00088, global_step=1008.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  42%|████▎     | 34/80 [03:36<04:44,  6.18s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=8.56e-7, train/loss_step=0.000208, global_step=1008.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  44%|████▍     | 35/80 [03:36<04:31,  6.02s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=8.56e-7, train/loss_step=0.000208, global_step=1008.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  44%|████▍     | 35/80 [03:36<04:31,  6.02s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=4.11e-6, train/loss_step=0.000423, global_step=1008.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  45%|████▌     | 36/80 [03:37<04:18,  5.87s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=4.11e-6, train/loss_step=0.000423, global_step=1008.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  45%|████▌     | 36/80 [03:37<04:18,  5.87s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.11e-5, train/loss_step=0.00303, global_step=1008.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  46%|████▋     | 37/80 [03:38<04:06,  5.74s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.11e-5, train/loss_step=0.00303, global_step=1008.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  46%|████▋     | 37/80 [03:38<04:06,  5.74s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=3.93e-6, train/loss_step=0.000482, global_step=1009.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  48%|████▊     | 38/80 [03:38<03:55,  5.61s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=3.93e-6, train/loss_step=0.000482, global_step=1009.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  48%|████▊     | 38/80 [03:38<03:55,  5.61s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.47e-5, train/loss_step=0.0139, global_step=1009.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]     Epoch 50:  49%|████▉     | 39/80 [03:39<03:44,  5.48s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=6.47e-5, train/loss_step=0.0139, global_step=1009.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  49%|████▉     | 39/80 [03:39<03:44,  5.48s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000607, train/loss_vlb_step=9.17e-6, train/loss_step=0.000607, global_step=1009.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  50%|█████     | 40/80 [03:57<03:51,  5.79s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000607, train/loss_vlb_step=9.17e-6, train/loss_step=0.000607, global_step=1009.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  50%|█████     | 40/80 [03:57<03:51,  5.79s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=1.9e-5, train/loss_step=0.00572, global_step=1009.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]   Epoch 50:  51%|█████▏    | 41/80 [04:15<03:57,  6.09s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=1.9e-5, train/loss_step=0.00572, global_step=1009.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  51%|█████▏    | 41/80 [04:15<03:57,  6.09s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=8.56e-5, train/loss_step=0.0134, global_step=1010.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  52%|█████▎    | 42/80 [04:28<03:57,  6.25s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=8.56e-5, train/loss_step=0.0134, global_step=1010.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  52%|█████▎    | 42/80 [04:28<03:57,  6.25s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000435, train/loss_vlb_step=2.37e-6, train/loss_step=0.000435, global_step=1010.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  54%|█████▍    | 43/80 [04:29<03:46,  6.12s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000435, train/loss_vlb_step=2.37e-6, train/loss_step=0.000435, global_step=1010.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  54%|█████▍    | 43/80 [04:29<03:46,  6.12s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=2.14e-6, train/loss_step=0.000392, global_step=1010.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  55%|█████▌    | 44/80 [04:29<03:35,  6.00s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=2.14e-6, train/loss_step=0.000392, global_step=1010.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  55%|█████▌    | 44/80 [04:29<03:35,  6.00s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=0.00187, train/loss_step=0.00389, global_step=1010.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  56%|█████▋    | 45/80 [04:31<03:26,  5.89s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=0.00187, train/loss_step=0.00389, global_step=1010.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  56%|█████▋    | 45/80 [04:31<03:26,  5.89s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=5e-6, train/loss_step=0.000778, global_step=1011.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  57%|█████▊    | 46/80 [04:31<03:16,  5.78s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=5e-6, train/loss_step=0.000778, global_step=1011.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  57%|█████▊    | 46/80 [04:31<03:16,  5.78s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=0.0001, train/loss_step=0.0208, global_step=1011.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  59%|█████▉    | 47/80 [04:31<03:06,  5.67s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=0.0001, train/loss_step=0.0208, global_step=1011.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  59%|█████▉    | 47/80 [04:31<03:06,  5.67s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=0.000261, train/loss_step=0.00166, global_step=1011.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  60%|██████    | 48/80 [04:41<03:04,  5.75s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=0.000261, train/loss_step=0.00166, global_step=1011.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  60%|██████    | 48/80 [04:41<03:04,  5.75s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.000374, train/loss_step=0.0194, global_step=1011.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]   Epoch 50:  61%|██████▏   | 49/80 [05:05<03:09,  6.11s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.000374, train/loss_step=0.0194, global_step=1011.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  61%|██████▏   | 49/80 [05:05<03:09,  6.11s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=0.00177, train/loss_step=0.00867, global_step=1012.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  62%|██████▎   | 50/80 [05:13<03:04,  6.15s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=0.00177, train/loss_step=0.00867, global_step=1012.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  62%|██████▎   | 50/80 [05:13<03:04,  6.15s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=2.84e-6, train/loss_step=0.000623, global_step=1012.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  64%|██████▍   | 51/80 [05:13<02:55,  6.04s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=2.84e-6, train/loss_step=0.000623, global_step=1012.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  64%|██████▍   | 51/80 [05:13<02:55,  6.04s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=4.16e-5, train/loss_step=0.00302, global_step=1012.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  65%|██████▌   | 52/80 [05:14<02:46,  5.93s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=4.16e-5, train/loss_step=0.00302, global_step=1012.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  65%|██████▌   | 52/80 [05:14<02:46,  5.93s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000795, train/loss_vlb_step=2.96e-6, train/loss_step=0.000795, global_step=1012.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  66%|██████▋   | 53/80 [05:15<02:37,  5.84s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000795, train/loss_vlb_step=2.96e-6, train/loss_step=0.000795, global_step=1012.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  66%|██████▋   | 53/80 [05:15<02:37,  5.84s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2.52e-5, train/loss_step=0.00364, global_step=1013.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]   Epoch 50:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=2.52e-5, train/loss_step=0.00364, global_step=1013.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=2.31e-6, train/loss_step=0.000437, global_step=1013.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  69%|██████▉   | 55/80 [05:16<02:21,  5.64s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=2.31e-6, train/loss_step=0.000437, global_step=1013.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  69%|██████▉   | 55/80 [05:16<02:21,  5.64s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=1.41e-6, train/loss_step=0.000294, global_step=1013.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  70%|███████   | 56/80 [05:17<02:13,  5.56s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=1.41e-6, train/loss_step=0.000294, global_step=1013.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  70%|███████   | 56/80 [05:17<02:13,  5.56s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=4.57e-6, train/loss_step=0.00121, global_step=1013.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  71%|███████▏  | 57/80 [05:42<02:15,  5.91s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=4.57e-6, train/loss_step=0.00121, global_step=1013.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  71%|███████▏  | 57/80 [05:42<02:15,  5.91s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=9.16e-6, train/loss_step=0.00118, global_step=1014.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  72%|███████▎  | 58/80 [05:48<02:09,  5.90s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=9.16e-6, train/loss_step=0.00118, global_step=1014.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  72%|███████▎  | 58/80 [05:48<02:09,  5.90s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000281, train/loss_vlb_step=3.2e-6, train/loss_step=0.000281, global_step=1014.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  74%|███████▍  | 59/80 [05:48<02:02,  5.81s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000281, train/loss_vlb_step=3.2e-6, train/loss_step=0.000281, global_step=1014.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  74%|███████▍  | 59/80 [05:48<02:02,  5.81s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.05e-5, train/loss_step=0.00979, global_step=1014.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.05e-5, train/loss_step=0.00979, global_step=1014.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=5.97e-6, train/loss_step=0.000793, global_step=1014.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  76%|███████▋  | 61/80 [05:50<01:47,  5.65s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=5.97e-6, train/loss_step=0.000793, global_step=1014.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  76%|███████▋  | 61/80 [05:50<01:47,  5.65s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=0.000123, train/loss_step=0.00128, global_step=1015.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  78%|███████▊  | 62/80 [05:51<01:40,  5.57s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=0.000123, train/loss_step=0.00128, global_step=1015.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  78%|███████▊  | 62/80 [05:51<01:40,  5.57s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=1.56e-5, train/loss_step=0.00437, global_step=1015.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  79%|███████▉  | 63/80 [05:51<01:33,  5.49s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=1.56e-5, train/loss_step=0.00437, global_step=1015.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  79%|███████▉  | 63/80 [05:51<01:33,  5.49s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=6.13e-5, train/loss_step=0.0082, global_step=1015.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  80%|████████  | 64/80 [06:00<01:28,  5.55s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=6.13e-5, train/loss_step=0.0082, global_step=1015.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  80%|████████  | 64/80 [06:00<01:28,  5.55s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=8.16e-6, train/loss_step=0.00156, global_step=1015.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  81%|████████▏ | 65/80 [06:27<01:28,  5.88s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=8.16e-6, train/loss_step=0.00156, global_step=1015.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  81%|████████▏ | 65/80 [06:27<01:28,  5.88s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=1.73e-5, train/loss_step=0.00489, global_step=1016.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  82%|████████▎ | 66/80 [06:30<01:21,  5.83s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00489, train/loss_vlb_step=1.73e-5, train/loss_step=0.00489, global_step=1016.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  82%|████████▎ | 66/80 [06:30<01:21,  5.83s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.79e-5, train/loss_step=0.00581, global_step=1016.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  84%|████████▍ | 67/80 [06:30<01:14,  5.75s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=3.79e-5, train/loss_step=0.00581, global_step=1016.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  84%|████████▍ | 67/80 [06:30<01:14,  5.75s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000989, train/loss_vlb_step=7.24e-6, train/loss_step=0.000989, global_step=1016.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  85%|████████▌ | 68/80 [06:31<01:08,  5.67s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000989, train/loss_vlb_step=7.24e-6, train/loss_step=0.000989, global_step=1016.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  85%|████████▌ | 68/80 [06:31<01:08,  5.67s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=0.000457, train/loss_step=0.0216, global_step=1016.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]   Epoch 50:  86%|████████▋ | 69/80 [06:31<01:01,  5.60s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=0.000457, train/loss_step=0.0216, global_step=1016.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  86%|████████▋ | 69/80 [06:31<01:01,  5.60s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000141, train/loss_vlb_step=5.81e-7, train/loss_step=0.000141, global_step=1017.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  88%|████████▊ | 70/80 [06:32<00:55,  5.53s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000141, train/loss_vlb_step=5.81e-7, train/loss_step=0.000141, global_step=1017.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  88%|████████▊ | 70/80 [06:32<00:55,  5.53s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=8.93e-7, train/loss_step=0.00025, global_step=1017.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50:  89%|████████▉ | 71/80 [06:32<00:49,  5.46s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=8.93e-7, train/loss_step=0.00025, global_step=1017.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  89%|████████▉ | 71/80 [06:32<00:49,  5.46s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.32e-5, train/loss_step=0.00338, global_step=1017.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  90%|█████████ | 72/80 [06:34<00:43,  5.41s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.32e-5, train/loss_step=0.00338, global_step=1017.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  90%|█████████ | 72/80 [06:34<00:43,  5.41s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00011, train/loss_vlb_step=4.24e-7, train/loss_step=0.00011, global_step=1017.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  91%|█████████▏| 73/80 [06:59<00:39,  5.67s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00011, train/loss_vlb_step=4.24e-7, train/loss_step=0.00011, global_step=1017.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  91%|█████████▏| 73/80 [06:59<00:39,  5.67s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000534, train/loss_vlb_step=2.39e-6, train/loss_step=0.000534, global_step=1018.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  92%|█████████▎| 74/80 [07:02<00:33,  5.63s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000534, train/loss_vlb_step=2.39e-6, train/loss_step=0.000534, global_step=1018.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  92%|█████████▎| 74/80 [07:02<00:33,  5.63s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000705, train/loss_vlb_step=8.4e-6, train/loss_step=0.000705, global_step=1018.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  94%|█████████▍| 75/80 [07:02<00:27,  5.56s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000705, train/loss_vlb_step=8.4e-6, train/loss_step=0.000705, global_step=1018.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  94%|█████████▍| 75/80 [07:02<00:27,  5.56s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=4.07e-5, train/loss_step=0.0064, global_step=1018.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]   Epoch 50:  95%|█████████▌| 76/80 [07:03<00:21,  5.50s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=4.07e-5, train/loss_step=0.0064, global_step=1018.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  95%|█████████▌| 76/80 [07:03<00:21,  5.50s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=1.39e-6, train/loss_step=0.000235, global_step=1018.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  96%|█████████▋| 77/80 [07:03<00:16,  5.43s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=1.39e-6, train/loss_step=0.000235, global_step=1018.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  96%|█████████▋| 77/80 [07:03<00:16,  5.43s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=0.000138, train/loss_step=0.00139, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004] Epoch 50:  98%|█████████▊| 78/80 [07:04<00:10,  5.37s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=0.000138, train/loss_step=0.00139, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  98%|█████████▊| 78/80 [07:04<00:10,  5.37s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.52e-6, train/loss_step=0.000392, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  99%|█████████▉| 79/80 [07:04<00:05,  5.31s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.52e-6, train/loss_step=0.000392, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50:  99%|█████████▉| 79/80 [07:04<00:05,  5.31s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=2.94e-5, train/loss_step=0.00289, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 50: 100%|██████████| 80/80 [07:05<00:00,  5.25s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=2.94e-5, train/loss_step=0.00289, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 50: 100%|██████████| 80/80 [07:05<00:00,  5.25s/it, loss=0.00326, v_num=0, train/loss_simple_step=8.87e-5, train/loss_vlb_step=4.59e-7, train/loss_step=8.87e-5, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Average Epoch time: 425.19 seconds
+Average Peak memory 29563.69MiB
+Epoch 50:   0%|          | 0/80 [00:00<00:00, 3563.55it/s, loss=0.00326, v_num=0, train/loss_simple_step=8.87e-5, train/loss_vlb_step=4.59e-7, train/loss_step=8.87e-5, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 51:   0%|          | 0/80 [00:00<00:00, 1669.04it/s, loss=0.00326, v_num=0, train/loss_simple_step=8.87e-5, train/loss_vlb_step=4.59e-7, train/loss_step=8.87e-5, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]Epoch 51:   1%|▏         | 1/80 [00:46<30:28, 23.15s/it, loss=0.00326, v_num=0, train/loss_simple_step=8.87e-5, train/loss_vlb_step=4.59e-7, train/loss_step=8.87e-5, global_step=1019.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=0.000124, train/loss_epoch=0.004]  Epoch 51:   1%|▏         | 1/80 [00:46<30:28, 23.15s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=8.31e-6, train/loss_step=0.00225, global_step=1020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   2%|▎         | 2/80 [00:46<20:16, 15.59s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=8.31e-6, train/loss_step=0.00225, global_step=1020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   2%|▎         | 2/80 [00:46<20:16, 15.59s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=4.37e-6, train/loss_step=0.000557, global_step=1020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   4%|▍         | 3/80 [00:49<15:47, 12.30s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=4.37e-6, train/loss_step=0.000557, global_step=1020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   4%|▍         | 3/80 [00:49<15:47, 12.30s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=2.87e-5, train/loss_step=0.00689, global_step=1020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:   5%|▌         | 4/80 [00:49<12:35,  9.94s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=2.87e-5, train/loss_step=0.00689, global_step=1020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   5%|▌         | 4/80 [00:49<12:35,  9.94s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000767, train/loss_vlb_step=3.38e-6, train/loss_step=0.000767, global_step=1020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   6%|▋         | 5/80 [00:50<10:27,  8.37s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000767, train/loss_vlb_step=3.38e-6, train/loss_step=0.000767, global_step=1020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   6%|▋         | 5/80 [00:50<10:27,  8.37s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000804, train/loss_vlb_step=4.09e-6, train/loss_step=0.000804, global_step=1021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   8%|▊         | 6/80 [00:51<09:06,  7.38s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000804, train/loss_vlb_step=4.09e-6, train/loss_step=0.000804, global_step=1021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   8%|▊         | 6/80 [00:51<09:06,  7.38s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.39e-5, train/loss_step=0.00495, global_step=1021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:   9%|▉         | 7/80 [00:52<07:56,  6.52s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=2.39e-5, train/loss_step=0.00495, global_step=1021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:   9%|▉         | 7/80 [00:52<07:56,  6.52s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=9.14e-7, train/loss_step=0.000204, global_step=1021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  10%|█         | 8/80 [01:32<12:22, 10.31s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=9.14e-7, train/loss_step=0.000204, global_step=1021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  10%|█         | 8/80 [01:32<12:22, 10.31s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.31e-5, train/loss_step=0.00318, global_step=1021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  11%|█▏        | 9/80 [01:33<11:02,  9.33s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.31e-5, train/loss_step=0.00318, global_step=1021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  11%|█▏        | 9/80 [01:33<11:02,  9.33s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=3.19e-5, train/loss_step=0.00849, global_step=1022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  12%|█▎        | 10/80 [01:33<09:56,  8.53s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.00849, train/loss_vlb_step=3.19e-5, train/loss_step=0.00849, global_step=1022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  12%|█▎        | 10/80 [01:33<09:56,  8.53s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=5.01e-6, train/loss_step=0.000564, global_step=1022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  14%|█▍        | 11/80 [01:40<09:38,  8.38s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=5.01e-6, train/loss_step=0.000564, global_step=1022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  14%|█▍        | 11/80 [01:40<09:38,  8.38s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=0.000466, train/loss_step=0.0084, global_step=1022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]   Epoch 51:  15%|█▌        | 12/80 [01:41<08:48,  7.78s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.0084, train/loss_vlb_step=0.000466, train/loss_step=0.0084, global_step=1022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  15%|█▌        | 12/80 [01:41<08:48,  7.78s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000909, train/loss_vlb_step=3.04e-5, train/loss_step=0.000909, global_step=1022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  16%|█▋        | 13/80 [01:41<08:06,  7.26s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000909, train/loss_vlb_step=3.04e-5, train/loss_step=0.000909, global_step=1022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  16%|█▋        | 13/80 [01:41<08:06,  7.26s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.02e-5, train/loss_step=0.00106, global_step=1023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  18%|█▊        | 14/80 [01:42<07:29,  6.81s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.02e-5, train/loss_step=0.00106, global_step=1023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  18%|█▊        | 14/80 [01:42<07:29,  6.81s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.4e-5, train/loss_step=0.00265, global_step=1023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409] Epoch 51:  19%|█▉        | 15/80 [01:42<06:56,  6.41s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.4e-5, train/loss_step=0.00265, global_step=1023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  19%|█▉        | 15/80 [01:42<06:56,  6.41s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=1.43e-5, train/loss_step=0.00417, global_step=1023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  20%|██        | 16/80 [02:11<08:14,  7.73s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=1.43e-5, train/loss_step=0.00417, global_step=1023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  20%|██        | 16/80 [02:11<08:14,  7.73s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=6.27e-5, train/loss_step=0.0119, global_step=1023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  21%|██▏       | 17/80 [02:11<07:41,  7.33s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=6.27e-5, train/loss_step=0.0119, global_step=1023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  21%|██▏       | 17/80 [02:11<07:41,  7.33s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=2.65e-5, train/loss_step=0.0076, global_step=1024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  22%|██▎       | 18/80 [02:12<07:11,  6.97s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=2.65e-5, train/loss_step=0.0076, global_step=1024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  22%|██▎       | 18/80 [02:12<07:11,  6.97s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000136, train/loss_step=0.0136, global_step=1024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  24%|██▍       | 19/80 [02:14<06:51,  6.75s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000136, train/loss_step=0.0136, global_step=1024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  24%|██▍       | 19/80 [02:14<06:51,  6.75s/it, loss=0.004, v_num=0, train/loss_simple_step=0.000958, train/loss_vlb_step=4.18e-6, train/loss_step=0.000958, global_step=1024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  25%|██▌       | 20/80 [02:15<06:27,  6.45s/it, loss=0.004, v_num=0, train/loss_simple_step=0.000958, train/loss_vlb_step=4.18e-6, train/loss_step=0.000958, global_step=1024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  25%|██▌       | 20/80 [02:15<06:27,  6.45s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=1.79e-5, train/loss_step=0.00506, global_step=1024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  26%|██▋       | 21/80 [02:15<06:04,  6.18s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00506, train/loss_vlb_step=1.79e-5, train/loss_step=0.00506, global_step=1024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  26%|██▋       | 21/80 [02:15<06:04,  6.18s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=2.49e-5, train/loss_step=0.00302, global_step=1025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  28%|██▊       | 22/80 [02:16<05:44,  5.93s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=2.49e-5, train/loss_step=0.00302, global_step=1025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  28%|██▊       | 22/80 [02:16<05:44,  5.93s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=9.66e-6, train/loss_step=0.00282, global_step=1025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409] Epoch 51:  29%|██▉       | 23/80 [02:16<05:25,  5.71s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=9.66e-6, train/loss_step=0.00282, global_step=1025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  29%|██▉       | 23/80 [02:16<05:25,  5.71s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=1.87e-6, train/loss_step=0.000337, global_step=1025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  30%|███       | 24/80 [02:51<06:23,  6.85s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=1.87e-6, train/loss_step=0.000337, global_step=1025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  30%|███       | 24/80 [02:51<06:23,  6.85s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=1.86e-5, train/loss_step=0.000798, global_step=1025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  31%|███▏      | 25/80 [02:56<06:12,  6.78s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=1.86e-5, train/loss_step=0.000798, global_step=1025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  31%|███▏      | 25/80 [02:56<06:12,  6.78s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=7.98e-6, train/loss_step=0.0012, global_step=1026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]    Epoch 51:  32%|███▎      | 26/80 [02:56<05:53,  6.55s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=7.98e-6, train/loss_step=0.0012, global_step=1026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  32%|███▎      | 26/80 [02:56<05:53,  6.55s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=5.6e-6, train/loss_step=0.00041, global_step=1026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  34%|███▍      | 27/80 [03:02<05:45,  6.51s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=5.6e-6, train/loss_step=0.00041, global_step=1026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  34%|███▍      | 27/80 [03:02<05:45,  6.51s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000745, train/loss_vlb_step=2.6e-6, train/loss_step=0.000745, global_step=1026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000745, train/loss_vlb_step=2.6e-6, train/loss_step=0.000745, global_step=1026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=8.72e-5, train/loss_step=0.017, global_step=1026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]    Epoch 51:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=8.72e-5, train/loss_step=0.017, global_step=1026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=2.04e-5, train/loss_step=0.00587, global_step=1027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=2.04e-5, train/loss_step=0.00587, global_step=1027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.22e-6, train/loss_step=0.000253, global_step=1027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.22e-6, train/loss_step=0.000253, global_step=1027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000265, train/loss_vlb_step=1.55e-6, train/loss_step=0.000265, global_step=1027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  40%|████      | 32/80 [03:39<05:19,  6.65s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000265, train/loss_vlb_step=1.55e-6, train/loss_step=0.000265, global_step=1027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  40%|████      | 32/80 [03:39<05:19,  6.65s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=2.44e-5, train/loss_step=0.00684, global_step=1027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  41%|████▏     | 33/80 [03:42<05:06,  6.53s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00684, train/loss_vlb_step=2.44e-5, train/loss_step=0.00684, global_step=1027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  41%|████▏     | 33/80 [03:42<05:06,  6.53s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.000808, train/loss_step=0.024, global_step=1028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]   Epoch 51:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.000808, train/loss_step=0.024, global_step=1028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=6.17e-6, train/loss_step=0.00108, global_step=1028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  44%|████▍     | 35/80 [03:45<04:42,  6.28s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=6.17e-6, train/loss_step=0.00108, global_step=1028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  44%|████▍     | 35/80 [03:45<04:42,  6.28s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.54e-5, train/loss_step=0.00341, global_step=1028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  45%|████▌     | 36/80 [03:46<04:29,  6.12s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.54e-5, train/loss_step=0.00341, global_step=1028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  45%|████▌     | 36/80 [03:46<04:29,  6.12s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=5.66e-6, train/loss_step=0.000417, global_step=1028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  46%|████▋     | 37/80 [03:47<04:16,  5.97s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=5.66e-6, train/loss_step=0.000417, global_step=1028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  46%|████▋     | 37/80 [03:47<04:16,  5.97s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.0002, train/loss_step=0.0139, global_step=1029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]      Epoch 51:  48%|████▊     | 38/80 [03:47<04:04,  5.83s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.0002, train/loss_step=0.0139, global_step=1029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  48%|████▊     | 38/80 [03:47<04:04,  5.83s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000265, train/loss_vlb_step=1.36e-6, train/loss_step=0.000265, global_step=1029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  49%|████▉     | 39/80 [03:47<03:53,  5.70s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000265, train/loss_vlb_step=1.36e-6, train/loss_step=0.000265, global_step=1029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  49%|████▉     | 39/80 [03:47<03:53,  5.70s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=1.91e-5, train/loss_step=0.000521, global_step=1029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  50%|█████     | 40/80 [04:14<04:07,  6.20s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=1.91e-5, train/loss_step=0.000521, global_step=1029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  50%|█████     | 40/80 [04:14<04:07,  6.20s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=9.96e-6, train/loss_step=0.00115, global_step=1029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  51%|█████▏    | 41/80 [04:25<04:06,  6.32s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=9.96e-6, train/loss_step=0.00115, global_step=1029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  51%|█████▏    | 41/80 [04:25<04:06,  6.32s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000126, train/loss_vlb_step=5.55e-7, train/loss_step=0.000126, global_step=1030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  52%|█████▎    | 42/80 [04:26<03:55,  6.19s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000126, train/loss_vlb_step=5.55e-7, train/loss_step=0.000126, global_step=1030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  52%|█████▎    | 42/80 [04:26<03:55,  6.19s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=6.81e-5, train/loss_step=0.00116, global_step=1030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  54%|█████▍    | 43/80 [04:36<03:52,  6.28s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=6.81e-5, train/loss_step=0.00116, global_step=1030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  54%|█████▍    | 43/80 [04:36<03:52,  6.28s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=8.25e-6, train/loss_step=0.00168, global_step=1030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  55%|█████▌    | 44/80 [04:36<03:41,  6.15s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=8.25e-6, train/loss_step=0.00168, global_step=1030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  55%|█████▌    | 44/80 [04:36<03:41,  6.15s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.00104, train/loss_step=0.0307, global_step=1030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  56%|█████▋    | 45/80 [04:37<03:31,  6.03s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.0307, train/loss_vlb_step=0.00104, train/loss_step=0.0307, global_step=1030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  56%|█████▋    | 45/80 [04:37<03:31,  6.03s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.13e-5, train/loss_step=0.00472, global_step=1031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  57%|█████▊    | 46/80 [04:37<03:20,  5.91s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.13e-5, train/loss_step=0.00472, global_step=1031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  57%|█████▊    | 46/80 [04:37<03:20,  5.91s/it, loss=0.00654, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.000119, train/loss_step=0.0169, global_step=1031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409] Epoch 51:  59%|█████▉    | 47/80 [04:38<03:11,  5.80s/it, loss=0.00654, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.000119, train/loss_step=0.0169, global_step=1031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  59%|█████▉    | 47/80 [04:38<03:11,  5.80s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.26e-6, train/loss_step=0.00207, global_step=1031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  60%|██████    | 48/80 [05:06<03:20,  6.26s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.26e-6, train/loss_step=0.00207, global_step=1031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  60%|██████    | 48/80 [05:06<03:20,  6.26s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.000983, train/loss_vlb_step=4.37e-5, train/loss_step=0.000983, global_step=1031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.000983, train/loss_vlb_step=4.37e-5, train/loss_step=0.000983, global_step=1031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.26e-6, train/loss_step=0.000241, global_step=1032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  62%|██████▎   | 50/80 [05:07<03:01,  6.04s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.26e-6, train/loss_step=0.000241, global_step=1032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  62%|██████▎   | 50/80 [05:07<03:01,  6.04s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=3.17e-6, train/loss_step=0.000416, global_step=1032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  64%|██████▍   | 51/80 [05:17<02:56,  6.10s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=3.17e-6, train/loss_step=0.000416, global_step=1032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  64%|██████▍   | 51/80 [05:17<02:56,  6.10s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=1.3e-5, train/loss_step=0.000606, global_step=1032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409] Epoch 51:  65%|██████▌   | 52/80 [05:17<02:47,  6.00s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=1.3e-5, train/loss_step=0.000606, global_step=1032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  65%|██████▌   | 52/80 [05:17<02:47,  6.00s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=2.85e-5, train/loss_step=0.00716, global_step=1032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409] Epoch 51:  66%|██████▋   | 53/80 [05:18<02:39,  5.90s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=2.85e-5, train/loss_step=0.00716, global_step=1032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  66%|██████▋   | 53/80 [05:18<02:39,  5.90s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=6.51e-5, train/loss_step=0.0115, global_step=1033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  68%|██████▊   | 54/80 [05:19<02:30,  5.80s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=6.51e-5, train/loss_step=0.0115, global_step=1033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  68%|██████▊   | 54/80 [05:19<02:30,  5.80s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=3.64e-6, train/loss_step=0.00105, global_step=1033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  69%|██████▉   | 55/80 [05:19<02:22,  5.71s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=3.64e-6, train/loss_step=0.00105, global_step=1033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  69%|██████▉   | 55/80 [05:19<02:22,  5.71s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.85e-5, train/loss_step=0.0172, global_step=1033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  70%|███████   | 56/80 [05:57<02:30,  6.27s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0172, train/loss_vlb_step=7.85e-5, train/loss_step=0.0172, global_step=1033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  70%|███████   | 56/80 [05:57<02:30,  6.27s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=1.82e-5, train/loss_step=0.0052, global_step=1033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  71%|███████▏  | 57/80 [05:58<02:21,  6.17s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=1.82e-5, train/loss_step=0.0052, global_step=1033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  71%|███████▏  | 57/80 [05:58<02:21,  6.17s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=9.53e-6, train/loss_step=0.00233, global_step=1034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  72%|███████▎  | 58/80 [05:58<02:13,  6.08s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=9.53e-6, train/loss_step=0.00233, global_step=1034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  72%|███████▎  | 58/80 [05:58<02:13,  6.08s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=6.4e-6, train/loss_step=0.00157, global_step=1034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  74%|███████▍  | 59/80 [05:58<02:05,  5.98s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=6.4e-6, train/loss_step=0.00157, global_step=1034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  74%|███████▍  | 59/80 [05:58<02:05,  5.98s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=4.16e-5, train/loss_step=0.00799, global_step=1034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=4.16e-5, train/loss_step=0.00799, global_step=1034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=0.00026, train/loss_step=0.00432, global_step=1034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  76%|███████▋  | 61/80 [06:00<01:50,  5.81s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=0.00026, train/loss_step=0.00432, global_step=1034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  76%|███████▋  | 61/80 [06:00<01:50,  5.81s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=2.33e-5, train/loss_step=0.00702, global_step=1035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  78%|███████▊  | 62/80 [06:00<01:43,  5.73s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=2.33e-5, train/loss_step=0.00702, global_step=1035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  78%|███████▊  | 62/80 [06:00<01:43,  5.73s/it, loss=0.0062, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=1.05e-5, train/loss_step=0.000451, global_step=1035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  79%|███████▉  | 63/80 [06:01<01:35,  5.64s/it, loss=0.0062, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=1.05e-5, train/loss_step=0.000451, global_step=1035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  79%|███████▉  | 63/80 [06:01<01:35,  5.64s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.43e-5, train/loss_step=0.00197, global_step=1035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409] Epoch 51:  80%|████████  | 64/80 [06:35<01:37,  6.09s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.43e-5, train/loss_step=0.00197, global_step=1035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  80%|████████  | 64/80 [06:35<01:37,  6.09s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=6.13e-6, train/loss_step=0.00059, global_step=1035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  81%|████████▏ | 65/80 [06:36<01:30,  6.01s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=6.13e-6, train/loss_step=0.00059, global_step=1035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  81%|████████▏ | 65/80 [06:36<01:30,  6.01s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.12e-6, train/loss_step=0.000499, global_step=1036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  82%|████████▎ | 66/80 [06:36<01:22,  5.92s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.12e-6, train/loss_step=0.000499, global_step=1036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  82%|████████▎ | 66/80 [06:36<01:22,  5.92s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.02e-5, train/loss_step=0.0115, global_step=1036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]   Epoch 51:  84%|████████▍ | 67/80 [06:37<01:15,  5.84s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.02e-5, train/loss_step=0.0115, global_step=1036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  84%|████████▍ | 67/80 [06:37<01:15,  5.84s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=2.53e-6, train/loss_step=0.000524, global_step=1036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  85%|████████▌ | 68/80 [06:37<01:09,  5.77s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=2.53e-6, train/loss_step=0.000524, global_step=1036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  85%|████████▌ | 68/80 [06:37<01:09,  5.77s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.26e-5, train/loss_step=0.00246, global_step=1036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  86%|████████▋ | 69/80 [06:38<01:02,  5.69s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.26e-5, train/loss_step=0.00246, global_step=1036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  86%|████████▋ | 69/80 [06:38<01:02,  5.69s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=7.34e-6, train/loss_step=0.00188, global_step=1037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  88%|████████▊ | 70/80 [06:39<00:56,  5.62s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=7.34e-6, train/loss_step=0.00188, global_step=1037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  88%|████████▊ | 70/80 [06:39<00:56,  5.62s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.23e-5, train/loss_step=0.00632, global_step=1037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  89%|████████▉ | 71/80 [06:39<00:49,  5.55s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.23e-5, train/loss_step=0.00632, global_step=1037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  89%|████████▉ | 71/80 [06:39<00:49,  5.55s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=5.12e-5, train/loss_step=0.00226, global_step=1037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  90%|█████████ | 72/80 [07:08<00:46,  5.87s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=5.12e-5, train/loss_step=0.00226, global_step=1037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  90%|█████████ | 72/80 [07:08<00:46,  5.87s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=9.34e-6, train/loss_step=0.00155, global_step=1037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  91%|█████████▏| 73/80 [07:08<00:40,  5.80s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=9.34e-6, train/loss_step=0.00155, global_step=1037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  91%|█████████▏| 73/80 [07:08<00:40,  5.80s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=0.00124, train/loss_step=0.00572, global_step=1038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  92%|█████████▎| 74/80 [07:09<00:34,  5.73s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=0.00124, train/loss_step=0.00572, global_step=1038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  92%|█████████▎| 74/80 [07:09<00:34,  5.73s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.24e-5, train/loss_step=0.00305, global_step=1038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  94%|█████████▍| 75/80 [07:09<00:28,  5.66s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.24e-5, train/loss_step=0.00305, global_step=1038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  94%|█████████▍| 75/80 [07:09<00:28,  5.66s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=3.03e-5, train/loss_step=0.00439, global_step=1038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  95%|█████████▌| 76/80 [07:10<00:22,  5.59s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=3.03e-5, train/loss_step=0.00439, global_step=1038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  95%|█████████▌| 76/80 [07:10<00:22,  5.59s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.99e-5, train/loss_step=0.00331, global_step=1038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  96%|█████████▋| 77/80 [07:10<00:16,  5.52s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.99e-5, train/loss_step=0.00331, global_step=1038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  96%|█████████▋| 77/80 [07:10<00:16,  5.52s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.36e-5, train/loss_step=0.0117, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 51:  98%|█████████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.36e-5, train/loss_step=0.0117, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  98%|█████████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.02e-5, train/loss_step=0.00248, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.02e-5, train/loss_step=0.00248, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=3.51e-5, train/loss_step=0.00152, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=3.51e-5, train/loss_step=0.00152, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 51: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.32e-6, train/loss_step=0.00148, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Average Epoch time: 433.47 seconds
+Average Peak memory 29565.43MiB
+Epoch 51:   0%|          | 0/80 [00:00<00:00, 4236.67it/s, loss=0.00354, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.32e-6, train/loss_step=0.00148, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 52:   0%|          | 0/80 [00:00<00:00, 1855.89it/s, loss=0.00354, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.32e-6, train/loss_step=0.00148, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]Epoch 52:   1%|▏         | 1/80 [00:41<27:02, 20.54s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.32e-6, train/loss_step=0.00148, global_step=1039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=6.24e-5, train/loss_epoch=0.00409]  Epoch 52:   1%|▏         | 1/80 [00:41<27:02, 20.54s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000885, train/loss_vlb_step=4.37e-6, train/loss_step=0.000885, global_step=1040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   2%|▎         | 2/80 [00:41<18:00, 13.85s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000885, train/loss_vlb_step=4.37e-6, train/loss_step=0.000885, global_step=1040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   2%|▎         | 2/80 [00:41<18:00, 13.85s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=2.48e-5, train/loss_step=0.00193, global_step=1040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]   Epoch 52:   4%|▍         | 3/80 [00:44<14:08, 11.01s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=2.48e-5, train/loss_step=0.00193, global_step=1040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   4%|▍         | 3/80 [00:44<14:08, 11.01s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=1.38e-5, train/loss_step=0.00389, global_step=1040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   5%|▌         | 4/80 [00:44<11:17,  8.92s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=1.38e-5, train/loss_step=0.00389, global_step=1040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   5%|▌         | 4/80 [00:44<11:17,  8.92s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=2.66e-6, train/loss_step=0.000582, global_step=1040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   6%|▋         | 5/80 [00:45<09:23,  7.52s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=2.66e-6, train/loss_step=0.000582, global_step=1040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   6%|▋         | 5/80 [00:45<09:23,  7.52s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=7.11e-6, train/loss_step=0.00136, global_step=1041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417] Epoch 52:   8%|▊         | 6/80 [00:45<08:01,  6.51s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=7.11e-6, train/loss_step=0.00136, global_step=1041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   8%|▊         | 6/80 [00:45<08:01,  6.51s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.48e-6, train/loss_step=0.00116, global_step=1041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   9%|▉         | 7/80 [00:46<07:00,  5.76s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=5.48e-6, train/loss_step=0.00116, global_step=1041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:   9%|▉         | 7/80 [00:46<07:00,  5.76s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=9.84e-6, train/loss_step=0.00147, global_step=1041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  10%|█         | 8/80 [01:28<11:51,  9.88s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=9.84e-6, train/loss_step=0.00147, global_step=1041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  10%|█         | 8/80 [01:28<11:51,  9.88s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000863, train/loss_vlb_step=3.83e-6, train/loss_step=0.000863, global_step=1041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  11%|█▏        | 9/80 [01:29<10:34,  8.94s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000863, train/loss_vlb_step=3.83e-6, train/loss_step=0.000863, global_step=1041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  11%|█▏        | 9/80 [01:29<10:34,  8.94s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.79e-5, train/loss_step=0.0106, global_step=1042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]    Epoch 52:  12%|█▎        | 10/80 [01:29<09:32,  8.17s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.79e-5, train/loss_step=0.0106, global_step=1042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  12%|█▎        | 10/80 [01:29<09:32,  8.17s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.33e-5, train/loss_step=0.00184, global_step=1042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  14%|█▍        | 11/80 [01:30<08:39,  7.53s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=1.33e-5, train/loss_step=0.00184, global_step=1042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  14%|█▍        | 11/80 [01:30<08:39,  7.53s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=9.08e-5, train/loss_step=0.0179, global_step=1042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417] Epoch 52:  15%|█▌        | 12/80 [01:30<07:55,  6.99s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=9.08e-5, train/loss_step=0.0179, global_step=1042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  15%|█▌        | 12/80 [01:30<07:55,  6.99s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000948, train/loss_vlb_step=3.87e-6, train/loss_step=0.000948, global_step=1042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  16%|█▋        | 13/80 [01:31<07:17,  6.53s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000948, train/loss_vlb_step=3.87e-6, train/loss_step=0.000948, global_step=1042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  16%|█▋        | 13/80 [01:31<07:17,  6.53s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.00023, train/loss_step=0.0155, global_step=1043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]    Epoch 52:  18%|█▊        | 14/80 [01:31<06:44,  6.13s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.00023, train/loss_step=0.0155, global_step=1043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  18%|█▊        | 14/80 [01:31<06:44,  6.13s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=4.26e-5, train/loss_step=0.00707, global_step=1043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  19%|█▉        | 15/80 [01:32<06:15,  5.78s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=4.26e-5, train/loss_step=0.00707, global_step=1043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  19%|█▉        | 15/80 [01:32<06:15,  5.78s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=2.25e-5, train/loss_step=0.00347, global_step=1043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417] Epoch 52:  20%|██        | 16/80 [02:09<08:06,  7.61s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=2.25e-5, train/loss_step=0.00347, global_step=1043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  20%|██        | 16/80 [02:09<08:06,  7.61s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=4.87e-6, train/loss_step=0.000928, global_step=1043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  21%|██▏       | 17/80 [02:09<07:34,  7.22s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=4.87e-6, train/loss_step=0.000928, global_step=1043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  21%|██▏       | 17/80 [02:09<07:34,  7.22s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=0.000161, train/loss_step=0.00266, global_step=1044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417] Epoch 52:  22%|██▎       | 18/80 [02:10<07:05,  6.86s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=0.000161, train/loss_step=0.00266, global_step=1044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  22%|██▎       | 18/80 [02:10<07:05,  6.86s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6.82e-6, train/loss_step=0.00151, global_step=1044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417] Epoch 52:  24%|██▍       | 19/80 [02:10<06:39,  6.54s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6.82e-6, train/loss_step=0.00151, global_step=1044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  24%|██▍       | 19/80 [02:10<06:39,  6.54s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=9.52e-6, train/loss_step=0.00177, global_step=1044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  25%|██▌       | 20/80 [02:11<06:15,  6.26s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=9.52e-6, train/loss_step=0.00177, global_step=1044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  25%|██▌       | 20/80 [02:11<06:15,  6.26s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=9.02e-5, train/loss_step=0.0175, global_step=1044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  26%|██▋       | 21/80 [02:11<05:53,  6.00s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=9.02e-5, train/loss_step=0.0175, global_step=1044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  26%|██▋       | 21/80 [02:11<05:53,  6.00s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.74e-5, train/loss_step=0.00299, global_step=1045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  28%|██▊       | 22/80 [02:12<05:33,  5.76s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.74e-5, train/loss_step=0.00299, global_step=1045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  28%|██▊       | 22/80 [02:12<05:33,  5.76s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=2.6e-5, train/loss_step=0.00646, global_step=1045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  29%|██▉       | 23/80 [02:12<05:15,  5.54s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=2.6e-5, train/loss_step=0.00646, global_step=1045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  29%|██▉       | 23/80 [02:12<05:15,  5.54s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000668, train/loss_vlb_step=3.26e-6, train/loss_step=0.000668, global_step=1045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  30%|███       | 24/80 [03:04<06:53,  7.39s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000668, train/loss_vlb_step=3.26e-6, train/loss_step=0.000668, global_step=1045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  30%|███       | 24/80 [03:04<06:53,  7.39s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.04e-5, train/loss_step=0.00471, global_step=1045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  31%|███▏      | 25/80 [03:05<06:31,  7.12s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.04e-5, train/loss_step=0.00471, global_step=1045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  31%|███▏      | 25/80 [03:05<06:31,  7.12s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=8.37e-5, train/loss_step=0.013, global_step=1046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]    Epoch 52:  32%|███▎      | 26/80 [03:05<06:11,  6.88s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=8.37e-5, train/loss_step=0.013, global_step=1046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  32%|███▎      | 26/80 [03:05<06:11,  6.88s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=8.78e-6, train/loss_step=0.00205, global_step=1046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  34%|███▍      | 27/80 [03:06<05:52,  6.65s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=8.78e-6, train/loss_step=0.00205, global_step=1046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  34%|███▍      | 27/80 [03:06<05:52,  6.65s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=1.98e-5, train/loss_step=0.0013, global_step=1046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417] Epoch 52:  35%|███▌      | 28/80 [03:06<05:34,  6.44s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=1.98e-5, train/loss_step=0.0013, global_step=1046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  35%|███▌      | 28/80 [03:06<05:34,  6.44s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=9.18e-6, train/loss_step=0.0018, global_step=1046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  36%|███▋      | 29/80 [03:07<05:18,  6.24s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=9.18e-6, train/loss_step=0.0018, global_step=1046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  36%|███▋      | 29/80 [03:07<05:18,  6.24s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000729, train/loss_vlb_step=3.87e-6, train/loss_step=0.000729, global_step=1047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  38%|███▊      | 30/80 [03:07<05:02,  6.06s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000729, train/loss_vlb_step=3.87e-6, train/loss_step=0.000729, global_step=1047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  38%|███▊      | 30/80 [03:07<05:02,  6.06s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.63e-5, train/loss_step=0.0148, global_step=1047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]    Epoch 52:  39%|███▉      | 31/80 [03:08<04:48,  5.88s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.63e-5, train/loss_step=0.0148, global_step=1047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  39%|███▉      | 31/80 [03:08<04:48,  5.88s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.01e-5, train/loss_step=0.00593, global_step=1047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  40%|████      | 32/80 [03:44<05:26,  6.80s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=3.01e-5, train/loss_step=0.00593, global_step=1047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  40%|████      | 32/80 [03:44<05:26,  6.80s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=2.14e-5, train/loss_step=0.00137, global_step=1047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  41%|████▏     | 33/80 [03:44<05:10,  6.62s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=2.14e-5, train/loss_step=0.00137, global_step=1047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  41%|████▏     | 33/80 [03:44<05:10,  6.62s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00067, train/loss_vlb_step=2.77e-6, train/loss_step=0.00067, global_step=1048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  42%|████▎     | 34/80 [03:45<04:56,  6.44s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00067, train/loss_vlb_step=2.77e-6, train/loss_step=0.00067, global_step=1048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  42%|████▎     | 34/80 [03:45<04:56,  6.44s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000719, train/loss_vlb_step=4.2e-6, train/loss_step=0.000719, global_step=1048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  44%|████▍     | 35/80 [03:45<04:42,  6.28s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000719, train/loss_vlb_step=4.2e-6, train/loss_step=0.000719, global_step=1048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  44%|████▍     | 35/80 [03:45<04:42,  6.28s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=5.13e-5, train/loss_step=0.00835, global_step=1048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  45%|████▌     | 36/80 [03:46<04:29,  6.12s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=5.13e-5, train/loss_step=0.00835, global_step=1048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  45%|████▌     | 36/80 [03:46<04:29,  6.12s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=8.87e-6, train/loss_step=0.00173, global_step=1048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  46%|████▋     | 37/80 [03:46<04:16,  5.97s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=8.87e-6, train/loss_step=0.00173, global_step=1048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  46%|████▋     | 37/80 [03:46<04:16,  5.97s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.25e-5, train/loss_step=0.00286, global_step=1049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  48%|████▊     | 38/80 [03:47<04:04,  5.83s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1.25e-5, train/loss_step=0.00286, global_step=1049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  48%|████▊     | 38/80 [03:47<04:04,  5.83s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000775, train/loss_vlb_step=3.26e-6, train/loss_step=0.000775, global_step=1049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  49%|████▉     | 39/80 [03:47<03:53,  5.70s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000775, train/loss_vlb_step=3.26e-6, train/loss_step=0.000775, global_step=1049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  49%|████▉     | 39/80 [03:47<03:53,  5.70s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.06e-5, train/loss_step=0.00847, global_step=1049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  50%|█████     | 40/80 [04:28<04:22,  6.56s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=4.06e-5, train/loss_step=0.00847, global_step=1049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  50%|█████     | 40/80 [04:28<04:22,  6.56s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=1.75e-5, train/loss_step=0.00525, global_step=1049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  51%|█████▏    | 41/80 [04:29<04:10,  6.42s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=1.75e-5, train/loss_step=0.00525, global_step=1049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  51%|█████▏    | 41/80 [04:29<04:10,  6.42s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=9.93e-6, train/loss_step=0.0014, global_step=1050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  52%|█████▎    | 42/80 [04:29<03:58,  6.28s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=9.93e-6, train/loss_step=0.0014, global_step=1050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  52%|█████▎    | 42/80 [04:29<03:58,  6.28s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=7.73e-6, train/loss_step=0.0015, global_step=1050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  54%|█████▍    | 43/80 [04:30<03:47,  6.15s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=7.73e-6, train/loss_step=0.0015, global_step=1050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  54%|█████▍    | 43/80 [04:30<03:47,  6.15s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=7.6e-6, train/loss_step=0.000956, global_step=1050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  55%|█████▌    | 44/80 [04:31<03:36,  6.02s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=7.6e-6, train/loss_step=0.000956, global_step=1050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  55%|█████▌    | 44/80 [04:31<03:36,  6.02s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=2.57e-5, train/loss_step=0.0072, global_step=1050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]   Epoch 52:  56%|█████▋    | 45/80 [04:31<03:26,  5.90s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=2.57e-5, train/loss_step=0.0072, global_step=1050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  56%|█████▋    | 45/80 [04:31<03:26,  5.90s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000863, train/loss_vlb_step=4.21e-6, train/loss_step=0.000863, global_step=1051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  57%|█████▊    | 46/80 [04:32<03:16,  5.79s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000863, train/loss_vlb_step=4.21e-6, train/loss_step=0.000863, global_step=1051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  57%|█████▊    | 46/80 [04:32<03:16,  5.79s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.51e-6, train/loss_step=0.00104, global_step=1051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  59%|█████▉    | 47/80 [04:32<03:07,  5.68s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.51e-6, train/loss_step=0.00104, global_step=1051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  59%|█████▉    | 47/80 [04:32<03:07,  5.68s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=1.42e-5, train/loss_step=0.00108, global_step=1051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  60%|██████    | 48/80 [05:14<03:25,  6.41s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=1.42e-5, train/loss_step=0.00108, global_step=1051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  60%|██████    | 48/80 [05:14<03:25,  6.41s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000766, train/loss_vlb_step=4.5e-6, train/loss_step=0.000766, global_step=1051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  61%|██████▏   | 49/80 [05:14<03:15,  6.29s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000766, train/loss_vlb_step=4.5e-6, train/loss_step=0.000766, global_step=1051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  61%|██████▏   | 49/80 [05:14<03:15,  6.29s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.16e-5, train/loss_step=0.0169, global_step=1052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]   Epoch 52:  62%|██████▎   | 50/80 [05:15<03:05,  6.18s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=7.16e-5, train/loss_step=0.0169, global_step=1052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  62%|██████▎   | 50/80 [05:15<03:05,  6.18s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000976, train/loss_vlb_step=5.99e-6, train/loss_step=0.000976, global_step=1052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  64%|██████▍   | 51/80 [05:15<02:56,  6.07s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000976, train/loss_vlb_step=5.99e-6, train/loss_step=0.000976, global_step=1052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  64%|██████▍   | 51/80 [05:15<02:56,  6.07s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.19e-5, train/loss_step=0.00116, global_step=1052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]   Epoch 52:  65%|██████▌   | 52/80 [05:16<02:47,  5.97s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.19e-5, train/loss_step=0.00116, global_step=1052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  65%|██████▌   | 52/80 [05:16<02:47,  5.97s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=9.46e-6, train/loss_step=0.0025, global_step=1052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417] Epoch 52:  66%|██████▋   | 53/80 [05:16<02:38,  5.86s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=9.46e-6, train/loss_step=0.0025, global_step=1052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  66%|██████▋   | 53/80 [05:16<02:38,  5.86s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=8.28e-5, train/loss_step=0.0158, global_step=1053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  68%|██████▊   | 54/80 [05:17<02:29,  5.77s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=8.28e-5, train/loss_step=0.0158, global_step=1053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  68%|██████▊   | 54/80 [05:17<02:29,  5.77s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.27e-5, train/loss_step=0.00365, global_step=1053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.27e-5, train/loss_step=0.00365, global_step=1053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=7.79e-6, train/loss_step=0.00142, global_step=1053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  70%|███████   | 56/80 [05:50<02:27,  6.15s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=7.79e-6, train/loss_step=0.00142, global_step=1053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  70%|███████   | 56/80 [05:50<02:27,  6.15s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=8.11e-5, train/loss_step=0.00302, global_step=1053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  71%|███████▏  | 57/80 [05:51<02:19,  6.05s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=8.11e-5, train/loss_step=0.00302, global_step=1053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  71%|███████▏  | 57/80 [05:51<02:19,  6.05s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000674, train/loss_vlb_step=3.02e-6, train/loss_step=0.000674, global_step=1054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  72%|███████▎  | 58/80 [05:51<02:11,  5.96s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000674, train/loss_vlb_step=3.02e-6, train/loss_step=0.000674, global_step=1054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  72%|███████▎  | 58/80 [05:51<02:11,  5.96s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=4.99e-6, train/loss_step=0.00088, global_step=1054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  74%|███████▍  | 59/80 [05:52<02:03,  5.87s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=4.99e-6, train/loss_step=0.00088, global_step=1054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  74%|███████▍  | 59/80 [05:52<02:03,  5.87s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=2.39e-6, train/loss_step=0.000584, global_step=1054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  75%|███████▌  | 60/80 [05:52<01:55,  5.78s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=2.39e-6, train/loss_step=0.000584, global_step=1054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  75%|███████▌  | 60/80 [05:52<01:55,  5.78s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=5.41e-6, train/loss_step=0.00094, global_step=1054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=5.41e-6, train/loss_step=0.00094, global_step=1054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.52e-5, train/loss_step=0.0112, global_step=1055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  78%|███████▊  | 62/80 [05:53<01:41,  5.61s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.52e-5, train/loss_step=0.0112, global_step=1055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  78%|███████▊  | 62/80 [05:53<01:41,  5.61s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00092, train/loss_vlb_step=4.29e-6, train/loss_step=0.00092, global_step=1055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  79%|███████▉  | 63/80 [05:54<01:34,  5.53s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00092, train/loss_vlb_step=4.29e-6, train/loss_step=0.00092, global_step=1055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  79%|███████▉  | 63/80 [05:54<01:34,  5.53s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.69e-5, train/loss_step=0.00283, global_step=1055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  80%|████████  | 64/80 [06:36<01:37,  6.11s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.69e-5, train/loss_step=0.00283, global_step=1055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  80%|████████  | 64/80 [06:36<01:37,  6.11s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6.19e-6, train/loss_step=0.00151, global_step=1055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  81%|████████▏ | 65/80 [06:37<01:30,  6.02s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6.19e-6, train/loss_step=0.00151, global_step=1055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  81%|████████▏ | 65/80 [06:37<01:30,  6.02s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=6.38e-5, train/loss_step=0.00145, global_step=1056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  82%|████████▎ | 66/80 [06:38<01:23,  5.94s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=6.38e-5, train/loss_step=0.00145, global_step=1056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  82%|████████▎ | 66/80 [06:38<01:23,  5.94s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=0.000222, train/loss_step=0.0117, global_step=1056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]   Epoch 52:  84%|████████▍ | 67/80 [06:38<01:16,  5.86s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=0.000222, train/loss_step=0.0117, global_step=1056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  84%|████████▍ | 67/80 [06:38<01:16,  5.86s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=1.68e-6, train/loss_step=0.000426, global_step=1056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  85%|████████▌ | 68/80 [06:39<01:09,  5.78s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=1.68e-6, train/loss_step=0.000426, global_step=1056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  85%|████████▌ | 68/80 [06:39<01:09,  5.78s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=4.23e-5, train/loss_step=0.00331, global_step=1056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 52:  86%|████████▋ | 69/80 [06:39<01:02,  5.71s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=4.23e-5, train/loss_step=0.00331, global_step=1056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  86%|████████▋ | 69/80 [06:39<01:02,  5.71s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=9.28e-6, train/loss_step=0.00218, global_step=1057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  88%|████████▊ | 70/80 [06:40<00:56,  5.63s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=9.28e-6, train/loss_step=0.00218, global_step=1057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  88%|████████▊ | 70/80 [06:40<00:56,  5.63s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=6.13e-6, train/loss_step=0.000833, global_step=1057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=6.13e-6, train/loss_step=0.000833, global_step=1057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.01e-6, train/loss_step=0.000452, global_step=1057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  90%|█████████ | 72/80 [07:09<00:47,  5.88s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.01e-6, train/loss_step=0.000452, global_step=1057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  90%|█████████ | 72/80 [07:09<00:47,  5.88s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=1.49e-5, train/loss_step=0.0038, global_step=1057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]    Epoch 52:  91%|█████████▏| 73/80 [07:09<00:40,  5.81s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=1.49e-5, train/loss_step=0.0038, global_step=1057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  91%|█████████▏| 73/80 [07:09<00:40,  5.81s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=1.52e-5, train/loss_step=0.00427, global_step=1058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  92%|█████████▎| 74/80 [07:10<00:34,  5.74s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=1.52e-5, train/loss_step=0.00427, global_step=1058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  92%|█████████▎| 74/80 [07:10<00:34,  5.74s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=7.22e-6, train/loss_step=0.00109, global_step=1058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  94%|█████████▍| 75/80 [07:10<00:28,  5.67s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=7.22e-6, train/loss_step=0.00109, global_step=1058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  94%|█████████▍| 75/80 [07:10<00:28,  5.67s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.93e-6, train/loss_step=0.000416, global_step=1058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  95%|█████████▌| 76/80 [07:11<00:22,  5.60s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.93e-6, train/loss_step=0.000416, global_step=1058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  95%|█████████▌| 76/80 [07:11<00:22,  5.60s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=3.33e-6, train/loss_step=0.000637, global_step=1058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417] Epoch 52:  96%|█████████▋| 77/80 [07:11<00:16,  5.54s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=3.33e-6, train/loss_step=0.000637, global_step=1058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  96%|█████████▋| 77/80 [07:11<00:16,  5.54s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=2.57e-6, train/loss_step=0.000613, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  98%|█████████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=2.57e-6, train/loss_step=0.000613, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  98%|█████████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=2.82e-5, train/loss_step=0.000999, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=2.82e-5, train/loss_step=0.000999, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=4.4e-6, train/loss_step=0.00074, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]   Epoch 52: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=4.4e-6, train/loss_step=0.00074, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 52: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.01e-6, train/loss_step=0.000242, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Average Epoch time: 433.34 seconds
+Average Peak memory 29564.53MiB
+Epoch 52:   0%|          | 0/80 [00:00<00:00, 4120.14it/s, loss=0.00248, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.01e-6, train/loss_step=0.000242, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 53:   0%|          | 0/80 [00:00<00:00, 1829.18it/s, loss=0.00248, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.01e-6, train/loss_step=0.000242, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]Epoch 53:   1%|▏         | 1/80 [00:34<22:27, 17.05s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.01e-6, train/loss_step=0.000242, global_step=1059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00417, train/loss_vlb_epoch=8.3e-5, train/loss_epoch=0.00417]  Epoch 53:   1%|▏         | 1/80 [00:34<22:27, 17.05s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=7.86e-6, train/loss_step=0.0019, global_step=1060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]   Epoch 53:   2%|▎         | 2/80 [00:44<19:28, 14.98s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=7.86e-6, train/loss_step=0.0019, global_step=1060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:   2%|▎         | 2/80 [00:44<19:28, 14.98s/it, loss=0.002, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=2.24e-6, train/loss_step=0.000538, global_step=1060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:   4%|▍         | 3/80 [00:45<14:34, 11.36s/it, loss=0.002, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=2.24e-6, train/loss_step=0.000538, global_step=1060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:   4%|▍         | 3/80 [00:45<14:34, 11.36s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=1.62e-5, train/loss_step=0.00132, global_step=1060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:   5%|▌         | 4/80 [00:45<11:38,  9.19s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=1.62e-5, train/loss_step=0.00132, global_step=1060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:   5%|▌         | 4/80 [00:45<11:38,  9.19s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=4.86e-5, train/loss_step=0.0126, global_step=1060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:   6%|▋         | 5/80 [00:46<09:46,  7.82s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=4.86e-5, train/loss_step=0.0126, global_step=1060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:   6%|▋         | 5/80 [00:46<09:46,  7.82s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=7.8e-6, train/loss_step=0.00124, global_step=1061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:   8%|▊         | 6/80 [00:47<08:21,  6.77s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=7.8e-6, train/loss_step=0.00124, global_step=1061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:   8%|▊         | 6/80 [00:47<08:21,  6.77s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=9.39e-5, train/loss_step=0.012, global_step=1061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]   Epoch 53:   9%|▉         | 7/80 [00:47<07:16,  5.99s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=9.39e-5, train/loss_step=0.012, global_step=1061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:   9%|▉         | 7/80 [00:47<07:16,  5.99s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=3.92e-5, train/loss_step=0.0102, global_step=1061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  10%|█         | 8/80 [01:15<10:06,  8.42s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=3.92e-5, train/loss_step=0.0102, global_step=1061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  10%|█         | 8/80 [01:15<10:06,  8.42s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.67e-6, train/loss_step=0.000599, global_step=1061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  11%|█▏        | 9/80 [01:16<09:01,  7.63s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.67e-6, train/loss_step=0.000599, global_step=1061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  11%|█▏        | 9/80 [01:16<09:01,  7.63s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=1.81e-5, train/loss_step=0.00497, global_step=1062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  12%|█▎        | 10/80 [01:21<08:39,  7.42s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=1.81e-5, train/loss_step=0.00497, global_step=1062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  12%|█▎        | 10/80 [01:21<08:39,  7.42s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.0095, train/loss_vlb_step=4.92e-5, train/loss_step=0.0095, global_step=1062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]   Epoch 53:  14%|█▍        | 11/80 [01:22<07:51,  6.84s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.0095, train/loss_vlb_step=4.92e-5, train/loss_step=0.0095, global_step=1062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  14%|█▍        | 11/80 [01:22<07:51,  6.84s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=2.83e-5, train/loss_step=0.00788, global_step=1062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  15%|█▌        | 12/80 [01:39<08:40,  7.66s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=2.83e-5, train/loss_step=0.00788, global_step=1062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  15%|█▌        | 12/80 [01:39<08:40,  7.66s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000822, train/loss_vlb_step=4.97e-6, train/loss_step=0.000822, global_step=1062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  16%|█▋        | 13/80 [01:40<07:58,  7.15s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000822, train/loss_vlb_step=4.97e-6, train/loss_step=0.000822, global_step=1062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  16%|█▋        | 13/80 [01:40<07:58,  7.15s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=6.09e-6, train/loss_step=0.000817, global_step=1063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  18%|█▊        | 14/80 [01:40<07:22,  6.70s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=6.09e-6, train/loss_step=0.000817, global_step=1063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  18%|█▊        | 14/80 [01:40<07:22,  6.70s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.35e-5, train/loss_step=0.00394, global_step=1063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]   Epoch 53:  19%|█▉        | 15/80 [01:41<06:50,  6.31s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.35e-5, train/loss_step=0.00394, global_step=1063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  19%|█▉        | 15/80 [01:41<06:50,  6.31s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=0.000405, train/loss_step=0.019, global_step=1063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  20%|██        | 16/80 [01:51<06:58,  6.53s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=0.000405, train/loss_step=0.019, global_step=1063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  20%|██        | 16/80 [01:51<06:58,  6.53s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000611, train/loss_vlb_step=2.89e-6, train/loss_step=0.000611, global_step=1063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  21%|██▏       | 17/80 [02:05<07:18,  6.96s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000611, train/loss_vlb_step=2.89e-6, train/loss_step=0.000611, global_step=1063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  21%|██▏       | 17/80 [02:05<07:18,  6.96s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=0.000113, train/loss_step=0.00226, global_step=1064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  22%|██▎       | 18/80 [02:12<07:11,  6.96s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=0.000113, train/loss_step=0.00226, global_step=1064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  22%|██▎       | 18/80 [02:12<07:11,  6.96s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.37e-5, train/loss_step=0.0108, global_step=1064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  24%|██▍       | 19/80 [02:12<06:44,  6.63s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.37e-5, train/loss_step=0.0108, global_step=1064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  24%|██▍       | 19/80 [02:12<06:44,  6.63s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=5.65e-6, train/loss_step=0.00113, global_step=1064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  25%|██▌       | 20/80 [02:24<06:52,  6.88s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=5.65e-6, train/loss_step=0.00113, global_step=1064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  25%|██▌       | 20/80 [02:24<06:52,  6.88s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000916, train/loss_vlb_step=3.18e-6, train/loss_step=0.000916, global_step=1064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  26%|██▋       | 21/80 [02:25<06:29,  6.59s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000916, train/loss_vlb_step=3.18e-6, train/loss_step=0.000916, global_step=1064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  26%|██▋       | 21/80 [02:25<06:29,  6.59s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=3.2e-6, train/loss_step=0.000472, global_step=1065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443] Epoch 53:  28%|██▊       | 22/80 [02:25<06:07,  6.33s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=3.2e-6, train/loss_step=0.000472, global_step=1065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  28%|██▊       | 22/80 [02:25<06:07,  6.33s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000944, train/loss_vlb_step=1.38e-5, train/loss_step=0.000944, global_step=1065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  29%|██▉       | 23/80 [02:26<05:46,  6.09s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000944, train/loss_vlb_step=1.38e-5, train/loss_step=0.000944, global_step=1065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  29%|██▉       | 23/80 [02:26<05:46,  6.09s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=2.88e-6, train/loss_step=0.000802, global_step=1065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  30%|███       | 24/80 [02:26<05:28,  5.86s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=2.88e-6, train/loss_step=0.000802, global_step=1065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  30%|███       | 24/80 [02:26<05:28,  5.86s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.99e-6, train/loss_step=0.00136, global_step=1065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  31%|███▏      | 25/80 [02:46<05:53,  6.42s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.99e-6, train/loss_step=0.00136, global_step=1065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  31%|███▏      | 25/80 [02:46<05:53,  6.42s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.21e-5, train/loss_step=0.00352, global_step=1066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  32%|███▎      | 26/80 [02:49<05:39,  6.30s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.21e-5, train/loss_step=0.00352, global_step=1066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  32%|███▎      | 26/80 [02:49<05:39,  6.30s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=1.69e-6, train/loss_step=0.00043, global_step=1066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  34%|███▍      | 27/80 [02:50<05:22,  6.09s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=1.69e-6, train/loss_step=0.00043, global_step=1066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  34%|███▍      | 27/80 [02:50<05:22,  6.09s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=3.91e-5, train/loss_step=0.00824, global_step=1066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  35%|███▌      | 28/80 [03:08<05:37,  6.49s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=3.91e-5, train/loss_step=0.00824, global_step=1066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  35%|███▌      | 28/80 [03:08<05:37,  6.49s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=2e-5, train/loss_step=0.00184, global_step=1066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]   Epoch 53:  36%|███▋      | 29/80 [03:08<05:20,  6.29s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=2e-5, train/loss_step=0.00184, global_step=1066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  36%|███▋      | 29/80 [03:08<05:20,  6.29s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.77e-5, train/loss_step=0.0198, global_step=1067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  38%|███▊      | 30/80 [03:09<05:05,  6.10s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=7.77e-5, train/loss_step=0.0198, global_step=1067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  38%|███▊      | 30/80 [03:09<05:05,  6.10s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.41e-6, train/loss_step=0.000323, global_step=1067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  39%|███▉      | 31/80 [03:09<04:50,  5.93s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.41e-6, train/loss_step=0.000323, global_step=1067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  39%|███▉      | 31/80 [03:09<04:50,  5.93s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.87e-5, train/loss_step=0.0108, global_step=1067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]    Epoch 53:  40%|████      | 32/80 [03:10<04:36,  5.76s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.87e-5, train/loss_step=0.0108, global_step=1067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  40%|████      | 32/80 [03:10<04:36,  5.76s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.00966, train/loss_step=0.0443, global_step=1067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  41%|████▏     | 33/80 [03:26<04:45,  6.08s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0443, train/loss_vlb_step=0.00966, train/loss_step=0.0443, global_step=1067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  41%|████▏     | 33/80 [03:26<04:45,  6.08s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=2.25e-5, train/loss_step=0.00239, global_step=1068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  42%|████▎     | 34/80 [03:39<04:48,  6.28s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=2.25e-5, train/loss_step=0.00239, global_step=1068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  42%|████▎     | 34/80 [03:39<04:48,  6.28s/it, loss=0.00725, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=8.04e-5, train/loss_step=0.0152, global_step=1068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00725, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=8.04e-5, train/loss_step=0.0152, global_step=1068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00634, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=4.29e-6, train/loss_step=0.000606, global_step=1068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  45%|████▌     | 36/80 [03:44<04:27,  6.08s/it, loss=0.00634, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=4.29e-6, train/loss_step=0.000606, global_step=1068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  45%|████▌     | 36/80 [03:44<04:27,  6.08s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.32e-6, train/loss_step=0.000326, global_step=1068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  46%|████▋     | 37/80 [03:45<04:15,  5.93s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.32e-6, train/loss_step=0.000326, global_step=1068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  46%|████▋     | 37/80 [03:45<04:15,  5.93s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=0.00056, train/loss_step=0.00294, global_step=1069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  48%|████▊     | 38/80 [03:45<04:03,  5.79s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=0.00056, train/loss_step=0.00294, global_step=1069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  48%|████▊     | 38/80 [03:45<04:03,  5.79s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=2.13e-5, train/loss_step=0.00221, global_step=1069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  49%|████▉     | 39/80 [03:46<03:52,  5.66s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=2.13e-5, train/loss_step=0.00221, global_step=1069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  49%|████▉     | 39/80 [03:46<03:52,  5.66s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=0.000125, train/loss_step=0.00172, global_step=1069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  50%|█████     | 40/80 [03:50<03:44,  5.62s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=0.000125, train/loss_step=0.00172, global_step=1069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  50%|█████     | 40/80 [03:50<03:44,  5.62s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=5.03e-5, train/loss_step=0.00897, global_step=1069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443] Epoch 53:  51%|█████▏    | 41/80 [04:10<03:52,  5.96s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=5.03e-5, train/loss_step=0.00897, global_step=1069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  51%|█████▏    | 41/80 [04:10<03:52,  5.96s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=3.51e-5, train/loss_step=0.0054, global_step=1070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=3.51e-5, train/loss_step=0.0054, global_step=1070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.0007, train/loss_vlb_step=5.38e-6, train/loss_step=0.0007, global_step=1070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.0007, train/loss_vlb_step=5.38e-6, train/loss_step=0.0007, global_step=1070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=2.03e-5, train/loss_step=0.00106, global_step=1070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  55%|█████▌    | 44/80 [04:26<03:33,  5.93s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=2.03e-5, train/loss_step=0.00106, global_step=1070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  55%|█████▌    | 44/80 [04:26<03:33,  5.93s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.28e-5, train/loss_step=0.00363, global_step=1070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  56%|█████▋    | 45/80 [04:27<03:23,  5.81s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.28e-5, train/loss_step=0.00363, global_step=1070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  56%|█████▋    | 45/80 [04:27<03:23,  5.81s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=2.55e-6, train/loss_step=0.000613, global_step=1071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  57%|█████▊    | 46/80 [04:27<03:13,  5.70s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=2.55e-6, train/loss_step=0.000613, global_step=1071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  57%|█████▊    | 46/80 [04:27<03:13,  5.70s/it, loss=0.00662, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.31e-6, train/loss_step=0.00144, global_step=1071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  59%|█████▉    | 47/80 [04:36<03:09,  5.75s/it, loss=0.00662, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.31e-6, train/loss_step=0.00144, global_step=1071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  59%|█████▉    | 47/80 [04:36<03:09,  5.75s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.000771, train/loss_vlb_step=6.48e-6, train/loss_step=0.000771, global_step=1071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  60%|██████    | 48/80 [04:36<03:00,  5.64s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.000771, train/loss_vlb_step=6.48e-6, train/loss_step=0.000771, global_step=1071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  60%|██████    | 48/80 [04:36<03:00,  5.64s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.000427, train/loss_vlb_step=2.07e-6, train/loss_step=0.000427, global_step=1071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  61%|██████▏   | 49/80 [04:48<02:58,  5.77s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.000427, train/loss_vlb_step=2.07e-6, train/loss_step=0.000427, global_step=1071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  61%|██████▏   | 49/80 [04:48<02:58,  5.77s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000628, train/loss_vlb_step=3.03e-6, train/loss_step=0.000628, global_step=1072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  62%|██████▎   | 50/80 [05:06<03:00,  6.02s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000628, train/loss_vlb_step=3.03e-6, train/loss_step=0.000628, global_step=1072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  62%|██████▎   | 50/80 [05:06<03:00,  6.02s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000944, train/loss_vlb_step=4.58e-6, train/loss_step=0.000944, global_step=1072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000944, train/loss_vlb_step=4.58e-6, train/loss_step=0.000944, global_step=1072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000492, train/loss_vlb_step=2.17e-6, train/loss_step=0.000492, global_step=1072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  65%|██████▌   | 52/80 [05:13<02:45,  5.91s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000492, train/loss_vlb_step=2.17e-6, train/loss_step=0.000492, global_step=1072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  65%|██████▌   | 52/80 [05:13<02:45,  5.91s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.59e-5, train/loss_step=0.00293, global_step=1072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  66%|██████▋   | 53/80 [05:13<02:36,  5.81s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=1.59e-5, train/loss_step=0.00293, global_step=1072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  66%|██████▋   | 53/80 [05:13<02:36,  5.81s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=3.06e-6, train/loss_step=0.000632, global_step=1073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  68%|██████▊   | 54/80 [05:14<02:28,  5.71s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=3.06e-6, train/loss_step=0.000632, global_step=1073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  68%|██████▊   | 54/80 [05:14<02:28,  5.71s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000493, train/loss_vlb_step=2.6e-6, train/loss_step=0.000493, global_step=1073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443] Epoch 53:  69%|██████▉   | 55/80 [05:18<02:22,  5.70s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000493, train/loss_vlb_step=2.6e-6, train/loss_step=0.000493, global_step=1073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  69%|██████▉   | 55/80 [05:18<02:22,  5.70s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=7.32e-6, train/loss_step=0.000696, global_step=1073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  70%|███████   | 56/80 [05:19<02:14,  5.60s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000696, train/loss_vlb_step=7.32e-6, train/loss_step=0.000696, global_step=1073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  70%|███████   | 56/80 [05:19<02:14,  5.60s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=3.39e-5, train/loss_step=0.00201, global_step=1073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  71%|███████▏  | 57/80 [05:41<02:15,  5.89s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=3.39e-5, train/loss_step=0.00201, global_step=1073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  71%|███████▏  | 57/80 [05:41<02:15,  5.89s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.000853, train/loss_vlb_step=7.5e-6, train/loss_step=0.000853, global_step=1074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  72%|███████▎  | 58/80 [05:49<02:10,  5.93s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.000853, train/loss_vlb_step=7.5e-6, train/loss_step=0.000853, global_step=1074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  72%|███████▎  | 58/80 [05:49<02:10,  5.93s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=5.31e-5, train/loss_step=0.00111, global_step=1074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443] Epoch 53:  74%|███████▍  | 59/80 [05:50<02:02,  5.84s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=5.31e-5, train/loss_step=0.00111, global_step=1074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  74%|███████▍  | 59/80 [05:50<02:02,  5.84s/it, loss=0.00173, v_num=0, train/loss_simple_step=0.000889, train/loss_vlb_step=3.65e-6, train/loss_step=0.000889, global_step=1074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  75%|███████▌  | 60/80 [05:52<01:55,  5.77s/it, loss=0.00173, v_num=0, train/loss_simple_step=0.000889, train/loss_vlb_step=3.65e-6, train/loss_step=0.000889, global_step=1074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  75%|███████▌  | 60/80 [05:52<01:55,  5.77s/it, loss=0.00144, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.79e-5, train/loss_step=0.00317, global_step=1074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  76%|███████▋  | 61/80 [05:53<01:48,  5.69s/it, loss=0.00144, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.79e-5, train/loss_step=0.00317, global_step=1074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  76%|███████▋  | 61/80 [05:53<01:48,  5.69s/it, loss=0.00119, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.16e-6, train/loss_step=0.000264, global_step=1075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  78%|███████▊  | 62/80 [05:53<01:41,  5.61s/it, loss=0.00119, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.16e-6, train/loss_step=0.000264, global_step=1075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  78%|███████▊  | 62/80 [05:53<01:41,  5.61s/it, loss=0.00124, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=9.6e-6, train/loss_step=0.00174, global_step=1075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]   Epoch 53:  79%|███████▉  | 63/80 [05:58<01:35,  5.61s/it, loss=0.00124, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=9.6e-6, train/loss_step=0.00174, global_step=1075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  79%|███████▉  | 63/80 [05:58<01:35,  5.61s/it, loss=0.00137, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2.2e-5, train/loss_step=0.00362, global_step=1075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  80%|████████  | 64/80 [05:59<01:28,  5.53s/it, loss=0.00137, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2.2e-5, train/loss_step=0.00362, global_step=1075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  80%|████████  | 64/80 [05:59<01:28,  5.53s/it, loss=0.0012, v_num=0, train/loss_simple_step=0.000249, train/loss_vlb_step=1.15e-6, train/loss_step=0.000249, global_step=1075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  81%|████████▏ | 65/80 [06:30<01:28,  5.92s/it, loss=0.0012, v_num=0, train/loss_simple_step=0.000249, train/loss_vlb_step=1.15e-6, train/loss_step=0.000249, global_step=1075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  81%|████████▏ | 65/80 [06:30<01:28,  5.92s/it, loss=0.002, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=0.000103, train/loss_step=0.0167, global_step=1076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]    Epoch 53:  82%|████████▎ | 66/80 [06:31<01:21,  5.84s/it, loss=0.002, v_num=0, train/loss_simple_step=0.0167, train/loss_vlb_step=0.000103, train/loss_step=0.0167, global_step=1076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  82%|████████▎ | 66/80 [06:31<01:21,  5.84s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=0.00119, train/loss_step=0.00732, global_step=1076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  84%|████████▍ | 67/80 [06:31<01:14,  5.76s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=0.00119, train/loss_step=0.00732, global_step=1076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  84%|████████▍ | 67/80 [06:31<01:14,  5.76s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=1.48e-5, train/loss_step=0.00449, global_step=1076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  85%|████████▌ | 68/80 [06:32<01:08,  5.68s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=1.48e-5, train/loss_step=0.00449, global_step=1076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  85%|████████▌ | 68/80 [06:32<01:08,  5.68s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000829, train/loss_vlb_step=4.36e-6, train/loss_step=0.000829, global_step=1076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  86%|████████▋ | 69/80 [06:33<01:01,  5.61s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000829, train/loss_vlb_step=4.36e-6, train/loss_step=0.000829, global_step=1076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  86%|████████▋ | 69/80 [06:33<01:01,  5.61s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=4.76e-6, train/loss_step=0.000893, global_step=1077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=4.76e-6, train/loss_step=0.000893, global_step=1077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=1.02e-5, train/loss_step=0.000727, global_step=1077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  89%|████████▉ | 71/80 [06:38<00:49,  5.53s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=1.02e-5, train/loss_step=0.000727, global_step=1077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  89%|████████▉ | 71/80 [06:38<00:49,  5.53s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.91e-5, train/loss_step=0.00467, global_step=1077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  90%|█████████ | 72/80 [06:38<00:43,  5.46s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=2.91e-5, train/loss_step=0.00467, global_step=1077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  90%|█████████ | 72/80 [06:38<00:43,  5.46s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.42e-5, train/loss_step=0.00676, global_step=1077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  91%|█████████▏| 73/80 [07:02<00:39,  5.71s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.42e-5, train/loss_step=0.00676, global_step=1077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  91%|█████████▏| 73/80 [07:02<00:39,  5.71s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.49e-6, train/loss_step=0.000295, global_step=1078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  92%|█████████▎| 74/80 [07:02<00:33,  5.64s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.49e-6, train/loss_step=0.000295, global_step=1078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  92%|█████████▎| 74/80 [07:02<00:33,  5.64s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=1.45e-5, train/loss_step=0.00432, global_step=1078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 53:  94%|█████████▍| 75/80 [07:03<00:27,  5.57s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=1.45e-5, train/loss_step=0.00432, global_step=1078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  94%|█████████▍| 75/80 [07:03<00:27,  5.57s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=5.41e-5, train/loss_step=0.00691, global_step=1078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  95%|█████████▌| 76/80 [07:03<00:22,  5.50s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=5.41e-5, train/loss_step=0.00691, global_step=1078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  95%|█████████▌| 76/80 [07:03<00:22,  5.50s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00083, train/loss_vlb_step=7.28e-6, train/loss_step=0.00083, global_step=1078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  96%|█████████▋| 77/80 [07:04<00:16,  5.44s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00083, train/loss_vlb_step=7.28e-6, train/loss_step=0.00083, global_step=1078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  96%|█████████▋| 77/80 [07:04<00:16,  5.44s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.32e-6, train/loss_step=0.00119, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  98%|█████████▊| 78/80 [07:04<00:10,  5.38s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.32e-6, train/loss_step=0.00119, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  98%|█████████▊| 78/80 [07:04<00:10,  5.38s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=9.12e-6, train/loss_step=0.00134, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  99%|█████████▉| 79/80 [07:05<00:05,  5.32s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=9.12e-6, train/loss_step=0.00134, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53:  99%|█████████▉| 79/80 [07:05<00:05,  5.32s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=1.01e-5, train/loss_step=0.00068, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53: 100%|██████████| 80/80 [07:05<00:00,  5.26s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=1.01e-5, train/loss_step=0.00068, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 53: 100%|██████████| 80/80 [07:05<00:00,  5.26s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000583, train/loss_vlb_step=2.23e-6, train/loss_step=0.000583, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Average Epoch time: 425.78 seconds
+Average Peak memory 29564.03MiB
+Epoch 53:   0%|          | 0/80 [00:00<00:00, 6533.18it/s, loss=0.00322, v_num=0, train/loss_simple_step=0.000583, train/loss_vlb_step=2.23e-6, train/loss_step=0.000583, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 54:   0%|          | 0/80 [00:00<00:00, 2223.92it/s, loss=0.00322, v_num=0, train/loss_simple_step=0.000583, train/loss_vlb_step=2.23e-6, train/loss_step=0.000583, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]Epoch 54:   1%|▏         | 1/80 [00:46<30:22, 23.07s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000583, train/loss_vlb_step=2.23e-6, train/loss_step=0.000583, global_step=1079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00443, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00443]  Epoch 54:   1%|▏         | 1/80 [00:46<30:22, 23.07s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.24e-6, train/loss_step=0.000271, global_step=1080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   2%|▎         | 2/80 [00:46<20:11, 15.54s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.24e-6, train/loss_step=0.000271, global_step=1080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   2%|▎         | 2/80 [00:46<20:11, 15.54s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=3.63e-5, train/loss_step=0.00902, global_step=1080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:   4%|▍         | 3/80 [00:47<15:06, 11.78s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00902, train/loss_vlb_step=3.63e-5, train/loss_step=0.00902, global_step=1080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   4%|▍         | 3/80 [00:47<15:06, 11.78s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=9.81e-6, train/loss_step=0.00275, global_step=1080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   5%|▌         | 4/80 [00:47<12:03,  9.53s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=9.81e-6, train/loss_step=0.00275, global_step=1080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   5%|▌         | 4/80 [00:47<12:03,  9.53s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=0.000107, train/loss_step=0.00636, global_step=1080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   6%|▋         | 5/80 [00:48<10:01,  8.02s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=0.000107, train/loss_step=0.00636, global_step=1080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   6%|▋         | 5/80 [00:48<10:01,  8.02s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000465, train/loss_vlb_step=2.47e-6, train/loss_step=0.000465, global_step=1081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   8%|▊         | 6/80 [00:48<08:33,  6.94s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000465, train/loss_vlb_step=2.47e-6, train/loss_step=0.000465, global_step=1081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   8%|▊         | 6/80 [00:48<08:33,  6.94s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=2.7e-5, train/loss_step=0.0075, global_step=1081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]     Epoch 54:   9%|▉         | 7/80 [00:49<07:28,  6.14s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=2.7e-5, train/loss_step=0.0075, global_step=1081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:   9%|▉         | 7/80 [00:49<07:28,  6.14s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000502, train/loss_vlb_step=2.01e-6, train/loss_step=0.000502, global_step=1081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  10%|█         | 8/80 [01:19<10:33,  8.80s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000502, train/loss_vlb_step=2.01e-6, train/loss_step=0.000502, global_step=1081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  10%|█         | 8/80 [01:19<10:33,  8.80s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=1.36e-5, train/loss_step=0.00413, global_step=1081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  11%|█▏        | 9/80 [01:19<09:26,  7.98s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=1.36e-5, train/loss_step=0.00413, global_step=1081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  11%|█▏        | 9/80 [01:19<09:26,  7.98s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=1.38e-6, train/loss_step=0.000316, global_step=1082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  12%|█▎        | 10/80 [01:22<08:46,  7.52s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=1.38e-6, train/loss_step=0.000316, global_step=1082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  12%|█▎        | 10/80 [01:22<08:46,  7.52s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=7.93e-5, train/loss_step=0.0126, global_step=1082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]    Epoch 54:  14%|█▍        | 11/80 [01:49<10:30,  9.14s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=7.93e-5, train/loss_step=0.0126, global_step=1082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  14%|█▍        | 11/80 [01:49<10:30,  9.14s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.14e-5, train/loss_step=0.00581, global_step=1082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  15%|█▌        | 12/80 [01:50<09:36,  8.47s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.14e-5, train/loss_step=0.00581, global_step=1082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  15%|█▌        | 12/80 [01:50<09:36,  8.47s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.000191, train/loss_step=0.0107, global_step=1082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54:  16%|█▋        | 13/80 [01:50<08:49,  7.91s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.000191, train/loss_step=0.0107, global_step=1082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  16%|█▋        | 13/80 [01:50<08:49,  7.91s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=7.29e-6, train/loss_step=0.00122, global_step=1083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  18%|█▊        | 14/80 [01:51<08:09,  7.41s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=7.29e-6, train/loss_step=0.00122, global_step=1083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  18%|█▊        | 14/80 [01:51<08:09,  7.41s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.25e-5, train/loss_step=0.00234, global_step=1083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  19%|█▉        | 15/80 [01:51<07:33,  6.98s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=1.25e-5, train/loss_step=0.00234, global_step=1083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  19%|█▉        | 15/80 [01:51<07:33,  6.98s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000535, train/loss_vlb_step=3.39e-6, train/loss_step=0.000535, global_step=1083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  20%|██        | 16/80 [01:52<07:02,  6.60s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000535, train/loss_vlb_step=3.39e-6, train/loss_step=0.000535, global_step=1083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  20%|██        | 16/80 [01:52<07:02,  6.60s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=1.73e-6, train/loss_step=0.000446, global_step=1083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  21%|██▏       | 17/80 [01:52<06:34,  6.26s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=1.73e-6, train/loss_step=0.000446, global_step=1083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  21%|██▏       | 17/80 [01:52<06:34,  6.26s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.33e-5, train/loss_step=0.00248, global_step=1084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]   Epoch 54:  22%|██▎       | 18/80 [01:56<06:18,  6.11s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.33e-5, train/loss_step=0.00248, global_step=1084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  22%|██▎       | 18/80 [01:56<06:18,  6.11s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.16e-5, train/loss_step=0.00111, global_step=1084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  24%|██▍       | 19/80 [02:26<07:26,  7.32s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.16e-5, train/loss_step=0.00111, global_step=1084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  24%|██▍       | 19/80 [02:26<07:26,  7.32s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=3.44e-6, train/loss_step=0.000643, global_step=1084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  25%|██▌       | 20/80 [02:26<06:59,  7.00s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=3.44e-6, train/loss_step=0.000643, global_step=1084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  25%|██▌       | 20/80 [02:26<06:59,  7.00s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.67e-6, train/loss_step=0.00035, global_step=1084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  26%|██▋       | 21/80 [02:27<06:35,  6.70s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.67e-6, train/loss_step=0.00035, global_step=1084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  26%|██▋       | 21/80 [02:27<06:35,  6.70s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=4e-6, train/loss_step=0.000969, global_step=1085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54:  28%|██▊       | 22/80 [02:27<06:13,  6.43s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=4e-6, train/loss_step=0.000969, global_step=1085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  28%|██▊       | 22/80 [02:27<06:13,  6.43s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=2.14e-6, train/loss_step=0.000378, global_step=1085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  29%|██▉       | 23/80 [02:28<05:52,  6.19s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=2.14e-6, train/loss_step=0.000378, global_step=1085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  29%|██▉       | 23/80 [02:28<05:52,  6.19s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.54e-5, train/loss_step=0.00706, global_step=1085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  30%|███       | 24/80 [02:38<05:54,  6.33s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.54e-5, train/loss_step=0.00706, global_step=1085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  30%|███       | 24/80 [02:38<05:54,  6.33s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00991, train/loss_vlb_step=0.0044, train/loss_step=0.00991, global_step=1085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54:  31%|███▏      | 25/80 [02:40<05:38,  6.16s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00991, train/loss_vlb_step=0.0044, train/loss_step=0.00991, global_step=1085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  31%|███▏      | 25/80 [02:40<05:38,  6.16s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=2.21e-5, train/loss_step=0.0064, global_step=1086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54:  32%|███▎      | 26/80 [02:42<05:25,  6.04s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=2.21e-5, train/loss_step=0.0064, global_step=1086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  32%|███▎      | 26/80 [02:42<05:25,  6.04s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000853, train/loss_vlb_step=3.29e-6, train/loss_step=0.000853, global_step=1086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  34%|███▍      | 27/80 [03:02<05:45,  6.51s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000853, train/loss_vlb_step=3.29e-6, train/loss_step=0.000853, global_step=1086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  34%|███▍      | 27/80 [03:02<05:45,  6.51s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.07e-6, train/loss_step=0.000259, global_step=1086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.07e-6, train/loss_step=0.000259, global_step=1086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  35%|███▌      | 28/80 [03:02<05:27,  6.30s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=7.9e-6, train/loss_step=0.00147, global_step=1086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]   Epoch 54:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=7.9e-6, train/loss_step=0.00147, global_step=1086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  36%|███▋      | 29/80 [03:03<05:11,  6.11s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=7.93e-6, train/loss_step=0.00156, global_step=1087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=7.93e-6, train/loss_step=0.00156, global_step=1087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00085, train/loss_vlb_step=4.79e-6, train/loss_step=0.00085, global_step=1087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00085, train/loss_vlb_step=4.79e-6, train/loss_step=0.00085, global_step=1087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=0.000358, train/loss_step=0.00446, global_step=1087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  40%|████      | 32/80 [03:20<04:51,  6.07s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00446, train/loss_vlb_step=0.000358, train/loss_step=0.00446, global_step=1087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  40%|████      | 32/80 [03:20<04:51,  6.07s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.000203, train/loss_vlb_step=8.43e-7, train/loss_step=0.000203, global_step=1087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  41%|████▏     | 33/80 [03:20<04:37,  5.91s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.000203, train/loss_vlb_step=8.43e-7, train/loss_step=0.000203, global_step=1087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  41%|████▏     | 33/80 [03:20<04:37,  5.91s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.00143, train/loss_step=0.0107, global_step=1088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]    Epoch 54:  42%|████▎     | 34/80 [03:24<04:28,  5.83s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.00143, train/loss_step=0.0107, global_step=1088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  42%|████▎     | 34/80 [03:24<04:28,  5.83s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=7.52e-6, train/loss_step=0.00163, global_step=1088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  44%|████▍     | 35/80 [03:46<04:42,  6.28s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=7.52e-6, train/loss_step=0.00163, global_step=1088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  44%|████▍     | 35/80 [03:46<04:42,  6.28s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000692, train/loss_vlb_step=1.18e-5, train/loss_step=0.000692, global_step=1088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  45%|████▌     | 36/80 [03:46<04:29,  6.13s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000692, train/loss_vlb_step=1.18e-5, train/loss_step=0.000692, global_step=1088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  45%|████▌     | 36/80 [03:46<04:29,  6.13s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000249, train/loss_vlb_step=1.1e-6, train/loss_step=0.000249, global_step=1088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54:  46%|████▋     | 37/80 [03:47<04:17,  5.98s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000249, train/loss_vlb_step=1.1e-6, train/loss_step=0.000249, global_step=1088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  46%|████▋     | 37/80 [03:47<04:17,  5.98s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=1.44e-5, train/loss_step=0.00425, global_step=1089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  48%|████▊     | 38/80 [03:47<04:05,  5.84s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=1.44e-5, train/loss_step=0.00425, global_step=1089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  48%|████▊     | 38/80 [03:47<04:05,  5.84s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=2.52e-5, train/loss_step=0.00156, global_step=1089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  49%|████▉     | 39/80 [03:48<03:54,  5.71s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=2.52e-5, train/loss_step=0.00156, global_step=1089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  49%|████▉     | 39/80 [03:48<03:54,  5.71s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=7.07e-6, train/loss_step=0.00173, global_step=1089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  50%|█████     | 40/80 [03:56<03:51,  5.78s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=7.07e-6, train/loss_step=0.00173, global_step=1089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  50%|█████     | 40/80 [03:56<03:51,  5.78s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=2.5e-6, train/loss_step=0.000389, global_step=1089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  51%|█████▏    | 41/80 [03:57<03:40,  5.65s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=2.5e-6, train/loss_step=0.000389, global_step=1089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  51%|█████▏    | 41/80 [03:57<03:40,  5.65s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=8.89e-6, train/loss_step=0.00243, global_step=1090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54:  52%|█████▎    | 42/80 [03:57<03:30,  5.53s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=8.89e-6, train/loss_step=0.00243, global_step=1090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  52%|█████▎    | 42/80 [03:57<03:30,  5.53s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=9.38e-5, train/loss_step=0.0114, global_step=1090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=9.38e-5, train/loss_step=0.0114, global_step=1090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.48e-6, train/loss_step=0.00031, global_step=1090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  55%|█████▌    | 44/80 [04:28<03:34,  5.97s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.48e-6, train/loss_step=0.00031, global_step=1090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  55%|█████▌    | 44/80 [04:28<03:34,  5.97s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=2.94e-6, train/loss_step=0.000562, global_step=1090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  56%|█████▋    | 45/80 [04:29<03:24,  5.85s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=2.94e-6, train/loss_step=0.000562, global_step=1090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  56%|█████▋    | 45/80 [04:29<03:24,  5.85s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.27e-5, train/loss_step=0.00255, global_step=1091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.27e-5, train/loss_step=0.00255, global_step=1091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=0.0016, train/loss_step=0.00749, global_step=1091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=0.0016, train/loss_step=0.00749, global_step=1091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  59%|█████▉    | 47/80 [04:30<03:05,  5.63s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=6.7e-5, train/loss_step=0.00261, global_step=1091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  60%|██████    | 48/80 [04:49<03:08,  5.90s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=6.7e-5, train/loss_step=0.00261, global_step=1091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  60%|██████    | 48/80 [04:49<03:08,  5.90s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=0.000343, train/loss_step=0.0015, global_step=1091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  61%|██████▏   | 49/80 [04:50<02:59,  5.80s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=0.000343, train/loss_step=0.0015, global_step=1091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  61%|██████▏   | 49/80 [04:50<02:59,  5.80s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.08e-5, train/loss_step=0.0103, global_step=1092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  62%|██████▎   | 50/80 [04:50<02:50,  5.70s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.08e-5, train/loss_step=0.0103, global_step=1092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  62%|██████▎   | 50/80 [04:50<02:50,  5.70s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=4.02e-5, train/loss_step=0.00509, global_step=1092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  64%|██████▍   | 51/80 [05:07<02:51,  5.92s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=4.02e-5, train/loss_step=0.00509, global_step=1092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  64%|██████▍   | 51/80 [05:07<02:51,  5.92s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=0.00134, train/loss_step=0.00766, global_step=1092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  65%|██████▌   | 52/80 [05:08<02:42,  5.82s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=0.00134, train/loss_step=0.00766, global_step=1092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  65%|██████▌   | 52/80 [05:08<02:42,  5.82s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=7.51e-6, train/loss_step=0.00203, global_step=1092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=7.51e-6, train/loss_step=0.00203, global_step=1092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000307, train/loss_step=0.0154, global_step=1093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54:  68%|██████▊   | 54/80 [05:09<02:26,  5.63s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000307, train/loss_step=0.0154, global_step=1093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  68%|██████▊   | 54/80 [05:09<02:26,  5.63s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.000384, train/loss_vlb_step=1.48e-6, train/loss_step=0.000384, global_step=1093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  69%|██████▉   | 55/80 [05:10<02:18,  5.54s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.000384, train/loss_vlb_step=1.48e-6, train/loss_step=0.000384, global_step=1093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  69%|██████▉   | 55/80 [05:10<02:18,  5.54s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=1.2e-5, train/loss_step=0.00135, global_step=1093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]   Epoch 54:  70%|███████   | 56/80 [05:39<02:23,  5.96s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=1.2e-5, train/loss_step=0.00135, global_step=1093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  70%|███████   | 56/80 [05:39<02:23,  5.96s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=1.5e-5, train/loss_step=0.00389, global_step=1093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  71%|███████▏  | 57/80 [05:40<02:14,  5.87s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=1.5e-5, train/loss_step=0.00389, global_step=1093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  71%|███████▏  | 57/80 [05:40<02:14,  5.87s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=0.000105, train/loss_step=0.00944, global_step=1094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  72%|███████▎  | 58/80 [05:40<02:07,  5.78s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=0.000105, train/loss_step=0.00944, global_step=1094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  72%|███████▎  | 58/80 [05:40<02:07,  5.78s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.49e-5, train/loss_step=0.00535, global_step=1094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  74%|███████▍  | 59/80 [05:52<02:03,  5.88s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00535, train/loss_vlb_step=2.49e-5, train/loss_step=0.00535, global_step=1094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  74%|███████▍  | 59/80 [05:52<02:03,  5.88s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=0.000114, train/loss_step=0.0115, global_step=1094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  75%|███████▌  | 60/80 [05:53<01:55,  5.79s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=0.000114, train/loss_step=0.0115, global_step=1094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  75%|███████▌  | 60/80 [05:53<01:55,  5.79s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=1.88e-5, train/loss_step=0.00566, global_step=1094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  76%|███████▋  | 61/80 [05:53<01:48,  5.71s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=1.88e-5, train/loss_step=0.00566, global_step=1094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  76%|███████▋  | 61/80 [05:53<01:48,  5.71s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000948, train/loss_vlb_step=5.58e-6, train/loss_step=0.000948, global_step=1095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  78%|███████▊  | 62/80 [05:54<01:41,  5.62s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000948, train/loss_vlb_step=5.58e-6, train/loss_step=0.000948, global_step=1095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  78%|███████▊  | 62/80 [05:54<01:41,  5.62s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.07e-5, train/loss_step=0.003, global_step=1095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]      Epoch 54:  79%|███████▉  | 63/80 [05:54<01:34,  5.54s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.07e-5, train/loss_step=0.003, global_step=1095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  79%|███████▉  | 63/80 [05:54<01:34,  5.54s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000869, train/loss_vlb_step=9.59e-5, train/loss_step=0.000869, global_step=1095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  80%|████████  | 64/80 [06:22<01:34,  5.88s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000869, train/loss_vlb_step=9.59e-5, train/loss_step=0.000869, global_step=1095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  80%|████████  | 64/80 [06:22<01:34,  5.88s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.03e-6, train/loss_step=0.000296, global_step=1095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  81%|████████▏ | 65/80 [06:22<01:26,  5.80s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.03e-6, train/loss_step=0.000296, global_step=1095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  81%|████████▏ | 65/80 [06:22<01:26,  5.80s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.12e-5, train/loss_step=0.00186, global_step=1096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  82%|████████▎ | 66/80 [06:23<01:20,  5.72s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.12e-5, train/loss_step=0.00186, global_step=1096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  82%|████████▎ | 66/80 [06:23<01:20,  5.72s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=9.61e-7, train/loss_step=0.000278, global_step=1096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  84%|████████▍ | 67/80 [06:32<01:15,  5.77s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=9.61e-7, train/loss_step=0.000278, global_step=1096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  84%|████████▍ | 67/80 [06:32<01:15,  5.77s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00049, train/loss_vlb_step=2.97e-6, train/loss_step=0.00049, global_step=1096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  85%|████████▌ | 68/80 [06:33<01:08,  5.70s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00049, train/loss_vlb_step=2.97e-6, train/loss_step=0.00049, global_step=1096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  85%|████████▌ | 68/80 [06:33<01:08,  5.70s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=5.76e-6, train/loss_step=0.000939, global_step=1096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  86%|████████▋ | 69/80 [06:33<01:01,  5.63s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=5.76e-6, train/loss_step=0.000939, global_step=1096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  86%|████████▋ | 69/80 [06:33<01:01,  5.63s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=5.34e-6, train/loss_step=0.000566, global_step=1097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=5.34e-6, train/loss_step=0.000566, global_step=1097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.59e-5, train/loss_step=0.00469, global_step=1097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.59e-5, train/loss_step=0.00469, global_step=1097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.07e-5, train/loss_step=0.00252, global_step=1097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  90%|█████████ | 72/80 [06:54<00:45,  5.68s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=1.07e-5, train/loss_step=0.00252, global_step=1097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  90%|█████████ | 72/80 [06:54<00:45,  5.68s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=1.11e-5, train/loss_step=0.000732, global_step=1097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  91%|█████████▏| 73/80 [06:55<00:39,  5.61s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=1.11e-5, train/loss_step=0.000732, global_step=1097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  91%|█████████▏| 73/80 [06:55<00:39,  5.61s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=2.33e-6, train/loss_step=0.000564, global_step=1098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  92%|█████████▎| 74/80 [07:00<00:33,  5.60s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=2.33e-6, train/loss_step=0.000564, global_step=1098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  92%|█████████▎| 74/80 [07:00<00:33,  5.60s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.28e-5, train/loss_step=0.00132, global_step=1098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 54:  94%|█████████▍| 75/80 [07:01<00:27,  5.55s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.28e-5, train/loss_step=0.00132, global_step=1098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  94%|█████████▍| 75/80 [07:01<00:27,  5.55s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.12e-5, train/loss_step=0.00213, global_step=1098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  95%|█████████▌| 76/80 [07:02<00:21,  5.48s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=1.12e-5, train/loss_step=0.00213, global_step=1098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  95%|█████████▌| 76/80 [07:02<00:21,  5.48s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000519, train/loss_vlb_step=5.97e-6, train/loss_step=0.000519, global_step=1098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  96%|█████████▋| 77/80 [07:02<00:16,  5.42s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000519, train/loss_vlb_step=5.97e-6, train/loss_step=0.000519, global_step=1098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  96%|█████████▋| 77/80 [07:02<00:16,  5.42s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=9.51e-5, train/loss_step=0.0207, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]    Epoch 54:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=9.51e-5, train/loss_step=0.0207, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000228, train/loss_step=0.0119, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  99%|█████████▉| 79/80 [07:03<00:05,  5.30s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000228, train/loss_step=0.0119, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54:  99%|█████████▉| 79/80 [07:03<00:05,  5.30s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=5.27e-5, train/loss_step=0.0016, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461] Epoch 54: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=5.27e-5, train/loss_step=0.0016, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 54: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=1.03e-6, train/loss_step=0.00019, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Average Epoch time: 424.15 seconds
+Average Peak memory 29561.33MiB
+Epoch 54:   0%|          | 0/80 [00:00<00:00, 4013.69it/s, loss=0.0028, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=1.03e-6, train/loss_step=0.00019, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 55:   0%|          | 0/80 [00:00<00:00, 1800.13it/s, loss=0.0028, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=1.03e-6, train/loss_step=0.00019, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]Epoch 55:   1%|▏         | 1/80 [00:37<24:30, 18.61s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=1.03e-6, train/loss_step=0.00019, global_step=1099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00461, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00461]  Epoch 55:   1%|▏         | 1/80 [00:37<24:30, 18.61s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=2.85e-6, train/loss_step=0.000579, global_step=1100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:   2%|▎         | 2/80 [00:37<16:20, 12.57s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=2.85e-6, train/loss_step=0.000579, global_step=1100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:   2%|▎         | 2/80 [00:37<16:20, 12.57s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.34e-5, train/loss_step=0.00167, global_step=1100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:   4%|▍         | 3/80 [00:42<13:32, 10.56s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=1.34e-5, train/loss_step=0.00167, global_step=1100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:   4%|▍         | 3/80 [00:42<13:32, 10.56s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000347, train/loss_step=0.0138, global_step=1100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424] Epoch 55:   5%|▌         | 4/80 [00:48<12:19,  9.73s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000347, train/loss_step=0.0138, global_step=1100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:   5%|▌         | 4/80 [00:48<12:19,  9.73s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=0.000629, train/loss_step=0.00709, global_step=1100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:   6%|▋         | 5/80 [00:49<10:14,  8.20s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=0.000629, train/loss_step=0.00709, global_step=1100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:   6%|▋         | 5/80 [00:49<10:14,  8.20s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=0.000184, train/loss_step=0.010, global_step=1101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]   Epoch 55:   8%|▊         | 6/80 [00:49<08:45,  7.10s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=0.000184, train/loss_step=0.010, global_step=1101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:   8%|▊         | 6/80 [00:49<08:45,  7.10s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=2.92e-6, train/loss_step=0.00029, global_step=1101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:   9%|▉         | 7/80 [00:50<07:37,  6.27s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=2.92e-6, train/loss_step=0.00029, global_step=1101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:   9%|▉         | 7/80 [00:50<07:37,  6.27s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00016, train/loss_vlb_step=6.68e-7, train/loss_step=0.00016, global_step=1101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  10%|█         | 8/80 [01:27<11:37,  9.69s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00016, train/loss_vlb_step=6.68e-7, train/loss_step=0.00016, global_step=1101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  10%|█         | 8/80 [01:27<11:37,  9.69s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000272, train/loss_step=0.0188, global_step=1101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424] Epoch 55:  11%|█▏        | 9/80 [01:27<10:22,  8.77s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000272, train/loss_step=0.0188, global_step=1101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  11%|█▏        | 9/80 [01:27<10:22,  8.77s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=7.39e-6, train/loss_step=0.00213, global_step=1102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  12%|█▎        | 10/80 [01:28<09:21,  8.02s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=7.39e-6, train/loss_step=0.00213, global_step=1102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  12%|█▎        | 10/80 [01:28<09:21,  8.02s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000796, train/loss_vlb_step=4.11e-6, train/loss_step=0.000796, global_step=1102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  14%|█▍        | 11/80 [01:31<08:46,  7.63s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000796, train/loss_vlb_step=4.11e-6, train/loss_step=0.000796, global_step=1102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  14%|█▍        | 11/80 [01:31<08:46,  7.63s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=0.00546, train/loss_step=0.0111, global_step=1102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]     Epoch 55:  15%|█▌        | 12/80 [01:32<08:01,  7.09s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=0.00546, train/loss_step=0.0111, global_step=1102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  15%|█▌        | 12/80 [01:32<08:01,  7.09s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.000463, train/loss_vlb_step=2.27e-6, train/loss_step=0.000463, global_step=1102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  16%|█▋        | 13/80 [01:32<07:23,  6.62s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.000463, train/loss_vlb_step=2.27e-6, train/loss_step=0.000463, global_step=1102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  16%|█▋        | 13/80 [01:32<07:23,  6.62s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=2.5e-5, train/loss_step=0.00712, global_step=1103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]   Epoch 55:  18%|█▊        | 14/80 [01:33<06:49,  6.21s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=2.5e-5, train/loss_step=0.00712, global_step=1103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  18%|█▊        | 14/80 [01:33<06:49,  6.21s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.63e-6, train/loss_step=0.000426, global_step=1103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  19%|█▉        | 15/80 [01:33<06:20,  5.85s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.63e-6, train/loss_step=0.000426, global_step=1103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  19%|█▉        | 15/80 [01:33<06:20,  5.85s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=7.44e-6, train/loss_step=0.000712, global_step=1103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424] Epoch 55:  20%|██        | 16/80 [02:12<08:18,  7.78s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=7.44e-6, train/loss_step=0.000712, global_step=1103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  20%|██        | 16/80 [02:12<08:18,  7.78s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=1.24e-6, train/loss_step=0.000258, global_step=1103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  21%|██▏       | 17/80 [02:12<07:44,  7.38s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=1.24e-6, train/loss_step=0.000258, global_step=1103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  21%|██▏       | 17/80 [02:12<07:44,  7.38s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=0.000166, train/loss_step=0.00243, global_step=1104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424] Epoch 55:  22%|██▎       | 18/80 [02:13<07:15,  7.02s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=0.000166, train/loss_step=0.00243, global_step=1104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  22%|██▎       | 18/80 [02:13<07:15,  7.02s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000724, train/loss_vlb_step=2.53e-6, train/loss_step=0.000724, global_step=1104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  24%|██▍       | 19/80 [02:13<06:48,  6.69s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000724, train/loss_vlb_step=2.53e-6, train/loss_step=0.000724, global_step=1104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  24%|██▍       | 19/80 [02:13<06:48,  6.69s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=1.38e-6, train/loss_step=0.000347, global_step=1104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  25%|██▌       | 20/80 [02:14<06:24,  6.41s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=1.38e-6, train/loss_step=0.000347, global_step=1104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  25%|██▌       | 20/80 [02:14<06:24,  6.41s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.02e-5, train/loss_step=0.00578, global_step=1104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:  26%|██▋       | 21/80 [02:15<06:02,  6.14s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.02e-5, train/loss_step=0.00578, global_step=1104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  26%|██▋       | 21/80 [02:15<06:02,  6.14s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=7.69e-6, train/loss_step=0.00118, global_step=1105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  28%|██▊       | 22/80 [02:15<05:41,  5.89s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=7.69e-6, train/loss_step=0.00118, global_step=1105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  28%|██▊       | 22/80 [02:15<05:41,  5.89s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.25e-5, train/loss_step=0.00313, global_step=1105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  29%|██▉       | 23/80 [02:16<05:23,  5.67s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.25e-5, train/loss_step=0.00313, global_step=1105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  29%|██▉       | 23/80 [02:16<05:23,  5.67s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.28e-6, train/loss_step=0.000411, global_step=1105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  30%|███       | 24/80 [03:03<06:50,  7.33s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.28e-6, train/loss_step=0.000411, global_step=1105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  30%|███       | 24/80 [03:03<06:50,  7.33s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.31e-5, train/loss_step=0.0104, global_step=1105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]    Epoch 55:  31%|███▏      | 25/80 [03:03<06:28,  7.07s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.31e-5, train/loss_step=0.0104, global_step=1105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  31%|███▏      | 25/80 [03:03<06:28,  7.07s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000353, train/loss_vlb_step=1.49e-6, train/loss_step=0.000353, global_step=1106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  32%|███▎      | 26/80 [03:04<06:08,  6.83s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000353, train/loss_vlb_step=1.49e-6, train/loss_step=0.000353, global_step=1106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  32%|███▎      | 26/80 [03:04<06:08,  6.83s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.66e-5, train/loss_step=0.0107, global_step=1106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]    Epoch 55:  34%|███▍      | 27/80 [03:04<05:49,  6.60s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.66e-5, train/loss_step=0.0107, global_step=1106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  34%|███▍      | 27/80 [03:04<05:49,  6.60s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=0.000857, train/loss_step=0.00245, global_step=1106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  35%|███▌      | 28/80 [03:05<05:32,  6.39s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=0.000857, train/loss_step=0.00245, global_step=1106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  35%|███▌      | 28/80 [03:05<05:32,  6.39s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=7.4e-5, train/loss_step=0.0101, global_step=1106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]    Epoch 55:  36%|███▋      | 29/80 [03:05<05:16,  6.20s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=7.4e-5, train/loss_step=0.0101, global_step=1106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  36%|███▋      | 29/80 [03:05<05:16,  6.20s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=0.00105, train/loss_step=0.00243, global_step=1107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  38%|███▊      | 30/80 [03:06<05:00,  6.01s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=0.00105, train/loss_step=0.00243, global_step=1107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  38%|███▊      | 30/80 [03:06<05:00,  6.01s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=4.25e-6, train/loss_step=0.000547, global_step=1107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  39%|███▉      | 31/80 [03:06<04:46,  5.84s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=4.25e-6, train/loss_step=0.000547, global_step=1107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  39%|███▉      | 31/80 [03:06<04:46,  5.84s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000936, train/loss_vlb_step=6.6e-6, train/loss_step=0.000936, global_step=1107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424] Epoch 55:  40%|████      | 32/80 [03:49<05:33,  6.96s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000936, train/loss_vlb_step=6.6e-6, train/loss_step=0.000936, global_step=1107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  40%|████      | 32/80 [03:49<05:33,  6.96s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=3.24e-6, train/loss_step=0.000604, global_step=1107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  41%|████▏     | 33/80 [03:50<05:18,  6.77s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=3.24e-6, train/loss_step=0.000604, global_step=1107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  41%|████▏     | 33/80 [03:50<05:18,  6.77s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.3e-6, train/loss_step=0.000268, global_step=1108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424] Epoch 55:  42%|████▎     | 34/80 [03:50<05:03,  6.59s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.3e-6, train/loss_step=0.000268, global_step=1108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  42%|████▎     | 34/80 [03:50<05:03,  6.59s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=6.29e-5, train/loss_step=0.0117, global_step=1108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]   Epoch 55:  44%|████▍     | 35/80 [03:51<04:48,  6.42s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=6.29e-5, train/loss_step=0.0117, global_step=1108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  44%|████▍     | 35/80 [03:51<04:48,  6.42s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=1.69e-6, train/loss_step=0.000357, global_step=1108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  45%|████▌     | 36/80 [03:51<04:35,  6.26s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=1.69e-6, train/loss_step=0.000357, global_step=1108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  45%|████▌     | 36/80 [03:51<04:35,  6.26s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=3.16e-5, train/loss_step=0.00246, global_step=1108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:  46%|████▋     | 37/80 [03:52<04:22,  6.11s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=3.16e-5, train/loss_step=0.00246, global_step=1108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  46%|████▋     | 37/80 [03:52<04:22,  6.11s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.17e-6, train/loss_step=0.00162, global_step=1109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  48%|████▊     | 38/80 [03:52<04:10,  5.96s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=9.17e-6, train/loss_step=0.00162, global_step=1109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  48%|████▊     | 38/80 [03:52<04:10,  5.96s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=5.97e-6, train/loss_step=0.000734, global_step=1109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  49%|████▉     | 39/80 [03:53<03:58,  5.83s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000734, train/loss_vlb_step=5.97e-6, train/loss_step=0.000734, global_step=1109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  49%|████▉     | 39/80 [03:53<03:58,  5.83s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000318, train/loss_vlb_step=1.42e-6, train/loss_step=0.000318, global_step=1109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  50%|█████     | 40/80 [04:38<04:32,  6.80s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000318, train/loss_vlb_step=1.42e-6, train/loss_step=0.000318, global_step=1109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  50%|█████     | 40/80 [04:38<04:32,  6.80s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.11e-6, train/loss_step=0.000471, global_step=1109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  51%|█████▏    | 41/80 [04:39<04:19,  6.65s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.11e-6, train/loss_step=0.000471, global_step=1109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  51%|█████▏    | 41/80 [04:39<04:19,  6.65s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000629, train/loss_vlb_step=9.33e-6, train/loss_step=0.000629, global_step=1110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  52%|█████▎    | 42/80 [04:39<04:07,  6.51s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000629, train/loss_vlb_step=9.33e-6, train/loss_step=0.000629, global_step=1110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  52%|█████▎    | 42/80 [04:39<04:07,  6.51s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=5.07e-6, train/loss_step=0.00108, global_step=1110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:  54%|█████▍    | 43/80 [04:40<03:55,  6.37s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=5.07e-6, train/loss_step=0.00108, global_step=1110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  54%|█████▍    | 43/80 [04:40<03:55,  6.37s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00999, train/loss_vlb_step=4.23e-5, train/loss_step=0.00999, global_step=1110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  55%|█████▌    | 44/80 [04:40<03:44,  6.24s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00999, train/loss_vlb_step=4.23e-5, train/loss_step=0.00999, global_step=1110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  55%|█████▌    | 44/80 [04:40<03:44,  6.24s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=0.00135, train/loss_step=0.00329, global_step=1110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  56%|█████▋    | 45/80 [04:41<03:34,  6.12s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=0.00135, train/loss_step=0.00329, global_step=1110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  56%|█████▋    | 45/80 [04:41<03:34,  6.12s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.7e-6, train/loss_step=0.000296, global_step=1111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  57%|█████▊    | 46/80 [04:41<03:23,  6.00s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.7e-6, train/loss_step=0.000296, global_step=1111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  57%|█████▊    | 46/80 [04:41<03:23,  6.00s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=9.99e-6, train/loss_step=0.00254, global_step=1111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424] Epoch 55:  59%|█████▉    | 47/80 [04:42<03:14,  5.88s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=9.99e-6, train/loss_step=0.00254, global_step=1111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  59%|█████▉    | 47/80 [04:42<03:14,  5.88s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=1.78e-5, train/loss_step=0.00464, global_step=1111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  60%|██████    | 48/80 [05:26<03:33,  6.66s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=1.78e-5, train/loss_step=0.00464, global_step=1111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  60%|██████    | 48/80 [05:26<03:33,  6.66s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=8.25e-6, train/loss_step=0.00128, global_step=1111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  61%|██████▏   | 49/80 [05:26<03:22,  6.54s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=8.25e-6, train/loss_step=0.00128, global_step=1111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  61%|██████▏   | 49/80 [05:26<03:22,  6.54s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.000756, train/loss_vlb_step=2.83e-6, train/loss_step=0.000756, global_step=1112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  62%|██████▎   | 50/80 [05:27<03:12,  6.42s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.000756, train/loss_vlb_step=2.83e-6, train/loss_step=0.000756, global_step=1112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  62%|██████▎   | 50/80 [05:27<03:12,  6.42s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=0.00136, train/loss_step=0.00292, global_step=1112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:  64%|██████▍   | 51/80 [05:27<03:02,  6.30s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=0.00136, train/loss_step=0.00292, global_step=1112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  64%|██████▍   | 51/80 [05:27<03:02,  6.30s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000926, train/loss_vlb_step=1.82e-5, train/loss_step=0.000926, global_step=1112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  65%|██████▌   | 52/80 [05:28<02:53,  6.20s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000926, train/loss_vlb_step=1.82e-5, train/loss_step=0.000926, global_step=1112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  65%|██████▌   | 52/80 [05:28<02:53,  6.20s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000213, train/loss_step=0.0244, global_step=1112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]   Epoch 55:  66%|██████▋   | 53/80 [05:28<02:44,  6.09s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000213, train/loss_step=0.0244, global_step=1112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  66%|██████▋   | 53/80 [05:28<02:44,  6.09s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.2e-5, train/loss_step=0.00523, global_step=1113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  68%|██████▊   | 54/80 [05:29<02:35,  5.99s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=2.2e-5, train/loss_step=0.00523, global_step=1113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  68%|██████▊   | 54/80 [05:29<02:35,  5.99s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.43e-5, train/loss_step=0.00853, global_step=1113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  69%|██████▉   | 55/80 [05:29<02:27,  5.89s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.43e-5, train/loss_step=0.00853, global_step=1113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  69%|██████▉   | 55/80 [05:29<02:27,  5.89s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000508, train/loss_vlb_step=2.28e-6, train/loss_step=0.000508, global_step=1113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  70%|███████   | 56/80 [06:18<02:39,  6.64s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000508, train/loss_vlb_step=2.28e-6, train/loss_step=0.000508, global_step=1113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  70%|███████   | 56/80 [06:18<02:39,  6.64s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=2.62e-6, train/loss_step=0.000567, global_step=1113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  71%|███████▏  | 57/80 [06:19<02:30,  6.53s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=2.62e-6, train/loss_step=0.000567, global_step=1113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  71%|███████▏  | 57/80 [06:19<02:30,  6.53s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000295, train/loss_step=0.0182, global_step=1114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]   Epoch 55:  72%|███████▎  | 58/80 [06:19<02:21,  6.43s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000295, train/loss_step=0.0182, global_step=1114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  72%|███████▎  | 58/80 [06:19<02:21,  6.43s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000864, train/loss_vlb_step=4.19e-6, train/loss_step=0.000864, global_step=1114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  74%|███████▍  | 59/80 [06:20<02:13,  6.33s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000864, train/loss_vlb_step=4.19e-6, train/loss_step=0.000864, global_step=1114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  74%|███████▍  | 59/80 [06:20<02:13,  6.33s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000171, train/loss_step=0.015, global_step=1114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]      Epoch 55:  75%|███████▌  | 60/80 [06:20<02:04,  6.24s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000171, train/loss_step=0.015, global_step=1114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  75%|███████▌  | 60/80 [06:20<02:04,  6.24s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.31e-5, train/loss_step=0.00604, global_step=1114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  76%|███████▋  | 61/80 [06:21<01:56,  6.15s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.31e-5, train/loss_step=0.00604, global_step=1114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  76%|███████▋  | 61/80 [06:21<01:56,  6.15s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=0.00177, train/loss_step=0.0117, global_step=1115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:  78%|███████▊  | 62/80 [06:21<01:49,  6.06s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=0.00177, train/loss_step=0.0117, global_step=1115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  78%|███████▊  | 62/80 [06:21<01:49,  6.06s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.71e-5, train/loss_step=0.00106, global_step=1115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  79%|███████▉  | 63/80 [06:22<01:41,  5.97s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.71e-5, train/loss_step=0.00106, global_step=1115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  79%|███████▉  | 63/80 [06:22<01:41,  5.97s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000306, train/loss_vlb_step=1.26e-6, train/loss_step=0.000306, global_step=1115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  80%|████████  | 64/80 [06:53<01:41,  6.37s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000306, train/loss_vlb_step=1.26e-6, train/loss_step=0.000306, global_step=1115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  80%|████████  | 64/80 [06:53<01:41,  6.37s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=3.04e-5, train/loss_step=0.00232, global_step=1115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]   Epoch 55:  81%|████████▏ | 65/80 [06:54<01:34,  6.28s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=3.04e-5, train/loss_step=0.00232, global_step=1115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  81%|████████▏ | 65/80 [06:54<01:34,  6.28s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=7.09e-6, train/loss_step=0.000446, global_step=1116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  82%|████████▎ | 66/80 [06:54<01:26,  6.19s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=7.09e-6, train/loss_step=0.000446, global_step=1116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  82%|████████▎ | 66/80 [06:54<01:26,  6.19s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.13e-5, train/loss_step=0.00783, global_step=1116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:  84%|████████▍ | 67/80 [06:55<01:19,  6.11s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.13e-5, train/loss_step=0.00783, global_step=1116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  84%|████████▍ | 67/80 [06:55<01:19,  6.11s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.42e-5, train/loss_step=0.0101, global_step=1116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:  85%|████████▌ | 68/80 [06:56<01:12,  6.03s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.42e-5, train/loss_step=0.0101, global_step=1116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  85%|████████▌ | 68/80 [06:56<01:12,  6.03s/it, loss=0.0068, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000206, train/loss_step=0.0183, global_step=1116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  86%|████████▋ | 69/80 [06:56<01:05,  5.95s/it, loss=0.0068, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000206, train/loss_step=0.0183, global_step=1116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  86%|████████▋ | 69/80 [06:56<01:05,  5.95s/it, loss=0.0068, v_num=0, train/loss_simple_step=0.000716, train/loss_vlb_step=2.61e-6, train/loss_step=0.000716, global_step=1117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  88%|████████▊ | 70/80 [06:56<00:58,  5.87s/it, loss=0.0068, v_num=0, train/loss_simple_step=0.000716, train/loss_vlb_step=2.61e-6, train/loss_step=0.000716, global_step=1117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  88%|████████▊ | 70/80 [06:56<00:58,  5.87s/it, loss=0.00709, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=3.11e-5, train/loss_step=0.00886, global_step=1117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424] Epoch 55:  89%|████████▉ | 71/80 [06:57<00:52,  5.80s/it, loss=0.00709, v_num=0, train/loss_simple_step=0.00886, train/loss_vlb_step=3.11e-5, train/loss_step=0.00886, global_step=1117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  89%|████████▉ | 71/80 [06:57<00:52,  5.80s/it, loss=0.00775, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=5.66e-5, train/loss_step=0.014, global_step=1117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]    Epoch 55:  90%|█████████ | 72/80 [07:29<00:49,  6.15s/it, loss=0.00775, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=5.66e-5, train/loss_step=0.014, global_step=1117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  90%|█████████ | 72/80 [07:29<00:49,  6.15s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.000695, train/loss_vlb_step=6.19e-6, train/loss_step=0.000695, global_step=1117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  91%|█████████▏| 73/80 [07:29<00:42,  6.08s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.000695, train/loss_vlb_step=6.19e-6, train/loss_step=0.000695, global_step=1117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  91%|█████████▏| 73/80 [07:29<00:42,  6.08s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.000403, train/loss_vlb_step=1.66e-6, train/loss_step=0.000403, global_step=1118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  92%|█████████▎| 74/80 [07:30<00:36,  6.00s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.000403, train/loss_vlb_step=1.66e-6, train/loss_step=0.000403, global_step=1118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  92%|█████████▎| 74/80 [07:30<00:36,  6.00s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.27e-5, train/loss_step=0.00321, global_step=1118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:  94%|█████████▍| 75/80 [07:30<00:29,  5.93s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.27e-5, train/loss_step=0.00321, global_step=1118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  94%|█████████▍| 75/80 [07:30<00:29,  5.93s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.000191, train/loss_vlb_step=8.82e-7, train/loss_step=0.000191, global_step=1118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  95%|█████████▌| 76/80 [07:31<00:23,  5.86s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.000191, train/loss_vlb_step=8.82e-7, train/loss_step=0.000191, global_step=1118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  95%|█████████▌| 76/80 [07:31<00:23,  5.86s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.41e-5, train/loss_step=0.00572, global_step=1118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 55:  96%|█████████▋| 77/80 [07:31<00:17,  5.79s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=2.41e-5, train/loss_step=0.00572, global_step=1118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  96%|█████████▋| 77/80 [07:31<00:17,  5.79s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.6e-5, train/loss_step=0.0052, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]   Epoch 55:  98%|█████████▊| 78/80 [07:32<00:11,  5.72s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.6e-5, train/loss_step=0.0052, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  98%|█████████▊| 78/80 [07:32<00:11,  5.72s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.88e-6, train/loss_step=0.00126, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  99%|█████████▉| 79/80 [07:32<00:05,  5.66s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.88e-6, train/loss_step=0.00126, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55:  99%|█████████▉| 79/80 [07:32<00:05,  5.66s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=1.34e-5, train/loss_step=0.00404, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55: 100%|██████████| 80/80 [07:33<00:00,  5.59s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=1.34e-5, train/loss_step=0.00404, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 55: 100%|██████████| 80/80 [07:33<00:00,  5.59s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.29e-6, train/loss_step=0.00168, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424] Average Epoch time: 453.19 seconds
+Average Peak memory 29567.01MiB
+Epoch 55:   0%|          | 0/80 [00:00<00:00, 3113.81it/s, loss=0.0049, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.29e-6, train/loss_step=0.00168, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 56:   0%|          | 0/80 [00:00<00:00, 1320.62it/s, loss=0.0049, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.29e-6, train/loss_step=0.00168, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]Epoch 56:   1%|▏         | 1/80 [00:44<29:09, 22.15s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.29e-6, train/loss_step=0.00168, global_step=1119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=0.000101, train/loss_epoch=0.00424]  Epoch 56:   1%|▏         | 1/80 [00:44<29:09, 22.15s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1e-6, train/loss_step=0.000264, global_step=1120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   2%|▎         | 2/80 [00:44<19:24, 14.93s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1e-6, train/loss_step=0.000264, global_step=1120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   2%|▎         | 2/80 [00:44<19:24, 14.93s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=1.38e-5, train/loss_step=0.00389, global_step=1120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   4%|▍         | 3/80 [00:45<14:31, 11.32s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=1.38e-5, train/loss_step=0.00389, global_step=1120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   4%|▍         | 3/80 [00:45<14:31, 11.32s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=2.01e-6, train/loss_step=0.000392, global_step=1120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   5%|▌         | 4/80 [00:45<11:36,  9.16s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=2.01e-6, train/loss_step=0.000392, global_step=1120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   5%|▌         | 4/80 [00:45<11:36,  9.16s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=6.89e-5, train/loss_step=0.00828, global_step=1120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:   6%|▋         | 5/80 [00:47<09:54,  7.92s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=6.89e-5, train/loss_step=0.00828, global_step=1120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   6%|▋         | 5/80 [00:47<09:54,  7.92s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000906, train/loss_vlb_step=3.13e-6, train/loss_step=0.000906, global_step=1121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   8%|▊         | 6/80 [00:48<08:27,  6.86s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000906, train/loss_vlb_step=3.13e-6, train/loss_step=0.000906, global_step=1121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   8%|▊         | 6/80 [00:48<08:27,  6.86s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=8.35e-5, train/loss_step=0.0155, global_step=1121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]    Epoch 56:   9%|▉         | 7/80 [00:48<07:22,  6.06s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=8.35e-5, train/loss_step=0.0155, global_step=1121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:   9%|▉         | 7/80 [00:48<07:22,  6.06s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.27e-6, train/loss_step=0.00151, global_step=1121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  10%|█         | 8/80 [01:26<11:33,  9.63s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.27e-6, train/loss_step=0.00151, global_step=1121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  10%|█         | 8/80 [01:26<11:33,  9.63s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=4.06e-6, train/loss_step=0.000662, global_step=1121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  11%|█▏        | 9/80 [01:27<10:19,  8.72s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=4.06e-6, train/loss_step=0.000662, global_step=1121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  11%|█▏        | 9/80 [01:27<10:19,  8.72s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.29e-5, train/loss_step=0.000718, global_step=1122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  12%|█▎        | 10/80 [01:27<09:18,  7.97s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.29e-5, train/loss_step=0.000718, global_step=1122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  12%|█▎        | 10/80 [01:27<09:18,  7.97s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.17e-5, train/loss_step=0.00334, global_step=1122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  14%|█▍        | 11/80 [01:28<08:27,  7.35s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.17e-5, train/loss_step=0.00334, global_step=1122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  14%|█��        | 11/80 [01:28<08:27,  7.35s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00975, train/loss_vlb_step=6.62e-5, train/loss_step=0.00975, global_step=1122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  15%|█▌        | 12/80 [01:28<07:44,  6.83s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00975, train/loss_vlb_step=6.62e-5, train/loss_step=0.00975, global_step=1122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  15%|█▌        | 12/80 [01:28<07:44,  6.83s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=0.000134, train/loss_step=0.00591, global_step=1122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  16%|█▋        | 13/80 [01:29<07:07,  6.38s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=0.000134, train/loss_step=0.00591, global_step=1122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  16%|█▋        | 13/80 [01:29<07:07,  6.38s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000302, train/loss_vlb_step=1.29e-6, train/loss_step=0.000302, global_step=1123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  18%|█▊        | 14/80 [01:29<06:34,  5.98s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000302, train/loss_vlb_step=1.29e-6, train/loss_step=0.000302, global_step=1123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  18%|█▊        | 14/80 [01:29<06:34,  5.98s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=7.14e-5, train/loss_step=0.0112, global_step=1123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]    Epoch 56:  19%|█▉        | 15/80 [01:30<06:06,  5.64s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=7.14e-5, train/loss_step=0.0112, global_step=1123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  19%|█▉        | 15/80 [01:30<06:06,  5.64s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=9.26e-6, train/loss_step=0.00208, global_step=1123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  20%|██        | 16/80 [02:03<07:46,  7.28s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=9.26e-6, train/loss_step=0.00208, global_step=1123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  20%|██        | 16/80 [02:03<07:46,  7.28s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=3.4e-6, train/loss_step=0.00044, global_step=1123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  21%|██▏       | 17/80 [02:05<07:18,  6.96s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=3.4e-6, train/loss_step=0.00044, global_step=1123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  21%|██▏       | 17/80 [02:05<07:18,  6.96s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000836, train/loss_vlb_step=3.38e-6, train/loss_step=0.000836, global_step=1124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  22%|██▎       | 18/80 [02:05<06:50,  6.62s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000836, train/loss_vlb_step=3.38e-6, train/loss_step=0.000836, global_step=1124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  22%|██▎       | 18/80 [02:05<06:50,  6.62s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=2.43e-6, train/loss_step=0.00059, global_step=1124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  24%|██▍       | 19/80 [02:06<06:25,  6.32s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=2.43e-6, train/loss_step=0.00059, global_step=1124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  24%|██▍       | 19/80 [02:06<06:25,  6.32s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=2.13e-6, train/loss_step=0.000348, global_step=1124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  25%|██▌       | 20/80 [02:07<06:03,  6.06s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=2.13e-6, train/loss_step=0.000348, global_step=1124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  25%|██▌       | 20/80 [02:07<06:03,  6.06s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.77e-6, train/loss_step=0.000387, global_step=1124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.77e-6, train/loss_step=0.000387, global_step=1124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.66e-5, train/loss_step=0.003, global_step=1125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]      Epoch 56:  28%|██▊       | 22/80 [02:14<05:40,  5.87s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.66e-5, train/loss_step=0.003, global_step=1125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  28%|██▊       | 22/80 [02:14<05:40,  5.87s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=7.2e-6, train/loss_step=0.00192, global_step=1125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  29%|██▉       | 23/80 [02:15<05:21,  5.64s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=7.2e-6, train/loss_step=0.00192, global_step=1125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  29%|██▉       | 23/80 [02:15<05:21,  5.64s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000129, train/loss_step=0.0159, global_step=1125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  30%|███       | 24/80 [02:47<06:14,  6.69s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000129, train/loss_step=0.0159, global_step=1125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  30%|███       | 24/80 [02:47<06:14,  6.69s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=4.64e-6, train/loss_step=0.00136, global_step=1125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  31%|███▏      | 25/80 [02:47<05:54,  6.45s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=4.64e-6, train/loss_step=0.00136, global_step=1125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  31%|███▏      | 25/80 [02:47<05:54,  6.45s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=0.000111, train/loss_step=0.0175, global_step=1126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  32%|███▎      | 26/80 [02:51<05:42,  6.34s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=0.000111, train/loss_step=0.0175, global_step=1126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  32%|███▎      | 26/80 [02:51<05:42,  6.34s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.29e-5, train/loss_step=0.0101, global_step=1126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  34%|███▍      | 27/80 [02:51<05:24,  6.13s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.29e-5, train/loss_step=0.0101, global_step=1126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  34%|███▍      | 27/80 [02:51<05:24,  6.13s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=2.53e-5, train/loss_step=0.00316, global_step=1126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  35%|███▌      | 28/80 [02:52<05:08,  5.94s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=2.53e-5, train/loss_step=0.00316, global_step=1126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  35%|███▌      | 28/80 [02:52<05:08,  5.94s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.32e-5, train/loss_step=0.00354, global_step=1126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  36%|███▋      | 29/80 [02:58<05:03,  5.95s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.32e-5, train/loss_step=0.00354, global_step=1126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  36%|███▋      | 29/80 [02:58<05:03,  5.95s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=3.93e-5, train/loss_step=0.00724, global_step=1127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  38%|███▊      | 30/80 [02:59<04:48,  5.78s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00724, train/loss_vlb_step=3.93e-5, train/loss_step=0.00724, global_step=1127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  38%|███▊      | 30/80 [02:59<04:48,  5.78s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=8.66e-7, train/loss_step=0.000187, global_step=1127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  39%|███▉      | 31/80 [02:59<04:34,  5.61s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=8.66e-7, train/loss_step=0.000187, global_step=1127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  39%|███▉      | 31/80 [02:59<04:34,  5.61s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000517, train/loss_vlb_step=2.07e-6, train/loss_step=0.000517, global_step=1127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  40%|████      | 32/80 [03:31<05:08,  6.42s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000517, train/loss_vlb_step=2.07e-6, train/loss_step=0.000517, global_step=1127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  40%|████      | 32/80 [03:31<05:08,  6.42s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000875, train/loss_vlb_step=4.49e-6, train/loss_step=0.000875, global_step=1127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  41%|████▏     | 33/80 [03:32<04:53,  6.25s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000875, train/loss_vlb_step=4.49e-6, train/loss_step=0.000875, global_step=1127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  41%|████▏     | 33/80 [03:32<04:53,  6.25s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=9.2e-6, train/loss_step=0.00277, global_step=1128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]    Epoch 56:  42%|████▎     | 34/80 [03:32<04:39,  6.08s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=9.2e-6, train/loss_step=0.00277, global_step=1128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  42%|████▎     | 34/80 [03:32<04:39,  6.08s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000646, train/loss_vlb_step=1.51e-5, train/loss_step=0.000646, global_step=1128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  44%|████▍     | 35/80 [03:33<04:26,  5.93s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000646, train/loss_vlb_step=1.51e-5, train/loss_step=0.000646, global_step=1128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  44%|████▍     | 35/80 [03:33<04:26,  5.93s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=4.23e-6, train/loss_step=0.000661, global_step=1128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  45%|████▌     | 36/80 [03:34<04:14,  5.79s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=4.23e-6, train/loss_step=0.000661, global_step=1128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  45%|████▌     | 36/80 [03:34<04:14,  5.79s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.59e-6, train/loss_step=0.000279, global_step=1128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  46%|████▋     | 37/80 [03:42<04:11,  5.85s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.59e-6, train/loss_step=0.000279, global_step=1128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  46%|████▋     | 37/80 [03:42<04:11,  5.85s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=8.34e-7, train/loss_step=0.000213, global_step=1129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  48%|████▊     | 38/80 [03:42<03:59,  5.71s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=8.34e-7, train/loss_step=0.000213, global_step=1129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  48%|████▊     | 38/80 [03:42<03:59,  5.71s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=2.11e-5, train/loss_step=0.00621, global_step=1129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  49%|████▉     | 39/80 [03:43<03:48,  5.58s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00621, train/loss_vlb_step=2.11e-5, train/loss_step=0.00621, global_step=1129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  49%|████▉     | 39/80 [03:43<03:48,  5.58s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.25e-5, train/loss_step=0.0107, global_step=1129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  50%|█████     | 40/80 [04:09<04:03,  6.08s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.25e-5, train/loss_step=0.0107, global_step=1129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  50%|█████     | 40/80 [04:09<04:03,  6.08s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=3.5e-6, train/loss_step=0.000386, global_step=1129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  51%|█████▏    | 41/80 [04:09<03:52,  5.95s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=3.5e-6, train/loss_step=0.000386, global_step=1129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  51%|█████▏    | 41/80 [04:09<03:52,  5.95s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000478, train/loss_vlb_step=2.33e-6, train/loss_step=0.000478, global_step=1130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  52%|█████▎    | 42/80 [04:10<03:41,  5.83s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000478, train/loss_vlb_step=2.33e-6, train/loss_step=0.000478, global_step=1130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  52%|█████▎    | 42/80 [04:10<03:41,  5.83s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00777, train/loss_vlb_step=2.63e-5, train/loss_step=0.00777, global_step=1130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  54%|█████▍    | 43/80 [04:10<03:31,  5.70s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00777, train/loss_vlb_step=2.63e-5, train/loss_step=0.00777, global_step=1130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  54%|█████▍    | 43/80 [04:10<03:31,  5.70s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=9.21e-6, train/loss_step=0.00242, global_step=1130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  55%|█████▌    | 44/80 [04:30<03:36,  6.01s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=9.21e-6, train/loss_step=0.00242, global_step=1130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  55%|█████▌    | 44/80 [04:30<03:36,  6.01s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=8.53e-7, train/loss_step=0.00019, global_step=1130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  56%|█████▋    | 45/80 [04:31<03:26,  5.89s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=8.53e-7, train/loss_step=0.00019, global_step=1130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  56%|█████▋    | 45/80 [04:31<03:26,  5.89s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.45e-5, train/loss_step=0.00197, global_step=1131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  57%|█████▊    | 46/80 [04:31<03:16,  5.78s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=1.45e-5, train/loss_step=0.00197, global_step=1131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  57%|█████▊    | 46/80 [04:31<03:16,  5.78s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=2.86e-5, train/loss_step=0.00836, global_step=1131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  59%|█████▉    | 47/80 [04:31<03:06,  5.67s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=2.86e-5, train/loss_step=0.00836, global_step=1131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  59%|█████▉    | 47/80 [04:31<03:06,  5.67s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.000427, train/loss_vlb_step=1.98e-6, train/loss_step=0.000427, global_step=1131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  60%|██████    | 48/80 [04:49<03:08,  5.90s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.000427, train/loss_vlb_step=1.98e-6, train/loss_step=0.000427, global_step=1131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  60%|██████    | 48/80 [04:49<03:08,  5.90s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.3e-5, train/loss_step=0.00344, global_step=1131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]   Epoch 56:  61%|██████▏   | 49/80 [04:50<03:00,  5.81s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.3e-5, train/loss_step=0.00344, global_step=1131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  61%|██████▏   | 49/80 [04:50<03:00,  5.81s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=0.00306, train/loss_step=0.0198, global_step=1132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  62%|██████▎   | 50/80 [04:50<02:51,  5.70s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=0.00306, train/loss_step=0.0198, global_step=1132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  62%|██████▎   | 50/80 [04:50<02:51,  5.70s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000911, train/loss_vlb_step=3.32e-5, train/loss_step=0.000911, global_step=1132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  64%|██████▍   | 51/80 [04:51<02:42,  5.60s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000911, train/loss_vlb_step=3.32e-5, train/loss_step=0.000911, global_step=1132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  64%|██████▍   | 51/80 [04:51<02:42,  5.60s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000415, train/loss_vlb_step=1.71e-6, train/loss_step=0.000415, global_step=1132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000415, train/loss_vlb_step=1.71e-6, train/loss_step=0.000415, global_step=1132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=5.34e-5, train/loss_step=0.00746, global_step=1132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  66%|██████▋   | 53/80 [05:13<02:36,  5.81s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=5.34e-5, train/loss_step=0.00746, global_step=1132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  66%|██████▋   | 53/80 [05:13<02:36,  5.81s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=1.6e-5, train/loss_step=0.00468, global_step=1133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  68%|██████▊   | 54/80 [05:14<02:28,  5.71s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00468, train/loss_vlb_step=1.6e-5, train/loss_step=0.00468, global_step=1133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  68%|██████▊   | 54/80 [05:14<02:28,  5.71s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=6.99e-5, train/loss_step=0.0102, global_step=1133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  69%|██████▉   | 55/80 [05:14<02:20,  5.62s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=6.99e-5, train/loss_step=0.0102, global_step=1133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  69%|██████▉   | 55/80 [05:14<02:20,  5.62s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=1.05e-5, train/loss_step=0.000865, global_step=1133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  70%|███████   | 56/80 [05:36<02:21,  5.91s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=1.05e-5, train/loss_step=0.000865, global_step=1133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  70%|███████   | 56/80 [05:36<02:21,  5.91s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=2.15e-6, train/loss_step=0.000476, global_step=1133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  71%|███████▏  | 57/80 [05:42<02:15,  5.91s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=2.15e-6, train/loss_step=0.000476, global_step=1133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  71%|███████▏  | 57/80 [05:42<02:15,  5.91s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.48e-5, train/loss_step=0.00608, global_step=1134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  72%|███████▎  | 58/80 [05:43<02:08,  5.82s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00608, train/loss_vlb_step=3.48e-5, train/loss_step=0.00608, global_step=1134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  72%|███████▎  | 58/80 [05:43<02:08,  5.82s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000786, train/loss_vlb_step=3.84e-6, train/loss_step=0.000786, global_step=1134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  74%|███████▍  | 59/80 [05:43<02:00,  5.73s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000786, train/loss_vlb_step=3.84e-6, train/loss_step=0.000786, global_step=1134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  74%|███████▍  | 59/80 [05:43<02:00,  5.73s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=0.000123, train/loss_step=0.0077, global_step=1134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]   Epoch 56:  75%|███████▌  | 60/80 [05:53<01:55,  5.79s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=0.000123, train/loss_step=0.0077, global_step=1134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  75%|███████▌  | 60/80 [05:53<01:55,  5.79s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000892, train/loss_vlb_step=3.85e-6, train/loss_step=0.000892, global_step=1134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  76%|███████▋  | 61/80 [05:57<01:49,  5.77s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000892, train/loss_vlb_step=3.85e-6, train/loss_step=0.000892, global_step=1134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  76%|███████▋  | 61/80 [05:57<01:49,  5.77s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=5.63e-5, train/loss_step=0.00863, global_step=1135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  78%|███████▊  | 62/80 [05:58<01:42,  5.69s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=5.63e-5, train/loss_step=0.00863, global_step=1135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  78%|███████▊  | 62/80 [05:58<01:42,  5.69s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=4.18e-5, train/loss_step=0.00164, global_step=1135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  79%|███████▉  | 63/80 [05:58<01:35,  5.61s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=4.18e-5, train/loss_step=0.00164, global_step=1135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  79%|███████▉  | 63/80 [05:58<01:35,  5.61s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000776, train/loss_vlb_step=6.63e-6, train/loss_step=0.000776, global_step=1135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  80%|████████  | 64/80 [06:24<01:34,  5.91s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000776, train/loss_vlb_step=6.63e-6, train/loss_step=0.000776, global_step=1135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  80%|████████  | 64/80 [06:24<01:34,  5.91s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=0.000246, train/loss_step=0.00409, global_step=1135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  81%|████████▏ | 65/80 [06:29<01:28,  5.91s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=0.000246, train/loss_step=0.00409, global_step=1135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  81%|████████▏ | 65/80 [06:29<01:28,  5.91s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=5.85e-6, train/loss_step=0.00153, global_step=1136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  82%|████████▎ | 66/80 [06:30<01:21,  5.83s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=5.85e-6, train/loss_step=0.00153, global_step=1136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  82%|████████▎ | 66/80 [06:30<01:21,  5.83s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.28e-5, train/loss_step=0.00335, global_step=1136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  84%|████████▍ | 67/80 [06:30<01:14,  5.75s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.28e-5, train/loss_step=0.00335, global_step=1136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  84%|████████▍ | 67/80 [06:30<01:14,  5.75s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=8.07e-6, train/loss_step=0.000857, global_step=1136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  85%|████████▌ | 68/80 [06:33<01:08,  5.70s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=8.07e-6, train/loss_step=0.000857, global_step=1136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  85%|████████▌ | 68/80 [06:33<01:08,  5.70s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000483, train/loss_vlb_step=3.38e-6, train/loss_step=0.000483, global_step=1136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  86%|████████▋ | 69/80 [06:40<01:03,  5.73s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000483, train/loss_vlb_step=3.38e-6, train/loss_step=0.000483, global_step=1136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  86%|████████▋ | 69/80 [06:40<01:03,  5.73s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000127, train/loss_step=0.0131, global_step=1137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]   Epoch 56:  88%|████████▊ | 70/80 [06:41<00:56,  5.65s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000127, train/loss_step=0.0131, global_step=1137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  88%|████████▊ | 70/80 [06:41<00:56,  5.65s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1e-5, train/loss_step=0.00226, global_step=1137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  89%|████████▉ | 71/80 [06:41<00:50,  5.58s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1e-5, train/loss_step=0.00226, global_step=1137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  89%|████████▉ | 71/80 [06:41<00:50,  5.58s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=1.18e-5, train/loss_step=0.00103, global_step=1137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  90%|█████████ | 72/80 [06:55<00:45,  5.69s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=1.18e-5, train/loss_step=0.00103, global_step=1137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  90%|█████████ | 72/80 [06:55<00:45,  5.69s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=3.19e-6, train/loss_step=0.000697, global_step=1137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=3.19e-6, train/loss_step=0.000697, global_step=1137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=1.33e-5, train/loss_step=0.00152, global_step=1138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=1.33e-5, train/loss_step=0.00152, global_step=1138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=6.73e-5, train/loss_step=0.0174, global_step=1138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 56:  94%|█████████▍| 75/80 [06:58<00:27,  5.51s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0174, train/loss_vlb_step=6.73e-5, train/loss_step=0.0174, global_step=1138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  94%|█████████▍| 75/80 [06:58<00:27,  5.51s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=5.63e-6, train/loss_step=0.000514, global_step=1138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  95%|█████████▌| 76/80 [07:05<00:22,  5.52s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=5.63e-6, train/loss_step=0.000514, global_step=1138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  95%|█████████▌| 76/80 [07:05<00:22,  5.52s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.2e-6, train/loss_step=0.000298, global_step=1138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411] Epoch 56:  96%|█████████▋| 77/80 [07:13<00:16,  5.56s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.2e-6, train/loss_step=0.000298, global_step=1138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  96%|█████████▋| 77/80 [07:13<00:16,  5.56s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=1.58e-6, train/loss_step=0.000381, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  98%|█████████▊| 78/80 [07:14<00:10,  5.50s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=1.58e-6, train/loss_step=0.000381, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  98%|█████████▊| 78/80 [07:14<00:10,  5.50s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.41e-5, train/loss_step=0.0103, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]   Epoch 56:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.41e-5, train/loss_step=0.0103, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=8.44e-6, train/loss_step=0.00229, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56: 100%|██████████| 80/80 [07:15<00:00,  5.37s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=8.44e-6, train/loss_step=0.00229, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 56: 100%|██████████| 80/80 [07:15<00:00,  5.37s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=5.63e-6, train/loss_step=0.000521, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Average Epoch time: 435.12 seconds
+Average Peak memory 29567.72MiB
+Epoch 56:   0%|          | 0/80 [00:00<00:00, 4505.16it/s, loss=0.00358, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=5.63e-6, train/loss_step=0.000521, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 57:   0%|          | 0/80 [00:00<00:00, 1965.47it/s, loss=0.00358, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=5.63e-6, train/loss_step=0.000521, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]Epoch 57:   1%|▏         | 1/80 [00:39<25:43, 19.54s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=5.63e-6, train/loss_step=0.000521, global_step=1139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000145, train/loss_epoch=0.00411]  Epoch 57:   1%|▏         | 1/80 [00:39<25:43, 19.54s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=6.07e-6, train/loss_step=0.000563, global_step=1140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:   2%|▎         | 2/80 [00:39<17:08, 13.19s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=6.07e-6, train/loss_step=0.000563, global_step=1140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:   2%|▎         | 2/80 [00:39<17:08, 13.19s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.37e-5, train/loss_step=0.00661, global_step=1140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:   4%|▍         | 3/80 [00:45<14:43, 11.48s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=3.37e-5, train/loss_step=0.00661, global_step=1140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:   4%|▍         | 3/80 [00:45<14:43, 11.48s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=8.05e-6, train/loss_step=0.00192, global_step=1140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:   5%|▌         | 4/80 [00:47<12:08,  9.59s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=8.05e-6, train/loss_step=0.00192, global_step=1140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:   5%|▌         | 4/80 [00:47<12:08,  9.59s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=1.71e-6, train/loss_step=0.000395, global_step=1140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:   6%|▋         | 5/80 [00:48<10:06,  8.08s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=1.71e-6, train/loss_step=0.000395, global_step=1140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:   6%|▋         | 5/80 [00:48<10:06,  8.08s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000583, train/loss_vlb_step=2.86e-6, train/loss_step=0.000583, global_step=1141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:   8%|▊         | 6/80 [00:48<08:37,  7.00s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000583, train/loss_vlb_step=2.86e-6, train/loss_step=0.000583, global_step=1141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:   8%|▊         | 6/80 [00:48<08:37,  7.00s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=6.4e-6, train/loss_step=0.00138, global_step=1141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]   Epoch 57:   9%|▉         | 7/80 [00:49<07:31,  6.18s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=6.4e-6, train/loss_step=0.00138, global_step=1141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:   9%|▉         | 7/80 [00:49<07:31,  6.18s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.39e-5, train/loss_step=0.00384, global_step=1141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  10%|█         | 8/80 [01:14<09:59,  8.33s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.39e-5, train/loss_step=0.00384, global_step=1141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  10%|█         | 8/80 [01:14<09:59,  8.33s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=8.53e-6, train/loss_step=0.0019, global_step=1141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:  11%|█▏        | 9/80 [01:20<09:33,  8.08s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=8.53e-6, train/loss_step=0.0019, global_step=1141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  11%|█▏        | 9/80 [01:20<09:33,  8.08s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=1.14e-6, train/loss_step=0.000224, global_step=1142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  12%|█▎        | 10/80 [01:29<09:28,  8.12s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=1.14e-6, train/loss_step=0.000224, global_step=1142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  12%|█▎        | 10/80 [01:29<09:28,  8.12s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.28e-5, train/loss_step=0.00637, global_step=1142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:  14%|█▍        | 11/80 [01:29<08:36,  7.48s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.28e-5, train/loss_step=0.00637, global_step=1142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  14%|█▍        | 11/80 [01:29<08:36,  7.48s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=8.09e-7, train/loss_step=0.000224, global_step=1142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  15%|█▌        | 12/80 [01:30<07:52,  6.95s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=8.09e-7, train/loss_step=0.000224, global_step=1142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  15%|█▌        | 12/80 [01:30<07:52,  6.95s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000504, train/loss_vlb_step=1.26e-5, train/loss_step=0.000504, global_step=1142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  16%|█▋        | 13/80 [01:30<07:14,  6.49s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000504, train/loss_vlb_step=1.26e-5, train/loss_step=0.000504, global_step=1142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  16%|█▋        | 13/80 [01:30<07:14,  6.49s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.52e-5, train/loss_step=0.0036, global_step=1143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]    Epoch 57:  18%|█▊        | 14/80 [01:31<06:41,  6.09s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.52e-5, train/loss_step=0.0036, global_step=1143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  18%|█▊        | 14/80 [01:31<06:41,  6.09s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=1.75e-6, train/loss_step=0.000407, global_step=1143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  19%|█▉        | 15/80 [01:31<06:12,  5.74s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=1.75e-6, train/loss_step=0.000407, global_step=1143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  19%|█▉        | 15/80 [01:31<06:12,  5.74s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.59e-6, train/loss_step=0.000375, global_step=1143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  20%|██        | 16/80 [02:07<08:00,  7.51s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.59e-6, train/loss_step=0.000375, global_step=1143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  20%|██        | 16/80 [02:07<08:00,  7.51s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=5.63e-6, train/loss_step=0.00153, global_step=1143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:  21%|██▏       | 17/80 [02:08<07:28,  7.12s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=5.63e-6, train/loss_step=0.00153, global_step=1143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  21%|██▏       | 17/80 [02:08<07:28,  7.12s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.11e-6, train/loss_step=0.000418, global_step=1144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  22%|██▎       | 18/80 [02:19<07:36,  7.36s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.11e-6, train/loss_step=0.000418, global_step=1144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  22%|██▎       | 18/80 [02:19<07:36,  7.36s/it, loss=0.00171, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=1.91e-6, train/loss_step=0.00052, global_step=1144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:  24%|██▍       | 19/80 [02:20<07:08,  7.02s/it, loss=0.00171, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=1.91e-6, train/loss_step=0.00052, global_step=1144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  24%|██▍       | 19/80 [02:20<07:08,  7.02s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=0.000869, train/loss_step=0.00421, global_step=1144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  25%|██▌       | 20/80 [02:20<06:42,  6.71s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=0.000869, train/loss_step=0.00421, global_step=1144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  25%|██▌       | 20/80 [02:20<06:42,  6.71s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000679, train/loss_vlb_step=2.98e-5, train/loss_step=0.000679, global_step=1144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  26%|██▋       | 21/80 [02:21<06:19,  6.43s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000679, train/loss_vlb_step=2.98e-5, train/loss_step=0.000679, global_step=1144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  26%|██▋       | 21/80 [02:21<06:19,  6.43s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.28e-5, train/loss_step=0.00335, global_step=1145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:  28%|██▊       | 22/80 [02:21<05:57,  6.17s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.28e-5, train/loss_step=0.00335, global_step=1145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  28%|██▊       | 22/80 [02:21<05:57,  6.17s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=4.6e-5, train/loss_step=0.0128, global_step=1145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]   Epoch 57:  29%|██▉       | 23/80 [02:22<05:38,  5.93s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=4.6e-5, train/loss_step=0.0128, global_step=1145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  29%|██▉       | 23/80 [02:22<05:38,  5.93s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=2.73e-5, train/loss_step=0.00783, global_step=1145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  30%|███       | 24/80 [02:53<06:29,  6.95s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=2.73e-5, train/loss_step=0.00783, global_step=1145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  30%|███       | 24/80 [02:53<06:29,  6.95s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=2.25e-6, train/loss_step=0.000412, global_step=1145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  31%|███▏      | 25/80 [02:54<06:08,  6.70s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=2.25e-6, train/loss_step=0.000412, global_step=1145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  31%|███▏      | 25/80 [02:54<06:08,  6.70s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=0.00013, train/loss_step=0.0102, global_step=1146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]    Epoch 57:  32%|███▎      | 26/80 [03:02<06:04,  6.75s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=0.00013, train/loss_step=0.0102, global_step=1146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  32%|███▎      | 26/80 [03:02<06:04,  6.75s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.22e-5, train/loss_step=0.00327, global_step=1146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  34%|███▍      | 27/80 [03:02<05:46,  6.53s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.22e-5, train/loss_step=0.00327, global_step=1146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  34%|███▍      | 27/80 [03:02<05:46,  6.53s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.22e-5, train/loss_step=0.00354, global_step=1146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  35%|███▌      | 28/80 [03:03<05:28,  6.32s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=1.22e-5, train/loss_step=0.00354, global_step=1146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  35%|███▌      | 28/80 [03:03<05:28,  6.32s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=2.72e-5, train/loss_step=0.00713, global_step=1146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  36%|███▋      | 29/80 [03:03<05:12,  6.13s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=2.72e-5, train/loss_step=0.00713, global_step=1146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  36%|███▋      | 29/80 [03:03<05:12,  6.13s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=8.38e-5, train/loss_step=0.000939, global_step=1147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  38%|███▊      | 30/80 [03:04<04:57,  5.95s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=8.38e-5, train/loss_step=0.000939, global_step=1147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  38%|███▊      | 30/80 [03:04<04:57,  5.95s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.000505, train/loss_step=0.0211, global_step=1147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]   Epoch 57:  39%|███▉      | 31/80 [03:04<04:43,  5.78s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.000505, train/loss_step=0.0211, global_step=1147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  39%|███▉      | 31/80 [03:04<04:43,  5.78s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.68e-5, train/loss_step=0.00244, global_step=1147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  40%|████      | 32/80 [03:39<05:19,  6.65s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=1.68e-5, train/loss_step=0.00244, global_step=1147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  40%|████      | 32/80 [03:39<05:19,  6.65s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000361, train/loss_vlb_step=1.37e-6, train/loss_step=0.000361, global_step=1147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  41%|████▏     | 33/80 [03:39<05:03,  6.47s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000361, train/loss_vlb_step=1.37e-6, train/loss_step=0.000361, global_step=1147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  41%|████▏     | 33/80 [03:39<05:03,  6.47s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00975, train/loss_vlb_step=4.08e-5, train/loss_step=0.00975, global_step=1148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:  42%|████▎     | 34/80 [03:50<05:02,  6.59s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00975, train/loss_vlb_step=4.08e-5, train/loss_step=0.00975, global_step=1148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  42%|████▎     | 34/80 [03:50<05:02,  6.59s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=2.78e-5, train/loss_step=0.00114, global_step=1148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:  44%|████▍     | 35/80 [03:51<04:48,  6.42s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=2.78e-5, train/loss_step=0.00114, global_step=1148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  44%|████▍     | 35/80 [03:51<04:48,  6.42s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.09e-5, train/loss_step=0.0132, global_step=1148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:  45%|████▌     | 36/80 [03:51<04:35,  6.26s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=5.09e-5, train/loss_step=0.0132, global_step=1148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  45%|████▌     | 36/80 [03:51<04:35,  6.26s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=3.88e-6, train/loss_step=0.000763, global_step=1148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  46%|████▋     | 37/80 [03:52<04:22,  6.11s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=3.88e-6, train/loss_step=0.000763, global_step=1148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  46%|████▋     | 37/80 [03:52<04:22,  6.11s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.91e-6, train/loss_step=0.000336, global_step=1149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  48%|████▊     | 38/80 [03:52<04:10,  5.96s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.91e-6, train/loss_step=0.000336, global_step=1149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  48%|████▊     | 38/80 [03:52<04:10,  5.96s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=7.9e-7, train/loss_step=0.000207, global_step=1149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  49%|████▉     | 39/80 [03:53<03:58,  5.83s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=7.9e-7, train/loss_step=0.000207, global_step=1149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  49%|████▉     | 39/80 [03:53<03:58,  5.83s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.23e-6, train/loss_step=0.0011, global_step=1149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]   Epoch 57:  50%|█████     | 40/80 [04:15<04:09,  6.24s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.23e-6, train/loss_step=0.0011, global_step=1149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  50%|█████     | 40/80 [04:15<04:09,  6.24s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00058, train/loss_vlb_step=3.57e-6, train/loss_step=0.00058, global_step=1149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  51%|█████▏    | 41/80 [04:16<03:58,  6.11s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00058, train/loss_vlb_step=3.57e-6, train/loss_step=0.00058, global_step=1149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  51%|█████▏    | 41/80 [04:16<03:58,  6.11s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=8.69e-5, train/loss_step=0.0163, global_step=1150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:  52%|█████▎    | 42/80 [04:37<04:05,  6.46s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=8.69e-5, train/loss_step=0.0163, global_step=1150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  52%|█████▎    | 42/80 [04:37<04:05,  6.46s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.41e-5, train/loss_step=0.0214, global_step=1150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:  54%|█████▍    | 43/80 [04:38<03:54,  6.33s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.0214, train/loss_vlb_step=8.41e-5, train/loss_step=0.0214, global_step=1150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  54%|█████▍    | 43/80 [04:38<03:54,  6.33s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=1.68e-5, train/loss_step=0.00491, global_step=1150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  55%|█████▌    | 44/80 [04:38<03:43,  6.20s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=1.68e-5, train/loss_step=0.00491, global_step=1150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  55%|█████▌    | 44/80 [04:38<03:43,  6.20s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.13e-6, train/loss_step=0.000268, global_step=1150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  56%|█████▋    | 45/80 [04:39<03:32,  6.08s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.13e-6, train/loss_step=0.000268, global_step=1150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  56%|█████▋    | 45/80 [04:39<03:32,  6.08s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000676, train/loss_vlb_step=2.87e-6, train/loss_step=0.000676, global_step=1151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  57%|█████▊    | 46/80 [04:40<03:22,  5.96s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000676, train/loss_vlb_step=2.87e-6, train/loss_step=0.000676, global_step=1151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  57%|█████▊    | 46/80 [04:40<03:22,  5.96s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.22e-6, train/loss_step=0.00123, global_step=1151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:  59%|█████▉    | 47/80 [04:40<03:12,  5.84s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.22e-6, train/loss_step=0.00123, global_step=1151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  59%|█████▉    | 47/80 [04:40<03:12,  5.84s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000824, train/loss_vlb_step=3.4e-6, train/loss_step=0.000824, global_step=1151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  60%|██████    | 48/80 [05:04<03:18,  6.21s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000824, train/loss_vlb_step=3.4e-6, train/loss_step=0.000824, global_step=1151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  60%|██████    | 48/80 [05:04<03:18,  6.21s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=9.34e-6, train/loss_step=0.00176, global_step=1151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:  61%|██████▏   | 49/80 [05:04<03:08,  6.09s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=9.34e-6, train/loss_step=0.00176, global_step=1151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  61%|██████▏   | 49/80 [05:04<03:08,  6.09s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.5e-6, train/loss_step=0.000314, global_step=1152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  62%|██████▎   | 50/80 [05:18<03:07,  6.24s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.5e-6, train/loss_step=0.000314, global_step=1152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  62%|██████▎   | 50/80 [05:18<03:07,  6.24s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000214, train/loss_step=0.0159, global_step=1152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:  64%|██████▍   | 51/80 [05:22<02:59,  6.19s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000214, train/loss_step=0.0159, global_step=1152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  64%|██████▍   | 51/80 [05:22<02:59,  6.19s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.13e-6, train/loss_step=0.000253, global_step=1152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  65%|██████▌   | 52/80 [05:22<02:50,  6.09s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.13e-6, train/loss_step=0.000253, global_step=1152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  65%|██████▌   | 52/80 [05:22<02:50,  6.09s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.05e-5, train/loss_step=0.016, global_step=1152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]      Epoch 57:  66%|██████▋   | 53/80 [05:23<02:41,  5.98s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=7.05e-5, train/loss_step=0.016, global_step=1152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  66%|██████▋   | 53/80 [05:23<02:41,  5.98s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=3.68e-6, train/loss_step=0.000852, global_step=1153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  68%|██████▊   | 54/80 [05:23<02:32,  5.88s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000852, train/loss_vlb_step=3.68e-6, train/loss_step=0.000852, global_step=1153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  68%|██████▊   | 54/80 [05:23<02:32,  5.88s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.04e-6, train/loss_step=0.00028, global_step=1153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:  69%|██████▉   | 55/80 [05:24<02:24,  5.79s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.04e-6, train/loss_step=0.00028, global_step=1153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  69%|██████▉   | 55/80 [05:24<02:24,  5.79s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=2.3e-6, train/loss_step=0.000574, global_step=1153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  70%|███████   | 56/80 [05:55<02:29,  6.23s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=2.3e-6, train/loss_step=0.000574, global_step=1153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  70%|███████   | 56/80 [05:55<02:29,  6.23s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000575, train/loss_vlb_step=7.97e-6, train/loss_step=0.000575, global_step=1153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  71%|███████▏  | 57/80 [05:55<02:21,  6.13s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000575, train/loss_vlb_step=7.97e-6, train/loss_step=0.000575, global_step=1153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  71%|███████▏  | 57/80 [05:55<02:21,  6.13s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=1.68e-5, train/loss_step=0.00483, global_step=1154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:  72%|███████▎  | 58/80 [06:06<02:16,  6.21s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=1.68e-5, train/loss_step=0.00483, global_step=1154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  72%|███████▎  | 58/80 [06:06<02:16,  6.21s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=6.3e-6, train/loss_step=0.0013, global_step=1154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]    Epoch 57:  74%|███████▍  | 59/80 [06:07<02:08,  6.13s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=6.3e-6, train/loss_step=0.0013, global_step=1154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  74%|███████▍  | 59/80 [06:07<02:08,  6.13s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=2.4e-6, train/loss_step=0.000544, global_step=1154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  75%|███████▌  | 60/80 [06:08<02:00,  6.04s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=2.4e-6, train/loss_step=0.000544, global_step=1154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  75%|███████▌  | 60/80 [06:08<02:00,  6.04s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.15e-5, train/loss_step=0.00232, global_step=1154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:  76%|███████▋  | 61/80 [06:09<01:53,  5.95s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=1.15e-5, train/loss_step=0.00232, global_step=1154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  76%|███████▋  | 61/80 [06:09<01:53,  5.95s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.22e-5, train/loss_step=0.00593, global_step=1155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  78%|███████▊  | 62/80 [06:09<01:45,  5.87s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.22e-5, train/loss_step=0.00593, global_step=1155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  78%|███████▊  | 62/80 [06:09<01:45,  5.87s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.57e-6, train/loss_step=0.00041, global_step=1155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  79%|███████▉  | 63/80 [06:10<01:38,  5.78s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.57e-6, train/loss_step=0.00041, global_step=1155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  79%|███████▉  | 63/80 [06:10<01:38,  5.78s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=4.33e-5, train/loss_step=0.00694, global_step=1155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  80%|████████  | 64/80 [06:47<01:40,  6.27s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00694, train/loss_vlb_step=4.33e-5, train/loss_step=0.00694, global_step=1155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  80%|████████  | 64/80 [06:47<01:40,  6.27s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000155, train/loss_step=0.0119, global_step=1155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57:  81%|████████▏ | 65/80 [06:47<01:32,  6.18s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000155, train/loss_step=0.0119, global_step=1155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  81%|████████▏ | 65/80 [06:47<01:32,  6.18s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=3.32e-5, train/loss_step=0.00771, global_step=1156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  82%|████████▎ | 66/80 [06:48<01:25,  6.10s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=3.32e-5, train/loss_step=0.00771, global_step=1156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  82%|████████▎ | 66/80 [06:48<01:25,  6.10s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=1.21e-6, train/loss_step=0.000229, global_step=1156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  84%|████████▍ | 67/80 [06:48<01:18,  6.01s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=1.21e-6, train/loss_step=0.000229, global_step=1156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  84%|████████▍ | 67/80 [06:48<01:18,  6.01s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.72e-6, train/loss_step=0.000295, global_step=1156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  85%|████████▌ | 68/80 [06:49<01:11,  5.93s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.72e-6, train/loss_step=0.000295, global_step=1156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  85%|████████▌ | 68/80 [06:49<01:11,  5.93s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=7.51e-5, train/loss_step=0.013, global_step=1156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]      Epoch 57:  86%|████████▋ | 69/80 [06:50<01:04,  5.86s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=7.51e-5, train/loss_step=0.013, global_step=1156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  86%|████████▋ | 69/80 [06:50<01:04,  5.86s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=4e-6, train/loss_step=0.00094, global_step=1157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  88%|████████▊ | 70/80 [06:50<00:57,  5.78s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=4e-6, train/loss_step=0.00094, global_step=1157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  88%|████████▊ | 70/80 [06:50<00:57,  5.78s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.33e-5, train/loss_step=0.0106, global_step=1157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  89%|████████▉ | 71/80 [06:51<00:51,  5.71s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.33e-5, train/loss_step=0.0106, global_step=1157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  89%|████████▉ | 71/80 [06:51<00:51,  5.71s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.36e-6, train/loss_step=0.00105, global_step=1157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  90%|█████████ | 72/80 [07:27<00:49,  6.13s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.36e-6, train/loss_step=0.00105, global_step=1157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  90%|█████████ | 72/80 [07:27<00:49,  6.13s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=0.000536, train/loss_step=0.00151, global_step=1157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  91%|█████████▏| 73/80 [07:27<00:42,  6.05s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=0.000536, train/loss_step=0.00151, global_step=1157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  91%|█████████▏| 73/80 [07:27<00:42,  6.05s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000128, train/loss_vlb_step=5.94e-7, train/loss_step=0.000128, global_step=1158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  92%|█████████▎| 74/80 [07:28<00:35,  5.98s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000128, train/loss_vlb_step=5.94e-7, train/loss_step=0.000128, global_step=1158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  92%|█████████▎| 74/80 [07:28<00:35,  5.98s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.54e-6, train/loss_step=0.000317, global_step=1158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  94%|█████████▍| 75/80 [07:28<00:29,  5.91s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.54e-6, train/loss_step=0.000317, global_step=1158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  94%|█████████▍| 75/80 [07:28<00:29,  5.91s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=2.73e-5, train/loss_step=0.00599, global_step=1158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 57:  95%|█████████▌| 76/80 [07:29<00:23,  5.84s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00599, train/loss_vlb_step=2.73e-5, train/loss_step=0.00599, global_step=1158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  95%|█████████▌| 76/80 [07:29<00:23,  5.84s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.91e-6, train/loss_step=0.000433, global_step=1158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  96%|█████████▋| 77/80 [07:29<00:17,  5.77s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.91e-6, train/loss_step=0.000433, global_step=1158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  96%|█████████▋| 77/80 [07:29<00:17,  5.77s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=9.51e-6, train/loss_step=0.0011, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]    Epoch 57:  98%|█████████▊| 78/80 [07:30<00:11,  5.70s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=9.51e-6, train/loss_step=0.0011, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  98%|█████████▊| 78/80 [07:30<00:11,  5.70s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000903, train/loss_vlb_step=3.58e-6, train/loss_step=0.000903, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  99%|█████████▉| 79/80 [07:30<00:05,  5.64s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000903, train/loss_vlb_step=3.58e-6, train/loss_step=0.000903, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57:  99%|█████████▉| 79/80 [07:30<00:05,  5.64s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=1.87e-6, train/loss_step=0.000338, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419] Epoch 57: 100%|██████████| 80/80 [07:31<00:00,  5.57s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=1.87e-6, train/loss_step=0.000338, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 57: 100%|██████████| 80/80 [07:31<00:00,  5.57s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=1.04e-6, train/loss_step=0.000226, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Average Epoch time: 451.42 seconds
+Average Peak memory 29567.01MiB
+Epoch 57:   0%|          | 0/80 [00:00<00:00, 7002.18it/s, loss=0.0035, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=1.04e-6, train/loss_step=0.000226, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 58:   0%|          | 0/80 [00:00<00:00, 2576.35it/s, loss=0.0035, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=1.04e-6, train/loss_step=0.000226, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]Epoch 58:   1%|▏         | 1/80 [00:32<21:25, 16.28s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=1.04e-6, train/loss_step=0.000226, global_step=1159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=9.69e-5, train/loss_epoch=0.00419]  Epoch 58:   1%|▏         | 1/80 [00:32<21:25, 16.28s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000401, train/loss_vlb_step=1.87e-6, train/loss_step=0.000401, global_step=1160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   2%|▎         | 2/80 [00:44<19:15, 14.81s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000401, train/loss_vlb_step=1.87e-6, train/loss_step=0.000401, global_step=1160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   2%|▎         | 2/80 [00:44<19:15, 14.81s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=1.85e-5, train/loss_step=0.00543, global_step=1160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:   4%|▍         | 3/80 [00:44<14:24, 11.23s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=1.85e-5, train/loss_step=0.00543, global_step=1160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   4%|▍         | 3/80 [00:44<14:24, 11.23s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.08e-5, train/loss_step=0.00282, global_step=1160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   5%|▌         | 4/80 [00:45<11:30,  9.09s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.08e-5, train/loss_step=0.00282, global_step=1160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   5%|▌         | 4/80 [00:45<11:30,  9.09s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.000492, train/loss_vlb_step=2.49e-6, train/loss_step=0.000492, global_step=1160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   6%|▋         | 5/80 [00:45<09:34,  7.66s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.000492, train/loss_vlb_step=2.49e-6, train/loss_step=0.000492, global_step=1160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   6%|▋         | 5/80 [00:45<09:34,  7.66s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.62e-6, train/loss_step=0.000314, global_step=1161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   8%|▊         | 6/80 [00:46<08:11,  6.64s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.62e-6, train/loss_step=0.000314, global_step=1161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   8%|▊         | 6/80 [00:46<08:11,  6.64s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=1.51e-6, train/loss_step=0.000402, global_step=1161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   9%|▉         | 7/80 [00:46<07:08,  5.87s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=1.51e-6, train/loss_step=0.000402, global_step=1161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:   9%|▉         | 7/80 [00:46<07:08,  5.87s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.45e-6, train/loss_step=0.00166, global_step=1161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  10%|█         | 8/80 [01:14<09:58,  8.32s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.45e-6, train/loss_step=0.00166, global_step=1161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  10%|█         | 8/80 [01:14<09:58,  8.32s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.21e-5, train/loss_step=0.00334, global_step=1161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  11%|█▏        | 9/80 [01:15<08:55,  7.54s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.21e-5, train/loss_step=0.00334, global_step=1161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  11%|█▏        | 9/80 [01:15<08:55,  7.54s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=2.1e-5, train/loss_step=0.00149, global_step=1162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419] Epoch 58:  12%|█▎        | 10/80 [01:20<08:33,  7.33s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=2.1e-5, train/loss_step=0.00149, global_step=1162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  12%|█▎        | 10/80 [01:20<08:33,  7.33s/it, loss=0.00143, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.45e-6, train/loss_step=0.000315, global_step=1162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  14%|█▍        | 11/80 [01:40<09:39,  8.40s/it, loss=0.00143, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.45e-6, train/loss_step=0.000315, global_step=1162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  14%|█▍        | 11/80 [01:40<09:39,  8.40s/it, loss=0.00139, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.14e-6, train/loss_step=0.000259, global_step=1162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  15%|█▌        | 12/80 [01:41<08:49,  7.79s/it, loss=0.00139, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.14e-6, train/loss_step=0.000259, global_step=1162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  15%|█▌        | 12/80 [01:41<08:49,  7.79s/it, loss=0.00135, v_num=0, train/loss_simple_step=0.000575, train/loss_vlb_step=1.18e-5, train/loss_step=0.000575, global_step=1162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  16%|█▋        | 13/80 [01:41<08:07,  7.27s/it, loss=0.00135, v_num=0, train/loss_simple_step=0.000575, train/loss_vlb_step=1.18e-5, train/loss_step=0.000575, global_step=1162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  16%|█▋        | 13/80 [01:41<08:07,  7.27s/it, loss=0.00176, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=3.44e-5, train/loss_step=0.00843, global_step=1163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  18%|█▊        | 14/80 [01:42<07:30,  6.82s/it, loss=0.00176, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=3.44e-5, train/loss_step=0.00843, global_step=1163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  18%|█▊        | 14/80 [01:42<07:30,  6.82s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.09e-6, train/loss_step=0.00133, global_step=1163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  19%|█▉        | 15/80 [01:42<06:57,  6.43s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.09e-6, train/loss_step=0.00133, global_step=1163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  19%|█▉        | 15/80 [01:42<06:57,  6.43s/it, loss=0.00159, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.44e-6, train/loss_step=0.00152, global_step=1163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  20%|██        | 16/80 [01:51<06:59,  6.56s/it, loss=0.00159, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=9.44e-6, train/loss_step=0.00152, global_step=1163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  20%|██        | 16/80 [01:51<06:59,  6.56s/it, loss=0.0016, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=6.18e-6, train/loss_step=0.000567, global_step=1163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  21%|██▏       | 17/80 [01:52<06:32,  6.22s/it, loss=0.0016, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=6.18e-6, train/loss_step=0.000567, global_step=1163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  21%|██▏       | 17/80 [01:52<06:32,  6.22s/it, loss=0.00157, v_num=0, train/loss_simple_step=0.000534, train/loss_vlb_step=2.42e-6, train/loss_step=0.000534, global_step=1164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  22%|██▎       | 18/80 [02:01<06:36,  6.39s/it, loss=0.00157, v_num=0, train/loss_simple_step=0.000534, train/loss_vlb_step=2.42e-6, train/loss_step=0.000534, global_step=1164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  22%|██▎       | 18/80 [02:01<06:36,  6.39s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=2.37e-5, train/loss_step=0.00639, global_step=1164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  24%|██▍       | 19/80 [02:26<07:27,  7.34s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=2.37e-5, train/loss_step=0.00639, global_step=1164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  24%|██▍       | 19/80 [02:26<07:27,  7.34s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=0.000227, train/loss_step=0.00413, global_step=1164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  25%|██▌       | 20/80 [02:27<07:01,  7.02s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=0.000227, train/loss_step=0.00413, global_step=1164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  25%|██▌       | 20/80 [02:27<07:01,  7.02s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000882, train/loss_vlb_step=4.87e-6, train/loss_step=0.000882, global_step=1164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  26%|██▋       | 21/80 [02:27<06:36,  6.72s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000882, train/loss_vlb_step=4.87e-6, train/loss_step=0.000882, global_step=1164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  26%|██▋       | 21/80 [02:27<06:36,  6.72s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=8.19e-6, train/loss_step=0.00104, global_step=1165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]   Epoch 58:  28%|██▊       | 22/80 [02:28<06:14,  6.45s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=8.19e-6, train/loss_step=0.00104, global_step=1165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  28%|██▊       | 22/80 [02:28<06:14,  6.45s/it, loss=0.00194, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.29e-5, train/loss_step=0.00239, global_step=1165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  29%|██▉       | 23/80 [02:28<05:53,  6.20s/it, loss=0.00194, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=1.29e-5, train/loss_step=0.00239, global_step=1165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  29%|██▉       | 23/80 [02:28<05:53,  6.20s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=0.000112, train/loss_step=0.006, global_step=1165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]    Epoch 58:  30%|███       | 24/80 [02:29<05:34,  5.98s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=0.000112, train/loss_step=0.006, global_step=1165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  30%|███       | 24/80 [02:29<05:34,  5.98s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=1.46e-6, train/loss_step=0.000293, global_step=1165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  31%|███▏      | 25/80 [02:42<05:44,  6.27s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=1.46e-6, train/loss_step=0.000293, global_step=1165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  31%|███▏      | 25/80 [02:42<05:44,  6.27s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.25e-5, train/loss_step=0.00168, global_step=1166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  32%|███▎      | 26/80 [02:43<05:26,  6.05s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.25e-5, train/loss_step=0.00168, global_step=1166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  32%|███▎      | 26/80 [02:43<05:26,  6.05s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.0004, train/loss_vlb_step=3.15e-6, train/loss_step=0.0004, global_step=1166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  34%|███▍      | 27/80 [03:15<06:10,  7.00s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.0004, train/loss_vlb_step=3.15e-6, train/loss_step=0.0004, global_step=1166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  34%|███▍      | 27/80 [03:15<06:10,  7.00s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000178, train/loss_vlb_step=8.57e-7, train/loss_step=0.000178, global_step=1166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  35%|███▌      | 28/80 [03:16<05:52,  6.77s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000178, train/loss_vlb_step=8.57e-7, train/loss_step=0.000178, global_step=1166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  35%|███▌      | 28/80 [03:16<05:52,  6.77s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.87e-5, train/loss_step=0.00106, global_step=1166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  36%|███▋      | 29/80 [03:16<05:34,  6.57s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.87e-5, train/loss_step=0.00106, global_step=1166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  36%|███▋      | 29/80 [03:16<05:34,  6.57s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.000971, train/loss_vlb_step=4.71e-6, train/loss_step=0.000971, global_step=1167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  38%|███▊      | 30/80 [03:17<05:18,  6.37s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.000971, train/loss_vlb_step=4.71e-6, train/loss_step=0.000971, global_step=1167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  38%|███▊      | 30/80 [03:17<05:18,  6.37s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=2.65e-6, train/loss_step=0.000518, global_step=1167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  39%|███▉      | 31/80 [03:17<05:03,  6.19s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=2.65e-6, train/loss_step=0.000518, global_step=1167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  39%|███▉      | 31/80 [03:17<05:03,  6.19s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=2.86e-5, train/loss_step=0.00775, global_step=1167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  40%|████      | 32/80 [03:18<04:48,  6.01s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=2.86e-5, train/loss_step=0.00775, global_step=1167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  40%|████      | 32/80 [03:18<04:48,  6.01s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=8.72e-6, train/loss_step=0.00226, global_step=1167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  41%|████▏     | 33/80 [03:20<04:36,  5.89s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=8.72e-6, train/loss_step=0.00226, global_step=1167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  41%|████▏     | 33/80 [03:20<04:36,  5.89s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=4.13e-5, train/loss_step=0.00709, global_step=1168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  42%|████▎     | 34/80 [03:20<04:23,  5.73s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00709, train/loss_vlb_step=4.13e-5, train/loss_step=0.00709, global_step=1168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  42%|████▎     | 34/80 [03:20<04:23,  5.73s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.86e-6, train/loss_step=0.000326, global_step=1168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  44%|████▍     | 35/80 [03:52<04:50,  6.46s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.86e-6, train/loss_step=0.000326, global_step=1168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  44%|████▍     | 35/80 [03:52<04:50,  6.46s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000966, train/loss_vlb_step=3.32e-6, train/loss_step=0.000966, global_step=1168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  45%|████▌     | 36/80 [03:53<04:37,  6.30s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000966, train/loss_vlb_step=3.32e-6, train/loss_step=0.000966, global_step=1168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  45%|████▌     | 36/80 [03:53<04:37,  6.30s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.000372, train/loss_vlb_step=1.43e-6, train/loss_step=0.000372, global_step=1168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  46%|████▋     | 37/80 [03:54<04:24,  6.16s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.000372, train/loss_vlb_step=1.43e-6, train/loss_step=0.000372, global_step=1168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  46%|████▋     | 37/80 [03:54<04:24,  6.16s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=6.81e-5, train/loss_step=0.00314, global_step=1169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  48%|████▊     | 38/80 [03:54<04:12,  6.02s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=6.81e-5, train/loss_step=0.00314, global_step=1169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  48%|████▊     | 38/80 [03:54<04:12,  6.02s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.73e-6, train/loss_step=0.000307, global_step=1169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  49%|████▉     | 39/80 [03:55<04:00,  5.88s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.73e-6, train/loss_step=0.000307, global_step=1169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  49%|████▉     | 39/80 [03:55<04:00,  5.88s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000257, train/loss_vlb_step=1.22e-6, train/loss_step=0.000257, global_step=1169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  50%|█████     | 40/80 [03:55<03:49,  5.75s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000257, train/loss_vlb_step=1.22e-6, train/loss_step=0.000257, global_step=1169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  50%|█████     | 40/80 [03:55<03:49,  5.75s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=1.44e-5, train/loss_step=0.00426, global_step=1169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  51%|█████▏    | 41/80 [03:59<03:42,  5.70s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=1.44e-5, train/loss_step=0.00426, global_step=1169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  51%|█████▏    | 41/80 [03:59<03:42,  5.70s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=1.37e-5, train/loss_step=0.0039, global_step=1170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  52%|█████▎    | 42/80 [04:01<03:32,  5.61s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=1.37e-5, train/loss_step=0.0039, global_step=1170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  52%|█████▎    | 42/80 [04:01<03:32,  5.61s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.06e-5, train/loss_step=0.0134, global_step=1170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  54%|█████▍    | 43/80 [04:36<03:52,  6.28s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.06e-5, train/loss_step=0.0134, global_step=1170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  54%|█████▍    | 43/80 [04:36<03:52,  6.28s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=9.19e-6, train/loss_step=0.00238, global_step=1170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  55%|█████▌    | 44/80 [04:36<03:41,  6.15s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=9.19e-6, train/loss_step=0.00238, global_step=1170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  55%|█████▌    | 44/80 [04:36<03:41,  6.15s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=3.03e-5, train/loss_step=0.00896, global_step=1170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  56%|█████▋    | 45/80 [04:37<03:31,  6.04s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=3.03e-5, train/loss_step=0.00896, global_step=1170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  56%|█████▋    | 45/80 [04:37<03:31,  6.04s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=6.79e-6, train/loss_step=0.00169, global_step=1171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  57%|█████▊    | 46/80 [04:38<03:21,  5.92s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=6.79e-6, train/loss_step=0.00169, global_step=1171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  57%|█████▊    | 46/80 [04:38<03:21,  5.92s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=1.92e-5, train/loss_step=0.00495, global_step=1171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  59%|█████▉    | 47/80 [04:38<03:11,  5.80s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=1.92e-5, train/loss_step=0.00495, global_step=1171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  59%|█████▉    | 47/80 [04:38<03:11,  5.80s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.32e-6, train/loss_step=0.00114, global_step=1171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  60%|██████    | 48/80 [04:39<03:02,  5.70s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.32e-6, train/loss_step=0.00114, global_step=1171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  60%|██████    | 48/80 [04:39<03:02,  5.70s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=1.17e-5, train/loss_step=0.000819, global_step=1171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  61%|██████▏   | 49/80 [04:47<02:58,  5.75s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=1.17e-5, train/loss_step=0.000819, global_step=1171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  61%|██████▏   | 49/80 [04:47<02:58,  5.75s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=2.38e-6, train/loss_step=0.000462, global_step=1172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  62%|██████▎   | 50/80 [04:47<02:49,  5.64s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=2.38e-6, train/loss_step=0.000462, global_step=1172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  62%|██████▎   | 50/80 [04:47<02:49,  5.64s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=1.58e-6, train/loss_step=0.000263, global_step=1172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  64%|██████▍   | 51/80 [05:23<03:00,  6.22s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=1.58e-6, train/loss_step=0.000263, global_step=1172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  64%|██████▍   | 51/80 [05:23<03:00,  6.22s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=3.1e-5, train/loss_step=0.000761, global_step=1172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419] Epoch 58:  65%|██████▌   | 52/80 [05:23<02:51,  6.11s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=3.1e-5, train/loss_step=0.000761, global_step=1172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  65%|██████▌   | 52/80 [05:23<02:51,  6.11s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=8.82e-6, train/loss_step=0.00256, global_step=1172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  66%|██████▋   | 53/80 [05:24<02:42,  6.01s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=8.82e-6, train/loss_step=0.00256, global_step=1172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  66%|██████▋   | 53/80 [05:24<02:42,  6.01s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.41e-6, train/loss_step=0.00174, global_step=1173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  68%|██████▊   | 54/80 [05:24<02:33,  5.91s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.41e-6, train/loss_step=0.00174, global_step=1173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  68%|██████▊   | 54/80 [05:24<02:33,  5.91s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.63e-5, train/loss_step=0.0122, global_step=1173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  69%|██████▉   | 55/80 [05:25<02:25,  5.81s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=5.63e-5, train/loss_step=0.0122, global_step=1173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  69%|██████▉   | 55/80 [05:25<02:25,  5.81s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000234, train/loss_vlb_step=1e-6, train/loss_step=0.000234, global_step=1173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  70%|███████   | 56/80 [05:26<02:17,  5.72s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000234, train/loss_vlb_step=1e-6, train/loss_step=0.000234, global_step=1173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  70%|███████   | 56/80 [05:26<02:17,  5.72s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=7.27e-6, train/loss_step=0.000732, global_step=1173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  71%|███████▏  | 57/80 [05:36<02:13,  5.80s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=7.27e-6, train/loss_step=0.000732, global_step=1173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  71%|███████▏  | 57/80 [05:36<02:13,  5.80s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.37e-6, train/loss_step=0.00115, global_step=1174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.37e-6, train/loss_step=0.00115, global_step=1174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000946, train/loss_vlb_step=5.33e-5, train/loss_step=0.000946, global_step=1174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  74%|███████▍  | 59/80 [06:05<02:08,  6.10s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000946, train/loss_vlb_step=5.33e-5, train/loss_step=0.000946, global_step=1174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  74%|███████▍  | 59/80 [06:05<02:08,  6.10s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.68e-6, train/loss_step=0.000433, global_step=1174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  75%|███████▌  | 60/80 [06:06<02:00,  6.01s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.68e-6, train/loss_step=0.000433, global_step=1174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  75%|███████▌  | 60/80 [06:06<02:00,  6.01s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=3.79e-5, train/loss_step=0.00896, global_step=1174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  76%|███████▋  | 61/80 [06:07<01:52,  5.92s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=3.79e-5, train/loss_step=0.00896, global_step=1174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  76%|███████▋  | 61/80 [06:07<01:52,  5.92s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000829, train/loss_vlb_step=6.4e-6, train/loss_step=0.000829, global_step=1175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  78%|███████▊  | 62/80 [06:07<01:45,  5.84s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000829, train/loss_vlb_step=6.4e-6, train/loss_step=0.000829, global_step=1175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  78%|███████▊  | 62/80 [06:07<01:45,  5.84s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000622, train/loss_vlb_step=6.02e-6, train/loss_step=0.000622, global_step=1175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  79%|███████▉  | 63/80 [06:08<01:37,  5.75s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000622, train/loss_vlb_step=6.02e-6, train/loss_step=0.000622, global_step=1175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  79%|███████▉  | 63/80 [06:08<01:37,  5.75s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=5.59e-6, train/loss_step=0.0012, global_step=1175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]    Epoch 58:  80%|████████  | 64/80 [06:08<01:30,  5.68s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=5.59e-6, train/loss_step=0.0012, global_step=1175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  80%|████████  | 64/80 [06:08<01:30,  5.68s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.95e-5, train/loss_step=0.0107, global_step=1175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  81%|████████▏ | 65/80 [06:15<01:25,  5.69s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.95e-5, train/loss_step=0.0107, global_step=1175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  81%|████████▏ | 65/80 [06:15<01:25,  5.69s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=2.02e-6, train/loss_step=0.000472, global_step=1176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  82%|████████▎ | 66/80 [06:15<01:18,  5.61s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=2.02e-6, train/loss_step=0.000472, global_step=1176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  82%|████████▎ | 66/80 [06:15<01:18,  5.61s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=2.59e-5, train/loss_step=0.00627, global_step=1176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  84%|████████▍ | 67/80 [06:44<01:17,  5.94s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=2.59e-5, train/loss_step=0.00627, global_step=1176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  84%|████████▍ | 67/80 [06:44<01:17,  5.94s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000539, train/loss_vlb_step=6.15e-6, train/loss_step=0.000539, global_step=1176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  85%|████████▌ | 68/80 [06:44<01:10,  5.86s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000539, train/loss_vlb_step=6.15e-6, train/loss_step=0.000539, global_step=1176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  85%|████████▌ | 68/80 [06:44<01:10,  5.86s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000931, train/loss_vlb_step=4.14e-6, train/loss_step=0.000931, global_step=1176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419] Epoch 58:  86%|████████▋ | 69/80 [06:45<01:03,  5.79s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000931, train/loss_vlb_step=4.14e-6, train/loss_step=0.000931, global_step=1176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  86%|████████▋ | 69/80 [06:45<01:03,  5.79s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000353, train/loss_vlb_step=1.49e-6, train/loss_step=0.000353, global_step=1177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  88%|████████▊ | 70/80 [06:45<00:57,  5.71s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000353, train/loss_vlb_step=1.49e-6, train/loss_step=0.000353, global_step=1177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  88%|████████▊ | 70/80 [06:45<00:57,  5.71s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.85e-6, train/loss_step=0.000411, global_step=1177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419] Epoch 58:  89%|████████▉ | 71/80 [06:46<00:50,  5.64s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.85e-6, train/loss_step=0.000411, global_step=1177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  89%|████████▉ | 71/80 [06:46<00:50,  5.64s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=1.06e-5, train/loss_step=0.000805, global_step=1177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  90%|█████████ | 72/80 [06:46<00:44,  5.57s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=1.06e-5, train/loss_step=0.000805, global_step=1177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  90%|█████████ | 72/80 [06:46<00:44,  5.57s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=2.83e-5, train/loss_step=0.00792, global_step=1177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419] Epoch 58:  91%|█████████▏| 73/80 [06:51<00:38,  5.56s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=2.83e-5, train/loss_step=0.00792, global_step=1177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  91%|█████████▏| 73/80 [06:51<00:38,  5.56s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.1e-5, train/loss_step=0.00313, global_step=1178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419] Epoch 58:  92%|█████████▎| 74/80 [06:51<00:32,  5.49s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.1e-5, train/loss_step=0.00313, global_step=1178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  92%|█████████▎| 74/80 [06:51<00:32,  5.49s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=1.47e-6, train/loss_step=0.000316, global_step=1178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  94%|█████████▍| 75/80 [07:16<00:28,  5.74s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=1.47e-6, train/loss_step=0.000316, global_step=1178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  94%|█████████▍| 75/80 [07:16<00:28,  5.74s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.95e-5, train/loss_step=0.00361, global_step=1178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58:  95%|█████████▌| 76/80 [07:17<00:22,  5.68s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.95e-5, train/loss_step=0.00361, global_step=1178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  95%|█████████▌| 76/80 [07:17<00:22,  5.68s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.16e-5, train/loss_step=0.00411, global_step=1178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  96%|█████████▋| 77/80 [07:17<00:16,  5.61s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=2.16e-5, train/loss_step=0.00411, global_step=1178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  96%|█████████▋| 77/80 [07:17<00:16,  5.61s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=1.09e-5, train/loss_step=0.00143, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419] Epoch 58:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=1.09e-5, train/loss_step=0.00143, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=3.46e-6, train/loss_step=0.000802, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  99%|█████████▉| 79/80 [07:18<00:05,  5.48s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=3.46e-6, train/loss_step=0.000802, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58:  99%|█████████▉| 79/80 [07:18<00:05,  5.48s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.44e-5, train/loss_step=0.00196, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 58: 100%|██████████| 80/80 [07:19<00:00,  5.42s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.44e-5, train/loss_step=0.00196, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 58: 100%|██████████| 80/80 [07:19<00:00,  5.42s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.23e-5, train/loss_step=0.00511, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Average Epoch time: 439.07 seconds
+Average Peak memory 29562.67MiB
+Epoch 58:   0%|          | 0/80 [00:00<00:00, 4922.89it/s, loss=0.00258, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.23e-5, train/loss_step=0.00511, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 59:   0%|          | 0/80 [00:00<00:00, 1972.86it/s, loss=0.00258, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.23e-5, train/loss_step=0.00511, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]Epoch 59:   1%|▏         | 1/80 [00:55<36:26, 27.67s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.23e-5, train/loss_step=0.00511, global_step=1179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=7.04e-5, train/loss_epoch=0.00419]  Epoch 59:   1%|▏         | 1/80 [00:55<36:26, 27.67s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=4.56e-5, train/loss_step=0.0132, global_step=1180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]   Epoch 59:   2%|▎         | 2/80 [00:55<24:11, 18.61s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=4.56e-5, train/loss_step=0.0132, global_step=1180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   2%|▎         | 2/80 [00:55<24:11, 18.61s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=6.01e-6, train/loss_step=0.00102, global_step=1180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   4%|▍         | 3/80 [00:56<18:04, 14.08s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=6.01e-6, train/loss_step=0.00102, global_step=1180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   4%|▍         | 3/80 [00:56<18:04, 14.08s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000927, train/loss_vlb_step=3.58e-6, train/loss_step=0.000927, global_step=1180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   5%|▌         | 4/80 [00:56<14:24, 11.37s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000927, train/loss_vlb_step=3.58e-6, train/loss_step=0.000927, global_step=1180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   5%|▌         | 4/80 [00:56<14:24, 11.37s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=5.8e-6, train/loss_step=0.000497, global_step=1180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   6%|▋         | 5/80 [00:57<11:57,  9.56s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=5.8e-6, train/loss_step=0.000497, global_step=1180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   6%|▋         | 5/80 [00:57<11:57,  9.56s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.2e-6, train/loss_step=0.000305, global_step=1181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   8%|▊         | 6/80 [00:57<10:11,  8.26s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.2e-6, train/loss_step=0.000305, global_step=1181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   8%|▊         | 6/80 [00:57<10:11,  8.26s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.08e-6, train/loss_step=0.000279, global_step=1181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   9%|▉         | 7/80 [00:58<08:52,  7.29s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.08e-6, train/loss_step=0.000279, global_step=1181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:   9%|▉         | 7/80 [00:58<08:52,  7.29s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.0006, train/loss_vlb_step=3.34e-6, train/loss_step=0.0006, global_step=1181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]    Epoch 59:  10%|█         | 8/80 [01:38<13:09, 10.97s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.0006, train/loss_vlb_step=3.34e-6, train/loss_step=0.0006, global_step=1181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  10%|█         | 8/80 [01:38<13:09, 10.97s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=9.4e-6, train/loss_step=0.00245, global_step=1181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  11%|█▏        | 9/80 [01:39<11:44,  9.93s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=9.4e-6, train/loss_step=0.00245, global_step=1181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  11%|█▏        | 9/80 [01:39<11:44,  9.93s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=2.02e-5, train/loss_step=0.00256, global_step=1182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  12%|█▎        | 10/80 [01:39<10:34,  9.07s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=2.02e-5, train/loss_step=0.00256, global_step=1182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  12%|█▎        | 10/80 [01:39<10:34,  9.07s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=2.8e-6, train/loss_step=0.000567, global_step=1182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  14%|█▍        | 11/80 [01:40<09:36,  8.35s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=2.8e-6, train/loss_step=0.000567, global_step=1182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  14%|█▍        | 11/80 [01:40<09:36,  8.35s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=6.13e-6, train/loss_step=0.00149, global_step=1182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  15%|█▌        | 12/80 [01:40<08:48,  7.77s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=6.13e-6, train/loss_step=0.00149, global_step=1182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  15%|█▌        | 12/80 [01:40<08:48,  7.77s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=3.63e-5, train/loss_step=0.00317, global_step=1182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  16%|█▋        | 13/80 [01:41<08:05,  7.25s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=3.63e-5, train/loss_step=0.00317, global_step=1182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  16%|█▋        | 13/80 [01:41<08:05,  7.25s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=1.69e-5, train/loss_step=0.00425, global_step=1183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  18%|█▊        | 14/80 [01:41<07:28,  6.80s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.00425, train/loss_vlb_step=1.69e-5, train/loss_step=0.00425, global_step=1183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  18%|█▊        | 14/80 [01:41<07:28,  6.80s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.33e-5, train/loss_step=0.002, global_step=1183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]    Epoch 59:  19%|█▉        | 15/80 [01:42<06:56,  6.40s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.33e-5, train/loss_step=0.002, global_step=1183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  19%|█▉        | 15/80 [01:42<06:56,  6.40s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=7.45e-6, train/loss_step=0.00161, global_step=1183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  20%|██        | 16/80 [02:26<09:13,  8.64s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=7.45e-6, train/loss_step=0.00161, global_step=1183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  20%|██        | 16/80 [02:26<09:13,  8.64s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.0158, train/loss_step=0.0459, global_step=1183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]   Epoch 59:  21%|██▏       | 17/80 [02:27<08:35,  8.19s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0459, train/loss_vlb_step=0.0158, train/loss_step=0.0459, global_step=1183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  21%|██▏       | 17/80 [02:27<08:35,  8.19s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000191, train/loss_vlb_step=7.99e-7, train/loss_step=0.000191, global_step=1184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  22%|██▎       | 18/80 [02:27<08:02,  7.78s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000191, train/loss_vlb_step=7.99e-7, train/loss_step=0.000191, global_step=1184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  22%|██▎       | 18/80 [02:27<08:02,  7.78s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=0.000124, train/loss_step=0.00206, global_step=1184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  24%|██▍       | 19/80 [02:28<07:32,  7.42s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=0.000124, train/loss_step=0.00206, global_step=1184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  24%|██▍       | 19/80 [02:28<07:32,  7.42s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000405, train/loss_vlb_step=1.94e-6, train/loss_step=0.000405, global_step=1184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  25%|██▌       | 20/80 [02:29<07:06,  7.11s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000405, train/loss_vlb_step=1.94e-6, train/loss_step=0.000405, global_step=1184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  25%|██▌       | 20/80 [02:29<07:06,  7.11s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=1.95e-5, train/loss_step=0.00104, global_step=1184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 59:  26%|██▋       | 21/80 [02:29<06:41,  6.81s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=1.95e-5, train/loss_step=0.00104, global_step=1184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  26%|██▋       | 21/80 [02:29<06:41,  6.81s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.34e-5, train/loss_step=0.00112, global_step=1185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  28%|██▊       | 22/80 [02:30<06:18,  6.53s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=7.34e-5, train/loss_step=0.00112, global_step=1185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  28%|██▊       | 22/80 [02:30<06:18,  6.53s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=9.18e-5, train/loss_step=0.00109, global_step=1185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  29%|██▉       | 23/80 [02:30<05:57,  6.28s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=9.18e-5, train/loss_step=0.00109, global_step=1185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  29%|██▉       | 23/80 [02:30<05:57,  6.28s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=9.54e-6, train/loss_step=0.00267, global_step=1185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  30%|███       | 24/80 [03:11<07:09,  7.67s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=9.54e-6, train/loss_step=0.00267, global_step=1185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  30%|███       | 24/80 [03:11<07:09,  7.67s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=2.82e-5, train/loss_step=0.00657, global_step=1185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  31%|███▏      | 25/80 [03:12<06:47,  7.41s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=2.82e-5, train/loss_step=0.00657, global_step=1185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  31%|███▏      | 25/80 [03:12<06:47,  7.41s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000638, train/loss_vlb_step=3.15e-5, train/loss_step=0.000638, global_step=1186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  32%|███▎      | 26/80 [03:13<06:26,  7.15s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000638, train/loss_vlb_step=3.15e-5, train/loss_step=0.000638, global_step=1186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  32%|███▎      | 26/80 [03:13<06:26,  7.15s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.48e-6, train/loss_step=0.000348, global_step=1186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  34%|███▍      | 27/80 [03:13<06:06,  6.92s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.48e-6, train/loss_step=0.000348, global_step=1186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  34%|███▍      | 27/80 [03:13<06:06,  6.92s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=8.4e-7, train/loss_step=0.000221, global_step=1186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  35%|███▌      | 28/80 [03:14<05:48,  6.70s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=8.4e-7, train/loss_step=0.000221, global_step=1186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  35%|███▌      | 28/80 [03:14<05:48,  6.70s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=1.06e-5, train/loss_step=0.00169, global_step=1186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  36%|███▋      | 29/80 [03:14<05:30,  6.49s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=1.06e-5, train/loss_step=0.00169, global_step=1186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  36%|███▋      | 29/80 [03:14<05:30,  6.49s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=3.48e-5, train/loss_step=0.00901, global_step=1187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  38%|███▊      | 30/80 [03:15<05:14,  6.30s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=3.48e-5, train/loss_step=0.00901, global_step=1187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  38%|███▊      | 30/80 [03:15<05:14,  6.30s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=9.78e-7, train/loss_step=0.000268, global_step=1187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  39%|███▉      | 31/80 [03:15<04:59,  6.11s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=9.78e-7, train/loss_step=0.000268, global_step=1187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  39%|███▉      | 31/80 [03:15<04:59,  6.11s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=2.78e-5, train/loss_step=0.00727, global_step=1187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 59:  40%|████      | 32/80 [03:58<05:46,  7.22s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=2.78e-5, train/loss_step=0.00727, global_step=1187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  40%|████      | 32/80 [03:58<05:46,  7.22s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.24e-6, train/loss_step=0.00256, global_step=1187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  41%|████▏     | 33/80 [03:58<05:30,  7.03s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.24e-6, train/loss_step=0.00256, global_step=1187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  41%|████▏     | 33/80 [03:58<05:30,  7.03s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=0.000102, train/loss_step=0.0148, global_step=1188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  42%|████▎     | 34/80 [03:59<05:14,  6.84s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=0.000102, train/loss_step=0.0148, global_step=1188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  42%|████▎     | 34/80 [03:59<05:14,  6.84s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=3.92e-6, train/loss_step=0.000378, global_step=1188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  44%|████▍     | 35/80 [03:59<04:59,  6.66s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=3.92e-6, train/loss_step=0.000378, global_step=1188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  44%|████▍     | 35/80 [03:59<04:59,  6.66s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.72e-5, train/loss_step=0.0101, global_step=1188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]    Epoch 59:  45%|████▌     | 36/80 [04:00<04:45,  6.50s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.72e-5, train/loss_step=0.0101, global_step=1188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  45%|████▌     | 36/80 [04:00<04:45,  6.50s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.12e-5, train/loss_step=0.00201, global_step=1188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  46%|████▋     | 37/80 [04:00<04:32,  6.34s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.12e-5, train/loss_step=0.00201, global_step=1188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  46%|████▋     | 37/80 [04:00<04:32,  6.34s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.18e-5, train/loss_step=0.0033, global_step=1189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 59:  48%|████▊     | 38/80 [04:01<04:19,  6.19s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.18e-5, train/loss_step=0.0033, global_step=1189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  48%|████▊     | 38/80 [04:01<04:19,  6.19s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=1.37e-5, train/loss_step=0.00398, global_step=1189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  49%|████▉     | 39/80 [04:01<04:07,  6.05s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=1.37e-5, train/loss_step=0.00398, global_step=1189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  49%|████▉     | 39/80 [04:01<04:07,  6.05s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.23e-5, train/loss_step=0.00343, global_step=1189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  50%|█████     | 40/80 [04:40<04:33,  6.83s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.23e-5, train/loss_step=0.00343, global_step=1189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  50%|█████     | 40/80 [04:40<04:33,  6.84s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=1.04e-6, train/loss_step=0.000245, global_step=1189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  51%|█████▏    | 41/80 [04:40<04:20,  6.68s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=1.04e-6, train/loss_step=0.000245, global_step=1189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  51%|█████▏    | 41/80 [04:40<04:20,  6.68s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000447, train/loss_vlb_step=2.66e-6, train/loss_step=0.000447, global_step=1190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  52%|█████▎    | 42/80 [04:41<04:08,  6.54s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000447, train/loss_vlb_step=2.66e-6, train/loss_step=0.000447, global_step=1190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  52%|█████▎    | 42/80 [04:41<04:08,  6.54s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.23e-5, train/loss_step=0.0099, global_step=1190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]    Epoch 59:  54%|█████▍    | 43/80 [04:41<03:56,  6.40s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=4.23e-5, train/loss_step=0.0099, global_step=1190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  54%|█████▍    | 43/80 [04:41<03:56,  6.40s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=2.17e-5, train/loss_step=0.00641, global_step=1190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  55%|█████▌    | 44/80 [04:42<03:46,  6.28s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=2.17e-5, train/loss_step=0.00641, global_step=1190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  55%|█████▌    | 44/80 [04:42<03:46,  6.28s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=4.06e-6, train/loss_step=0.00035, global_step=1190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  56%|█████▋    | 45/80 [04:43<03:35,  6.16s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=4.06e-6, train/loss_step=0.00035, global_step=1190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  56%|█████▋    | 45/80 [04:43<03:35,  6.16s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000153, train/loss_vlb_step=7.15e-7, train/loss_step=0.000153, global_step=1191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  57%|█████▊    | 46/80 [04:43<03:25,  6.04s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000153, train/loss_vlb_step=7.15e-7, train/loss_step=0.000153, global_step=1191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  57%|█████▊    | 46/80 [04:43<03:25,  6.04s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=1.87e-6, train/loss_step=0.000399, global_step=1191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  59%|█████▉    | 47/80 [04:44<03:15,  5.92s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=1.87e-6, train/loss_step=0.000399, global_step=1191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  59%|█████▉    | 47/80 [04:44<03:15,  5.92s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.17e-6, train/loss_step=0.000312, global_step=1191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  60%|██████    | 48/80 [05:25<03:32,  6.64s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.17e-6, train/loss_step=0.000312, global_step=1191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  60%|██████    | 48/80 [05:25<03:32,  6.64s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=4.15e-6, train/loss_step=0.000582, global_step=1191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  61%|██████▏   | 49/80 [05:26<03:22,  6.52s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=4.15e-6, train/loss_step=0.000582, global_step=1191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  61%|██████▏   | 49/80 [05:26<03:22,  6.52s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=1.95e-6, train/loss_step=0.000446, global_step=1192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  62%|██████▎   | 50/80 [05:26<03:12,  6.40s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=1.95e-6, train/loss_step=0.000446, global_step=1192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  62%|██████▎   | 50/80 [05:26<03:12,  6.40s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=1.63e-5, train/loss_step=0.00147, global_step=1192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 59:  64%|██████▍   | 51/80 [05:27<03:02,  6.29s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=1.63e-5, train/loss_step=0.00147, global_step=1192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  64%|██████▍   | 51/80 [05:27<03:02,  6.29s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000397, train/loss_vlb_step=1.94e-6, train/loss_step=0.000397, global_step=1192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  65%|██████▌   | 52/80 [05:27<02:53,  6.18s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000397, train/loss_vlb_step=1.94e-6, train/loss_step=0.000397, global_step=1192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  65%|██████▌   | 52/80 [05:27<02:53,  6.18s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.75e-5, train/loss_step=0.0114, global_step=1192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]    Epoch 59:  66%|██████▋   | 53/80 [05:28<02:44,  6.08s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=4.75e-5, train/loss_step=0.0114, global_step=1192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  66%|██████▋   | 53/80 [05:28<02:44,  6.08s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=2.54e-5, train/loss_step=0.0032, global_step=1193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  68%|██████▊   | 54/80 [05:28<02:35,  5.97s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=2.54e-5, train/loss_step=0.0032, global_step=1193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  68%|██████▊   | 54/80 [05:28<02:35,  5.97s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000346, train/loss_vlb_step=1.9e-6, train/loss_step=0.000346, global_step=1193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  69%|██████▉   | 55/80 [05:29<02:26,  5.88s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000346, train/loss_vlb_step=1.9e-6, train/loss_step=0.000346, global_step=1193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  69%|██████▉   | 55/80 [05:29<02:26,  5.88s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=7.58e-6, train/loss_step=0.00197, global_step=1193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  70%|███████   | 56/80 [05:56<02:30,  6.26s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=7.58e-6, train/loss_step=0.00197, global_step=1193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  70%|███████   | 56/80 [05:56<02:30,  6.26s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=1.09e-6, train/loss_step=0.00024, global_step=1193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  71%|███████▏  | 57/80 [05:57<02:21,  6.17s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=1.09e-6, train/loss_step=0.00024, global_step=1193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  71%|███████▏  | 57/80 [05:57<02:21,  6.17s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000262, train/loss_vlb_step=2.28e-6, train/loss_step=0.000262, global_step=1194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  72%|███████▎  | 58/80 [05:58<02:13,  6.07s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000262, train/loss_vlb_step=2.28e-6, train/loss_step=0.000262, global_step=1194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  72%|███████▎  | 58/80 [05:58<02:13,  6.07s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=3.72e-5, train/loss_step=0.00936, global_step=1194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  74%|███████▍  | 59/80 [05:58<02:05,  5.98s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=3.72e-5, train/loss_step=0.00936, global_step=1194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  74%|███████▍  | 59/80 [05:58<02:05,  5.98s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=2.42e-5, train/loss_step=0.00692, global_step=1194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=2.42e-5, train/loss_step=0.00692, global_step=1194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=7.38e-6, train/loss_step=0.00162, global_step=1194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  76%|███████▋  | 61/80 [05:59<01:50,  5.80s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=7.38e-6, train/loss_step=0.00162, global_step=1194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  76%|███████▋  | 61/80 [05:59<01:50,  5.80s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=9.13e-6, train/loss_step=0.00141, global_step=1195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  78%|███████▊  | 62/80 [06:00<01:42,  5.72s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=9.13e-6, train/loss_step=0.00141, global_step=1195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  78%|███████▊  | 62/80 [06:00<01:42,  5.72s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=8.7e-7, train/loss_step=0.000209, global_step=1195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  79%|███████▉  | 63/80 [06:00<01:35,  5.64s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=8.7e-7, train/loss_step=0.000209, global_step=1195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  79%|███████▉  | 63/80 [06:00<01:35,  5.64s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.54e-5, train/loss_step=0.00402, global_step=1195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  80%|████████  | 64/80 [06:30<01:36,  6.01s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.54e-5, train/loss_step=0.00402, global_step=1195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  80%|████████  | 64/80 [06:30<01:36,  6.01s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=7.74e-5, train/loss_step=0.0105, global_step=1195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 59:  81%|████████▏ | 65/80 [06:31<01:28,  5.92s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=7.74e-5, train/loss_step=0.0105, global_step=1195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  81%|████████▏ | 65/80 [06:31<01:28,  5.92s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000479, train/loss_vlb_step=7.19e-6, train/loss_step=0.000479, global_step=1196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  82%|████████▎ | 66/80 [06:31<01:21,  5.84s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000479, train/loss_vlb_step=7.19e-6, train/loss_step=0.000479, global_step=1196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  82%|████████▎ | 66/80 [06:31<01:21,  5.84s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.03e-5, train/loss_step=0.00249, global_step=1196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 59:  84%|████████▍ | 67/80 [06:32<01:14,  5.76s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=1.03e-5, train/loss_step=0.00249, global_step=1196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  84%|████████▍ | 67/80 [06:32<01:14,  5.77s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=5.04e-6, train/loss_step=0.00103, global_step=1196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  85%|████████▌ | 68/80 [06:33<01:08,  5.70s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=5.04e-6, train/loss_step=0.00103, global_step=1196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  85%|████████▌ | 68/80 [06:33<01:08,  5.70s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.00125, train/loss_step=0.0288, global_step=1196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 59:  86%|████████▋ | 69/80 [06:33<01:01,  5.62s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0288, train/loss_vlb_step=0.00125, train/loss_step=0.0288, global_step=1196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  86%|████████▋ | 69/80 [06:33<01:01,  5.62s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000923, train/loss_vlb_step=3.34e-6, train/loss_step=0.000923, global_step=1197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000923, train/loss_vlb_step=3.34e-6, train/loss_step=0.000923, global_step=1197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000484, train/loss_vlb_step=2.14e-6, train/loss_step=0.000484, global_step=1197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000484, train/loss_vlb_step=2.14e-6, train/loss_step=0.000484, global_step=1197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=1.6e-6, train/loss_step=0.000331, global_step=1197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363] Epoch 59:  90%|█████████ | 72/80 [07:11<00:47,  5.91s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=1.6e-6, train/loss_step=0.000331, global_step=1197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  90%|█████████ | 72/80 [07:11<00:47,  5.91s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=1.59e-5, train/loss_step=0.00412, global_step=1197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  91%|█████████▏| 73/80 [07:12<00:40,  5.84s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=1.59e-5, train/loss_step=0.00412, global_step=1197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  91%|█████████▏| 73/80 [07:12<00:40,  5.84s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=3.92e-5, train/loss_step=0.0107, global_step=1198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 59:  92%|█████████▎| 74/80 [07:12<00:34,  5.77s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=3.92e-5, train/loss_step=0.0107, global_step=1198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  92%|█████████▎| 74/80 [07:12<00:34,  5.77s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.29e-5, train/loss_step=0.00193, global_step=1198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  94%|█████████▍| 75/80 [07:13<00:28,  5.70s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.29e-5, train/loss_step=0.00193, global_step=1198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  94%|█████████▍| 75/80 [07:13<00:28,  5.70s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=3.64e-6, train/loss_step=0.000842, global_step=1198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  95%|█████████▌| 76/80 [07:13<00:22,  5.63s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=3.64e-6, train/loss_step=0.000842, global_step=1198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  95%|█████████▌| 76/80 [07:13<00:22,  5.63s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=1.59e-5, train/loss_step=0.00442, global_step=1198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 59:  96%|█████████▋| 77/80 [07:14<00:16,  5.57s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=1.59e-5, train/loss_step=0.00442, global_step=1198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  96%|█████████▋| 77/80 [07:14<00:16,  5.57s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=0.00084, train/loss_step=0.002, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]    Epoch 59:  98%|█████████▊| 78/80 [07:14<00:11,  5.50s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=0.00084, train/loss_step=0.002, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  98%|█████████▊| 78/80 [07:14<00:11,  5.50s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.15e-5, train/loss_step=0.00338, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  99%|█████████▉| 79/80 [07:15<00:05,  5.44s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.15e-5, train/loss_step=0.00338, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59:  99%|█████████▉| 79/80 [07:15<00:05,  5.44s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.88e-6, train/loss_step=0.00101, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59: 100%|██████████| 80/80 [07:15<00:00,  5.38s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.88e-6, train/loss_step=0.00101, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 59: 100%|██████████| 80/80 [07:15<00:00,  5.38s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=2.21e-6, train/loss_step=0.000431, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Average Epoch time: 435.68 seconds
+Average Peak memory 29566.86MiB
+Epoch 59:   0%|          | 0/80 [00:00<00:00, 5461.33it/s, loss=0.00398, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=2.21e-6, train/loss_step=0.000431, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 60:   0%|          | 0/80 [00:00<00:00, 2164.24it/s, loss=0.00398, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=2.21e-6, train/loss_step=0.000431, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]Epoch 60:   1%|▏         | 1/80 [00:51<33:35, 25.51s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=2.21e-6, train/loss_step=0.000431, global_step=1199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00363, train/loss_vlb_epoch=6.82e-5, train/loss_epoch=0.00363]  Epoch 60:   1%|▏         | 1/80 [00:51<33:35, 25.51s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.17e-5, train/loss_step=0.00613, global_step=1200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396] Epoch 60:   2%|▎         | 2/80 [00:51<22:19, 17.17s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.17e-5, train/loss_step=0.00613, global_step=1200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:   2%|▎         | 2/80 [00:51<22:19, 17.17s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=1.02e-6, train/loss_step=0.000247, global_step=1200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:   4%|▍         | 3/80 [00:52<16:41, 13.00s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=1.02e-6, train/loss_step=0.000247, global_step=1200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:   4%|▍         | 3/80 [00:52<16:41, 13.00s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1e-5, train/loss_step=0.00286, global_step=1200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]     Epoch 60:   5%|▌         | 4/80 [00:52<13:18, 10.51s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1e-5, train/loss_step=0.00286, global_step=1200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:   5%|▌         | 4/80 [00:52<13:18, 10.51s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.85e-5, train/loss_step=0.0119, global_step=1200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:   6%|▋         | 5/80 [00:53<11:02,  8.84s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=5.85e-5, train/loss_step=0.0119, global_step=1200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:   6%|▋         | 5/80 [00:53<11:02,  8.84s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=1.88e-5, train/loss_step=0.00542, global_step=1201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:   8%|▊         | 6/80 [00:53<09:25,  7.65s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=1.88e-5, train/loss_step=0.00542, global_step=1201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:   8%|▊         | 6/80 [00:53<09:25,  7.65s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=3.99e-5, train/loss_step=0.0088, global_step=1201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:   9%|▉         | 7/80 [00:54<08:12,  6.75s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0088, train/loss_vlb_step=3.99e-5, train/loss_step=0.0088, global_step=1201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:   9%|▉         | 7/80 [00:54<08:12,  6.75s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=2.41e-6, train/loss_step=0.00061, global_step=1201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  10%|█         | 8/80 [01:17<10:20,  8.62s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=2.41e-6, train/loss_step=0.00061, global_step=1201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  10%|█         | 8/80 [01:17<10:20,  8.62s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=7.41e-5, train/loss_step=0.0128, global_step=1201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  11%|█▏        | 9/80 [01:26<10:11,  8.61s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=7.41e-5, train/loss_step=0.0128, global_step=1201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  11%|█▏        | 9/80 [01:26<10:11,  8.61s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=2.62e-5, train/loss_step=0.00673, global_step=1202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  12%|█▎        | 10/80 [01:26<09:11,  7.88s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00673, train/loss_vlb_step=2.62e-5, train/loss_step=0.00673, global_step=1202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  12%|█▎        | 10/80 [01:26<09:11,  7.88s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=2.27e-6, train/loss_step=0.000399, global_step=1202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  14%|█▍        | 11/80 [01:27<08:25,  7.32s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=2.27e-6, train/loss_step=0.000399, global_step=1202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  14%|█▍        | 11/80 [01:27<08:25,  7.32s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=2.95e-5, train/loss_step=0.00102, global_step=1202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  15%|█▌        | 12/80 [01:28<07:42,  6.80s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=2.95e-5, train/loss_step=0.00102, global_step=1202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  15%|█▌        | 12/80 [01:28<07:42,  6.80s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=3.35e-5, train/loss_step=0.00936, global_step=1202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  16%|█▋        | 13/80 [01:28<07:05,  6.35s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=3.35e-5, train/loss_step=0.00936, global_step=1202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  16%|█▋        | 13/80 [01:28<07:05,  6.35s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=7.07e-6, train/loss_step=0.00158, global_step=1203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  18%|█▊        | 14/80 [01:29<06:33,  5.96s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=7.07e-6, train/loss_step=0.00158, global_step=1203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  18%|█▊        | 14/80 [01:29<06:33,  5.96s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=3.16e-6, train/loss_step=0.000601, global_step=1203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  19%|█▉        | 15/80 [01:29<06:05,  5.62s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=3.16e-6, train/loss_step=0.000601, global_step=1203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  19%|█▉        | 15/80 [01:29<06:05,  5.62s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=1.48e-5, train/loss_step=0.00437, global_step=1203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]   Epoch 60:  20%|██        | 16/80 [02:05<07:51,  7.36s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=1.48e-5, train/loss_step=0.00437, global_step=1203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  20%|██        | 16/80 [02:05<07:51,  7.36s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=2.15e-5, train/loss_step=0.00589, global_step=1203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  21%|██▏       | 17/80 [02:18<08:03,  7.68s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=2.15e-5, train/loss_step=0.00589, global_step=1203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  21%|██▏       | 17/80 [02:18<08:03,  7.68s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=3.58e-5, train/loss_step=0.000847, global_step=1204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  22%|██▎       | 18/80 [02:18<07:32,  7.30s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=3.58e-5, train/loss_step=0.000847, global_step=1204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  22%|██▎       | 18/80 [02:18<07:32,  7.30s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=2.06e-6, train/loss_step=0.000536, global_step=1204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  24%|██▍       | 19/80 [02:19<07:04,  6.96s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=2.06e-6, train/loss_step=0.000536, global_step=1204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  24%|██▍       | 19/80 [02:19<07:04,  6.96s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.63e-6, train/loss_step=0.00114, global_step=1204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  25%|██▌       | 20/80 [02:19<06:39,  6.66s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=5.63e-6, train/loss_step=0.00114, global_step=1204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  25%|██▌       | 20/80 [02:19<06:39,  6.66s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.71e-5, train/loss_step=0.00561, global_step=1204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  26%|██▋       | 21/80 [02:20<06:16,  6.38s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.71e-5, train/loss_step=0.00561, global_step=1204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  26%|██▋       | 21/80 [02:20<06:16,  6.38s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=7.7e-5, train/loss_step=0.0137, global_step=1205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]   Epoch 60:  28%|██▊       | 22/80 [02:20<05:55,  6.12s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=7.7e-5, train/loss_step=0.0137, global_step=1205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  28%|██▊       | 22/80 [02:20<05:55,  6.12s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000916, train/loss_vlb_step=4.33e-6, train/loss_step=0.000916, global_step=1205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  29%|██▉       | 23/80 [02:21<05:35,  5.89s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000916, train/loss_vlb_step=4.33e-6, train/loss_step=0.000916, global_step=1205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  29%|██▉       | 23/80 [02:21<05:35,  5.89s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=0.00107, train/loss_step=0.00405, global_step=1205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  30%|███       | 24/80 [02:38<05:55,  6.35s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=0.00107, train/loss_step=0.00405, global_step=1205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  30%|███       | 24/80 [02:38<05:55,  6.35s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=2.07e-5, train/loss_step=0.00549, global_step=1205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  31%|███▏      | 25/80 [02:54<06:09,  6.73s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00549, train/loss_vlb_step=2.07e-5, train/loss_step=0.00549, global_step=1205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  31%|███▏      | 25/80 [02:54<06:09,  6.73s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00047, train/loss_vlb_step=1.85e-6, train/loss_step=0.00047, global_step=1206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  32%|███▎      | 26/80 [02:55<05:50,  6.49s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00047, train/loss_vlb_step=1.85e-6, train/loss_step=0.00047, global_step=1206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  32%|███▎      | 26/80 [02:55<05:50,  6.49s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=2.99e-5, train/loss_step=0.0085, global_step=1206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  34%|███▍      | 27/80 [02:55<05:32,  6.28s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0085, train/loss_vlb_step=2.99e-5, train/loss_step=0.0085, global_step=1206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  34%|███▍      | 27/80 [02:55<05:32,  6.28s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.49e-6, train/loss_step=0.000641, global_step=1206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  35%|███▌      | 28/80 [02:56<05:16,  6.08s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.49e-6, train/loss_step=0.000641, global_step=1206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  35%|███▌      | 28/80 [02:56<05:16,  6.08s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=1.72e-5, train/loss_step=0.00507, global_step=1206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  36%|███▋      | 29/80 [02:56<05:00,  5.90s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=1.72e-5, train/loss_step=0.00507, global_step=1206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  36%|███▋      | 29/80 [02:56<05:00,  5.90s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=2.49e-6, train/loss_step=0.000482, global_step=1207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  38%|███▊      | 30/80 [02:57<04:46,  5.72s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=2.49e-6, train/loss_step=0.000482, global_step=1207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  38%|███▊      | 30/80 [02:57<04:46,  5.72s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=2.4e-5, train/loss_step=0.000861, global_step=1207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396] Epoch 60:  39%|███▉      | 31/80 [02:57<04:32,  5.56s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=2.4e-5, train/loss_step=0.000861, global_step=1207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  39%|███▉      | 31/80 [02:57<04:32,  5.56s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.74e-5, train/loss_step=0.00409, global_step=1207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396] Epoch 60:  40%|████      | 32/80 [03:23<04:56,  6.17s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.74e-5, train/loss_step=0.00409, global_step=1207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  40%|████      | 32/80 [03:23<04:56,  6.17s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.71e-6, train/loss_step=0.0012, global_step=1207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]   Epoch 60:  41%|████▏     | 33/80 [03:37<05:00,  6.39s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.71e-6, train/loss_step=0.0012, global_step=1207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  41%|████▏     | 33/80 [03:37<05:00,  6.39s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.5e-5, train/loss_step=0.00341, global_step=1208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  42%|████▎     | 34/80 [03:37<04:46,  6.22s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.5e-5, train/loss_step=0.00341, global_step=1208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  42%|████▎     | 34/80 [03:37<04:46,  6.22s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=4.82e-6, train/loss_step=0.00118, global_step=1208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  44%|████▍     | 35/80 [03:38<04:32,  6.06s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=4.82e-6, train/loss_step=0.00118, global_step=1208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  44%|████▍     | 35/80 [03:38<04:32,  6.06s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=0.00129, train/loss_step=0.0207, global_step=1208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  45%|████▌     | 36/80 [03:39<04:20,  5.92s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=0.00129, train/loss_step=0.0207, global_step=1208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  45%|████▌     | 36/80 [03:39<04:20,  5.92s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000129, train/loss_vlb_step=5.12e-7, train/loss_step=0.000129, global_step=1208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  46%|████▋     | 37/80 [03:39<04:08,  5.78s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000129, train/loss_vlb_step=5.12e-7, train/loss_step=0.000129, global_step=1208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  46%|████▋     | 37/80 [03:39<04:08,  5.78s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000331, train/loss_step=0.0149, global_step=1209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]   Epoch 60:  48%|████▊     | 38/80 [03:40<03:56,  5.64s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000331, train/loss_step=0.0149, global_step=1209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  48%|████▊     | 38/80 [03:40<03:56,  5.64s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000167, train/loss_step=0.0154, global_step=1209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  49%|████▉     | 39/80 [03:40<03:46,  5.51s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000167, train/loss_step=0.0154, global_step=1209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  49%|████▉     | 39/80 [03:40<03:46,  5.51s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.2e-5, train/loss_step=0.00273, global_step=1209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  50%|█████     | 40/80 [04:06<04:00,  6.00s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.2e-5, train/loss_step=0.00273, global_step=1209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  50%|█████     | 40/80 [04:06<04:00,  6.00s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=6.11e-6, train/loss_step=0.00158, global_step=1209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  51%|█████▏    | 41/80 [04:23<04:04,  6.28s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=6.11e-6, train/loss_step=0.00158, global_step=1209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  51%|█████▏    | 41/80 [04:23<04:04,  6.28s/it, loss=0.00663, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.014, train/loss_step=0.041, global_step=1210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]      Epoch 60:  52%|█████▎    | 42/80 [04:24<03:53,  6.15s/it, loss=0.00663, v_num=0, train/loss_simple_step=0.041, train/loss_vlb_step=0.014, train/loss_step=0.041, global_step=1210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  52%|█████▎    | 42/80 [04:24<03:53,  6.15s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.000346, train/loss_vlb_step=2.18e-6, train/loss_step=0.000346, global_step=1210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  54%|█████▍    | 43/80 [04:31<03:48,  6.17s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.000346, train/loss_vlb_step=2.18e-6, train/loss_step=0.000346, global_step=1210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  54%|█████▍    | 43/80 [04:31<03:48,  6.17s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=1.71e-6, train/loss_step=0.000332, global_step=1210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  55%|█████▌    | 44/80 [04:31<03:37,  6.04s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=1.71e-6, train/loss_step=0.000332, global_step=1210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  55%|█████▌    | 44/80 [04:31<03:37,  6.04s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=0.000229, train/loss_step=0.0231, global_step=1210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]    Epoch 60:  56%|█████▋    | 45/80 [04:32<03:27,  5.92s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.0231, train/loss_vlb_step=0.000229, train/loss_step=0.0231, global_step=1210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  56%|█████▋    | 45/80 [04:32<03:27,  5.92s/it, loss=0.00731, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=4.28e-6, train/loss_step=0.000684, global_step=1211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  57%|█████▊    | 46/80 [04:32<03:17,  5.81s/it, loss=0.00731, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=4.28e-6, train/loss_step=0.000684, global_step=1211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  57%|█████▊    | 46/80 [04:32<03:17,  5.81s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=5.19e-6, train/loss_step=0.00145, global_step=1211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  59%|█████▉    | 47/80 [04:33<03:07,  5.70s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=5.19e-6, train/loss_step=0.00145, global_step=1211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  59%|█████▉    | 47/80 [04:33<03:07,  5.70s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.46e-5, train/loss_step=0.00624, global_step=1211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  60%|██████    | 48/80 [04:46<03:07,  5.85s/it, loss=0.00724, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.46e-5, train/loss_step=0.00624, global_step=1211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  60%|██████    | 48/80 [04:46<03:07,  5.85s/it, loss=0.007, v_num=0, train/loss_simple_step=0.000346, train/loss_vlb_step=2.17e-6, train/loss_step=0.000346, global_step=1211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  61%|██████▏   | 49/80 [05:12<03:13,  6.24s/it, loss=0.007, v_num=0, train/loss_simple_step=0.000346, train/loss_vlb_step=2.17e-6, train/loss_step=0.000346, global_step=1211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  61%|██████▏   | 49/80 [05:12<03:13,  6.24s/it, loss=0.00702, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=8.85e-6, train/loss_step=0.000847, global_step=1212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  62%|██████▎   | 50/80 [05:12<03:03,  6.13s/it, loss=0.00702, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=8.85e-6, train/loss_step=0.000847, global_step=1212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  62%|██████▎   | 50/80 [05:12<03:03,  6.13s/it, loss=0.00736, v_num=0, train/loss_simple_step=0.00776, train/loss_vlb_step=4.06e-5, train/loss_step=0.00776, global_step=1212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  64%|██████▍   | 51/80 [05:22<02:59,  6.20s/it, loss=0.00736, v_num=0, train/loss_simple_step=0.00776, train/loss_vlb_step=4.06e-5, train/loss_step=0.00776, global_step=1212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  64%|██████▍   | 51/80 [05:22<02:59,  6.20s/it, loss=0.00734, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=0.00175, train/loss_step=0.00365, global_step=1212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  65%|██████▌   | 52/80 [05:23<02:50,  6.10s/it, loss=0.00734, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=0.00175, train/loss_step=0.00365, global_step=1212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  65%|██████▌   | 52/80 [05:23<02:50,  6.10s/it, loss=0.00887, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.0158, train/loss_step=0.0317, global_step=1212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]   Epoch 60:  66%|██████▋   | 53/80 [05:23<02:41,  5.99s/it, loss=0.00887, v_num=0, train/loss_simple_step=0.0317, train/loss_vlb_step=0.0158, train/loss_step=0.0317, global_step=1212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  66%|██████▋   | 53/80 [05:23<02:41,  5.99s/it, loss=0.00899, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=1.95e-5, train/loss_step=0.0058, global_step=1213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  68%|██████▊   | 54/80 [05:24<02:33,  5.89s/it, loss=0.00899, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=1.95e-5, train/loss_step=0.0058, global_step=1213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  68%|██████▊   | 54/80 [05:24<02:33,  5.89s/it, loss=0.00901, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=8.01e-6, train/loss_step=0.00168, global_step=1213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  69%|██████▉   | 55/80 [05:24<02:24,  5.80s/it, loss=0.00901, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=8.01e-6, train/loss_step=0.00168, global_step=1213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  69%|██████▉   | 55/80 [05:24<02:24,  5.80s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=9.18e-5, train/loss_step=0.0144, global_step=1213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]   Epoch 60:  70%|███████   | 56/80 [05:27<02:17,  5.74s/it, loss=0.0087, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=9.18e-5, train/loss_step=0.0144, global_step=1213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  70%|███████   | 56/80 [05:27<02:17,  5.74s/it, loss=0.00878, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.17e-6, train/loss_step=0.00168, global_step=1213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  71%|███████▏  | 57/80 [05:50<02:18,  6.04s/it, loss=0.00878, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.17e-6, train/loss_step=0.00168, global_step=1213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  71%|███████▏  | 57/80 [05:50<02:18,  6.04s/it, loss=0.00899, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=0.000418, train/loss_step=0.019, global_step=1214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]   Epoch 60:  72%|███████▎  | 58/80 [05:50<02:10,  5.94s/it, loss=0.00899, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=0.000418, train/loss_step=0.019, global_step=1214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  72%|███████▎  | 58/80 [05:50<02:10,  5.94s/it, loss=0.00897, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.00151, train/loss_step=0.0151, global_step=1214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  74%|███████▍  | 59/80 [05:53<02:03,  5.89s/it, loss=0.00897, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.00151, train/loss_step=0.0151, global_step=1214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  74%|███████▍  | 59/80 [05:53<02:03,  5.89s/it, loss=0.00949, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000168, train/loss_step=0.0131, global_step=1214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  75%|███████▌  | 60/80 [05:53<01:56,  5.80s/it, loss=0.00949, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000168, train/loss_step=0.0131, global_step=1214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  75%|███████▌  | 60/80 [05:53<01:56,  5.80s/it, loss=0.00949, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=7.27e-6, train/loss_step=0.00159, global_step=1214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  76%|███████▋  | 61/80 [05:54<01:48,  5.72s/it, loss=0.00949, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=7.27e-6, train/loss_step=0.00159, global_step=1214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  76%|███████▋  | 61/80 [05:54<01:48,  5.72s/it, loss=0.00747, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.41e-6, train/loss_step=0.000551, global_step=1215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  78%|███████▊  | 62/80 [05:54<01:41,  5.63s/it, loss=0.00747, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.41e-6, train/loss_step=0.000551, global_step=1215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  78%|███████▊  | 62/80 [05:54<01:41,  5.63s/it, loss=0.00821, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=8.47e-5, train/loss_step=0.0152, global_step=1215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]    Epoch 60:  79%|███████▉  | 63/80 [05:55<01:34,  5.55s/it, loss=0.00821, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=8.47e-5, train/loss_step=0.0152, global_step=1215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  79%|███████▉  | 63/80 [05:55<01:34,  5.55s/it, loss=0.00912, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000245, train/loss_step=0.0185, global_step=1215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  80%|████████  | 64/80 [06:13<01:31,  5.74s/it, loss=0.00912, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000245, train/loss_step=0.0185, global_step=1215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  80%|████████  | 64/80 [06:13<01:31,  5.74s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=3e-6, train/loss_step=0.000411, global_step=1215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=3e-6, train/loss_step=0.000411, global_step=1215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.0082, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=1.71e-5, train/loss_step=0.00497, global_step=1216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.0082, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=1.71e-5, train/loss_step=0.00497, global_step=1216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.00814, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=3.21e-6, train/loss_step=0.000398, global_step=1216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00814, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=3.21e-6, train/loss_step=0.000398, global_step=1216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00822, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.21e-5, train/loss_step=0.00783, global_step=1216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  85%|████████▌ | 68/80 [06:30<01:07,  5.66s/it, loss=0.00822, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.21e-5, train/loss_step=0.00783, global_step=1216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  85%|████████▌ | 68/80 [06:30<01:07,  5.66s/it, loss=0.00822, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.21e-6, train/loss_step=0.000275, global_step=1216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  86%|████████▋ | 69/80 [06:31<01:01,  5.59s/it, loss=0.00822, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.21e-6, train/loss_step=0.000275, global_step=1216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  86%|████████▋ | 69/80 [06:31<01:01,  5.59s/it, loss=0.00835, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.25e-5, train/loss_step=0.00339, global_step=1217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  88%|████████▊ | 70/80 [06:31<00:55,  5.52s/it, loss=0.00835, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=1.25e-5, train/loss_step=0.00339, global_step=1217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  88%|████████▊ | 70/80 [06:31<00:55,  5.52s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.24e-6, train/loss_step=0.000321, global_step=1217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  89%|████████▉ | 71/80 [06:32<00:49,  5.45s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.24e-6, train/loss_step=0.000321, global_step=1217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  89%|████████▉ | 71/80 [06:32<00:49,  5.45s/it, loss=0.00782, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=2.75e-6, train/loss_step=0.000604, global_step=1217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  90%|█████████ | 72/80 [06:44<00:44,  5.55s/it, loss=0.00782, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=2.75e-6, train/loss_step=0.000604, global_step=1217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  90%|█████████ | 72/80 [06:44<00:44,  5.55s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.000276, train/loss_vlb_step=1.12e-6, train/loss_step=0.000276, global_step=1217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  91%|█████████▏| 73/80 [07:04<00:40,  5.74s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.000276, train/loss_vlb_step=1.12e-6, train/loss_step=0.000276, global_step=1217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  91%|█████████▏| 73/80 [07:04<00:40,  5.74s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=8.14e-6, train/loss_step=0.00212, global_step=1218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  92%|█████████▎| 74/80 [07:04<00:33,  5.67s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=8.14e-6, train/loss_step=0.00212, global_step=1218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  92%|█████████▎| 74/80 [07:04<00:33,  5.67s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.000764, train/loss_vlb_step=5.3e-6, train/loss_step=0.000764, global_step=1218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  94%|█████████▍| 75/80 [07:05<00:27,  5.60s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.000764, train/loss_vlb_step=5.3e-6, train/loss_step=0.000764, global_step=1218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  94%|█████████▍| 75/80 [07:05<00:27,  5.60s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=4.18e-6, train/loss_step=0.00062, global_step=1218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396] Epoch 60:  95%|█████████▌| 76/80 [07:05<00:22,  5.53s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=4.18e-6, train/loss_step=0.00062, global_step=1218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  95%|█████████▌| 76/80 [07:05<00:22,  5.53s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.000665, train/loss_vlb_step=6.78e-6, train/loss_step=0.000665, global_step=1218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  96%|█████████▋| 77/80 [07:06<00:16,  5.47s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.000665, train/loss_vlb_step=6.78e-6, train/loss_step=0.000665, global_step=1218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  96%|█████████▋| 77/80 [07:06<00:16,  5.47s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=1.76e-5, train/loss_step=0.00517, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=1.76e-5, train/loss_step=0.00517, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=6.84e-5, train/loss_step=0.0021, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 60:  99%|█████████▉| 79/80 [07:07<00:05,  5.34s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=6.84e-5, train/loss_step=0.0021, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60:  99%|█████████▉| 79/80 [07:07<00:05,  5.34s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000978, train/loss_vlb_step=6.43e-6, train/loss_step=0.000978, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000978, train/loss_vlb_step=6.43e-6, train/loss_step=0.000978, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 60: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000142, train/loss_vlb_step=4.81e-7, train/loss_step=0.000142, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Average Epoch time: 427.97 seconds
+Average Peak memory 29563.82MiB
+Epoch 60:   0%|          | 0/80 [00:00<00:00, 6307.22it/s, loss=0.00326, v_num=0, train/loss_simple_step=0.000142, train/loss_vlb_step=4.81e-7, train/loss_step=0.000142, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 61:   0%|          | 0/80 [00:00<00:00, 2480.37it/s, loss=0.00326, v_num=0, train/loss_simple_step=0.000142, train/loss_vlb_step=4.81e-7, train/loss_step=0.000142, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]Epoch 61:   1%|▏         | 1/80 [00:39<25:55, 19.69s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000142, train/loss_vlb_step=4.81e-7, train/loss_step=0.000142, global_step=1219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00396, train/loss_vlb_epoch=0.000123, train/loss_epoch=0.00396]  Epoch 61:   1%|▏         | 1/80 [00:39<25:55, 19.69s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.07e-6, train/loss_step=0.000255, global_step=1220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:   2%|▎         | 2/80 [00:39<17:16, 13.29s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.07e-6, train/loss_step=0.000255, global_step=1220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:   2%|▎         | 2/80 [00:39<17:16, 13.29s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=0.000936, train/loss_step=0.00987, global_step=1220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414] Epoch 61:   4%|▍         | 3/80 [00:44<14:07, 11.01s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=0.000936, train/loss_step=0.00987, global_step=1220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:   4%|▍         | 3/80 [00:44<14:07, 11.01s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.00076, train/loss_vlb_step=3.2e-6, train/loss_step=0.00076, global_step=1220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]   Epoch 61:   5%|▌         | 4/80 [00:44<11:17,  8.91s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.00076, train/loss_vlb_step=3.2e-6, train/loss_step=0.00076, global_step=1220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:   5%|▌         | 4/80 [00:44<11:17,  8.91s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000461, train/loss_vlb_step=4.88e-6, train/loss_step=0.000461, global_step=1220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:   6%|▋         | 5/80 [00:45<09:23,  7.51s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000461, train/loss_vlb_step=4.88e-6, train/loss_step=0.000461, global_step=1220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:   6%|▋         | 5/80 [00:45<09:23,  7.51s/it, loss=0.00188, v_num=0, train/loss_simple_step=0.000612, train/loss_vlb_step=2.89e-6, train/loss_step=0.000612, global_step=1221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:   8%|▊         | 6/80 [00:45<08:01,  6.51s/it, loss=0.00188, v_num=0, train/loss_simple_step=0.000612, train/loss_vlb_step=2.89e-6, train/loss_step=0.000612, global_step=1221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:   8%|▊         | 6/80 [00:45<08:01,  6.51s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=1.96e-5, train/loss_step=0.000865, global_step=1221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414] Epoch 61:   9%|▉         | 7/80 [00:46<07:00,  5.76s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=1.96e-5, train/loss_step=0.000865, global_step=1221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:   9%|▉         | 7/80 [00:46<07:00,  5.76s/it, loss=0.00154, v_num=0, train/loss_simple_step=0.000592, train/loss_vlb_step=3.01e-6, train/loss_step=0.000592, global_step=1221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  10%|█         | 8/80 [01:19<10:39,  8.88s/it, loss=0.00154, v_num=0, train/loss_simple_step=0.000592, train/loss_vlb_step=3.01e-6, train/loss_step=0.000592, global_step=1221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  10%|█         | 8/80 [01:19<10:39,  8.88s/it, loss=0.00156, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=1.73e-5, train/loss_step=0.000661, global_step=1221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  11%|█▏        | 9/80 [01:20<09:32,  8.06s/it, loss=0.00156, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=1.73e-5, train/loss_step=0.000661, global_step=1221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  11%|█▏        | 9/80 [01:20<09:32,  8.06s/it, loss=0.00149, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=7.74e-6, train/loss_step=0.00198, global_step=1222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  12%|█▎        | 10/80 [01:21<08:36,  7.38s/it, loss=0.00149, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=7.74e-6, train/loss_step=0.00198, global_step=1222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  12%|█▎        | 10/80 [01:21<08:36,  7.38s/it, loss=0.00151, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=3.25e-6, train/loss_step=0.00068, global_step=1222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  14%|█▍        | 11/80 [01:21<07:49,  6.80s/it, loss=0.00151, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=3.25e-6, train/loss_step=0.00068, global_step=1222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  14%|█▍        | 11/80 [01:21<07:49,  6.80s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.000839, train/loss_vlb_step=4.07e-6, train/loss_step=0.000839, global_step=1222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  15%|█▌        | 12/80 [01:23<07:14,  6.39s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.000839, train/loss_vlb_step=4.07e-6, train/loss_step=0.000839, global_step=1222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  15%|█▌        | 12/80 [01:23<07:14,  6.39s/it, loss=0.00154, v_num=0, train/loss_simple_step=0.000614, train/loss_vlb_step=5.66e-6, train/loss_step=0.000614, global_step=1222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  16%|█▋        | 13/80 [01:23<06:39,  5.97s/it, loss=0.00154, v_num=0, train/loss_simple_step=0.000614, train/loss_vlb_step=5.66e-6, train/loss_step=0.000614, global_step=1222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  16%|█▋        | 13/80 [01:23<06:39,  5.97s/it, loss=0.00149, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.82e-6, train/loss_step=0.00126, global_step=1223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  18%|█▊        | 14/80 [01:24<06:09,  5.60s/it, loss=0.00149, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.82e-6, train/loss_step=0.00126, global_step=1223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  18%|█▊        | 14/80 [01:24<06:09,  5.60s/it, loss=0.00146, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=5.57e-7, train/loss_step=0.000144, global_step=1223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  19%|█▉        | 15/80 [01:26<05:50,  5.39s/it, loss=0.00146, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=5.57e-7, train/loss_step=0.000144, global_step=1223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  19%|█▉        | 15/80 [01:26<05:50,  5.39s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=6.25e-5, train/loss_step=0.00747, global_step=1223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  20%|██        | 16/80 [02:05<07:53,  7.40s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=6.25e-5, train/loss_step=0.00747, global_step=1223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  20%|██        | 16/80 [02:05<07:53,  7.40s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.99e-6, train/loss_step=0.000254, global_step=1223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  21%|██▏       | 17/80 [02:06<07:22,  7.02s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.99e-6, train/loss_step=0.000254, global_step=1223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  21%|██▏       | 17/80 [02:06<07:22,  7.02s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.00921, train/loss_vlb_step=5.26e-5, train/loss_step=0.00921, global_step=1224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  22%|██▎       | 18/80 [02:06<06:53,  6.67s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.00921, train/loss_vlb_step=5.26e-5, train/loss_step=0.00921, global_step=1224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  22%|██▎       | 18/80 [02:06<06:53,  6.67s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=1.54e-6, train/loss_step=0.000231, global_step=1224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  24%|██▍       | 19/80 [02:07<06:28,  6.36s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=1.54e-6, train/loss_step=0.000231, global_step=1224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  24%|██▍       | 19/80 [02:07<06:28,  6.36s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.6e-6, train/loss_step=0.00137, global_step=1224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]   Epoch 61:  25%|██▌       | 20/80 [02:08<06:06,  6.11s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.6e-6, train/loss_step=0.00137, global_step=1224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  25%|██▌       | 20/80 [02:08<06:06,  6.11s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.62e-6, train/loss_step=0.00137, global_step=1224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  26%|██▋       | 21/80 [02:08<05:45,  5.85s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.62e-6, train/loss_step=0.00137, global_step=1224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  26%|██▋       | 21/80 [02:08<05:45,  5.85s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.39e-5, train/loss_step=0.00632, global_step=1225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  28%|██▊       | 22/80 [02:09<05:25,  5.62s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.39e-5, train/loss_step=0.00632, global_step=1225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  28%|██▊       | 22/80 [02:09<05:25,  5.62s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=6.71e-6, train/loss_step=0.000468, global_step=1225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  29%|██▉       | 23/80 [02:09<05:08,  5.40s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=6.71e-6, train/loss_step=0.000468, global_step=1225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  29%|██▉       | 23/80 [02:09<05:08,  5.41s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=1.62e-6, train/loss_step=0.000233, global_step=1225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  30%|███       | 24/80 [02:48<06:17,  6.74s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=1.62e-6, train/loss_step=0.000233, global_step=1225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  30%|███       | 24/80 [02:48<06:17,  6.74s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.94e-6, train/loss_step=0.00174, global_step=1225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  31%|███▏      | 25/80 [02:48<05:57,  6.50s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.94e-6, train/loss_step=0.00174, global_step=1225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  31%|███▏      | 25/80 [02:48<05:57,  6.50s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=6.65e-6, train/loss_step=0.00175, global_step=1226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414] Epoch 61:  32%|███▎      | 26/80 [02:49<05:38,  6.27s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=6.65e-6, train/loss_step=0.00175, global_step=1226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  32%|███▎      | 26/80 [02:49<05:38,  6.27s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=0.000298, train/loss_step=0.00196, global_step=1226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  34%|███▍      | 27/80 [02:49<05:21,  6.07s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=0.000298, train/loss_step=0.00196, global_step=1226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  34%|███▍      | 27/80 [02:49<05:21,  6.07s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=2.25e-5, train/loss_step=0.00645, global_step=1226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414] Epoch 61:  35%|███▌      | 28/80 [02:50<05:05,  5.88s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=2.25e-5, train/loss_step=0.00645, global_step=1226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  35%|███▌      | 28/80 [02:50<05:05,  5.88s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.06e-5, train/loss_step=0.00419, global_step=1226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  36%|███▋      | 29/80 [02:51<04:50,  5.70s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=2.06e-5, train/loss_step=0.00419, global_step=1226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  36%|███▋      | 29/80 [02:51<04:50,  5.70s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.37e-5, train/loss_step=0.0112, global_step=1227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  38%|███▊      | 30/80 [02:51<04:36,  5.53s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.37e-5, train/loss_step=0.0112, global_step=1227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  38%|███▊      | 30/80 [02:51<04:36,  5.53s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.41e-6, train/loss_step=0.000284, global_step=1227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  39%|███▉      | 31/80 [02:52<04:23,  5.38s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.41e-6, train/loss_step=0.000284, global_step=1227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  39%|███▉      | 31/80 [02:52<04:23,  5.38s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=8.86e-5, train/loss_step=0.0159, global_step=1227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]    Epoch 61:  40%|████      | 32/80 [03:41<05:22,  6.71s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=8.86e-5, train/loss_step=0.0159, global_step=1227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  40%|████      | 32/80 [03:41<05:22,  6.71s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.68e-6, train/loss_step=0.00147, global_step=1227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  41%|████▏     | 33/80 [03:41<05:06,  6.53s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=8.68e-6, train/loss_step=0.00147, global_step=1227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  41%|████▏     | 33/80 [03:41<05:06,  6.53s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=2.45e-5, train/loss_step=0.00711, global_step=1228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00711, train/loss_vlb_step=2.45e-5, train/loss_step=0.00711, global_step=1228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=0.00177, train/loss_step=0.00922, global_step=1228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=0.00177, train/loss_step=0.00922, global_step=1228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=4.17e-6, train/loss_step=0.000711, global_step=1228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=4.17e-6, train/loss_step=0.000711, global_step=1228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=2.99e-6, train/loss_step=0.000402, global_step=1228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=2.99e-6, train/loss_step=0.000402, global_step=1228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000134, train/loss_step=0.0155, global_step=1229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]    Epoch 61:  48%|████▊     | 38/80 [03:44<04:01,  5.76s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000134, train/loss_step=0.0155, global_step=1229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  48%|████▊     | 38/80 [03:44<04:01,  5.76s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000806, train/loss_vlb_step=1.25e-5, train/loss_step=0.000806, global_step=1229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000806, train/loss_vlb_step=1.25e-5, train/loss_step=0.000806, global_step=1229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.000212, train/loss_step=0.0211, global_step=1229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]   Epoch 61:  50%|█████     | 40/80 [04:19<04:13,  6.33s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.000212, train/loss_step=0.0211, global_step=1229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  50%|█████     | 40/80 [04:19<04:13,  6.33s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.000382, train/loss_vlb_step=2.21e-6, train/loss_step=0.000382, global_step=1229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  51%|█████▏    | 41/80 [04:20<04:01,  6.20s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.000382, train/loss_vlb_step=2.21e-6, train/loss_step=0.000382, global_step=1229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  51%|█████▏    | 41/80 [04:20<04:01,  6.20s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000144, train/loss_step=0.0141, global_step=1230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]   Epoch 61:  52%|█████▎    | 42/80 [04:20<03:50,  6.07s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000144, train/loss_step=0.0141, global_step=1230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  52%|█████▎    | 42/80 [04:20<03:50,  6.07s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00067, train/loss_vlb_step=4.59e-6, train/loss_step=0.00067, global_step=1230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  54%|█████▍    | 43/80 [04:21<03:39,  5.94s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00067, train/loss_vlb_step=4.59e-6, train/loss_step=0.00067, global_step=1230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  54%|█████▍    | 43/80 [04:21<03:39,  5.94s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=1.86e-5, train/loss_step=0.00555, global_step=1230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00603, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=1.86e-5, train/loss_step=0.00555, global_step=1230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.000177, train/loss_vlb_step=7.37e-7, train/loss_step=0.000177, global_step=1230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  56%|█████▋    | 45/80 [04:23<03:20,  5.73s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.000177, train/loss_vlb_step=7.37e-7, train/loss_step=0.000177, global_step=1230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  56%|█████▋    | 45/80 [04:23<03:20,  5.73s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=3.74e-6, train/loss_step=0.000833, global_step=1231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414] Epoch 61:  57%|█████▊    | 46/80 [04:24<03:11,  5.62s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=3.74e-6, train/loss_step=0.000833, global_step=1231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  57%|█████▊    | 46/80 [04:24<03:11,  5.62s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=7.18e-5, train/loss_step=0.0104, global_step=1231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]   Epoch 61:  59%|█████▉    | 47/80 [04:24<03:01,  5.51s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=7.18e-5, train/loss_step=0.0104, global_step=1231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  59%|█████▉    | 47/80 [04:24<03:01,  5.51s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.04e-5, train/loss_step=0.00267, global_step=1231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  60%|██████    | 48/80 [05:04<03:18,  6.21s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=1.04e-5, train/loss_step=0.00267, global_step=1231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  60%|██████    | 48/80 [05:04<03:18,  6.21s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=1.85e-5, train/loss_step=0.00507, global_step=1231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  61%|██████▏   | 49/80 [05:05<03:09,  6.10s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=1.85e-5, train/loss_step=0.00507, global_step=1231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  61%|██████▏   | 49/80 [05:05<03:09,  6.10s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.04e-5, train/loss_step=0.00566, global_step=1232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414] Epoch 61:  62%|██████▎   | 50/80 [05:05<02:59,  5.99s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.04e-5, train/loss_step=0.00566, global_step=1232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  62%|██████▎   | 50/80 [05:05<02:59,  5.99s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=2.25e-5, train/loss_step=0.00664, global_step=1232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  64%|██████▍   | 51/80 [05:06<02:50,  5.88s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=2.25e-5, train/loss_step=0.00664, global_step=1232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  64%|██████▍   | 51/80 [05:06<02:50,  5.88s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=1.75e-5, train/loss_step=0.00139, global_step=1232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  65%|██████▌   | 52/80 [05:06<02:42,  5.79s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=1.75e-5, train/loss_step=0.00139, global_step=1232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  65%|██████▌   | 52/80 [05:06<02:42,  5.79s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.26e-5, train/loss_step=0.00367, global_step=1232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414] Epoch 61:  66%|██████▋   | 53/80 [05:07<02:33,  5.69s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.26e-5, train/loss_step=0.00367, global_step=1232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  66%|██████▋   | 53/80 [05:07<02:33,  5.69s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.38e-5, train/loss_step=0.00866, global_step=1233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  68%|██████▊   | 54/80 [05:07<02:25,  5.59s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=4.38e-5, train/loss_step=0.00866, global_step=1233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  68%|██████▊   | 54/80 [05:07<02:25,  5.59s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=9.87e-7, train/loss_step=0.00022, global_step=1233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  69%|██████▉   | 55/80 [05:08<02:17,  5.50s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=9.87e-7, train/loss_step=0.00022, global_step=1233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  69%|██████▉   | 55/80 [05:08<02:17,  5.50s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=3.16e-5, train/loss_step=0.00564, global_step=1233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  70%|███████   | 56/80 [05:44<02:24,  6.04s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00564, train/loss_vlb_step=3.16e-5, train/loss_step=0.00564, global_step=1233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  70%|███████   | 56/80 [05:44<02:24,  6.04s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=2.08e-6, train/loss_step=0.000324, global_step=1233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  71%|███████▏  | 57/80 [05:44<02:16,  5.94s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=2.08e-6, train/loss_step=0.000324, global_step=1233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  71%|███████▏  | 57/80 [05:44<02:16,  5.94s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000327, train/loss_vlb_step=1.23e-6, train/loss_step=0.000327, global_step=1234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  72%|███████▎  | 58/80 [05:45<02:08,  5.85s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000327, train/loss_vlb_step=1.23e-6, train/loss_step=0.000327, global_step=1234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  72%|███████▎  | 58/80 [05:45<02:08,  5.85s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=2.77e-5, train/loss_step=0.00816, global_step=1234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  74%|███████▍  | 59/80 [05:45<02:01,  5.76s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00816, train/loss_vlb_step=2.77e-5, train/loss_step=0.00816, global_step=1234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  74%|███████▍  | 59/80 [05:45<02:01,  5.76s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=9.68e-5, train/loss_step=0.0137, global_step=1234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  75%|███████▌  | 60/80 [05:55<01:56,  5.82s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=9.68e-5, train/loss_step=0.0137, global_step=1234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  75%|███████▌  | 60/80 [05:55<01:56,  5.82s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.88e-6, train/loss_step=0.000464, global_step=1234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  76%|███████▋  | 61/80 [05:55<01:49,  5.74s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.88e-6, train/loss_step=0.000464, global_step=1234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  76%|███████▋  | 61/80 [05:55<01:49,  5.74s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=4.3e-5, train/loss_step=0.00144, global_step=1235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]   Epoch 61:  78%|███████▊  | 62/80 [05:56<01:41,  5.66s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=4.3e-5, train/loss_step=0.00144, global_step=1235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  78%|███████▊  | 62/80 [05:56<01:41,  5.66s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.04e-5, train/loss_step=0.00259, global_step=1235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  79%|███████▉  | 63/80 [05:56<01:34,  5.57s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00259, train/loss_vlb_step=1.04e-5, train/loss_step=0.00259, global_step=1235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  79%|███████▉  | 63/80 [05:56<01:34,  5.57s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.00123, train/loss_step=0.0192, global_step=1235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  80%|████████  | 64/80 [06:23<01:34,  5.90s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.00123, train/loss_step=0.0192, global_step=1235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  80%|████████  | 64/80 [06:23<01:34,  5.90s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.48e-5, train/loss_step=0.0115, global_step=1235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  81%|████████▏ | 65/80 [06:23<01:27,  5.82s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.48e-5, train/loss_step=0.0115, global_step=1235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  81%|████████▏ | 65/80 [06:23<01:27,  5.82s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=5.22e-5, train/loss_step=0.00865, global_step=1236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  82%|████████▎ | 66/80 [06:24<01:20,  5.74s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=5.22e-5, train/loss_step=0.00865, global_step=1236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  82%|████████▎ | 66/80 [06:24<01:20,  5.74s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000609, train/loss_vlb_step=4.15e-6, train/loss_step=0.000609, global_step=1236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  84%|████████▍ | 67/80 [06:24<01:13,  5.66s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000609, train/loss_vlb_step=4.15e-6, train/loss_step=0.000609, global_step=1236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  84%|████████▍ | 67/80 [06:24<01:13,  5.66s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=3.05e-6, train/loss_step=0.000399, global_step=1236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  85%|████████▌ | 68/80 [06:41<01:09,  5.83s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=3.05e-6, train/loss_step=0.000399, global_step=1236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  85%|████████▌ | 68/80 [06:41<01:09,  5.83s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=3.88e-6, train/loss_step=0.000763, global_step=1236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=3.88e-6, train/loss_step=0.000763, global_step=1236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.16e-6, train/loss_step=0.000453, global_step=1237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  88%|████████▊ | 70/80 [06:42<00:56,  5.68s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=2.16e-6, train/loss_step=0.000453, global_step=1237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  88%|████████▊ | 70/80 [06:42<00:56,  5.68s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00773, train/loss_vlb_step=3.81e-5, train/loss_step=0.00773, global_step=1237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]   Epoch 61:  89%|████████▉ | 71/80 [06:43<00:50,  5.60s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00773, train/loss_vlb_step=3.81e-5, train/loss_step=0.00773, global_step=1237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  89%|████████▉ | 71/80 [06:43<00:50,  5.60s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=4.59e-6, train/loss_step=0.000421, global_step=1237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  90%|█████████ | 72/80 [06:50<00:44,  5.62s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=4.59e-6, train/loss_step=0.000421, global_step=1237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  90%|█████████ | 72/80 [06:50<00:44,  5.62s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000838, train/loss_vlb_step=3.89e-6, train/loss_step=0.000838, global_step=1237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  91%|█████████▏| 73/80 [07:01<00:39,  5.69s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000838, train/loss_vlb_step=3.89e-6, train/loss_step=0.000838, global_step=1237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  91%|█████████▏| 73/80 [07:01<00:39,  5.69s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=9e-5, train/loss_step=0.00204, global_step=1238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]     Epoch 61:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=9e-5, train/loss_step=0.00204, global_step=1238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000341, train/loss_step=0.0125, global_step=1238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  94%|█████████▍| 75/80 [07:01<00:27,  5.55s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000341, train/loss_step=0.0125, global_step=1238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  94%|█████████▍| 75/80 [07:01<00:27,  5.55s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.51e-5, train/loss_step=0.00448, global_step=1238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  95%|█████████▌| 76/80 [07:17<00:22,  5.69s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.51e-5, train/loss_step=0.00448, global_step=1238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  95%|█████████▌| 76/80 [07:17<00:22,  5.69s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.11e-6, train/loss_step=0.000287, global_step=1238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  96%|█████████▋| 77/80 [07:18<00:16,  5.62s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.11e-6, train/loss_step=0.000287, global_step=1238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  96%|█████████▋| 77/80 [07:18<00:16,  5.62s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000633, train/loss_vlb_step=3.59e-6, train/loss_step=0.000633, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  98%|█████████▊| 78/80 [07:18<00:11,  5.56s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000633, train/loss_vlb_step=3.59e-6, train/loss_step=0.000633, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  98%|█████████▊| 78/80 [07:18<00:11,  5.56s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.75e-6, train/loss_step=0.000314, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  99%|█████████▉| 79/80 [07:19<00:05,  5.49s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.75e-6, train/loss_step=0.000314, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61:  99%|█████████▉| 79/80 [07:19<00:05,  5.49s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=4.18e-5, train/loss_step=0.00526, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 61: 100%|██████████| 80/80 [07:19<00:00,  5.43s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=4.18e-5, train/loss_step=0.00526, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 61: 100%|██████████| 80/80 [07:19<00:00,  5.43s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.15e-5, train/loss_step=0.00273, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Average Epoch time: 439.93 seconds
+Average Peak memory 29563.78MiB
+Epoch 61:   0%|          | 0/80 [00:00<00:00, 4236.67it/s, loss=0.00414, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.15e-5, train/loss_step=0.00273, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 62:   0%|          | 0/80 [00:00<00:00, 1832.37it/s, loss=0.00414, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.15e-5, train/loss_step=0.00273, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]Epoch 62:   1%|▏         | 1/80 [00:37<24:35, 18.67s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.15e-5, train/loss_step=0.00273, global_step=1239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00414, train/loss_vlb_epoch=0.000138, train/loss_epoch=0.00414]  Epoch 62:   1%|▏         | 1/80 [00:37<24:35, 18.67s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.64e-6, train/loss_step=0.000393, global_step=1240.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:   2%|▎         | 2/80 [00:37<16:23, 12.61s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.64e-6, train/loss_step=0.000393, global_step=1240.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:   2%|▎         | 2/80 [00:37<16:23, 12.61s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=1.98e-5, train/loss_step=0.00536, global_step=1240.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]  Epoch 62:   4%|▍         | 3/80 [00:38<12:17,  9.58s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=1.98e-5, train/loss_step=0.00536, global_step=1240.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:   4%|▍         | 3/80 [00:38<12:17,  9.58s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=1.5e-5, train/loss_step=0.00443, global_step=1240.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:   5%|▌         | 4/80 [00:38<09:50,  7.77s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00443, train/loss_vlb_step=1.5e-5, train/loss_step=0.00443, global_step=1240.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:   5%|▌         | 4/80 [00:38<09:50,  7.77s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.07e-6, train/loss_step=0.000279, global_step=1240.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:   6%|▋         | 5/80 [00:40<08:25,  6.74s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.07e-6, train/loss_step=0.000279, global_step=1240.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:   6%|▋         | 5/80 [00:40<08:25,  6.74s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000594, train/loss_vlb_step=1.5e-5, train/loss_step=0.000594, global_step=1241.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:   8%|▊         | 6/80 [00:40<07:12,  5.85s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000594, train/loss_vlb_step=1.5e-5, train/loss_step=0.000594, global_step=1241.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:   8%|▊         | 6/80 [00:40<07:12,  5.85s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=3.92e-5, train/loss_step=0.00784, global_step=1241.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:   9%|▉         | 7/80 [00:44<06:41,  5.51s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=3.92e-5, train/loss_step=0.00784, global_step=1241.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:   9%|▉         | 7/80 [00:44<06:41,  5.51s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000176, train/loss_step=0.0151, global_step=1241.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  10%|█         | 8/80 [01:10<09:20,  7.79s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000176, train/loss_step=0.0151, global_step=1241.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  10%|█         | 8/80 [01:10<09:20,  7.79s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.4e-5, train/loss_step=0.00409, global_step=1241.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  11%|█▏        | 9/80 [01:17<09:07,  7.71s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.4e-5, train/loss_step=0.00409, global_step=1241.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  11%|█▏        | 9/80 [01:17<09:07,  7.71s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.33e-6, train/loss_step=0.00036, global_step=1242.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  12%|█▎        | 10/80 [01:17<08:13,  7.05s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.33e-6, train/loss_step=0.00036, global_step=1242.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  12%|█▎        | 10/80 [01:17<08:13,  7.05s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=9.28e-5, train/loss_step=0.0164, global_step=1242.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]  Epoch 62:  14%|█▍        | 11/80 [01:18<07:28,  6.51s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=9.28e-5, train/loss_step=0.0164, global_step=1242.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  14%|█▍        | 11/80 [01:18<07:28,  6.51s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=4.01e-5, train/loss_step=0.00528, global_step=1242.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  15%|█▌        | 12/80 [01:18<06:51,  6.05s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=4.01e-5, train/loss_step=0.00528, global_step=1242.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  15%|█▌        | 12/80 [01:18<06:51,  6.05s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.03e-6, train/loss_step=0.00104, global_step=1242.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  16%|█▋        | 13/80 [01:21<06:29,  5.81s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.03e-6, train/loss_step=0.00104, global_step=1242.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  16%|█▋        | 13/80 [01:21<06:29,  5.81s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.49e-6, train/loss_step=0.000389, global_step=1243.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  18%|█▊        | 14/80 [01:27<06:26,  5.86s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.49e-6, train/loss_step=0.000389, global_step=1243.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  18%|█▊        | 14/80 [01:27<06:26,  5.86s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.23e-5, train/loss_step=0.00814, global_step=1243.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]  Epoch 62:  19%|█▉        | 15/80 [01:28<05:58,  5.52s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.23e-5, train/loss_step=0.00814, global_step=1243.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  19%|█▉        | 15/80 [01:28<05:58,  5.52s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=1.75e-5, train/loss_step=0.00485, global_step=1243.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  20%|██        | 16/80 [01:58<07:25,  6.95s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=1.75e-5, train/loss_step=0.00485, global_step=1243.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  20%|██        | 16/80 [01:58<07:25,  6.95s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000303, train/loss_step=0.0182, global_step=1243.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  21%|██▏       | 17/80 [01:58<06:55,  6.60s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000303, train/loss_step=0.0182, global_step=1243.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  21%|██▏       | 17/80 [01:58<06:55,  6.60s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000996, train/loss_vlb_step=3.14e-5, train/loss_step=0.000996, global_step=1244.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  22%|██▎       | 18/80 [01:59<06:29,  6.28s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000996, train/loss_vlb_step=3.14e-5, train/loss_step=0.000996, global_step=1244.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  22%|██▎       | 18/80 [01:59<06:29,  6.28s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.99e-6, train/loss_step=0.00132, global_step=1244.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  24%|██▍       | 19/80 [01:59<06:05,  5.99s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.99e-6, train/loss_step=0.00132, global_step=1244.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  24%|██▍       | 19/80 [01:59<06:05,  5.99s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.29e-6, train/loss_step=0.000246, global_step=1244.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  25%|██▌       | 20/80 [02:03<05:52,  5.87s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.29e-6, train/loss_step=0.000246, global_step=1244.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  25%|██▌       | 20/80 [02:03<05:52,  5.87s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=5.32e-6, train/loss_step=0.00126, global_step=1244.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  26%|██▋       | 21/80 [02:08<05:45,  5.86s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=5.32e-6, train/loss_step=0.00126, global_step=1244.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  26%|██▋       | 21/80 [02:08<05:45,  5.86s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.49e-5, train/loss_step=0.00452, global_step=1245.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  28%|██▊       | 22/80 [02:23<06:00,  6.22s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.49e-5, train/loss_step=0.00452, global_step=1245.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  28%|██▊       | 22/80 [02:23<06:00,  6.22s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=8.87e-6, train/loss_step=0.00254, global_step=1245.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  29%|██▉       | 23/80 [02:23<05:40,  5.98s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=8.87e-6, train/loss_step=0.00254, global_step=1245.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  29%|██▉       | 23/80 [02:23<05:40,  5.98s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=9.06e-6, train/loss_step=0.000642, global_step=1245.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  30%|███       | 24/80 [02:45<06:11,  6.64s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=9.06e-6, train/loss_step=0.000642, global_step=1245.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  30%|███       | 24/80 [02:45<06:11,  6.64s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=4.93e-6, train/loss_step=0.0013, global_step=1245.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]    Epoch 62:  31%|███▏      | 25/80 [02:46<05:52,  6.40s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=4.93e-6, train/loss_step=0.0013, global_step=1245.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  31%|███▏      | 25/80 [02:46<05:52,  6.40s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.16e-6, train/loss_step=0.000284, global_step=1246.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  32%|███▎      | 26/80 [02:46<05:33,  6.18s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.16e-6, train/loss_step=0.000284, global_step=1246.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  32%|███▎      | 26/80 [02:46<05:33,  6.18s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=3.75e-6, train/loss_step=0.000505, global_step=1246.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  34%|███▍      | 27/80 [02:47<05:16,  5.98s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=3.75e-6, train/loss_step=0.000505, global_step=1246.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  34%|███▍      | 27/80 [02:47<05:16,  5.98s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.05e-6, train/loss_step=0.000299, global_step=1246.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  35%|███▌      | 28/80 [02:48<05:01,  5.80s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.05e-6, train/loss_step=0.000299, global_step=1246.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  35%|███▌      | 28/80 [02:48<05:01,  5.80s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=6.56e-5, train/loss_step=0.0124, global_step=1246.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]    Epoch 62:  36%|███▋      | 29/80 [02:54<04:55,  5.80s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=6.56e-5, train/loss_step=0.0124, global_step=1246.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  36%|███▋      | 29/80 [02:54<04:55,  5.80s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=4.12e-5, train/loss_step=0.00639, global_step=1247.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  38%|███▊      | 30/80 [03:04<04:58,  5.96s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00639, train/loss_vlb_step=4.12e-5, train/loss_step=0.00639, global_step=1247.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  38%|███▊      | 30/80 [03:04<04:58,  5.96s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=9.26e-5, train/loss_step=0.00735, global_step=1247.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  39%|███▉      | 31/80 [03:05<04:43,  5.79s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=9.26e-5, train/loss_step=0.00735, global_step=1247.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  39%|███▉      | 31/80 [03:05<04:43,  5.79s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=1.6e-6, train/loss_step=0.000395, global_step=1247.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  40%|████      | 32/80 [03:23<04:55,  6.16s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=1.6e-6, train/loss_step=0.000395, global_step=1247.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  40%|████      | 32/80 [03:23<04:55,  6.16s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.11e-6, train/loss_step=0.00145, global_step=1247.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  41%|████▏     | 33/80 [03:23<04:41,  5.99s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.11e-6, train/loss_step=0.00145, global_step=1247.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  41%|████▏     | 33/80 [03:23<04:41,  5.99s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.46e-6, train/loss_step=0.000599, global_step=1248.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  42%|████▎     | 34/80 [03:24<04:28,  5.83s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.46e-6, train/loss_step=0.000599, global_step=1248.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  42%|████▎     | 34/80 [03:24<04:28,  5.83s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=9.17e-6, train/loss_step=0.00232, global_step=1248.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]   Epoch 62:  44%|████▍     | 35/80 [03:29<04:21,  5.82s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=9.17e-6, train/loss_step=0.00232, global_step=1248.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  44%|████▍     | 35/80 [03:29<04:21,  5.82s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=3.72e-6, train/loss_step=0.00086, global_step=1248.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  45%|████▌     | 36/80 [03:29<04:09,  5.67s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=3.72e-6, train/loss_step=0.00086, global_step=1248.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  45%|████▌     | 36/80 [03:29<04:09,  5.67s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.23e-6, train/loss_step=0.00114, global_step=1248.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  46%|████▋     | 37/80 [03:40<04:09,  5.80s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.23e-6, train/loss_step=0.00114, global_step=1248.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  46%|████▋     | 37/80 [03:40<04:09,  5.80s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000405, train/loss_vlb_step=2.31e-6, train/loss_step=0.000405, global_step=1249.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  48%|████▊     | 38/80 [03:42<03:59,  5.69s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000405, train/loss_vlb_step=2.31e-6, train/loss_step=0.000405, global_step=1249.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  48%|████▊     | 38/80 [03:42<03:59,  5.69s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.36e-6, train/loss_step=0.000273, global_step=1249.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  49%|████▉     | 39/80 [03:42<03:48,  5.56s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.36e-6, train/loss_step=0.000273, global_step=1249.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  49%|████▉     | 39/80 [03:42<03:48,  5.56s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=1.38e-5, train/loss_step=0.0041, global_step=1249.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]    Epoch 62:  50%|█████     | 40/80 [03:58<03:53,  5.83s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.0041, train/loss_vlb_step=1.38e-5, train/loss_step=0.0041, global_step=1249.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  50%|█████     | 40/80 [03:58<03:53,  5.83s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=7.97e-5, train/loss_step=0.00913, global_step=1249.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  51%|█████��    | 41/80 [04:06<03:48,  5.86s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=7.97e-5, train/loss_step=0.00913, global_step=1249.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  51%|█████▏    | 41/80 [04:06<03:48,  5.86s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000454, train/loss_step=0.018, global_step=1250.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]   Epoch 62:  52%|█████▎    | 42/80 [04:06<03:37,  5.73s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000454, train/loss_step=0.018, global_step=1250.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  52%|█████▎    | 42/80 [04:06<03:37,  5.73s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00851, train/loss_vlb_step=5.1e-5, train/loss_step=0.00851, global_step=1250.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  54%|█████▍    | 43/80 [04:08<03:28,  5.64s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00851, train/loss_vlb_step=5.1e-5, train/loss_step=0.00851, global_step=1250.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  54%|█████▍    | 43/80 [04:08<03:28,  5.64s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=1.52e-5, train/loss_step=0.0042, global_step=1250.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]   Epoch 62:  55%|█████▌    | 44/80 [04:08<03:18,  5.53s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=1.52e-5, train/loss_step=0.0042, global_step=1250.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  55%|█████▌    | 44/80 [04:08<03:18,  5.53s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000109, train/loss_step=0.0159, global_step=1250.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  56%|█████▋    | 45/80 [04:17<03:16,  5.61s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=0.000109, train/loss_step=0.0159, global_step=1250.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  56%|█████▋    | 45/80 [04:17<03:16,  5.61s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=1.23e-6, train/loss_step=0.000263, global_step=1251.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  57%|█████▊    | 46/80 [04:30<03:15,  5.75s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=1.23e-6, train/loss_step=0.000263, global_step=1251.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  57%|█████▊    | 46/80 [04:30<03:15,  5.75s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000844, train/loss_vlb_step=4e-6, train/loss_step=0.000844, global_step=1251.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]   Epoch 62:  59%|█████▉    | 47/80 [04:30<03:06,  5.64s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000844, train/loss_vlb_step=4e-6, train/loss_step=0.000844, global_step=1251.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  59%|█████▉    | 47/80 [04:30<03:06,  5.64s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.27e-5, train/loss_step=0.0165, global_step=1251.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  60%|██████    | 48/80 [04:41<03:04,  5.75s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=7.27e-5, train/loss_step=0.0165, global_step=1251.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  60%|██████    | 48/80 [04:41<03:04,  5.75s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=2e-6, train/loss_step=0.000377, global_step=1251.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  61%|██████▏   | 49/80 [04:50<03:00,  5.82s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=2e-6, train/loss_step=0.000377, global_step=1251.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  61%|██████▏   | 49/80 [04:50<03:00,  5.82s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=3.58e-5, train/loss_step=0.00255, global_step=1252.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  62%|██████▎   | 50/80 [04:51<02:51,  5.71s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=3.58e-5, train/loss_step=0.00255, global_step=1252.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  62%|██████▎   | 50/80 [04:51<02:51,  5.71s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.98e-6, train/loss_step=0.000375, global_step=1252.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  64%|██████▍   | 51/80 [04:51<02:42,  5.62s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.98e-6, train/loss_step=0.000375, global_step=1252.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  64%|██████▍   | 51/80 [04:51<02:42,  5.62s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.21e-6, train/loss_step=0.000295, global_step=1252.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  65%|██████▌   | 52/80 [04:52<02:34,  5.52s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.21e-6, train/loss_step=0.000295, global_step=1252.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  65%|██████▌   | 52/80 [04:52<02:34,  5.52s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=2.73e-5, train/loss_step=0.00317, global_step=1252.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  66%|██████▋   | 53/80 [05:11<02:35,  5.77s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=2.73e-5, train/loss_step=0.00317, global_step=1252.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  66%|██████▋   | 53/80 [05:11<02:35,  5.77s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=2.97e-6, train/loss_step=0.00061, global_step=1253.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  68%|██████▊   | 54/80 [05:17<02:30,  5.77s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=2.97e-6, train/loss_step=0.00061, global_step=1253.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  68%|██████▊   | 54/80 [05:17<02:30,  5.77s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=0.000298, train/loss_step=0.0189, global_step=1253.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  69%|██████▉   | 55/80 [05:17<02:21,  5.68s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=0.000298, train/loss_step=0.0189, global_step=1253.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  69%|██████▉   | 55/80 [05:17<02:21,  5.68s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=6.73e-6, train/loss_step=0.000987, global_step=1253.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  70%|███████   | 56/80 [05:22<02:15,  5.66s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=6.73e-6, train/loss_step=0.000987, global_step=1253.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  70%|███████   | 56/80 [05:22<02:15,  5.66s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.3e-6, train/loss_step=0.000274, global_step=1253.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.3e-6, train/loss_step=0.000274, global_step=1253.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=5.14e-5, train/loss_step=0.00455, global_step=1254.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  72%|███████▎  | 58/80 [05:32<02:03,  5.63s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=5.14e-5, train/loss_step=0.00455, global_step=1254.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  72%|███████▎  | 58/80 [05:32<02:03,  5.63s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.23e-6, train/loss_step=0.000298, global_step=1254.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  74%|███████▍  | 59/80 [05:34<01:56,  5.57s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.23e-6, train/loss_step=0.000298, global_step=1254.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  74%|███████▍  | 59/80 [05:34<01:56,  5.57s/it, loss=0.00653, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000189, train/loss_step=0.0249, global_step=1254.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]   Epoch 62:  75%|███████▌  | 60/80 [05:34<01:49,  5.49s/it, loss=0.00653, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000189, train/loss_step=0.0249, global_step=1254.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  75%|███████▌  | 60/80 [05:34<01:49,  5.49s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=9.38e-5, train/loss_step=0.0153, global_step=1254.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  76%|███████▋  | 61/80 [05:56<01:49,  5.75s/it, loss=0.00684, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=9.38e-5, train/loss_step=0.0153, global_step=1254.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  76%|███████▋  | 61/80 [05:56<01:49,  5.75s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.9e-5, train/loss_step=0.0104, global_step=1255.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  78%|███████▊  | 62/80 [05:57<01:42,  5.67s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.9e-5, train/loss_step=0.0104, global_step=1255.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  78%|███████▊  | 62/80 [05:57<01:42,  5.67s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.81e-5, train/loss_step=0.0106, global_step=1255.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  79%|███████▉  | 63/80 [05:57<01:34,  5.59s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.81e-5, train/loss_step=0.0106, global_step=1255.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  79%|███████▉  | 63/80 [05:57<01:34,  5.59s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=5.76e-6, train/loss_step=0.00138, global_step=1255.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  80%|████████  | 64/80 [05:58<01:28,  5.51s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=5.76e-6, train/loss_step=0.00138, global_step=1255.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  80%|████████  | 64/80 [05:58<01:28,  5.51s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.34e-5, train/loss_step=0.00149, global_step=1255.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  81%|████████▏ | 65/80 [06:28<01:28,  5.89s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.34e-5, train/loss_step=0.00149, global_step=1255.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  81%|████████▏ | 65/80 [06:28<01:28,  5.89s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=9.57e-6, train/loss_step=0.00127, global_step=1256.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  82%|████████▎ | 66/80 [06:28<01:21,  5.81s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.00127, train/loss_vlb_step=9.57e-6, train/loss_step=0.00127, global_step=1256.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  82%|████████▎ | 66/80 [06:28<01:21,  5.81s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=3.2e-5, train/loss_step=0.00925, global_step=1256.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  84%|████████▍ | 67/80 [06:29<01:14,  5.73s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=3.2e-5, train/loss_step=0.00925, global_step=1256.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  84%|████████▍ | 67/80 [06:29<01:14,  5.73s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000269, train/loss_vlb_step=1.82e-6, train/loss_step=0.000269, global_step=1256.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  85%|████████▌ | 68/80 [06:30<01:07,  5.65s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000269, train/loss_vlb_step=1.82e-6, train/loss_step=0.000269, global_step=1256.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  85%|████████▌ | 68/80 [06:30<01:07,  5.65s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000938, train/loss_vlb_step=6.96e-5, train/loss_step=0.000938, global_step=1256.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  86%|████████▋ | 69/80 [06:33<01:01,  5.62s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000938, train/loss_vlb_step=6.96e-5, train/loss_step=0.000938, global_step=1256.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  86%|████████▋ | 69/80 [06:33<01:01,  5.62s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=9.59e-5, train/loss_step=0.00523, global_step=1257.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]  Epoch 62:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=9.59e-5, train/loss_step=0.00523, global_step=1257.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.0133, train/loss_step=0.0306, global_step=1257.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]   Epoch 62:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.0306, train/loss_vlb_step=0.0133, train/loss_step=0.0306, global_step=1257.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.13e-6, train/loss_step=0.000511, global_step=1257.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  90%|█████████ | 72/80 [06:35<00:43,  5.42s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.13e-6, train/loss_step=0.000511, global_step=1257.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  90%|█████████ | 72/80 [06:35<00:43,  5.42s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=5.71e-6, train/loss_step=0.0015, global_step=1257.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]    Epoch 62:  91%|█████████▏| 73/80 [07:02<00:39,  5.71s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=5.71e-6, train/loss_step=0.0015, global_step=1257.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  91%|█████████▏| 73/80 [07:02<00:39,  5.71s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=5.74e-7, train/loss_step=0.000144, global_step=1258.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  92%|█████████▎| 74/80 [07:02<00:33,  5.64s/it, loss=0.00694, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=5.74e-7, train/loss_step=0.000144, global_step=1258.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  92%|█████████▎| 74/80 [07:02<00:33,  5.64s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=0.000152, train/loss_step=0.00542, global_step=1258.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  94%|█████████▍| 75/80 [07:03<00:27,  5.57s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=0.000152, train/loss_step=0.00542, global_step=1258.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  94%|█████████▍| 75/80 [07:03<00:27,  5.57s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.000884, train/loss_vlb_step=0.000105, train/loss_step=0.000884, global_step=1258.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  95%|█████████▌| 76/80 [07:03<00:22,  5.50s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.000884, train/loss_vlb_step=0.000105, train/loss_step=0.000884, global_step=1258.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  95%|█████████▌| 76/80 [07:03<00:22,  5.50s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.000818, train/loss_vlb_step=3.77e-6, train/loss_step=0.000818, global_step=1258.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043] Epoch 62:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.000818, train/loss_vlb_step=3.77e-6, train/loss_step=0.000818, global_step=1258.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.07e-7, train/loss_step=0.000139, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.07e-7, train/loss_step=0.000139, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.27e-5, train/loss_step=0.00322, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]  Epoch 62:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.27e-5, train/loss_step=0.00322, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000266, train/loss_vlb_step=1.66e-6, train/loss_step=0.000266, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000266, train/loss_vlb_step=1.66e-6, train/loss_step=0.000266, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 62: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=3.17e-6, train/loss_step=0.000803, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Average Epoch time: 430.94 seconds
+Average Peak memory 29565.89MiB
+Epoch 62:   0%|          | 0/80 [00:00<00:00, 3788.89it/s, loss=0.00426, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=3.17e-6, train/loss_step=0.000803, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 63:   0%|          | 0/80 [00:00<00:00, 1812.58it/s, loss=0.00426, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=3.17e-6, train/loss_step=0.000803, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]Epoch 63:   1%|▏         | 1/80 [00:41<27:17, 20.72s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=3.17e-6, train/loss_step=0.000803, global_step=1259.0, lr_abs=0.0001, train/loss_simple_epoch=0.0043, train/loss_vlb_epoch=8.88e-5, train/loss_epoch=0.0043]  Epoch 63:   1%|▏         | 1/80 [00:41<27:17, 20.72s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.33e-6, train/loss_step=0.000278, global_step=1260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   2%|▎         | 2/80 [00:42<18:13, 14.01s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.33e-6, train/loss_step=0.000278, global_step=1260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   2%|▎         | 2/80 [00:42<18:13, 14.01s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.4e-6, train/loss_step=0.00036, global_step=1260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]   Epoch 63:   4%|▍         | 3/80 [00:46<15:00, 11.69s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.4e-6, train/loss_step=0.00036, global_step=1260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   4%|▍         | 3/80 [00:46<15:00, 11.69s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=8.82e-6, train/loss_step=0.00245, global_step=1260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   5%|▌         | 4/80 [00:47<11:58,  9.46s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=8.82e-6, train/loss_step=0.00245, global_step=1260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   5%|▌         | 4/80 [00:47<11:58,  9.46s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.15e-5, train/loss_step=0.00318, global_step=1260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   6%|▋         | 5/80 [00:47<09:57,  7.97s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00318, train/loss_vlb_step=1.15e-5, train/loss_step=0.00318, global_step=1260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   6%|▋         | 5/80 [00:47<09:57,  7.97s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.66e-5, train/loss_step=0.0033, global_step=1261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:   8%|▊         | 6/80 [00:48<08:30,  6.90s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.66e-5, train/loss_step=0.0033, global_step=1261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   8%|▊         | 6/80 [00:48<08:30,  6.90s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=2.39e-6, train/loss_step=0.000375, global_step=1261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   9%|▉         | 7/80 [00:48<07:25,  6.10s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=2.39e-6, train/loss_step=0.000375, global_step=1261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:   9%|▉         | 7/80 [00:48<07:25,  6.10s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=9.03e-7, train/loss_step=0.000228, global_step=1261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  10%|█         | 8/80 [01:13<09:44,  8.12s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=9.03e-7, train/loss_step=0.000228, global_step=1261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  10%|█         | 8/80 [01:13<09:44,  8.12s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.16e-6, train/loss_step=0.000241, global_step=1261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  11%|█▏        | 9/80 [01:16<09:06,  7.69s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.16e-6, train/loss_step=0.000241, global_step=1261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  11%|█▏        | 9/80 [01:16<09:06,  7.69s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=9.57e-7, train/loss_step=0.000233, global_step=1262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  12%|█▎        | 10/80 [01:17<08:15,  7.07s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=9.57e-7, train/loss_step=0.000233, global_step=1262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  12%|█▎        | 10/80 [01:17<08:15,  7.07s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.62e-5, train/loss_step=0.0122, global_step=1262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]    Epoch 63:  14%|█▍        | 11/80 [01:22<07:56,  6.90s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.62e-5, train/loss_step=0.0122, global_step=1262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  14%|█▍        | 11/80 [01:22<07:56,  6.90s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=1.63e-5, train/loss_step=0.00462, global_step=1262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  15%|█▌        | 12/80 [01:31<07:57,  7.02s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=1.63e-5, train/loss_step=0.00462, global_step=1262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  15%|█▌        | 12/80 [01:31<07:57,  7.02s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=9.01e-6, train/loss_step=0.00245, global_step=1262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  16%|█▋        | 13/80 [01:31<07:19,  6.56s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=9.01e-6, train/loss_step=0.00245, global_step=1262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  16%|█▋        | 13/80 [01:31<07:19,  6.56s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=5.78e-6, train/loss_step=0.00138, global_step=1263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  18%|█▊        | 14/80 [01:32<06:46,  6.15s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=5.78e-6, train/loss_step=0.00138, global_step=1263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  18%|█▊        | 14/80 [01:32<06:46,  6.15s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.64e-6, train/loss_step=0.000551, global_step=1263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  19%|█▉        | 15/80 [01:32<06:17,  5.80s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.64e-6, train/loss_step=0.000551, global_step=1263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  19%|█▉        | 15/80 [01:32<06:17,  5.80s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=2.96e-5, train/loss_step=0.00825, global_step=1263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397] Epoch 63:  20%|██        | 16/80 [01:59<07:31,  7.06s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=2.96e-5, train/loss_step=0.00825, global_step=1263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  20%|██        | 16/80 [01:59<07:31,  7.06s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=1.89e-5, train/loss_step=0.00501, global_step=1263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  21%|██▏       | 17/80 [02:01<07:04,  6.74s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=1.89e-5, train/loss_step=0.00501, global_step=1263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  21%|██▏       | 17/80 [02:01<07:04,  6.74s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=2.61e-6, train/loss_step=0.000407, global_step=1264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  22%|██▎       | 18/80 [02:01<06:37,  6.41s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=2.61e-6, train/loss_step=0.000407, global_step=1264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  22%|██▎       | 18/80 [02:01<06:37,  6.41s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.1e-5, train/loss_step=0.00619, global_step=1264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]   Epoch 63:  24%|██▍       | 19/80 [02:07<06:27,  6.36s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.1e-5, train/loss_step=0.00619, global_step=1264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  24%|██▍       | 19/80 [02:07<06:27,  6.36s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.12e-5, train/loss_step=0.00811, global_step=1264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  25%|██▌       | 20/80 [02:21<06:43,  6.72s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00811, train/loss_vlb_step=3.12e-5, train/loss_step=0.00811, global_step=1264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  25%|██▌       | 20/80 [02:21<06:43,  6.72s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000277, train/loss_vlb_step=2.17e-6, train/loss_step=0.000277, global_step=1264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  26%|██▋       | 21/80 [02:21<06:19,  6.44s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000277, train/loss_vlb_step=2.17e-6, train/loss_step=0.000277, global_step=1264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  26%|██▋       | 21/80 [02:21<06:19,  6.44s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000269, train/loss_vlb_step=1.09e-6, train/loss_step=0.000269, global_step=1265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  28%|██▊       | 22/80 [02:22<05:58,  6.18s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000269, train/loss_vlb_step=1.09e-6, train/loss_step=0.000269, global_step=1265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  28%|██▊       | 22/80 [02:22<05:58,  6.18s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=9.88e-5, train/loss_step=0.0141, global_step=1265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  29%|██▉       | 23/80 [02:22<05:38,  5.94s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=9.88e-5, train/loss_step=0.0141, global_step=1265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  29%|██▉       | 23/80 [02:22<05:38,  5.94s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=7.77e-6, train/loss_step=0.00164, global_step=1265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  30%|███       | 24/80 [02:38<05:55,  6.36s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=7.77e-6, train/loss_step=0.00164, global_step=1265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  30%|███       | 24/80 [02:38<05:55,  6.36s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=1.65e-5, train/loss_step=0.00495, global_step=1265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  31%|███▏      | 25/80 [02:50<06:01,  6.57s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=1.65e-5, train/loss_step=0.00495, global_step=1265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  31%|███▏      | 25/80 [02:50<06:01,  6.57s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=9.08e-7, train/loss_step=0.000239, global_step=1266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  32%|███▎      | 26/80 [02:51<05:42,  6.35s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=9.08e-7, train/loss_step=0.000239, global_step=1266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  32%|███▎      | 26/80 [02:51<05:42,  6.35s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.39e-6, train/loss_step=0.00239, global_step=1266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  34%|███▍      | 27/80 [02:51<05:25,  6.14s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.39e-6, train/loss_step=0.00239, global_step=1266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  34%|███▍      | 27/80 [02:51<05:25,  6.14s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=9.6e-7, train/loss_step=0.000224, global_step=1266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  35%|███▌      | 28/80 [03:12<05:44,  6.63s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=9.6e-7, train/loss_step=0.000224, global_step=1266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  35%|███▌      | 28/80 [03:12<05:44,  6.63s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00014, train/loss_vlb_step=5.35e-7, train/loss_step=0.00014, global_step=1266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397] Epoch 63:  36%|███▋      | 29/80 [03:12<05:27,  6.42s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00014, train/loss_vlb_step=5.35e-7, train/loss_step=0.00014, global_step=1266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  36%|███▋      | 29/80 [03:12<05:27,  6.42s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=7.17e-6, train/loss_step=0.000487, global_step=1267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  38%|███▊      | 30/80 [03:13<05:11,  6.23s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=7.17e-6, train/loss_step=0.000487, global_step=1267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  38%|███▊      | 30/80 [03:13<05:11,  6.23s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.92e-5, train/loss_step=0.00155, global_step=1267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  39%|███▉      | 31/80 [03:13<04:56,  6.05s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.92e-5, train/loss_step=0.00155, global_step=1267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  39%|███▉      | 31/80 [03:13<04:56,  6.05s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.15e-5, train/loss_step=0.00336, global_step=1267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397] Epoch 63:  40%|████      | 32/80 [03:17<04:46,  5.97s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.15e-5, train/loss_step=0.00336, global_step=1267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  40%|████      | 32/80 [03:17<04:46,  5.97s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000177, train/loss_step=0.0152, global_step=1267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  41%|████▏     | 33/80 [03:30<04:51,  6.20s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000177, train/loss_step=0.0152, global_step=1267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  41%|████▏     | 33/80 [03:30<04:51,  6.20s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.43e-6, train/loss_step=0.000426, global_step=1268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  42%|████▎     | 34/80 [03:31<04:37,  6.04s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.43e-6, train/loss_step=0.000426, global_step=1268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  42%|████▎     | 34/80 [03:31<04:37,  6.04s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=1.19e-5, train/loss_step=0.00051, global_step=1268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  44%|████▍     | 35/80 [03:31<04:24,  5.89s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=1.19e-5, train/loss_step=0.00051, global_step=1268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  44%|████▍     | 35/80 [03:31<04:24,  5.89s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=0.000428, train/loss_step=0.00681, global_step=1268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  45%|████▌     | 36/80 [04:01<04:47,  6.52s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00681, train/loss_vlb_step=0.000428, train/loss_step=0.00681, global_step=1268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  45%|████▌     | 36/80 [04:01<04:47,  6.52s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000334, train/loss_vlb_step=1.56e-6, train/loss_step=0.000334, global_step=1268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  46%|████▋     | 37/80 [04:01<04:33,  6.37s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000334, train/loss_vlb_step=1.56e-6, train/loss_step=0.000334, global_step=1268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  46%|████▋     | 37/80 [04:01<04:33,  6.37s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.77e-5, train/loss_step=0.00557, global_step=1269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  48%|████▊     | 38/80 [04:02<04:21,  6.22s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.77e-5, train/loss_step=0.00557, global_step=1269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  48%|████▊     | 38/80 [04:02<04:21,  6.22s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=1.91e-6, train/loss_step=0.000455, global_step=1269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  49%|████▉     | 39/80 [04:02<04:08,  6.07s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=1.91e-6, train/loss_step=0.000455, global_step=1269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  49%|████▉     | 39/80 [04:02<04:08,  6.07s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.08e-6, train/loss_step=0.000275, global_step=1269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  50%|█████     | 40/80 [04:03<03:57,  5.94s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.08e-6, train/loss_step=0.000275, global_step=1269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  50%|█████     | 40/80 [04:03<03:57,  5.94s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000881, train/loss_vlb_step=1.22e-5, train/loss_step=0.000881, global_step=1269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  51%|█████▏    | 41/80 [04:15<03:57,  6.09s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000881, train/loss_vlb_step=1.22e-5, train/loss_step=0.000881, global_step=1269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  51%|█████▏    | 41/80 [04:15<03:57,  6.09s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.31e-5, train/loss_step=0.00175, global_step=1270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  52%|█████▎    | 42/80 [04:16<03:46,  5.96s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.31e-5, train/loss_step=0.00175, global_step=1270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  52%|█████▎    | 42/80 [04:16<03:46,  5.96s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=0.000346, train/loss_step=0.00109, global_step=1270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  54%|█████▍    | 43/80 [04:16<03:36,  5.84s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=0.000346, train/loss_step=0.00109, global_step=1270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  54%|█████▍    | 43/80 [04:16<03:36,  5.84s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=9.34e-7, train/loss_step=0.000252, global_step=1270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  55%|█████▌    | 44/80 [04:42<03:45,  6.28s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=9.34e-7, train/loss_step=0.000252, global_step=1270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  55%|█████▌    | 44/80 [04:42<03:45,  6.28s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=9.69e-6, train/loss_step=0.00255, global_step=1270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  56%|█████▋    | 45/80 [04:43<03:35,  6.15s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=9.69e-6, train/loss_step=0.00255, global_step=1270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  56%|█████▋    | 45/80 [04:43<03:35,  6.15s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=3.02e-5, train/loss_step=0.00882, global_step=1271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  57%|█████▊    | 46/80 [04:43<03:25,  6.03s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=3.02e-5, train/loss_step=0.00882, global_step=1271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  57%|█████▊    | 46/80 [04:43<03:25,  6.03s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.43e-5, train/loss_step=0.00144, global_step=1271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397] Epoch 63:  59%|█████▉    | 47/80 [04:43<03:15,  5.92s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.43e-5, train/loss_step=0.00144, global_step=1271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  59%|█████▉    | 47/80 [04:43<03:15,  5.92s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.99e-5, train/loss_step=0.00617, global_step=1271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  60%|██████    | 48/80 [04:44<03:05,  5.81s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=3.99e-5, train/loss_step=0.00617, global_step=1271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  60%|██████    | 48/80 [04:44<03:05,  5.81s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000708, train/loss_vlb_step=3.19e-6, train/loss_step=0.000708, global_step=1271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  61%|██████▏   | 49/80 [04:52<03:01,  5.86s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000708, train/loss_vlb_step=3.19e-6, train/loss_step=0.000708, global_step=1271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  61%|██████▏   | 49/80 [04:52<03:01,  5.86s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.07e-5, train/loss_step=0.00272, global_step=1272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  62%|██████▎   | 50/80 [04:53<02:52,  5.75s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.07e-5, train/loss_step=0.00272, global_step=1272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  62%|██████▎   | 50/80 [04:53<02:52,  5.75s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=6.61e-6, train/loss_step=0.00164, global_step=1272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  64%|██████▍   | 51/80 [04:53<02:43,  5.65s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=6.61e-6, train/loss_step=0.00164, global_step=1272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  64%|██████▍   | 51/80 [04:53<02:43,  5.65s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=0.000161, train/loss_step=0.00452, global_step=1272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  65%|██████▌   | 52/80 [05:26<02:52,  6.17s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=0.000161, train/loss_step=0.00452, global_step=1272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  65%|██████▌   | 52/80 [05:26<02:52,  6.17s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000985, train/loss_vlb_step=8.43e-6, train/loss_step=0.000985, global_step=1272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  66%|██████▋   | 53/80 [05:27<02:43,  6.06s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000985, train/loss_vlb_step=8.43e-6, train/loss_step=0.000985, global_step=1272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  66%|██████▋   | 53/80 [05:27<02:43,  6.06s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=3.25e-6, train/loss_step=0.000887, global_step=1273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  68%|██████▊   | 54/80 [05:27<02:35,  5.96s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=3.25e-6, train/loss_step=0.000887, global_step=1273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  68%|██████▊   | 54/80 [05:27<02:35,  5.96s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=2.37e-5, train/loss_step=0.0066, global_step=1273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]    Epoch 63:  69%|██████▉   | 55/80 [05:28<02:26,  5.86s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=2.37e-5, train/loss_step=0.0066, global_step=1273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  69%|██████▉   | 55/80 [05:28<02:26,  5.86s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.6e-6, train/loss_step=0.001, global_step=1273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]   Epoch 63:  70%|███████   | 56/80 [05:29<02:18,  5.77s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.6e-6, train/loss_step=0.001, global_step=1273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  70%|███████   | 56/80 [05:29<02:18,  5.77s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=7.99e-6, train/loss_step=0.00194, global_step=1273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  71%|███████▏  | 57/80 [05:43<02:16,  5.92s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=7.99e-6, train/loss_step=0.00194, global_step=1273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  71%|███████▏  | 57/80 [05:43<02:16,  5.92s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000649, train/loss_vlb_step=4.3e-6, train/loss_step=0.000649, global_step=1274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  72%|███████▎  | 58/80 [05:44<02:08,  5.83s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000649, train/loss_vlb_step=4.3e-6, train/loss_step=0.000649, global_step=1274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  72%|███████▎  | 58/80 [05:44<02:08,  5.83s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=2.12e-5, train/loss_step=0.00137, global_step=1274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397] Epoch 63:  74%|███████▍  | 59/80 [05:44<02:00,  5.74s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=2.12e-5, train/loss_step=0.00137, global_step=1274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  74%|███████▍  | 59/80 [05:44<02:00,  5.74s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=4.09e-6, train/loss_step=0.000678, global_step=1274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  75%|███████▌  | 60/80 [06:09<02:01,  6.06s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=4.09e-6, train/loss_step=0.000678, global_step=1274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  75%|███████▌  | 60/80 [06:09<02:01,  6.06s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=8.93e-5, train/loss_step=0.012, global_step=1274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]      Epoch 63:  76%|███████▋  | 61/80 [06:10<01:53,  5.97s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=8.93e-5, train/loss_step=0.012, global_step=1274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  76%|███████▋  | 61/80 [06:10<01:53,  5.97s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000984, train/loss_vlb_step=1.45e-5, train/loss_step=0.000984, global_step=1275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  78%|███████▊  | 62/80 [06:10<01:45,  5.88s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000984, train/loss_vlb_step=1.45e-5, train/loss_step=0.000984, global_step=1275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  78%|███████▊  | 62/80 [06:10<01:45,  5.88s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.75e-6, train/loss_step=0.00155, global_step=1275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  79%|███████▉  | 63/80 [06:11<01:38,  5.80s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.75e-6, train/loss_step=0.00155, global_step=1275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  79%|███████▉  | 63/80 [06:11<01:38,  5.80s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=4.65e-6, train/loss_step=0.00119, global_step=1275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  80%|████████  | 64/80 [06:11<01:31,  5.72s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=4.65e-6, train/loss_step=0.00119, global_step=1275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  80%|████████  | 64/80 [06:11<01:31,  5.72s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.06e-5, train/loss_step=0.0019, global_step=1275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  81%|████████▏ | 65/80 [06:22<01:26,  5.79s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=1.06e-5, train/loss_step=0.0019, global_step=1275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  81%|████████▏ | 65/80 [06:22<01:26,  5.79s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000963, train/loss_vlb_step=4.11e-6, train/loss_step=0.000963, global_step=1276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000963, train/loss_vlb_step=4.11e-6, train/loss_step=0.000963, global_step=1276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.13e-5, train/loss_step=0.00186, global_step=1276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397] Epoch 63:  84%|████████▍ | 67/80 [06:23<01:13,  5.63s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.13e-5, train/loss_step=0.00186, global_step=1276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  84%|████████▍ | 67/80 [06:23<01:13,  5.63s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=0.000102, train/loss_step=0.0215, global_step=1276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397] Epoch 63:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.0215, train/loss_vlb_step=0.000102, train/loss_step=0.0215, global_step=1276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=4.39e-6, train/loss_step=0.000737, global_step=1276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  86%|████████▋ | 69/80 [06:44<01:03,  5.78s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=4.39e-6, train/loss_step=0.000737, global_step=1276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  86%|████████▋ | 69/80 [06:44<01:03,  5.78s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=1.97e-5, train/loss_step=0.00581, global_step=1277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  88%|████████▊ | 70/80 [06:44<00:57,  5.70s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=1.97e-5, train/loss_step=0.00581, global_step=1277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  88%|████████▊ | 70/80 [06:44<00:57,  5.70s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=7.16e-6, train/loss_step=0.00173, global_step=1277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  89%|████████▉ | 71/80 [06:45<00:50,  5.63s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=7.16e-6, train/loss_step=0.00173, global_step=1277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  89%|████████▉ | 71/80 [06:45<00:50,  5.63s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=1.38e-6, train/loss_step=0.000342, global_step=1277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  90%|█████████ | 72/80 [06:45<00:44,  5.56s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=1.38e-6, train/loss_step=0.000342, global_step=1277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  90%|█████████ | 72/80 [06:45<00:44,  5.56s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.67e-6, train/loss_step=0.00166, global_step=1277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  91%|█████████▏| 73/80 [06:52<00:39,  5.58s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.67e-6, train/loss_step=0.00166, global_step=1277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  91%|█████████▏| 73/80 [06:52<00:39,  5.58s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=0.000471, train/loss_step=0.0023, global_step=1278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397] Epoch 63:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=0.000471, train/loss_step=0.0023, global_step=1278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000792, train/loss_vlb_step=3.32e-6, train/loss_step=0.000792, global_step=1278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  94%|█████████▍| 75/80 [06:53<00:27,  5.44s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000792, train/loss_vlb_step=3.32e-6, train/loss_step=0.000792, global_step=1278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  94%|█████████▍| 75/80 [06:53<00:27,  5.44s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=5.25e-6, train/loss_step=0.000876, global_step=1278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  95%|█████████▌| 76/80 [07:19<00:22,  5.71s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=5.25e-6, train/loss_step=0.000876, global_step=1278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  95%|█████████▌| 76/80 [07:19<00:22,  5.71s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=2.22e-6, train/loss_step=0.000566, global_step=1278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  96%|█████████▋| 77/80 [07:20<00:16,  5.64s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=2.22e-6, train/loss_step=0.000566, global_step=1278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  96%|█████████▋| 77/80 [07:20<00:16,  5.64s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000666, train/loss_vlb_step=4.18e-6, train/loss_step=0.000666, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  98%|█████████▊| 78/80 [07:20<00:11,  5.58s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000666, train/loss_vlb_step=4.18e-6, train/loss_step=0.000666, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  98%|█████████▊| 78/80 [07:20<00:11,  5.58s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=1.09e-5, train/loss_step=0.00142, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 63:  99%|█████████▉| 79/80 [07:21<00:05,  5.52s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=1.09e-5, train/loss_step=0.00142, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63:  99%|█████████▉| 79/80 [07:21<00:05,  5.52s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000672, train/loss_vlb_step=5.02e-6, train/loss_step=0.000672, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63: 100%|██████████| 80/80 [07:21<00:00,  5.45s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000672, train/loss_vlb_step=5.02e-6, train/loss_step=0.000672, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 63: 100%|██████████| 80/80 [07:21<00:00,  5.45s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=2.12e-6, train/loss_step=0.000444, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397] Average Epoch time: 441.76 seconds
+Average Peak memory 29562.31MiB
+Epoch 63:   0%|          | 0/80 [00:00<00:00, 5197.40it/s, loss=0.0024, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=2.12e-6, train/loss_step=0.000444, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 64:   0%|          | 0/80 [00:00<00:00, 2097.15it/s, loss=0.0024, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=2.12e-6, train/loss_step=0.000444, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]Epoch 64:   1%|▏         | 1/80 [00:40<26:22, 20.03s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=2.12e-6, train/loss_step=0.000444, global_step=1279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=7.49e-5, train/loss_epoch=0.00397]  Epoch 64:   1%|▏         | 1/80 [00:40<26:22, 20.04s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=3.38e-5, train/loss_step=0.00845, global_step=1280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   2%|▎         | 2/80 [00:45<19:46, 15.21s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=3.38e-5, train/loss_step=0.00845, global_step=1280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   2%|▎         | 2/80 [00:45<19:46, 15.21s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.17e-5, train/loss_step=0.00265, global_step=1280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   4%|▍         | 3/80 [00:46<14:47, 11.53s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.17e-5, train/loss_step=0.00265, global_step=1280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   4%|▍         | 3/80 [00:46<14:47, 11.53s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=5.6e-5, train/loss_step=0.00497, global_step=1280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447] Epoch 64:   5%|▌         | 4/80 [00:49<12:26,  9.83s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=5.6e-5, train/loss_step=0.00497, global_step=1280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   5%|▌         | 4/80 [00:49<12:26,  9.83s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=3.91e-6, train/loss_step=0.000466, global_step=1280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   6%|▋         | 5/80 [00:49<10:20,  8.28s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=3.91e-6, train/loss_step=0.000466, global_step=1280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   6%|▋         | 5/80 [00:49<10:20,  8.28s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=0.000356, train/loss_step=0.00224, global_step=1281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447] Epoch 64:   8%|▊         | 6/80 [00:50<08:50,  7.16s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=0.000356, train/loss_step=0.00224, global_step=1281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   8%|▊         | 6/80 [00:50<08:50,  7.16s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.63e-6, train/loss_step=0.000389, global_step=1281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   9%|▉         | 7/80 [00:50<07:42,  6.33s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.63e-6, train/loss_step=0.000389, global_step=1281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:   9%|▉         | 7/80 [00:50<07:42,  6.33s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=3.73e-6, train/loss_step=0.000642, global_step=1281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  10%|█         | 8/80 [01:30<12:06, 10.09s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000642, train/loss_vlb_step=3.73e-6, train/loss_step=0.000642, global_step=1281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  10%|█         | 8/80 [01:30<12:06, 10.09s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000101, train/loss_step=0.0145, global_step=1281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]   Epoch 64:  11%|█▏        | 9/80 [01:31<10:48,  9.13s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=0.000101, train/loss_step=0.0145, global_step=1281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  11%|█▏        | 9/80 [01:31<10:48,  9.13s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.39e-6, train/loss_step=0.000325, global_step=1282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  12%|█▎        | 10/80 [01:31<09:44,  8.34s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.39e-6, train/loss_step=0.000325, global_step=1282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  12%|█▎        | 10/80 [01:31<09:44,  8.34s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=4.79e-6, train/loss_step=0.000562, global_step=1282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  14%|█▍        | 11/80 [01:32<08:50,  7.69s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=4.79e-6, train/loss_step=0.000562, global_step=1282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  14%|█▍        | 11/80 [01:32<08:50,  7.69s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000205, train/loss_vlb_step=7.29e-7, train/loss_step=0.000205, global_step=1282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  15%|█▌        | 12/80 [01:32<08:05,  7.14s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000205, train/loss_vlb_step=7.29e-7, train/loss_step=0.000205, global_step=1282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  15%|█▌        | 12/80 [01:32<08:05,  7.14s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000942, train/loss_vlb_step=1.1e-5, train/loss_step=0.000942, global_step=1282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  16%|█▋        | 13/80 [01:33<07:26,  6.67s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000942, train/loss_vlb_step=1.1e-5, train/loss_step=0.000942, global_step=1282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  16%|█▋        | 13/80 [01:33<07:26,  6.67s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.02e-6, train/loss_step=0.000511, global_step=1283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  18%|█▊        | 14/80 [01:33<06:52,  6.25s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.02e-6, train/loss_step=0.000511, global_step=1283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  18%|█▊        | 14/80 [01:33<06:52,  6.25s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=6.58e-6, train/loss_step=0.000637, global_step=1283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  19%|█▉        | 15/80 [01:34<06:23,  5.89s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=6.58e-6, train/loss_step=0.000637, global_step=1283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  19%|█▉        | 15/80 [01:34<06:23,  5.89s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.000922, train/loss_vlb_step=3.48e-6, train/loss_step=0.000922, global_step=1283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  20%|██        | 16/80 [02:01<07:37,  7.14s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.000922, train/loss_vlb_step=3.48e-6, train/loss_step=0.000922, global_step=1283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  20%|██        | 16/80 [02:01<07:37,  7.14s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=4.31e-6, train/loss_step=0.000584, global_step=1283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  21%|██▏       | 17/80 [02:01<07:06,  6.77s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=4.31e-6, train/loss_step=0.000584, global_step=1283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  21%|██▏       | 17/80 [02:01<07:06,  6.77s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=2.67e-5, train/loss_step=0.00147, global_step=1284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  22%|██▎       | 18/80 [02:02<06:39,  6.44s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=2.67e-5, train/loss_step=0.00147, global_step=1284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  22%|██▎       | 18/80 [02:02<06:39,  6.44s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000141, train/loss_step=0.017, global_step=1284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]   Epoch 64:  24%|██▍       | 19/80 [02:02<06:14,  6.15s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000141, train/loss_step=0.017, global_step=1284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  24%|██▍       | 19/80 [02:02<06:14,  6.15s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=1.64e-6, train/loss_step=0.00042, global_step=1284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  25%|██▌       | 20/80 [02:05<05:59,  5.99s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=1.64e-6, train/loss_step=0.00042, global_step=1284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  25%|██▌       | 20/80 [02:05<05:59,  5.99s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=5.97e-5, train/loss_step=0.00218, global_step=1284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  26%|██▋       | 21/80 [02:06<05:38,  5.74s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=5.97e-5, train/loss_step=0.00218, global_step=1284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  26%|██▋       | 21/80 [02:06<05:38,  5.74s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=0.000239, train/loss_step=0.00125, global_step=1285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  28%|██▊       | 22/80 [02:09<05:25,  5.62s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=0.000239, train/loss_step=0.00125, global_step=1285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  28%|██▊       | 22/80 [02:09<05:25,  5.62s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000461, train/loss_vlb_step=3.36e-6, train/loss_step=0.000461, global_step=1285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  29%|██▉       | 23/80 [02:09<05:08,  5.41s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000461, train/loss_vlb_step=3.36e-6, train/loss_step=0.000461, global_step=1285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  29%|██▉       | 23/80 [02:09<05:08,  5.41s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.000157, train/loss_step=0.0232, global_step=1285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]   Epoch 64:  30%|███       | 24/80 [02:32<05:40,  6.08s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.000157, train/loss_step=0.0232, global_step=1285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  30%|███       | 24/80 [02:32<05:40,  6.08s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=1.08e-5, train/loss_step=0.000714, global_step=1285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  31%|███▏      | 25/80 [02:32<05:22,  5.87s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=1.08e-5, train/loss_step=0.000714, global_step=1285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  31%|███▏      | 25/80 [02:32<05:22,  5.87s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.12e-5, train/loss_step=0.00329, global_step=1286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  32%|███▎      | 26/80 [02:39<05:19,  5.91s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.12e-5, train/loss_step=0.00329, global_step=1286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  32%|███▎      | 26/80 [02:39<05:19,  5.91s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=5.96e-6, train/loss_step=0.000701, global_step=1286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  34%|███▍      | 27/80 [02:43<05:08,  5.83s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=5.96e-6, train/loss_step=0.000701, global_step=1286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  34%|███▍      | 27/80 [02:43<05:08,  5.83s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.52e-6, train/loss_step=0.000298, global_step=1286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  35%|███▌      | 28/80 [02:43<04:53,  5.65s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.52e-6, train/loss_step=0.000298, global_step=1286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  35%|███▌      | 28/80 [02:43<04:53,  5.65s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=5.71e-6, train/loss_step=0.00105, global_step=1286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  36%|███▋      | 29/80 [02:44<04:39,  5.48s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=5.71e-6, train/loss_step=0.00105, global_step=1286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  36%|███▋      | 29/80 [02:44<04:39,  5.48s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=9.14e-6, train/loss_step=0.0021, global_step=1287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  38%|███▊      | 30/80 [02:53<04:39,  5.59s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=9.14e-6, train/loss_step=0.0021, global_step=1287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  38%|███▊      | 30/80 [02:53<04:39,  5.59s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.43e-5, train/loss_step=0.0148, global_step=1287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  39%|███▉      | 31/80 [02:53<04:25,  5.43s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.43e-5, train/loss_step=0.0148, global_step=1287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  39%|███▉      | 31/80 [02:53<04:25,  5.43s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=6.39e-6, train/loss_step=0.00131, global_step=1287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  40%|████      | 32/80 [03:18<04:49,  6.02s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=6.39e-6, train/loss_step=0.00131, global_step=1287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  40%|████      | 32/80 [03:18<04:49,  6.02s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=5.13e-5, train/loss_step=0.00927, global_step=1287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  41%|████▏     | 33/80 [03:19<04:35,  5.86s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00927, train/loss_vlb_step=5.13e-5, train/loss_step=0.00927, global_step=1287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  41%|████▏     | 33/80 [03:19<04:35,  5.86s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.00999, train/loss_vlb_step=4.1e-5, train/loss_step=0.00999, global_step=1288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447] Epoch 64:  42%|████▎     | 34/80 [03:19<04:22,  5.71s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.00999, train/loss_vlb_step=4.1e-5, train/loss_step=0.00999, global_step=1288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  42%|████▎     | 34/80 [03:19<04:22,  5.71s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=8.2e-5, train/loss_step=0.00116, global_step=1288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=8.2e-5, train/loss_step=0.00116, global_step=1288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  44%|████▍     | 35/80 [03:40<04:35,  6.12s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.27e-5, train/loss_step=0.00168, global_step=1288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  45%|████▌     | 36/80 [03:40<04:22,  5.97s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.27e-5, train/loss_step=0.00168, global_step=1288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  45%|████▌     | 36/80 [03:40<04:22,  5.97s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000841, train/loss_vlb_step=1.42e-5, train/loss_step=0.000841, global_step=1288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  46%|████▋     | 37/80 [03:41<04:10,  5.82s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000841, train/loss_vlb_step=1.42e-5, train/loss_step=0.000841, global_step=1288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  46%|████▋     | 37/80 [03:41<04:10,  5.82s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000918, train/loss_vlb_step=3.81e-6, train/loss_step=0.000918, global_step=1289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  48%|████▊     | 38/80 [03:44<04:02,  5.76s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000918, train/loss_vlb_step=3.81e-6, train/loss_step=0.000918, global_step=1289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  48%|████▊     | 38/80 [03:44<04:02,  5.76s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=2.44e-5, train/loss_step=0.00101, global_step=1289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  49%|████▉     | 39/80 [03:45<03:50,  5.63s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=2.44e-5, train/loss_step=0.00101, global_step=1289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  49%|████▉     | 39/80 [03:45<03:50,  5.63s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=3.58e-5, train/loss_step=0.00915, global_step=1289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  50%|█████     | 40/80 [03:56<03:50,  5.77s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=3.58e-5, train/loss_step=0.00915, global_step=1289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  50%|█████     | 40/80 [03:56<03:50,  5.77s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=3.93e-6, train/loss_step=0.000564, global_step=1289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  51%|█████▏    | 41/80 [04:02<03:45,  5.78s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=3.93e-6, train/loss_step=0.000564, global_step=1289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  51%|█████▏    | 41/80 [04:02<03:45,  5.78s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.38e-6, train/loss_step=0.000323, global_step=1290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  52%|█████▎    | 42/80 [04:09<03:40,  5.81s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.38e-6, train/loss_step=0.000323, global_step=1290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  52%|█████▎    | 42/80 [04:09<03:40,  5.81s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.77e-5, train/loss_step=0.001, global_step=1290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]      Epoch 64:  54%|█████▍    | 43/80 [04:24<03:42,  6.02s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.77e-5, train/loss_step=0.001, global_step=1290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  54%|█████▍    | 43/80 [04:24<03:42,  6.02s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.15e-5, train/loss_step=0.00334, global_step=1290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  55%|█████▌    | 44/80 [04:25<03:32,  5.90s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.15e-5, train/loss_step=0.00334, global_step=1290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  55%|█████▌    | 44/80 [04:25<03:32,  5.90s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=1.51e-5, train/loss_step=0.00423, global_step=1290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  56%|█████▋    | 45/80 [04:25<03:22,  5.78s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=1.51e-5, train/loss_step=0.00423, global_step=1290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  56%|█████▋    | 45/80 [04:25<03:22,  5.78s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=6.28e-6, train/loss_step=0.000637, global_step=1291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  57%|█████▊    | 46/80 [04:27<03:13,  5.70s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=6.28e-6, train/loss_step=0.000637, global_step=1291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  57%|█████▊    | 46/80 [04:27<03:13,  5.70s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=1.13e-5, train/loss_step=0.00163, global_step=1291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=1.13e-5, train/loss_step=0.00163, global_step=1291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=5.56e-6, train/loss_step=0.0012, global_step=1291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  60%|██████    | 48/80 [04:36<03:00,  5.65s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=5.56e-6, train/loss_step=0.0012, global_step=1291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  60%|██████    | 48/80 [04:36<03:00,  5.65s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.48e-6, train/loss_step=0.000325, global_step=1291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  61%|██████▏   | 49/80 [04:43<02:55,  5.68s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.48e-6, train/loss_step=0.000325, global_step=1291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  61%|██████▏   | 49/80 [04:43<02:55,  5.68s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00048, train/loss_vlb_step=3.42e-6, train/loss_step=0.00048, global_step=1292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  62%|██████▎   | 50/80 [04:59<02:55,  5.87s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00048, train/loss_vlb_step=3.42e-6, train/loss_step=0.00048, global_step=1292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  62%|██████▎   | 50/80 [04:59<02:55,  5.87s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.0126, train/loss_step=0.0256, global_step=1292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]   Epoch 64:  64%|██████▍   | 51/80 [05:08<02:51,  5.93s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.0126, train/loss_step=0.0256, global_step=1292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  64%|██████▍   | 51/80 [05:08<02:51,  5.93s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=3.1e-5, train/loss_step=0.00798, global_step=1292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  65%|██████▌   | 52/80 [05:08<02:43,  5.83s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00798, train/loss_vlb_step=3.1e-5, train/loss_step=0.00798, global_step=1292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  65%|██████▌   | 52/80 [05:08<02:43,  5.83s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=6.56e-6, train/loss_step=0.00162, global_step=1292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=6.56e-6, train/loss_step=0.00162, global_step=1292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=5.94e-5, train/loss_step=0.00147, global_step=1293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  68%|██████▊   | 54/80 [05:13<02:28,  5.70s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=5.94e-5, train/loss_step=0.00147, global_step=1293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  68%|██████▊   | 54/80 [05:13<02:28,  5.70s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=3.97e-6, train/loss_step=0.000847, global_step=1293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  69%|██████▉   | 55/80 [05:13<02:20,  5.60s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=3.97e-6, train/loss_step=0.000847, global_step=1293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  69%|██████▉   | 55/80 [05:13<02:20,  5.60s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=2.11e-5, train/loss_step=0.00326, global_step=1293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  70%|███████   | 56/80 [05:34<02:20,  5.87s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=2.11e-5, train/loss_step=0.00326, global_step=1293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  70%|███████   | 56/80 [05:34<02:20,  5.87s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000457, train/loss_vlb_step=2.96e-6, train/loss_step=0.000457, global_step=1293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  71%|███████▏  | 57/80 [05:34<02:12,  5.77s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000457, train/loss_vlb_step=2.96e-6, train/loss_step=0.000457, global_step=1293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  71%|███████▏  | 57/80 [05:34<02:12,  5.77s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=5.9e-6, train/loss_step=0.00059, global_step=1294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  72%|███████▎  | 58/80 [05:40<02:06,  5.76s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=5.9e-6, train/loss_step=0.00059, global_step=1294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  72%|███████▎  | 58/80 [05:40<02:06,  5.76s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=6.26e-5, train/loss_step=0.00277, global_step=1294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  74%|███████▍  | 59/80 [05:49<02:02,  5.82s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=6.26e-5, train/loss_step=0.00277, global_step=1294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  74%|███████▍  | 59/80 [05:49<02:02,  5.82s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000651, train/loss_vlb_step=3.95e-6, train/loss_step=0.000651, global_step=1294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  75%|███████▌  | 60/80 [05:49<01:54,  5.74s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000651, train/loss_vlb_step=3.95e-6, train/loss_step=0.000651, global_step=1294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  75%|███████▌  | 60/80 [05:49<01:54,  5.74s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=1.97e-5, train/loss_step=0.00523, global_step=1294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  76%|███████▋  | 61/80 [05:50<01:47,  5.65s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=1.97e-5, train/loss_step=0.00523, global_step=1294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  76%|███████▋  | 61/80 [05:50<01:47,  5.65s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=1.26e-6, train/loss_step=0.00029, global_step=1295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  78%|███████▊  | 62/80 [05:57<01:42,  5.68s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=1.26e-6, train/loss_step=0.00029, global_step=1295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  78%|███████▊  | 62/80 [05:57<01:42,  5.68s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=7.1e-7, train/loss_step=0.00017, global_step=1295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447] Epoch 64:  79%|███████▉  | 63/80 [05:58<01:35,  5.60s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=7.1e-7, train/loss_step=0.00017, global_step=1295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  79%|███████▉  | 63/80 [05:58<01:35,  5.60s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=7.31e-6, train/loss_step=0.00162, global_step=1295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  80%|████████  | 64/80 [06:12<01:31,  5.74s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=7.31e-6, train/loss_step=0.00162, global_step=1295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  80%|████████  | 64/80 [06:12<01:31,  5.74s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=1.71e-5, train/loss_step=0.00517, global_step=1295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447] Epoch 64:  81%|████████▏ | 65/80 [06:13<01:24,  5.66s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00517, train/loss_vlb_step=1.71e-5, train/loss_step=0.00517, global_step=1295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  81%|████████▏ | 65/80 [06:13<01:24,  5.66s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.39e-5, train/loss_step=0.00303, global_step=1296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  82%|████████▎ | 66/80 [06:19<01:19,  5.66s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.39e-5, train/loss_step=0.00303, global_step=1296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  82%|████████▎ | 66/80 [06:19<01:19,  5.66s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.23e-5, train/loss_step=0.0034, global_step=1296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  84%|████████▍ | 67/80 [06:26<01:13,  5.68s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.23e-5, train/loss_step=0.0034, global_step=1296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  84%|████████▍ | 67/80 [06:26<01:13,  5.68s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000633, train/loss_vlb_step=5.24e-6, train/loss_step=0.000633, global_step=1296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  85%|████████▌ | 68/80 [06:27<01:07,  5.61s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000633, train/loss_vlb_step=5.24e-6, train/loss_step=0.000633, global_step=1296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  85%|████████▌ | 68/80 [06:27<01:07,  5.61s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=9.53e-7, train/loss_step=0.000201, global_step=1296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=9.53e-7, train/loss_step=0.000201, global_step=1296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  86%|████████▋ | 69/80 [06:27<01:00,  5.54s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000855, train/loss_vlb_step=3.89e-6, train/loss_step=0.000855, global_step=1297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000855, train/loss_vlb_step=3.89e-6, train/loss_step=0.000855, global_step=1297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.27e-5, train/loss_step=0.00347, global_step=1297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  89%|████████▉ | 71/80 [06:43<00:50,  5.60s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.27e-5, train/loss_step=0.00347, global_step=1297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  89%|████████▉ | 71/80 [06:43<00:50,  5.60s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=6.06e-5, train/loss_step=0.0104, global_step=1297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64:  90%|█████████ | 72/80 [06:44<00:44,  5.54s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=6.06e-5, train/loss_step=0.0104, global_step=1297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  90%|█████████ | 72/80 [06:44<00:44,  5.54s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=9.26e-7, train/loss_step=0.000235, global_step=1297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  91%|█████████▏| 73/80 [06:44<00:38,  5.47s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=9.26e-7, train/loss_step=0.000235, global_step=1297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  91%|█████████▏| 73/80 [06:44<00:38,  5.47s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.000926, train/loss_vlb_step=1.48e-5, train/loss_step=0.000926, global_step=1298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  92%|█████████▎| 74/80 [06:48<00:32,  5.44s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.000926, train/loss_vlb_step=1.48e-5, train/loss_step=0.000926, global_step=1298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  92%|█████████▎| 74/80 [06:48<00:32,  5.44s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=6.44e-5, train/loss_step=0.0118, global_step=1298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]    Epoch 64:  94%|█████████▍| 75/80 [06:59<00:27,  5.53s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=6.44e-5, train/loss_step=0.0118, global_step=1298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  94%|█████████▍| 75/80 [06:59<00:27,  5.53s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=3.35e-6, train/loss_step=0.000437, global_step=1298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=3.35e-6, train/loss_step=0.000437, global_step=1298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=0.00188, train/loss_step=0.0204, global_step=1298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]    Epoch 64:  96%|█████████▋| 77/80 [07:00<00:16,  5.40s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=0.00188, train/loss_step=0.0204, global_step=1298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  96%|█████████▋| 77/80 [07:00<00:16,  5.40s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=6.98e-5, train/loss_step=0.00872, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00872, train/loss_vlb_step=6.98e-5, train/loss_step=0.00872, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.35e-6, train/loss_step=0.000312, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  99%|█████████▉| 79/80 [07:11<00:05,  5.40s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.35e-6, train/loss_step=0.000312, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64:  99%|█████████▉| 79/80 [07:11<00:05,  5.40s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=3.18e-5, train/loss_step=0.00864, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 64: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00864, train/loss_vlb_step=3.18e-5, train/loss_step=0.00864, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 64: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.98e-6, train/loss_step=0.00036, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Average Epoch time: 432.50 seconds
+Average Peak memory 29561.98MiB
+Epoch 64:   0%|          | 0/80 [00:00<00:00, 5866.16it/s, loss=0.00405, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.98e-6, train/loss_step=0.00036, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 65:   0%|          | 0/80 [00:00<00:00, 2462.89it/s, loss=0.00405, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.98e-6, train/loss_step=0.00036, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]Epoch 65:   1%|▏         | 1/80 [00:40<26:30, 20.13s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.98e-6, train/loss_step=0.00036, global_step=1299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00447, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00447]  Epoch 65:   1%|▏         | 1/80 [00:40<26:30, 20.13s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=2.1e-6, train/loss_step=0.000442, global_step=1300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   2%|▎         | 2/80 [00:40<17:39, 13.58s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=2.1e-6, train/loss_step=0.000442, global_step=1300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   2%|▎         | 2/80 [00:40<17:39, 13.58s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.39e-5, train/loss_step=0.00361, global_step=1300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:   4%|▍         | 3/80 [00:50<16:08, 12.58s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.39e-5, train/loss_step=0.00361, global_step=1300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   4%|▍         | 3/80 [00:50<16:08, 12.58s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.34e-5, train/loss_step=0.00809, global_step=1300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   5%|▌         | 4/80 [00:50<12:52, 10.17s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00809, train/loss_vlb_step=3.34e-5, train/loss_step=0.00809, global_step=1300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   5%|▌         | 4/80 [00:50<12:52, 10.17s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.05e-6, train/loss_step=0.000296, global_step=1300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   6%|▋         | 5/80 [00:51<10:41,  8.56s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=1.05e-6, train/loss_step=0.000296, global_step=1300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   6%|▋         | 5/80 [00:51<10:41,  8.56s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=3.13e-6, train/loss_step=0.000613, global_step=1301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   8%|▊         | 6/80 [00:51<09:08,  7.41s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000613, train/loss_vlb_step=3.13e-6, train/loss_step=0.000613, global_step=1301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   8%|▊         | 6/80 [00:51<09:08,  7.41s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.51e-5, train/loss_step=0.0028, global_step=1301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]    Epoch 65:   9%|▉         | 7/80 [00:52<07:57,  6.54s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.51e-5, train/loss_step=0.0028, global_step=1301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:   9%|▉         | 7/80 [00:52<07:57,  6.54s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=9.91e-6, train/loss_step=0.00225, global_step=1301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  10%|█         | 8/80 [01:19<10:37,  8.86s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=9.91e-6, train/loss_step=0.00225, global_step=1301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  10%|█         | 8/80 [01:19<10:37,  8.86s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=0.000202, train/loss_step=0.00177, global_step=1301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  11%|█▏        | 9/80 [01:22<09:43,  8.23s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=0.000202, train/loss_step=0.00177, global_step=1301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  11%|█▏        | 9/80 [01:22<09:44,  8.23s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=6.75e-6, train/loss_step=0.00172, global_step=1302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  12%|█▎        | 10/80 [01:22<08:46,  7.52s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=6.75e-6, train/loss_step=0.00172, global_step=1302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  12%|█▎        | 10/80 [01:22<08:46,  7.52s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=0.000125, train/loss_step=0.0212, global_step=1302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  14%|█▍        | 11/80 [01:33<08:58,  7.80s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=0.000125, train/loss_step=0.0212, global_step=1302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  14%|█▍        | 11/80 [01:33<08:58,  7.80s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=1.49e-5, train/loss_step=0.00431, global_step=1302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  15%|█▌        | 12/80 [01:34<08:12,  7.24s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=1.49e-5, train/loss_step=0.00431, global_step=1302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  15%|█▌        | 12/80 [01:34<08:12,  7.24s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=2.75e-5, train/loss_step=0.00656, global_step=1302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  16%|█▋        | 13/80 [01:34<07:33,  6.76s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=2.75e-5, train/loss_step=0.00656, global_step=1302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  16%|█▋        | 13/80 [01:34<07:33,  6.76s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.38e-5, train/loss_step=0.0134, global_step=1303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  18%|█▊        | 14/80 [01:35<06:58,  6.34s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.38e-5, train/loss_step=0.0134, global_step=1303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  18%|█▊        | 14/80 [01:35<06:58,  6.34s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=8.16e-7, train/loss_step=0.000221, global_step=1303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  19%|█▉        | 15/80 [01:35<06:28,  5.98s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=8.16e-7, train/loss_step=0.000221, global_step=1303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  19%|█▉        | 15/80 [01:35<06:28,  5.98s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000252, train/loss_step=0.0192, global_step=1303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]   Epoch 65:  20%|██        | 16/80 [02:08<08:02,  7.54s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000252, train/loss_step=0.0192, global_step=1303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  20%|██        | 16/80 [02:08<08:02,  7.54s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.87e-5, train/loss_step=0.00725, global_step=1303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  21%|██▏       | 17/80 [02:08<07:30,  7.15s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.87e-5, train/loss_step=0.00725, global_step=1303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  21%|██▏       | 17/80 [02:08<07:30,  7.15s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=2.19e-6, train/loss_step=0.00029, global_step=1304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  22%|██▎       | 18/80 [02:09<07:01,  6.80s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=2.19e-6, train/loss_step=0.00029, global_step=1304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  22%|██▎       | 18/80 [02:09<07:01,  6.80s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=0.00129, train/loss_step=0.0206, global_step=1304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  24%|██▍       | 19/80 [02:18<07:01,  6.90s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=0.00129, train/loss_step=0.0206, global_step=1304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  24%|██▍       | 19/80 [02:18<07:01,  6.90s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.33e-6, train/loss_step=0.00239, global_step=1304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  25%|██▌       | 20/80 [02:18<06:35,  6.60s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.33e-6, train/loss_step=0.00239, global_step=1304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  25%|██▌       | 20/80 [02:18<06:35,  6.60s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.000912, train/loss_vlb_step=4.53e-6, train/loss_step=0.000912, global_step=1304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  26%|██▋       | 21/80 [02:19<06:12,  6.32s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.000912, train/loss_vlb_step=4.53e-6, train/loss_step=0.000912, global_step=1304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  26%|██▋       | 21/80 [02:19<06:12,  6.32s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=6.66e-5, train/loss_step=0.0104, global_step=1305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]   Epoch 65:  28%|██▊       | 22/80 [02:19<05:51,  6.07s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=6.66e-5, train/loss_step=0.0104, global_step=1305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  28%|██▊       | 22/80 [02:19<05:51,  6.07s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.06e-6, train/loss_step=0.000253, global_step=1305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  29%|██▉       | 23/80 [02:20<05:32,  5.84s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.06e-6, train/loss_step=0.000253, global_step=1305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  29%|██▉       | 23/80 [02:20<05:32,  5.84s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.28e-5, train/loss_step=0.00359, global_step=1305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]    Epoch 65:  30%|███       | 24/80 [02:51<06:24,  6.87s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00359, train/loss_vlb_step=1.28e-5, train/loss_step=0.00359, global_step=1305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  30%|███       | 24/80 [02:51<06:24,  6.87s/it, loss=0.00611, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=2.74e-5, train/loss_step=0.00244, global_step=1305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  31%|███▏      | 25/80 [02:52<06:04,  6.63s/it, loss=0.00611, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=2.74e-5, train/loss_step=0.00244, global_step=1305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  31%|███▏      | 25/80 [02:52<06:04,  6.63s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.47e-6, train/loss_step=0.0016, global_step=1306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  32%|███▎      | 26/80 [02:52<05:45,  6.40s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.47e-6, train/loss_step=0.0016, global_step=1306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  32%|███▎      | 26/80 [02:52<05:45,  6.40s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.42e-5, train/loss_step=0.00654, global_step=1306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  34%|███▍      | 27/80 [03:08<05:56,  6.72s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.42e-5, train/loss_step=0.00654, global_step=1306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  34%|███▍      | 27/80 [03:08<05:56,  6.72s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.28e-6, train/loss_step=0.000285, global_step=1306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  35%|███▌      | 28/80 [03:08<05:38,  6.50s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.28e-6, train/loss_step=0.000285, global_step=1306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  35%|███▌      | 28/80 [03:08<05:38,  6.50s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=1.54e-5, train/loss_step=0.00445, global_step=1306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  36%|███▋      | 29/80 [03:09<05:21,  6.31s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=1.54e-5, train/loss_step=0.00445, global_step=1306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  36%|███▋      | 29/80 [03:09<05:21,  6.31s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=1.4e-6, train/loss_step=0.000341, global_step=1307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  38%|███▊      | 30/80 [03:09<05:05,  6.12s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=1.4e-6, train/loss_step=0.000341, global_step=1307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  38%|███▊      | 30/80 [03:09<05:05,  6.12s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=9.38e-5, train/loss_step=0.0196, global_step=1307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]   Epoch 65:  39%|███▉      | 31/80 [03:10<04:51,  5.94s/it, loss=0.00623, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=9.38e-5, train/loss_step=0.0196, global_step=1307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  39%|███▉      | 31/80 [03:10<04:51,  5.94s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000346, train/loss_step=0.0205, global_step=1307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  40%|████      | 32/80 [03:33<05:10,  6.46s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000346, train/loss_step=0.0205, global_step=1307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  40%|████      | 32/80 [03:33<05:10,  6.46s/it, loss=0.00739, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=0.000126, train/loss_step=0.0135, global_step=1307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  41%|████▏     | 33/80 [03:33<04:55,  6.29s/it, loss=0.00739, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=0.000126, train/loss_step=0.0135, global_step=1307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  41%|████▏     | 33/80 [03:33<04:55,  6.29s/it, loss=0.00713, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=3.17e-5, train/loss_step=0.0082, global_step=1308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  42%|████▎     | 34/80 [03:34<04:41,  6.12s/it, loss=0.00713, v_num=0, train/loss_simple_step=0.0082, train/loss_vlb_step=3.17e-5, train/loss_step=0.0082, global_step=1308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  42%|████▎     | 34/80 [03:34<04:41,  6.12s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=0.000888, train/loss_step=0.00368, global_step=1308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  44%|████▍     | 35/80 [03:53<04:52,  6.50s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=0.000888, train/loss_step=0.00368, global_step=1308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  44%|████▍     | 35/80 [03:53<04:52,  6.50s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=5.11e-6, train/loss_step=0.000505, global_step=1308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  45%|████▌     | 36/80 [03:54<04:38,  6.34s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=5.11e-6, train/loss_step=0.000505, global_step=1308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  45%|████▌     | 36/80 [03:54<04:38,  6.34s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.36e-5, train/loss_step=0.00994, global_step=1308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]   Epoch 65:  46%|████▋     | 37/80 [03:55<04:25,  6.18s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.36e-5, train/loss_step=0.00994, global_step=1308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  46%|████▋     | 37/80 [03:55<04:25,  6.18s/it, loss=0.00687, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=4.63e-5, train/loss_step=0.00763, global_step=1309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  48%|████▊     | 38/80 [03:55<04:13,  6.04s/it, loss=0.00687, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=4.63e-5, train/loss_step=0.00763, global_step=1309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  48%|████▊     | 38/80 [03:55<04:13,  6.04s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=3.31e-5, train/loss_step=0.00862, global_step=1309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  49%|████▉     | 39/80 [03:55<04:01,  5.90s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00862, train/loss_vlb_step=3.31e-5, train/loss_step=0.00862, global_step=1309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  49%|████▉     | 39/80 [03:55<04:01,  5.90s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=8.48e-6, train/loss_step=0.00148, global_step=1309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  50%|█████     | 40/80 [04:23<04:16,  6.42s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=8.48e-6, train/loss_step=0.00148, global_step=1309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  50%|█████     | 40/80 [04:23<04:16,  6.42s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.000905, train/loss_vlb_step=4.15e-6, train/loss_step=0.000905, global_step=1309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  51%|█████▏    | 41/80 [04:23<04:04,  6.28s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.000905, train/loss_vlb_step=4.15e-6, train/loss_step=0.000905, global_step=1309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  51%|█████▏    | 41/80 [04:23<04:04,  6.28s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000648, train/loss_vlb_step=7.3e-6, train/loss_step=0.000648, global_step=1310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  52%|█████▎    | 42/80 [04:24<03:53,  6.15s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000648, train/loss_vlb_step=7.3e-6, train/loss_step=0.000648, global_step=1310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  52%|█████▎    | 42/80 [04:24<03:53,  6.15s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=1.94e-5, train/loss_step=0.00476, global_step=1310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  54%|█████▍    | 43/80 [04:38<03:54,  6.33s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=1.94e-5, train/loss_step=0.00476, global_step=1310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  54%|█████▍    | 43/80 [04:38<03:54,  6.33s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=2.4e-5, train/loss_step=0.00627, global_step=1310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  55%|█████▌    | 44/80 [04:38<03:43,  6.20s/it, loss=0.0061, v_num=0, train/loss_simple_step=0.00627, train/loss_vlb_step=2.4e-5, train/loss_step=0.00627, global_step=1310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  55%|█████▌    | 44/80 [04:38<03:43,  6.20s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=7.58e-6, train/loss_step=0.00215, global_step=1310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  56%|█████▋    | 45/80 [04:39<03:32,  6.07s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=7.58e-6, train/loss_step=0.00215, global_step=1310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  56%|█████▋    | 45/80 [04:39<03:32,  6.07s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.23e-5, train/loss_step=0.0117, global_step=1311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  57%|█████▊    | 46/80 [04:39<03:22,  5.96s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.23e-5, train/loss_step=0.0117, global_step=1311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  57%|█████▊    | 46/80 [04:39<03:22,  5.96s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.8e-5, train/loss_step=0.00314, global_step=1311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  59%|█████▉    | 47/80 [04:40<03:12,  5.84s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.8e-5, train/loss_step=0.00314, global_step=1311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  59%|█████▉    | 47/80 [04:40<03:12,  5.84s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=3.59e-6, train/loss_step=0.000732, global_step=1311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  60%|██████    | 48/80 [05:07<03:20,  6.27s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=3.59e-6, train/loss_step=0.000732, global_step=1311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  60%|██████    | 48/80 [05:07<03:20,  6.27s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.13e-6, train/loss_step=0.000411, global_step=1311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.13e-6, train/loss_step=0.000411, global_step=1311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.62e-6, train/loss_step=0.000351, global_step=1312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  62%|██████▎   | 50/80 [05:08<03:01,  6.04s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.62e-6, train/loss_step=0.000351, global_step=1312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  62%|██████▎   | 50/80 [05:08<03:01,  6.04s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.02e-5, train/loss_step=0.00392, global_step=1312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  64%|██████▍   | 51/80 [05:23<03:00,  6.22s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.02e-5, train/loss_step=0.00392, global_step=1312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  64%|██████▍   | 51/80 [05:23<03:00,  6.22s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.19e-5, train/loss_step=0.00352, global_step=1312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  65%|██████▌   | 52/80 [05:24<02:51,  6.12s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.19e-5, train/loss_step=0.00352, global_step=1312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  65%|██████▌   | 52/80 [05:24<02:51,  6.12s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=6.4e-6, train/loss_step=0.00152, global_step=1312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  66%|██████▋   | 53/80 [05:24<02:42,  6.01s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=6.4e-6, train/loss_step=0.00152, global_step=1312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  66%|██████▋   | 53/80 [05:24<02:42,  6.01s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000838, train/loss_vlb_step=4.51e-6, train/loss_step=0.000838, global_step=1313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  68%|██████▊   | 54/80 [05:25<02:33,  5.91s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000838, train/loss_vlb_step=4.51e-6, train/loss_step=0.000838, global_step=1313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  68%|██████▊   | 54/80 [05:25<02:33,  5.91s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=1.56e-5, train/loss_step=0.00471, global_step=1313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  69%|██████▉   | 55/80 [05:25<02:25,  5.81s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=1.56e-5, train/loss_step=0.00471, global_step=1313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  69%|██████▉   | 55/80 [05:25<02:25,  5.81s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=8.29e-7, train/loss_step=0.000208, global_step=1313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  70%|███████   | 56/80 [05:45<02:25,  6.06s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=8.29e-7, train/loss_step=0.000208, global_step=1313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  70%|███████   | 56/80 [05:45<02:25,  6.06s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=1.53e-6, train/loss_step=0.000374, global_step=1313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  71%|███████▏  | 57/80 [05:45<02:17,  5.96s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=1.53e-6, train/loss_step=0.000374, global_step=1313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  71%|███████▏  | 57/80 [05:45<02:17,  5.96s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000512, train/loss_vlb_step=1.17e-5, train/loss_step=0.000512, global_step=1314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  72%|███████▎  | 58/80 [05:46<02:09,  5.87s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000512, train/loss_vlb_step=1.17e-5, train/loss_step=0.000512, global_step=1314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  72%|███████▎  | 58/80 [05:46<02:09,  5.87s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=1.86e-5, train/loss_step=0.00533, global_step=1314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  74%|███████▍  | 59/80 [05:58<02:05,  5.98s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.00533, train/loss_vlb_step=1.86e-5, train/loss_step=0.00533, global_step=1314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  74%|███████▍  | 59/80 [05:58<02:05,  5.98s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.5e-6, train/loss_step=0.00028, global_step=1314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.5e-6, train/loss_step=0.00028, global_step=1314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.09e-5, train/loss_step=0.00508, global_step=1314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  76%|███████▋  | 61/80 [05:59<01:50,  5.80s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=2.09e-5, train/loss_step=0.00508, global_step=1314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  76%|███████▋  | 61/80 [05:59<01:50,  5.80s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=6.34e-7, train/loss_step=0.00015, global_step=1315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  78%|███████▊  | 62/80 [06:00<01:42,  5.72s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=6.34e-7, train/loss_step=0.00015, global_step=1315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  78%|███████▊  | 62/80 [06:00<01:42,  5.72s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2e-5, train/loss_step=0.00578, global_step=1315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  79%|███████▉  | 63/80 [06:00<01:35,  5.64s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2e-5, train/loss_step=0.00578, global_step=1315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  79%|███████▉  | 63/80 [06:00<01:35,  5.64s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=2.26e-5, train/loss_step=0.00622, global_step=1315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  80%|████████  | 64/80 [06:33<01:36,  6.05s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=2.26e-5, train/loss_step=0.00622, global_step=1315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  80%|████████  | 64/80 [06:33<01:36,  6.05s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000512, train/loss_step=0.0251, global_step=1315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]   Epoch 65:  81%|████████▏ | 65/80 [06:33<01:29,  5.97s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0251, train/loss_vlb_step=0.000512, train/loss_step=0.0251, global_step=1315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  81%|████████▏ | 65/80 [06:33<01:29,  5.97s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=5.31e-6, train/loss_step=0.000847, global_step=1316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  82%|████████▎ | 66/80 [06:34<01:22,  5.89s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000847, train/loss_vlb_step=5.31e-6, train/loss_step=0.000847, global_step=1316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  82%|████████▎ | 66/80 [06:34<01:22,  5.89s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000597, train/loss_vlb_step=2.76e-6, train/loss_step=0.000597, global_step=1316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  84%|████████▍ | 67/80 [06:45<01:17,  5.96s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000597, train/loss_vlb_step=2.76e-6, train/loss_step=0.000597, global_step=1316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  84%|████████▍ | 67/80 [06:45<01:17,  5.96s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000309, train/loss_vlb_step=1.28e-6, train/loss_step=0.000309, global_step=1316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  85%|████████▌ | 68/80 [06:45<01:10,  5.88s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000309, train/loss_vlb_step=1.28e-6, train/loss_step=0.000309, global_step=1316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  85%|████████▌ | 68/80 [06:45<01:10,  5.88s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.34e-6, train/loss_step=0.00103, global_step=1316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  86%|████████▋ | 69/80 [06:46<01:03,  5.81s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.34e-6, train/loss_step=0.00103, global_step=1316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  86%|████████▋ | 69/80 [06:46<01:03,  5.81s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000219, train/loss_vlb_step=1.39e-6, train/loss_step=0.000219, global_step=1317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  88%|████████▊ | 70/80 [06:46<00:57,  5.73s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000219, train/loss_vlb_step=1.39e-6, train/loss_step=0.000219, global_step=1317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  88%|████████▊ | 70/80 [06:46<00:57,  5.73s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.15e-6, train/loss_step=0.000273, global_step=1317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  89%|████████▉ | 71/80 [06:47<00:50,  5.66s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.15e-6, train/loss_step=0.000273, global_step=1317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  89%|████████▉ | 71/80 [06:47<00:50,  5.66s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=4.96e-6, train/loss_step=0.000514, global_step=1317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  90%|█████████ | 72/80 [07:09<00:47,  5.88s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=4.96e-6, train/loss_step=0.000514, global_step=1317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  90%|█████████ | 72/80 [07:09<00:47,  5.88s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2e-5, train/loss_step=0.00521, global_step=1317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]   Epoch 65:  91%|█████████▏| 73/80 [07:09<00:40,  5.81s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2e-5, train/loss_step=0.00521, global_step=1317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  91%|█████████▏| 73/80 [07:09<00:40,  5.81s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.21e-6, train/loss_step=0.000452, global_step=1318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  92%|█████████▎| 74/80 [07:10<00:34,  5.74s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.21e-6, train/loss_step=0.000452, global_step=1318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  92%|█████████▎| 74/80 [07:10<00:34,  5.74s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=3.59e-6, train/loss_step=0.000357, global_step=1318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  94%|█████████▍| 75/80 [07:15<00:28,  5.73s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=3.59e-6, train/loss_step=0.000357, global_step=1318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  94%|█████████▍| 75/80 [07:15<00:28,  5.73s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=7.12e-6, train/loss_step=0.00129, global_step=1318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]    Epoch 65:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=7.12e-6, train/loss_step=0.00129, global_step=1318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.46e-5, train/loss_step=0.00151, global_step=1318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.46e-5, train/loss_step=0.00151, global_step=1318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=8.19e-5, train/loss_step=0.0117, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 65:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=8.19e-5, train/loss_step=0.0117, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1e-5, train/loss_step=0.00276, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416] Epoch 65:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1e-5, train/loss_step=0.00276, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00953, train/loss_vlb_step=6.08e-5, train/loss_step=0.00953, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00953, train/loss_vlb_step=6.08e-5, train/loss_step=0.00953, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 65: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=1.65e-6, train/loss_step=0.000482, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Average Epoch time: 438.17 seconds
+Average Peak memory 29562.11MiB
+Epoch 65:   0%|          | 0/80 [00:00<00:00, 2906.66it/s, loss=0.00372, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=1.65e-6, train/loss_step=0.000482, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 66:   0%|          | 0/80 [00:00<00:00, 1410.80it/s, loss=0.00372, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=1.65e-6, train/loss_step=0.000482, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]Epoch 66:   1%|▏         | 1/80 [00:44<29:26, 22.36s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=1.65e-6, train/loss_step=0.000482, global_step=1319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00416, train/loss_vlb_epoch=0.00013, train/loss_epoch=0.00416]  Epoch 66:   1%|▏         | 1/80 [00:44<29:26, 22.36s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=1.62e-6, train/loss_step=0.000368, global_step=1320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:   2%|▎         | 2/80 [00:45<19:34, 15.06s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=1.62e-6, train/loss_step=0.000368, global_step=1320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:   2%|▎         | 2/80 [00:45<19:34, 15.06s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=8.61e-6, train/loss_step=0.00194, global_step=1320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:   4%|▍         | 3/80 [00:45<14:39, 11.42s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=8.61e-6, train/loss_step=0.00194, global_step=1320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:   4%|▍         | 3/80 [00:45<14:39, 11.42s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=4.31e-6, train/loss_step=0.000803, global_step=1320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:   5%|▌         | 4/80 [00:46<11:42,  9.24s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000803, train/loss_vlb_step=4.31e-6, train/loss_step=0.000803, global_step=1320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:   5%|▌         | 4/80 [00:46<11:42,  9.24s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=1.57e-5, train/loss_step=0.00415, global_step=1320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:   6%|▋         | 5/80 [00:46<09:44,  7.79s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=1.57e-5, train/loss_step=0.00415, global_step=1320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:   6%|▋         | 5/80 [00:46<09:44,  7.79s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000483, train/loss_vlb_step=2.88e-6, train/loss_step=0.000483, global_step=1321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:   8%|▊         | 6/80 [00:47<08:19,  6.74s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000483, train/loss_vlb_step=2.88e-6, train/loss_step=0.000483, global_step=1321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:   8%|▊         | 6/80 [00:47<08:19,  6.74s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.08e-5, train/loss_step=0.0115, global_step=1321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]   Epoch 66:   9%|▉         | 7/80 [00:47<07:15,  5.96s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.08e-5, train/loss_step=0.0115, global_step=1321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:   9%|▉         | 7/80 [00:47<07:15,  5.96s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=2.51e-5, train/loss_step=0.00286, global_step=1321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  10%|█         | 8/80 [01:19<10:38,  8.87s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=2.51e-5, train/loss_step=0.00286, global_step=1321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  10%|█         | 8/80 [01:19<10:38,  8.87s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=3.98e-5, train/loss_step=0.00867, global_step=1321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  11%|█▏        | 9/80 [01:25<10:10,  8.59s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00867, train/loss_vlb_step=3.98e-5, train/loss_step=0.00867, global_step=1321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  11%|█▏        | 9/80 [01:25<10:10,  8.59s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.4e-5, train/loss_step=0.00363, global_step=1322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  12%|█▎        | 10/80 [01:26<09:09,  7.86s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.4e-5, train/loss_step=0.00363, global_step=1322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  12%|█▎        | 10/80 [01:26<09:09,  7.86s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=0.000279, train/loss_step=0.00153, global_step=1322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  14%|█▍        | 11/80 [01:26<08:19,  7.24s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=0.000279, train/loss_step=0.00153, global_step=1322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  14%|█▍        | 11/80 [01:26<08:19,  7.24s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.2e-5, train/loss_step=0.00282, global_step=1322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]   Epoch 66:  15%|█▌        | 12/80 [01:27<07:37,  6.73s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.2e-5, train/loss_step=0.00282, global_step=1322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  15%|█▌        | 12/80 [01:27<07:37,  6.73s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.32e-6, train/loss_step=0.000426, global_step=1322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  16%|█▋        | 13/80 [01:27<07:00,  6.28s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.32e-6, train/loss_step=0.000426, global_step=1322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  16%|█▋        | 13/80 [01:27<07:00,  6.28s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=0.000537, train/loss_step=0.0228, global_step=1323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]   Epoch 66:  18%|█▊        | 14/80 [01:32<06:45,  6.14s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.0228, train/loss_vlb_step=0.000537, train/loss_step=0.0228, global_step=1323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  18%|█▊        | 14/80 [01:32<06:45,  6.14s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.39e-5, train/loss_step=0.00384, global_step=1323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  19%|█▉        | 15/80 [01:32<06:15,  5.78s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00384, train/loss_vlb_step=1.39e-5, train/loss_step=0.00384, global_step=1323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  19%|█▉        | 15/80 [01:32<06:15,  5.78s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=1.41e-5, train/loss_step=0.00424, global_step=1323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  20%|██        | 16/80 [02:04<07:49,  7.34s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=1.41e-5, train/loss_step=0.00424, global_step=1323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  20%|██        | 16/80 [02:04<07:49,  7.34s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.21e-5, train/loss_step=0.00275, global_step=1323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  21%|██▏       | 17/80 [02:10<07:36,  7.25s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=1.21e-5, train/loss_step=0.00275, global_step=1323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  21%|██▏       | 17/80 [02:10<07:36,  7.25s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=5e-5, train/loss_step=0.00853, global_step=1324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]   Epoch 66:  22%|██▎       | 18/80 [02:10<07:07,  6.89s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=5e-5, train/loss_step=0.00853, global_step=1324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  22%|██▎       | 18/80 [02:10<07:07,  6.89s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=3.73e-5, train/loss_step=0.00733, global_step=1324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  24%|██▍       | 19/80 [02:11<06:40,  6.57s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=3.73e-5, train/loss_step=0.00733, global_step=1324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  24%|██▍       | 19/80 [02:11<06:40,  6.57s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=2.36e-6, train/loss_step=0.00041, global_step=1324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  25%|██▌       | 20/80 [02:11<06:17,  6.29s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=2.36e-6, train/loss_step=0.00041, global_step=1324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  25%|██▌       | 20/80 [02:11<06:17,  6.29s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.21e-5, train/loss_step=0.00498, global_step=1324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  26%|██▋       | 21/80 [02:12<05:55,  6.02s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.21e-5, train/loss_step=0.00498, global_step=1324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  26%|██▋       | 21/80 [02:12<05:55,  6.02s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=4.41e-5, train/loss_step=0.00551, global_step=1325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  28%|██▊       | 22/80 [02:13<05:35,  5.78s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=4.41e-5, train/loss_step=0.00551, global_step=1325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  28%|██▊       | 22/80 [02:13<05:35,  5.78s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=3.12e-5, train/loss_step=0.00897, global_step=1325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  29%|██▉       | 23/80 [02:13<05:17,  5.57s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=3.12e-5, train/loss_step=0.00897, global_step=1325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  29%|██▉       | 23/80 [02:13<05:17,  5.57s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.14e-6, train/loss_step=0.000242, global_step=1325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  30%|███       | 24/80 [02:31<05:40,  6.07s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.14e-6, train/loss_step=0.000242, global_step=1325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  30%|███       | 24/80 [02:31<05:40,  6.07s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=6.73e-6, train/loss_step=0.00181, global_step=1325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  31%|███▏      | 25/80 [02:52<06:05,  6.64s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=6.73e-6, train/loss_step=0.00181, global_step=1325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  31%|███▏      | 25/80 [02:52<06:05,  6.64s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=2.61e-5, train/loss_step=0.00718, global_step=1326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  32%|███▎      | 26/80 [02:53<05:46,  6.41s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00718, train/loss_vlb_step=2.61e-5, train/loss_step=0.00718, global_step=1326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  32%|███▎      | 26/80 [02:53<05:46,  6.41s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=9.94e-6, train/loss_step=0.00148, global_step=1326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  34%|███▍      | 27/80 [02:53<05:28,  6.20s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=9.94e-6, train/loss_step=0.00148, global_step=1326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  34%|███▍      | 27/80 [02:53<05:28,  6.20s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.1e-6, train/loss_step=0.00211, global_step=1326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  35%|███▌      | 28/80 [02:54<05:12,  6.00s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.1e-6, train/loss_step=0.00211, global_step=1326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  35%|███▌      | 28/80 [02:54<05:12,  6.00s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.00258, train/loss_step=0.0277, global_step=1326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  36%|███▋      | 29/80 [02:54<04:56,  5.82s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.0277, train/loss_vlb_step=0.00258, train/loss_step=0.0277, global_step=1326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  36%|███▋      | 29/80 [02:54<04:56,  5.82s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=1.95e-5, train/loss_step=0.00545, global_step=1327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  38%|███▊      | 30/80 [02:55<04:42,  5.65s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=1.95e-5, train/loss_step=0.00545, global_step=1327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  38%|███▊      | 30/80 [02:55<04:42,  5.65s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.000937, train/loss_vlb_step=4.33e-6, train/loss_step=0.000937, global_step=1327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  39%|███▉      | 31/80 [03:08<04:48,  5.89s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.000937, train/loss_vlb_step=4.33e-6, train/loss_step=0.000937, global_step=1327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  39%|███▉      | 31/80 [03:08<04:48,  5.89s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=7.13e-6, train/loss_step=0.00192, global_step=1327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  40%|████      | 32/80 [03:10<04:36,  5.77s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=7.13e-6, train/loss_step=0.00192, global_step=1327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  40%|████      | 32/80 [03:10<04:36,  5.77s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=5.72e-5, train/loss_step=0.0094, global_step=1327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  41%|████▏     | 33/80 [03:31<04:51,  6.21s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.0094, train/loss_vlb_step=5.72e-5, train/loss_step=0.0094, global_step=1327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  41%|████▏     | 33/80 [03:31<04:51,  6.21s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.05e-5, train/loss_step=0.00282, global_step=1328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  42%|████▎     | 34/80 [03:31<04:38,  6.05s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.05e-5, train/loss_step=0.00282, global_step=1328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  42%|████▎     | 34/80 [03:31<04:38,  6.05s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000504, train/loss_vlb_step=6.52e-6, train/loss_step=0.000504, global_step=1328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  44%|████▍     | 35/80 [03:32<04:25,  5.89s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000504, train/loss_vlb_step=6.52e-6, train/loss_step=0.000504, global_step=1328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  44%|████▍     | 35/80 [03:32<04:25,  5.89s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.52e-6, train/loss_step=0.00119, global_step=1328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  45%|████▌     | 36/80 [03:32<04:12,  5.75s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.52e-6, train/loss_step=0.00119, global_step=1328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  45%|████▌     | 36/80 [03:32<04:12,  5.75s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=7e-6, train/loss_step=0.00165, global_step=1328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]   Epoch 66:  46%|████▋     | 37/80 [03:33<04:01,  5.61s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=7e-6, train/loss_step=0.00165, global_step=1328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  46%|████▋     | 37/80 [03:33<04:01,  5.61s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=8.8e-6, train/loss_step=0.000462, global_step=1329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  48%|████▊     | 38/80 [03:37<03:53,  5.57s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=8.8e-6, train/loss_step=0.000462, global_step=1329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  48%|████▊     | 38/80 [03:37<03:53,  5.57s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.78e-5, train/loss_step=0.00154, global_step=1329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  49%|████▉     | 39/80 [04:01<04:07,  6.03s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=9.78e-5, train/loss_step=0.00154, global_step=1329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  49%|████▉     | 39/80 [04:01<04:07,  6.03s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000807, train/loss_vlb_step=4.76e-6, train/loss_step=0.000807, global_step=1329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  50%|█████     | 40/80 [04:01<03:55,  5.90s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000807, train/loss_vlb_step=4.76e-6, train/loss_step=0.000807, global_step=1329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  50%|█████     | 40/80 [04:01<03:55,  5.90s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=3.73e-6, train/loss_step=0.000632, global_step=1329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  51%|█████▏    | 41/80 [04:18<04:00,  6.16s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=3.73e-6, train/loss_step=0.000632, global_step=1329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  51%|█████▏    | 41/80 [04:18<04:00,  6.16s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=2.91e-6, train/loss_step=0.000438, global_step=1330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  52%|█████▎    | 42/80 [04:19<03:49,  6.03s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=2.91e-6, train/loss_step=0.000438, global_step=1330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  52%|█████▎    | 42/80 [04:19<03:49,  6.03s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.53e-6, train/loss_step=0.000345, global_step=1330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  54%|█████▍    | 43/80 [04:19<03:38,  5.91s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.53e-6, train/loss_step=0.000345, global_step=1330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  54%|█████▍    | 43/80 [04:19<03:38,  5.91s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000281, train/loss_vlb_step=1.76e-6, train/loss_step=0.000281, global_step=1330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  55%|█████▌    | 44/80 [04:20<03:28,  5.79s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000281, train/loss_vlb_step=1.76e-6, train/loss_step=0.000281, global_step=1330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  55%|█████▌    | 44/80 [04:20<03:28,  5.79s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=3.99e-5, train/loss_step=0.0099, global_step=1330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]    Epoch 66:  56%|█████▋    | 45/80 [04:21<03:18,  5.68s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0099, train/loss_vlb_step=3.99e-5, train/loss_step=0.0099, global_step=1330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  56%|█████▋    | 45/80 [04:21<03:18,  5.68s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=6.34e-5, train/loss_step=0.00983, global_step=1331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00983, train/loss_vlb_step=6.34e-5, train/loss_step=0.00983, global_step=1331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  57%|█████▊    | 46/80 [04:29<03:15,  5.74s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.3e-5, train/loss_step=0.00357, global_step=1331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  59%|█████▉    | 47/80 [04:47<03:17,  5.99s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.3e-5, train/loss_step=0.00357, global_step=1331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  59%|█████▉    | 47/80 [04:47<03:17,  5.99s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=8.4e-6, train/loss_step=0.0018, global_step=1331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  60%|██████    | 48/80 [04:48<03:08,  5.88s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=8.4e-6, train/loss_step=0.0018, global_step=1331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  60%|██████    | 48/80 [04:48<03:08,  5.88s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.45e-5, train/loss_step=0.00906, global_step=1331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  61%|██████▏   | 49/80 [05:00<03:06,  6.02s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=4.45e-5, train/loss_step=0.00906, global_step=1331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  61%|██████▏   | 49/80 [05:00<03:06,  6.02s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.06e-6, train/loss_step=0.000271, global_step=1332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  62%|██████▎   | 50/80 [05:01<02:57,  5.91s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.06e-6, train/loss_step=0.000271, global_step=1332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  62%|██████▎   | 50/80 [05:01<02:57,  5.91s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=8.74e-5, train/loss_step=0.0149, global_step=1332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]    Epoch 66:  64%|██████▍   | 51/80 [05:01<02:48,  5.80s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=8.74e-5, train/loss_step=0.0149, global_step=1332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  64%|██████▍   | 51/80 [05:01<02:48,  5.80s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=3.33e-6, train/loss_step=0.000893, global_step=1332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  65%|██████▌   | 52/80 [05:02<02:39,  5.71s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=3.33e-6, train/loss_step=0.000893, global_step=1332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  65%|██████▌   | 52/80 [05:02<02:39,  5.71s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=9.44e-6, train/loss_step=0.00253, global_step=1332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  66%|██████▋   | 53/80 [05:02<02:31,  5.61s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00253, train/loss_vlb_step=9.44e-6, train/loss_step=0.00253, global_step=1332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  66%|██████▋   | 53/80 [05:02<02:31,  5.61s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=1.28e-5, train/loss_step=0.0038, global_step=1333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  68%|██████▊   | 54/80 [05:08<02:26,  5.62s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=1.28e-5, train/loss_step=0.0038, global_step=1333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  68%|██████▊   | 54/80 [05:08<02:26,  5.62s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=3.09e-6, train/loss_step=0.000378, global_step=1333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  69%|██████▉   | 55/80 [05:22<02:23,  5.75s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=3.09e-6, train/loss_step=0.000378, global_step=1333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  69%|██████▉   | 55/80 [05:22<02:23,  5.75s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=3.6e-5, train/loss_step=0.00815, global_step=1333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]   Epoch 66:  70%|███████   | 56/80 [05:22<02:15,  5.66s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=3.6e-5, train/loss_step=0.00815, global_step=1333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  70%|███████   | 56/80 [05:22<02:15,  5.66s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000771, train/loss_vlb_step=3.66e-6, train/loss_step=0.000771, global_step=1333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  71%|███████▏  | 57/80 [05:51<02:19,  6.06s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000771, train/loss_vlb_step=3.66e-6, train/loss_step=0.000771, global_step=1333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  71%|███████▏  | 57/80 [05:51<02:19,  6.06s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.2e-6, train/loss_step=0.001, global_step=1334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]       Epoch 66:  72%|███████▎  | 58/80 [05:51<02:11,  5.96s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.2e-6, train/loss_step=0.001, global_step=1334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  72%|███████▎  | 58/80 [05:51<02:11,  5.96s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000644, train/loss_vlb_step=2.99e-6, train/loss_step=0.000644, global_step=1334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  74%|███████▍  | 59/80 [05:52<02:03,  5.87s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000644, train/loss_vlb_step=2.99e-6, train/loss_step=0.000644, global_step=1334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  74%|███████▍  | 59/80 [05:52<02:03,  5.87s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.23e-5, train/loss_step=0.00353, global_step=1334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  75%|███████▌  | 60/80 [05:52<01:55,  5.79s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.23e-5, train/loss_step=0.00353, global_step=1334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  75%|███████▌  | 60/80 [05:52<01:55,  5.79s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=4.74e-6, train/loss_step=0.000945, global_step=1334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=4.74e-6, train/loss_step=0.000945, global_step=1334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.09e-5, train/loss_step=0.010, global_step=1335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]      Epoch 66:  78%|███████▊  | 62/80 [05:54<01:41,  5.62s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=4.09e-5, train/loss_step=0.010, global_step=1335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  78%|███████▊  | 62/80 [05:54<01:41,  5.62s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=2.16e-6, train/loss_step=0.000561, global_step=1335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  79%|███████▉  | 63/80 [05:57<01:34,  5.59s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=2.16e-6, train/loss_step=0.000561, global_step=1335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  79%|███████▉  | 63/80 [05:57<01:34,  5.59s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.88e-5, train/loss_step=0.00609, global_step=1335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  80%|████████  | 64/80 [05:58<01:28,  5.51s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.88e-5, train/loss_step=0.00609, global_step=1335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  80%|████████  | 64/80 [05:58<01:28,  5.51s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000814, train/loss_vlb_step=6.95e-6, train/loss_step=0.000814, global_step=1335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  81%|████████▏ | 65/80 [06:43<01:31,  6.12s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000814, train/loss_vlb_step=6.95e-6, train/loss_step=0.000814, global_step=1335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  81%|████████▏ | 65/80 [06:43<01:31,  6.12s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=3.74e-5, train/loss_step=0.00248, global_step=1336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  82%|████████▎ | 66/80 [06:44<01:24,  6.04s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=3.74e-5, train/loss_step=0.00248, global_step=1336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  82%|████████▎ | 66/80 [06:44<01:24,  6.04s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000118, train/loss_vlb_step=4.24e-7, train/loss_step=0.000118, global_step=1336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  84%|████████▍ | 67/80 [06:44<01:17,  5.95s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000118, train/loss_vlb_step=4.24e-7, train/loss_step=0.000118, global_step=1336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  84%|████████▍ | 67/80 [06:44<01:17,  5.95s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=8.38e-6, train/loss_step=0.00215, global_step=1336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  85%|████████▌ | 68/80 [06:45<01:10,  5.88s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=8.38e-6, train/loss_step=0.00215, global_step=1336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  85%|████████▌ | 68/80 [06:45<01:10,  5.88s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=9.45e-7, train/loss_step=0.000167, global_step=1336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  86%|████████▋ | 69/80 [06:45<01:03,  5.80s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=9.45e-7, train/loss_step=0.000167, global_step=1336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  86%|████████▋ | 69/80 [06:45<01:03,  5.80s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=6.01e-6, train/loss_step=0.00128, global_step=1337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 66:  88%|████████▊ | 70/80 [06:46<00:57,  5.72s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=6.01e-6, train/loss_step=0.00128, global_step=1337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  88%|████████▊ | 70/80 [06:46<00:57,  5.72s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=2.06e-5, train/loss_step=0.00232, global_step=1337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  89%|████████▉ | 71/80 [06:46<00:50,  5.65s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=2.06e-5, train/loss_step=0.00232, global_step=1337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  89%|████████▉ | 71/80 [06:46<00:50,  5.65s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=2.48e-6, train/loss_step=0.000456, global_step=1337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  90%|█████████ | 72/80 [06:47<00:44,  5.58s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=2.48e-6, train/loss_step=0.000456, global_step=1337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  90%|█████████ | 72/80 [06:47<00:44,  5.58s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=2.68e-6, train/loss_step=0.000297, global_step=1337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  91%|█████████▏| 73/80 [07:12<00:40,  5.85s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=2.68e-6, train/loss_step=0.000297, global_step=1337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  91%|█████████▏| 73/80 [07:12<00:40,  5.85s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.84e-5, train/loss_step=0.00503, global_step=1338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  92%|█████████▎| 74/80 [07:13<00:34,  5.78s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.84e-5, train/loss_step=0.00503, global_step=1338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  92%|█████████▎| 74/80 [07:13<00:34,  5.78s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=0.000742, train/loss_step=0.00226, global_step=1338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  94%|█████████▍| 75/80 [07:13<00:28,  5.71s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=0.000742, train/loss_step=0.00226, global_step=1338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  94%|█████████▍| 75/80 [07:13<00:28,  5.71s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=0.00125, train/loss_step=0.00614, global_step=1338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407] Epoch 66:  95%|█████████▌| 76/80 [07:14<00:22,  5.64s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=0.00125, train/loss_step=0.00614, global_step=1338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  95%|█████████▌| 76/80 [07:14<00:22,  5.64s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=1.76e-6, train/loss_step=0.000365, global_step=1338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  96%|█████████▋| 77/80 [07:14<00:16,  5.58s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=1.76e-6, train/loss_step=0.000365, global_step=1338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  96%|█████████▋| 77/80 [07:14<00:16,  5.58s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000248, train/loss_step=0.0188, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]   Epoch 66:  98%|█████████▊| 78/80 [07:15<00:11,  5.51s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000248, train/loss_step=0.0188, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  98%|█████████▊| 78/80 [07:15<00:11,  5.51s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.18e-5, train/loss_step=0.00342, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  99%|█████████▉| 79/80 [07:15<00:05,  5.45s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=1.18e-5, train/loss_step=0.00342, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66:  99%|█████████▉| 79/80 [07:15<00:05,  5.45s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=3.95e-5, train/loss_step=0.000566, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=3.95e-5, train/loss_step=0.000566, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 66: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=1.13e-6, train/loss_step=0.000294, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Average Epoch time: 436.33 seconds
+Average Peak memory 29563.62MiB
+Epoch 66:   0%|          | 0/80 [00:00<00:00, 4144.57it/s, loss=0.00318, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=1.13e-6, train/loss_step=0.000294, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 67:   0%|          | 0/80 [00:00<00:00, 1753.47it/s, loss=0.00318, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=1.13e-6, train/loss_step=0.000294, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]Epoch 67:   1%|▏         | 1/80 [00:38<25:13, 19.16s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=1.13e-6, train/loss_step=0.000294, global_step=1339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00407, train/loss_vlb_epoch=8.86e-5, train/loss_epoch=0.00407]  Epoch 67:   1%|▏         | 1/80 [00:38<25:13, 19.16s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=2.36e-5, train/loss_step=0.00713, global_step=1340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]   Epoch 67:   2%|▎         | 2/80 [00:38<16:48, 12.93s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00713, train/loss_vlb_step=2.36e-5, train/loss_step=0.00713, global_step=1340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:   2%|▎         | 2/80 [00:38<16:48, 12.93s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.22e-5, train/loss_step=0.0122, global_step=1340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:   4%|▍         | 3/80 [00:40<12:57, 10.10s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.22e-5, train/loss_step=0.0122, global_step=1340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:   4%|▍         | 3/80 [00:40<12:57, 10.10s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.48e-5, train/loss_step=0.00687, global_step=1340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:   5%|▌         | 4/80 [00:42<10:40,  8.42s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.48e-5, train/loss_step=0.00687, global_step=1340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:   5%|▌         | 4/80 [00:42<10:40,  8.42s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=2.68e-5, train/loss_step=0.00707, global_step=1340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:   6%|▋         | 5/80 [00:42<08:52,  7.10s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=2.68e-5, train/loss_step=0.00707, global_step=1340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:   6%|▋         | 5/80 [00:42<08:52,  7.10s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=9.02e-6, train/loss_step=0.0022, global_step=1341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:   8%|▊         | 6/80 [00:46<08:08,  6.60s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=9.02e-6, train/loss_step=0.0022, global_step=1341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:   8%|▊         | 6/80 [00:46<08:08,  6.60s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.35e-5, train/loss_step=0.00165, global_step=1341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:   9%|▉         | 7/80 [00:46<07:06,  5.84s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.35e-5, train/loss_step=0.00165, global_step=1341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:   9%|▉         | 7/80 [00:46<07:06,  5.84s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=1.57e-5, train/loss_step=0.00463, global_step=1341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  10%|█         | 8/80 [01:22<10:58,  9.15s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00463, train/loss_vlb_step=1.57e-5, train/loss_step=0.00463, global_step=1341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  10%|█         | 8/80 [01:22<10:58,  9.15s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000739, train/loss_vlb_step=8.14e-5, train/loss_step=0.000739, global_step=1341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  11%|█▏        | 9/80 [01:22<09:49,  8.30s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000739, train/loss_vlb_step=8.14e-5, train/loss_step=0.000739, global_step=1341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  11%|█▏        | 9/80 [01:22<09:49,  8.30s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000159, train/loss_vlb_step=5.82e-7, train/loss_step=0.000159, global_step=1342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  12%|█▎        | 10/80 [01:23<08:51,  7.59s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000159, train/loss_vlb_step=5.82e-7, train/loss_step=0.000159, global_step=1342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  12%|█▎        | 10/80 [01:23<08:51,  7.59s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.57e-5, train/loss_step=0.00323, global_step=1342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  14%|█▍        | 11/80 [01:23<08:02,  7.00s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.57e-5, train/loss_step=0.00323, global_step=1342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  14%|█▍        | 11/80 [01:23<08:02,  7.00s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=8.3e-7, train/loss_step=0.000213, global_step=1342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  15%|█▌        | 12/80 [01:29<07:50,  6.91s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=8.3e-7, train/loss_step=0.000213, global_step=1342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  15%|█▌        | 12/80 [01:29<07:50,  6.91s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=6.87e-7, train/loss_step=0.000171, global_step=1342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=6.87e-7, train/loss_step=0.000171, global_step=1342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.27e-6, train/loss_step=0.000324, global_step=1343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  18%|█▊        | 14/80 [01:31<06:40,  6.07s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.27e-6, train/loss_step=0.000324, global_step=1343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  18%|█▊        | 14/80 [01:31<06:40,  6.07s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000973, train/loss_vlb_step=4.14e-6, train/loss_step=0.000973, global_step=1343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  19%|█▉        | 15/80 [01:31<06:11,  5.72s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000973, train/loss_vlb_step=4.14e-6, train/loss_step=0.000973, global_step=1343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  19%|█▉        | 15/80 [01:31<06:11,  5.72s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=1.75e-5, train/loss_step=0.00509, global_step=1343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  20%|██        | 16/80 [01:57<07:21,  6.90s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=1.75e-5, train/loss_step=0.00509, global_step=1343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  20%|██        | 16/80 [01:57<07:21,  6.90s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.65e-5, train/loss_step=0.00448, global_step=1343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  21%|██▏       | 17/80 [02:07<07:26,  7.09s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.65e-5, train/loss_step=0.00448, global_step=1343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  21%|██▏       | 17/80 [02:07<07:26,  7.09s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000242, train/loss_step=0.0133, global_step=1344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383] Epoch 67:  22%|██▎       | 18/80 [02:08<06:57,  6.74s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000242, train/loss_step=0.0133, global_step=1344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  22%|██▎       | 18/80 [02:08<06:57,  6.74s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.5e-5, train/loss_step=0.00173, global_step=1344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  24%|██▍       | 19/80 [02:08<06:32,  6.43s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.5e-5, train/loss_step=0.00173, global_step=1344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  24%|██▍       | 19/80 [02:08<06:32,  6.43s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=2.02e-5, train/loss_step=0.00321, global_step=1344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  25%|██▌       | 20/80 [02:09<06:09,  6.15s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=2.02e-5, train/loss_step=0.00321, global_step=1344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  25%|██▌       | 20/80 [02:09<06:09,  6.15s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=2.66e-5, train/loss_step=0.00617, global_step=1344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  26%|██▋       | 21/80 [02:09<05:48,  5.90s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=2.66e-5, train/loss_step=0.00617, global_step=1344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  26%|██▋       | 21/80 [02:09<05:48,  5.90s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=7.76e-6, train/loss_step=0.000437, global_step=1345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  28%|██▊       | 22/80 [02:10<05:29,  5.68s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=7.76e-6, train/loss_step=0.000437, global_step=1345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  28%|██▊       | 22/80 [02:10<05:29,  5.68s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000539, train/loss_vlb_step=2.57e-6, train/loss_step=0.000539, global_step=1345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  29%|██▉       | 23/80 [02:11<05:11,  5.47s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000539, train/loss_vlb_step=2.57e-6, train/loss_step=0.000539, global_step=1345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  29%|██▉       | 23/80 [02:11<05:11,  5.47s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=2.72e-6, train/loss_step=0.000472, global_step=1345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  30%|███       | 24/80 [02:27<05:30,  5.91s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=2.72e-6, train/loss_step=0.000472, global_step=1345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  30%|███       | 24/80 [02:27<05:30,  5.91s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=6.09e-5, train/loss_step=0.0118, global_step=1345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]    Epoch 67:  31%|███▏      | 25/80 [02:56<06:13,  6.79s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=6.09e-5, train/loss_step=0.0118, global_step=1345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  31%|███▏      | 25/80 [02:56<06:13,  6.79s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.71e-5, train/loss_step=0.0036, global_step=1346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  32%|███▎      | 26/80 [02:57<05:54,  6.56s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.71e-5, train/loss_step=0.0036, global_step=1346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  32%|███▎      | 26/80 [02:57<05:54,  6.56s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=5.13e-5, train/loss_step=0.00836, global_step=1346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  34%|███▍      | 27/80 [02:57<05:36,  6.34s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00836, train/loss_vlb_step=5.13e-5, train/loss_step=0.00836, global_step=1346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  34%|███▍      | 27/80 [02:57<05:36,  6.34s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=1.47e-5, train/loss_step=0.00411, global_step=1346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  35%|███▌      | 28/80 [02:58<05:19,  6.14s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=1.47e-5, train/loss_step=0.00411, global_step=1346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  35%|███▌      | 28/80 [02:58<05:19,  6.14s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=2.8e-5, train/loss_step=0.0063, global_step=1346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]   Epoch 67:  36%|███▋      | 29/80 [02:58<05:03,  5.96s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0063, train/loss_vlb_step=2.8e-5, train/loss_step=0.0063, global_step=1346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  36%|███▋      | 29/80 [02:58<05:03,  5.96s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.53e-6, train/loss_step=0.000315, global_step=1347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  38%|███▊      | 30/80 [02:59<04:48,  5.78s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.53e-6, train/loss_step=0.000315, global_step=1347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  38%|███▊      | 30/80 [02:59<04:48,  5.78s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=1.86e-5, train/loss_step=0.00542, global_step=1347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  39%|███▉      | 31/80 [02:59<04:35,  5.61s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=1.86e-5, train/loss_step=0.00542, global_step=1347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  39%|███▉      | 31/80 [02:59<04:35,  5.61s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=3.24e-6, train/loss_step=0.00061, global_step=1347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  40%|████      | 32/80 [03:06<04:31,  5.66s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00061, train/loss_vlb_step=3.24e-6, train/loss_step=0.00061, global_step=1347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  40%|████      | 32/80 [03:06<04:31,  5.66s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.00051, train/loss_step=0.0197, global_step=1347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  41%|████▏     | 33/80 [03:37<05:00,  6.40s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.00051, train/loss_step=0.0197, global_step=1347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  41%|████▏     | 33/80 [03:37<05:00,  6.40s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=1.11e-6, train/loss_step=0.000233, global_step=1348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  42%|████▎     | 34/80 [03:38<04:46,  6.23s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=1.11e-6, train/loss_step=0.000233, global_step=1348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  42%|████▎     | 34/80 [03:38<04:46,  6.23s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000596, train/loss_vlb_step=2.61e-6, train/loss_step=0.000596, global_step=1348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  44%|████▍     | 35/80 [03:38<04:33,  6.07s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000596, train/loss_vlb_step=2.61e-6, train/loss_step=0.000596, global_step=1348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  44%|████▍     | 35/80 [03:38<04:33,  6.07s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000703, train/loss_vlb_step=3.02e-5, train/loss_step=0.000703, global_step=1348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  45%|████▌     | 36/80 [03:39<04:20,  5.92s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000703, train/loss_vlb_step=3.02e-5, train/loss_step=0.000703, global_step=1348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  45%|████▌     | 36/80 [03:39<04:20,  5.92s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=6.09e-5, train/loss_step=0.011, global_step=1348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]      Epoch 67:  46%|████▋     | 37/80 [03:40<04:09,  5.80s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=6.09e-5, train/loss_step=0.011, global_step=1348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  46%|████▋     | 37/80 [03:40<04:09,  5.80s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.88e-5, train/loss_step=0.0029, global_step=1349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  48%|████▊     | 38/80 [03:40<03:57,  5.66s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.88e-5, train/loss_step=0.0029, global_step=1349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  48%|████▊     | 38/80 [03:40<03:57,  5.66s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000715, train/loss_vlb_step=2.56e-6, train/loss_step=0.000715, global_step=1349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  49%|████▉     | 39/80 [03:41<03:46,  5.53s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000715, train/loss_vlb_step=2.56e-6, train/loss_step=0.000715, global_step=1349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  49%|████▉     | 39/80 [03:41<03:46,  5.53s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00073, train/loss_vlb_step=3.3e-6, train/loss_step=0.00073, global_step=1349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]   Epoch 67:  50%|█████     | 40/80 [03:47<03:41,  5.55s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00073, train/loss_vlb_step=3.3e-6, train/loss_step=0.00073, global_step=1349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  50%|█████     | 40/80 [03:47<03:41,  5.55s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=6.13e-6, train/loss_step=0.00171, global_step=1349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  51%|█████▏    | 41/80 [04:18<03:59,  6.15s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=6.13e-6, train/loss_step=0.00171, global_step=1349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  51%|█████▏    | 41/80 [04:18<03:59,  6.15s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=1.93e-5, train/loss_step=0.00541, global_step=1350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  52%|█████▎    | 42/80 [04:18<03:48,  6.02s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00541, train/loss_vlb_step=1.93e-5, train/loss_step=0.00541, global_step=1350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  52%|█████▎    | 42/80 [04:18<03:48,  6.02s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.02e-6, train/loss_step=0.000252, global_step=1350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  54%|█████▍    | 43/80 [04:19<03:38,  5.89s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.02e-6, train/loss_step=0.000252, global_step=1350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  54%|█████▍    | 43/80 [04:19<03:38,  5.89s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=8.1e-6, train/loss_step=0.00102, global_step=1350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]   Epoch 67:  55%|█████▌    | 44/80 [04:19<03:27,  5.78s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=8.1e-6, train/loss_step=0.00102, global_step=1350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  55%|█████▌    | 44/80 [04:19<03:27,  5.78s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000504, train/loss_step=0.0224, global_step=1350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383] Epoch 67:  56%|█████▋    | 45/80 [04:20<03:18,  5.66s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.0224, train/loss_vlb_step=0.000504, train/loss_step=0.0224, global_step=1350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  56%|█████▋    | 45/80 [04:20<03:18,  5.66s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=4.34e-5, train/loss_step=0.00829, global_step=1351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  57%|█████▊    | 46/80 [04:20<03:08,  5.55s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00829, train/loss_vlb_step=4.34e-5, train/loss_step=0.00829, global_step=1351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  57%|█████▊    | 46/80 [04:20<03:08,  5.55s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=4.01e-6, train/loss_step=0.000833, global_step=1351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  59%|█████▉    | 47/80 [04:21<02:59,  5.45s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=4.01e-6, train/loss_step=0.000833, global_step=1351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  59%|█████▉    | 47/80 [04:21<02:59,  5.45s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=2.68e-5, train/loss_step=0.00717, global_step=1351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  60%|██████    | 48/80 [04:35<02:59,  5.62s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00717, train/loss_vlb_step=2.68e-5, train/loss_step=0.00717, global_step=1351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  60%|██████    | 48/80 [04:35<02:59,  5.62s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=1.81e-5, train/loss_step=0.00516, global_step=1351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  61%|██████▏   | 49/80 [04:58<03:05,  5.97s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00516, train/loss_vlb_step=1.81e-5, train/loss_step=0.00516, global_step=1351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  61%|██████▏   | 49/80 [04:58<03:05,  5.97s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000177, train/loss_vlb_step=7.06e-7, train/loss_step=0.000177, global_step=1352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  62%|██████▎   | 50/80 [04:59<02:55,  5.87s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000177, train/loss_vlb_step=7.06e-7, train/loss_step=0.000177, global_step=1352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  62%|██████▎   | 50/80 [04:59<02:55,  5.87s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.56e-5, train/loss_step=0.0039, global_step=1352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]    Epoch 67:  64%|██████▍   | 51/80 [04:59<02:47,  5.76s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.0039, train/loss_vlb_step=2.56e-5, train/loss_step=0.0039, global_step=1352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  64%|██████▍   | 51/80 [04:59<02:47,  5.76s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.79e-6, train/loss_step=0.00033, global_step=1352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  65%|██████▌   | 52/80 [05:00<02:38,  5.67s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.79e-6, train/loss_step=0.00033, global_step=1352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  65%|██████▌   | 52/80 [05:00<02:38,  5.67s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=1.67e-5, train/loss_step=0.0047, global_step=1352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  66%|██████▋   | 53/80 [05:00<02:30,  5.57s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=1.67e-5, train/loss_step=0.0047, global_step=1352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  66%|██████▋   | 53/80 [05:00<02:30,  5.57s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000328, train/loss_vlb_step=5.13e-6, train/loss_step=0.000328, global_step=1353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  68%|██████▊   | 54/80 [05:01<02:22,  5.48s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000328, train/loss_vlb_step=5.13e-6, train/loss_step=0.000328, global_step=1353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  68%|██████▊   | 54/80 [05:01<02:22,  5.48s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.15e-5, train/loss_step=0.0107, global_step=1353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]    Epoch 67:  69%|██████▉   | 55/80 [05:01<02:14,  5.39s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.15e-5, train/loss_step=0.0107, global_step=1353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  69%|██████▉   | 55/80 [05:01<02:14,  5.39s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=5.76e-5, train/loss_step=0.00815, global_step=1353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  70%|███████   | 56/80 [05:27<02:17,  5.74s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00815, train/loss_vlb_step=5.76e-5, train/loss_step=0.00815, global_step=1353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  70%|███████   | 56/80 [05:27<02:17,  5.74s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.29e-5, train/loss_step=0.00365, global_step=1353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  71%|███████▏  | 57/80 [05:35<02:13,  5.79s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=1.29e-5, train/loss_step=0.00365, global_step=1353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  71%|███████▏  | 57/80 [05:35<02:13,  5.79s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.41e-5, train/loss_step=0.0139, global_step=1354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  72%|███████▎  | 58/80 [05:36<02:05,  5.70s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.41e-5, train/loss_step=0.0139, global_step=1354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  72%|███████▎  | 58/80 [05:36<02:05,  5.70s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=5.69e-5, train/loss_step=0.00858, global_step=1354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  74%|███████▍  | 59/80 [05:36<01:57,  5.61s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=5.69e-5, train/loss_step=0.00858, global_step=1354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  74%|███████▍  | 59/80 [05:36<01:57,  5.61s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.00077, train/loss_vlb_step=2.07e-5, train/loss_step=0.00077, global_step=1354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  75%|███████▌  | 60/80 [05:37<01:50,  5.54s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.00077, train/loss_vlb_step=2.07e-5, train/loss_step=0.00077, global_step=1354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  75%|███████▌  | 60/80 [05:37<01:50,  5.54s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=6.9e-6, train/loss_step=0.00185, global_step=1354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383] Epoch 67:  76%|███████▋  | 61/80 [05:38<01:43,  5.45s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=6.9e-6, train/loss_step=0.00185, global_step=1354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  76%|███████▋  | 61/80 [05:38<01:43,  5.45s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000848, train/loss_vlb_step=4.87e-6, train/loss_step=0.000848, global_step=1355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  78%|███████▊  | 62/80 [05:38<01:36,  5.38s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000848, train/loss_vlb_step=4.87e-6, train/loss_step=0.000848, global_step=1355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  78%|███████▊  | 62/80 [05:38<01:36,  5.38s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.000556, train/loss_vlb_step=3.02e-6, train/loss_step=0.000556, global_step=1355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  79%|███████▉  | 63/80 [05:39<01:30,  5.30s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.000556, train/loss_vlb_step=3.02e-6, train/loss_step=0.000556, global_step=1355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  79%|███████▉  | 63/80 [05:39<01:30,  5.30s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=0.000624, train/loss_step=0.00186, global_step=1355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383] Epoch 67:  80%|████████  | 64/80 [06:07<01:30,  5.66s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=0.000624, train/loss_step=0.00186, global_step=1355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  80%|████████  | 64/80 [06:07<01:30,  5.66s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=1.71e-6, train/loss_step=0.00042, global_step=1355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383] Epoch 67:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=1.71e-6, train/loss_step=0.00042, global_step=1355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=1.69e-6, train/loss_step=0.000412, global_step=1356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=1.69e-6, train/loss_step=0.000412, global_step=1356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.66e-5, train/loss_step=0.00783, global_step=1356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  84%|████████▍ | 67/80 [06:24<01:13,  5.65s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=3.66e-5, train/loss_step=0.00783, global_step=1356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  84%|████████▍ | 67/80 [06:24<01:13,  5.65s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.01e-6, train/loss_step=0.000242, global_step=1356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  85%|████████▌ | 68/80 [06:25<01:06,  5.58s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.01e-6, train/loss_step=0.000242, global_step=1356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  85%|████████▌ | 68/80 [06:25<01:06,  5.58s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.35e-5, train/loss_step=0.00844, global_step=1356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  86%|████████▋ | 69/80 [06:25<01:00,  5.51s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.35e-5, train/loss_step=0.00844, global_step=1356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  86%|████████▋ | 69/80 [06:25<01:00,  5.51s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=2.29e-6, train/loss_step=0.000533, global_step=1357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  88%|████████▊ | 70/80 [06:26<00:54,  5.44s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=2.29e-6, train/loss_step=0.000533, global_step=1357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  88%|████████▊ | 70/80 [06:26<00:54,  5.44s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000478, train/loss_vlb_step=4.18e-6, train/loss_step=0.000478, global_step=1357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  89%|████████▉ | 71/80 [06:26<00:48,  5.37s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000478, train/loss_vlb_step=4.18e-6, train/loss_step=0.000478, global_step=1357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  89%|████████▉ | 71/80 [06:26<00:48,  5.37s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.6e-5, train/loss_step=0.0072, global_step=1357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]     Epoch 67:  90%|█████████ | 72/80 [06:47<00:44,  5.58s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=3.6e-5, train/loss_step=0.0072, global_step=1357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  90%|█████████ | 72/80 [06:47<00:44,  5.58s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000184, train/loss_vlb_step=8.21e-7, train/loss_step=0.000184, global_step=1357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  91%|█████████▏| 73/80 [06:59<00:39,  5.67s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000184, train/loss_vlb_step=8.21e-7, train/loss_step=0.000184, global_step=1357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  91%|█████████▏| 73/80 [06:59<00:39,  5.67s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=1.65e-5, train/loss_step=0.00488, global_step=1358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 67:  92%|█████████▎| 74/80 [07:00<00:33,  5.60s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=1.65e-5, train/loss_step=0.00488, global_step=1358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  92%|█████████▎| 74/80 [07:00<00:33,  5.60s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=9.33e-6, train/loss_step=0.00126, global_step=1358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383] Epoch 67:  94%|█████████▍| 75/80 [07:00<00:27,  5.53s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=9.33e-6, train/loss_step=0.00126, global_step=1358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  94%|█████████▍| 75/80 [07:00<00:27,  5.53s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000609, train/loss_vlb_step=2.96e-6, train/loss_step=0.000609, global_step=1358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  95%|█████████▌| 76/80 [07:01<00:21,  5.47s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000609, train/loss_vlb_step=2.96e-6, train/loss_step=0.000609, global_step=1358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  95%|█████████▌| 76/80 [07:01<00:21,  5.47s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=1.77e-5, train/loss_step=0.00518, global_step=1358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]   Epoch 67:  96%|█████████▋| 77/80 [07:01<00:16,  5.41s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00518, train/loss_vlb_step=1.77e-5, train/loss_step=0.00518, global_step=1358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  96%|█████████▋| 77/80 [07:01<00:16,  5.41s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.43e-5, train/loss_step=0.0111, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383] Epoch 67:  98%|█████████▊| 78/80 [07:02<00:10,  5.34s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.43e-5, train/loss_step=0.0111, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  98%|█████████▊| 78/80 [07:02<00:10,  5.34s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.91e-5, train/loss_step=0.0026, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  99%|█████████▉| 79/80 [07:02<00:05,  5.28s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.91e-5, train/loss_step=0.0026, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67:  99%|█████████▉| 79/80 [07:02<00:05,  5.28s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.94e-6, train/loss_step=0.00041, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67: 100%|██████████| 80/80 [07:03<00:00,  5.22s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.94e-6, train/loss_step=0.00041, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 67: 100%|██████████| 80/80 [07:03<00:00,  5.22s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=7.73e-6, train/loss_step=0.000714, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Average Epoch time: 423.15 seconds
+Average Peak memory 29563.10MiB
+Epoch 67:   0%|          | 0/80 [00:00<00:00, 4148.67it/s, loss=0.00278, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=7.73e-6, train/loss_step=0.000714, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 68:   0%|          | 0/80 [00:00<00:00, 1828.38it/s, loss=0.00278, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=7.73e-6, train/loss_step=0.000714, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]Epoch 68:   1%|▏         | 1/80 [00:38<25:12, 19.14s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=7.73e-6, train/loss_step=0.000714, global_step=1359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00383, train/loss_vlb_epoch=6.2e-5, train/loss_epoch=0.00383]  Epoch 68:   1%|▏         | 1/80 [00:38<25:12, 19.14s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=2.92e-5, train/loss_step=0.00838, global_step=1360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381] Epoch 68:   2%|▎         | 2/80 [00:38<16:47, 12.92s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=2.92e-5, train/loss_step=0.00838, global_step=1360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:   2%|▎         | 2/80 [00:38<16:47, 12.92s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=1.99e-6, train/loss_step=0.000413, global_step=1360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:   4%|▍         | 3/80 [00:49<15:54, 12.39s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=1.99e-6, train/loss_step=0.000413, global_step=1360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:   4%|▍         | 3/80 [00:49<15:54, 12.39s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=3.11e-5, train/loss_step=0.00542, global_step=1360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:   5%|▌         | 4/80 [00:51<12:57, 10.23s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=3.11e-5, train/loss_step=0.00542, global_step=1360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:   5%|▌         | 4/80 [00:51<12:57, 10.23s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=3.24e-5, train/loss_step=0.00232, global_step=1360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:   6%|▋         | 5/80 [00:51<10:46,  8.61s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=3.24e-5, train/loss_step=0.00232, global_step=1360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:   6%|▋         | 5/80 [00:51<10:46,  8.61s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=0.000555, train/loss_step=0.0198, global_step=1361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:   8%|▊         | 6/80 [00:52<09:11,  7.45s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=0.000555, train/loss_step=0.0198, global_step=1361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:   8%|▊         | 6/80 [00:52<09:11,  7.45s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=2.32e-5, train/loss_step=0.000749, global_step=1361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:   9%|▉         | 7/80 [00:52<08:00,  6.58s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=2.32e-5, train/loss_step=0.000749, global_step=1361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:   9%|▉         | 7/80 [00:52<08:00,  6.58s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=2.45e-5, train/loss_step=0.00101, global_step=1361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:  10%|█         | 8/80 [01:14<09:55,  8.27s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=2.45e-5, train/loss_step=0.00101, global_step=1361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  10%|█         | 8/80 [01:14<09:55,  8.27s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=5.28e-5, train/loss_step=0.00948, global_step=1361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  11%|█▏        | 9/80 [01:14<08:52,  7.50s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=5.28e-5, train/loss_step=0.00948, global_step=1361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  11%|█▏        | 9/80 [01:14<08:52,  7.50s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=2.35e-6, train/loss_step=0.000349, global_step=1362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  12%|█▎        | 10/80 [01:15<08:01,  6.88s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=2.35e-6, train/loss_step=0.000349, global_step=1362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  12%|█▎        | 10/80 [01:15<08:01,  6.88s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=2.72e-6, train/loss_step=0.000424, global_step=1362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  14%|█▍        | 11/80 [01:34<09:03,  7.87s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=2.72e-6, train/loss_step=0.000424, global_step=1362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  14%|█▍        | 11/80 [01:34<09:03,  7.87s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.62e-5, train/loss_step=0.00391, global_step=1362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:  15%|█▌        | 12/80 [01:35<08:16,  7.31s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.62e-5, train/loss_step=0.00391, global_step=1362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  15%|█▌        | 12/80 [01:35<08:16,  7.31s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.9e-5, train/loss_step=0.00452, global_step=1362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381] Epoch 68:  16%|█▋        | 13/80 [01:35<07:37,  6.82s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.9e-5, train/loss_step=0.00452, global_step=1362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  16%|█▋        | 13/80 [01:35<07:37,  6.82s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=6.61e-5, train/loss_step=0.00495, global_step=1363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  18%|█▊        | 14/80 [01:36<07:02,  6.40s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=6.61e-5, train/loss_step=0.00495, global_step=1363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  18%|█▊        | 14/80 [01:36<07:02,  6.40s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.96e-6, train/loss_step=0.000416, global_step=1363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  19%|█▉        | 15/80 [01:36<06:32,  6.03s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.96e-6, train/loss_step=0.000416, global_step=1363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  19%|█▉        | 15/80 [01:36<06:32,  6.03s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=3.26e-5, train/loss_step=0.00333, global_step=1363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:  20%|██        | 16/80 [01:48<06:49,  6.40s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=3.26e-5, train/loss_step=0.00333, global_step=1363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  20%|██        | 16/80 [01:48<06:49,  6.40s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=3.92e-6, train/loss_step=0.000336, global_step=1363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  21%|██▏       | 17/80 [01:49<06:22,  6.08s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=3.92e-6, train/loss_step=0.000336, global_step=1363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  21%|██▏       | 17/80 [01:49<06:22,  6.08s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=4.33e-5, train/loss_step=0.0129, global_step=1364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]    Epoch 68:  22%|██▎       | 18/80 [02:08<06:59,  6.77s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=4.33e-5, train/loss_step=0.0129, global_step=1364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  22%|██▎       | 18/80 [02:08<06:59,  6.77s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.00182, train/loss_step=0.0182, global_step=1364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381] Epoch 68:  24%|██▍       | 19/80 [02:11<06:40,  6.56s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.00182, train/loss_step=0.0182, global_step=1364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  24%|██▍       | 19/80 [02:11<06:40,  6.56s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.1e-5, train/loss_step=0.00316, global_step=1364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  25%|██▌       | 20/80 [02:11<06:16,  6.27s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.1e-5, train/loss_step=0.00316, global_step=1364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  25%|██▌       | 20/80 [02:11<06:16,  6.27s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=7.52e-6, train/loss_step=0.00123, global_step=1364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  26%|██▋       | 21/80 [02:12<05:54,  6.01s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=7.52e-6, train/loss_step=0.00123, global_step=1364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  26%|██▋       | 21/80 [02:12<05:54,  6.01s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=7.93e-5, train/loss_step=0.00819, global_step=1365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  28%|██▊       | 22/80 [02:12<05:34,  5.77s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00819, train/loss_vlb_step=7.93e-5, train/loss_step=0.00819, global_step=1365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  28%|██▊       | 22/80 [02:12<05:34,  5.77s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=6.94e-5, train/loss_step=0.00913, global_step=1365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  29%|██▉       | 23/80 [02:13<05:16,  5.55s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00913, train/loss_vlb_step=6.94e-5, train/loss_step=0.00913, global_step=1365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  29%|██▉       | 23/80 [02:13<05:16,  5.55s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=6.76e-6, train/loss_step=0.0014, global_step=1365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:  30%|███       | 24/80 [02:33<05:43,  6.13s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=6.76e-6, train/loss_step=0.0014, global_step=1365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  30%|███       | 24/80 [02:33<05:43,  6.13s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000657, train/loss_vlb_step=3.11e-6, train/loss_step=0.000657, global_step=1365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  31%|███▏      | 25/80 [02:33<05:25,  5.91s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000657, train/loss_vlb_step=3.11e-6, train/loss_step=0.000657, global_step=1365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  31%|███▏      | 25/80 [02:33<05:25,  5.91s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.52e-5, train/loss_step=0.00458, global_step=1366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:  32%|███▎      | 26/80 [02:54<05:48,  6.45s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.52e-5, train/loss_step=0.00458, global_step=1366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  32%|███▎      | 26/80 [02:54<05:48,  6.45s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.42e-6, train/loss_step=0.000454, global_step=1366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  34%|███▍      | 27/80 [02:55<05:31,  6.26s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=2.42e-6, train/loss_step=0.000454, global_step=1366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  34%|███▍      | 27/80 [02:55<05:31,  6.26s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=2.14e-5, train/loss_step=0.000631, global_step=1366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  35%|███▌      | 28/80 [02:55<05:15,  6.06s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=2.14e-5, train/loss_step=0.000631, global_step=1366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  35%|███▌      | 28/80 [02:55<05:15,  6.06s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00904, train/loss_vlb_step=3.5e-5, train/loss_step=0.00904, global_step=1366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]   Epoch 68:  36%|███▋      | 29/80 [02:56<05:00,  5.89s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00904, train/loss_vlb_step=3.5e-5, train/loss_step=0.00904, global_step=1366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  36%|███▋      | 29/80 [02:56<05:00,  5.89s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.00011, train/loss_step=0.017, global_step=1367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]   Epoch 68:  38%|███▊      | 30/80 [02:57<04:45,  5.71s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.00011, train/loss_step=0.017, global_step=1367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  38%|███▊      | 30/80 [02:57<04:45,  5.71s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.76e-5, train/loss_step=0.00512, global_step=1367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  39%|███▉      | 31/80 [02:57<04:31,  5.55s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.76e-5, train/loss_step=0.00512, global_step=1367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  39%|███▉      | 31/80 [02:57<04:31,  5.55s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.000901, train/loss_vlb_step=4e-6, train/loss_step=0.000901, global_step=1367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381] Epoch 68:  40%|████      | 32/80 [03:11<04:38,  5.81s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.000901, train/loss_vlb_step=4e-6, train/loss_step=0.000901, global_step=1367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  40%|████      | 32/80 [03:11<04:38,  5.81s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=3.8e-6, train/loss_step=0.000456, global_step=1367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  41%|████▏     | 33/80 [03:15<04:29,  5.74s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=3.8e-6, train/loss_step=0.000456, global_step=1367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  41%|████▏     | 33/80 [03:15<04:29,  5.74s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000135, train/loss_vlb_step=5.66e-7, train/loss_step=0.000135, global_step=1368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  42%|████▎     | 34/80 [03:28<04:33,  5.95s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000135, train/loss_vlb_step=5.66e-7, train/loss_step=0.000135, global_step=1368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  42%|████▎     | 34/80 [03:28<04:33,  5.95s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000262, train/loss_vlb_step=1.41e-6, train/loss_step=0.000262, global_step=1368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  44%|████▍     | 35/80 [03:35<04:29,  5.98s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000262, train/loss_vlb_step=1.41e-6, train/loss_step=0.000262, global_step=1368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  44%|████▍     | 35/80 [03:35<04:29,  5.98s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000576, train/loss_vlb_step=4.09e-6, train/loss_step=0.000576, global_step=1368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  45%|████▌     | 36/80 [03:35<04:16,  5.84s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000576, train/loss_vlb_step=4.09e-6, train/loss_step=0.000576, global_step=1368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  45%|████▌     | 36/80 [03:35<04:16,  5.84s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.51e-7, train/loss_step=0.000167, global_step=1368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  46%|████▋     | 37/80 [03:36<04:04,  5.70s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.51e-7, train/loss_step=0.000167, global_step=1368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  46%|████▋     | 37/80 [03:36<04:04,  5.70s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000119, train/loss_step=0.0153, global_step=1369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]   Epoch 68:  48%|████▊     | 38/80 [03:36<03:53,  5.56s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000119, train/loss_step=0.0153, global_step=1369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  48%|████▊     | 38/80 [03:36<03:53,  5.56s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=9.67e-6, train/loss_step=0.00262, global_step=1369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  49%|████▉     | 39/80 [03:37<03:42,  5.44s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=9.67e-6, train/loss_step=0.00262, global_step=1369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  49%|████▉     | 39/80 [03:37<03:42,  5.44s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=1.53e-5, train/loss_step=0.00461, global_step=1369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  50%|█████     | 40/80 [03:47<03:41,  5.54s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=1.53e-5, train/loss_step=0.00461, global_step=1369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  50%|█████     | 40/80 [03:47<03:41,  5.54s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000649, train/loss_vlb_step=4.12e-6, train/loss_step=0.000649, global_step=1369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  51%|█████▏    | 41/80 [04:02<03:45,  5.77s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000649, train/loss_vlb_step=4.12e-6, train/loss_step=0.000649, global_step=1369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  51%|█████▏    | 41/80 [04:02<03:45,  5.77s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=3.07e-5, train/loss_step=0.00833, global_step=1370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]   Epoch 68:  52%|█████▎    | 42/80 [04:02<03:34,  5.65s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00833, train/loss_vlb_step=3.07e-5, train/loss_step=0.00833, global_step=1370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  52%|█████▎    | 42/80 [04:02<03:34,  5.65s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=3.49e-6, train/loss_step=0.000422, global_step=1370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  54%|█████▍    | 43/80 [04:22<03:41,  5.98s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=3.49e-6, train/loss_step=0.000422, global_step=1370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  54%|█████▍    | 43/80 [04:22<03:41,  5.98s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=1.08e-6, train/loss_step=0.000243, global_step=1370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=1.08e-6, train/loss_step=0.000243, global_step=1370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=5.7e-6, train/loss_step=0.00147, global_step=1370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]   Epoch 68:  56%|█████▋    | 45/80 [04:23<03:20,  5.74s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=5.7e-6, train/loss_step=0.00147, global_step=1370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  56%|█████▋    | 45/80 [04:23<03:20,  5.74s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00071, train/loss_vlb_step=2.11e-5, train/loss_step=0.00071, global_step=1371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  57%|█████▊    | 46/80 [04:24<03:11,  5.63s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00071, train/loss_vlb_step=2.11e-5, train/loss_step=0.00071, global_step=1371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  57%|█████▊    | 46/80 [04:24<03:11,  5.63s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.02e-5, train/loss_step=0.00241, global_step=1371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  59%|█████▉    | 47/80 [04:24<03:02,  5.52s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=1.02e-5, train/loss_step=0.00241, global_step=1371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  59%|█████▉    | 47/80 [04:24<03:02,  5.52s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.21e-6, train/loss_step=0.000259, global_step=1371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  60%|██████    | 48/80 [04:26<02:54,  5.44s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.21e-6, train/loss_step=0.000259, global_step=1371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  60%|██████    | 48/80 [04:26<02:54,  5.44s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=4.16e-6, train/loss_step=0.000632, global_step=1371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  61%|██████▏   | 49/80 [04:38<02:52,  5.56s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=4.16e-6, train/loss_step=0.000632, global_step=1371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  61%|██████▏   | 49/80 [04:38<02:52,  5.56s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.78e-5, train/loss_step=0.00592, global_step=1372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:  62%|██████▎   | 50/80 [04:50<02:50,  5.69s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00592, train/loss_vlb_step=3.78e-5, train/loss_step=0.00592, global_step=1372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  62%|██████▎   | 50/80 [04:50<02:50,  5.69s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.00027, train/loss_step=0.0109, global_step=1372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:  64%|██████▍   | 51/80 [05:04<02:49,  5.86s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.00027, train/loss_step=0.0109, global_step=1372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  64%|██████▍   | 51/80 [05:04<02:49,  5.86s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=7e-6, train/loss_step=0.000735, global_step=1372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  65%|██████▌   | 52/80 [05:05<02:41,  5.76s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=7e-6, train/loss_step=0.000735, global_step=1372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  65%|██████▌   | 52/80 [05:05<02:41,  5.76s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=1.25e-5, train/loss_step=0.00371, global_step=1372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381] Epoch 68:  66%|██████▋   | 53/80 [05:05<02:32,  5.67s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00371, train/loss_vlb_step=1.25e-5, train/loss_step=0.00371, global_step=1372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  66%|██████▋   | 53/80 [05:05<02:32,  5.67s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2e-5, train/loss_step=0.00362, global_step=1373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381] Epoch 68:  68%|█████��▊   | 54/80 [05:06<02:24,  5.57s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=2e-5, train/loss_step=0.00362, global_step=1373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  68%|██████▊   | 54/80 [05:06<02:24,  5.57s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=3.38e-6, train/loss_step=0.000787, global_step=1373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  69%|██████▉   | 55/80 [05:06<02:17,  5.48s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=3.38e-6, train/loss_step=0.000787, global_step=1373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  69%|██████▉   | 55/80 [05:06<02:17,  5.48s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000924, train/loss_vlb_step=3.71e-6, train/loss_step=0.000924, global_step=1373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  70%|███████   | 56/80 [05:12<02:11,  5.48s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000924, train/loss_vlb_step=3.71e-6, train/loss_step=0.000924, global_step=1373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  70%|███████   | 56/80 [05:12<02:11,  5.48s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000319, train/loss_vlb_step=2.62e-6, train/loss_step=0.000319, global_step=1373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  71%|███████▏  | 57/80 [05:18<02:06,  5.48s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000319, train/loss_vlb_step=2.62e-6, train/loss_step=0.000319, global_step=1373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  71%|███████▏  | 57/80 [05:18<02:06,  5.48s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.02e-5, train/loss_step=0.00289, global_step=1374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 68:  72%|███████▎  | 58/80 [05:26<02:01,  5.54s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.02e-5, train/loss_step=0.00289, global_step=1374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  72%|███████▎  | 58/80 [05:26<02:01,  5.54s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000582, train/loss_step=0.0373, global_step=1374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381] Epoch 68:  74%|███████▍  | 59/80 [05:37<01:58,  5.62s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000582, train/loss_step=0.0373, global_step=1374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  74%|███████▍  | 59/80 [05:37<01:58,  5.62s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.06e-6, train/loss_step=0.00102, global_step=1374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  75%|███████▌  | 60/80 [05:41<01:51,  5.59s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.06e-6, train/loss_step=0.00102, global_step=1374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  75%|███████▌  | 60/80 [05:41<01:51,  5.59s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=0.000243, train/loss_step=0.00184, global_step=1374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  76%|███████▋  | 61/80 [05:41<01:44,  5.51s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=0.000243, train/loss_step=0.00184, global_step=1374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  76%|███████▋  | 61/80 [05:41<01:44,  5.51s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=3.63e-6, train/loss_step=0.000454, global_step=1375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  78%|███████▊  | 62/80 [05:42<01:37,  5.43s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=3.63e-6, train/loss_step=0.000454, global_step=1375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  78%|███████▊  | 62/80 [05:42<01:37,  5.43s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=2.71e-5, train/loss_step=0.00785, global_step=1375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]   Epoch 68:  79%|███████▉  | 63/80 [05:42<01:31,  5.36s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00785, train/loss_vlb_step=2.71e-5, train/loss_step=0.00785, global_step=1375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  79%|███████▉  | 63/80 [05:42<01:31,  5.36s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=4.5e-5, train/loss_step=0.00663, global_step=1375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  80%|████████  | 64/80 [05:50<01:26,  5.39s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=4.5e-5, train/loss_step=0.00663, global_step=1375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  80%|████████  | 64/80 [05:50<01:26,  5.39s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=2.97e-6, train/loss_step=0.000748, global_step=1375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  81%|████████▏ | 65/80 [05:56<01:21,  5.41s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=2.97e-6, train/loss_step=0.000748, global_step=1375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  81%|████████▏ | 65/80 [05:56<01:21,  5.41s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=2.65e-6, train/loss_step=0.000555, global_step=1376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  82%|████████▎ | 66/80 [06:16<01:18,  5.62s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=2.65e-6, train/loss_step=0.000555, global_step=1376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  82%|████████▎ | 66/80 [06:16<01:18,  5.62s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=4.94e-6, train/loss_step=0.000444, global_step=1376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  84%|████████▍ | 67/80 [06:16<01:12,  5.54s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=4.94e-6, train/loss_step=0.000444, global_step=1376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  84%|████████▍ | 67/80 [06:16<01:12,  5.54s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000513, train/loss_vlb_step=9.53e-6, train/loss_step=0.000513, global_step=1376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  85%|████████▌ | 68/80 [06:38<01:09,  5.78s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000513, train/loss_vlb_step=9.53e-6, train/loss_step=0.000513, global_step=1376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  85%|████████▌ | 68/80 [06:38<01:09,  5.78s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.46e-6, train/loss_step=0.000499, global_step=1376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  86%|████████▋ | 69/80 [06:39<01:02,  5.71s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.46e-6, train/loss_step=0.000499, global_step=1376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  86%|████████▋ | 69/80 [06:39<01:02,  5.71s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.000461, train/loss_vlb_step=8.67e-6, train/loss_step=0.000461, global_step=1377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.000461, train/loss_vlb_step=8.67e-6, train/loss_step=0.000461, global_step=1377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.7e-6, train/loss_step=0.00111, global_step=1377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]   Epoch 68:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.7e-6, train/loss_step=0.00111, global_step=1377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=0.000182, train/loss_step=0.00431, global_step=1377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  90%|█████████ | 72/80 [06:40<00:43,  5.49s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=0.000182, train/loss_step=0.00431, global_step=1377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  90%|█████████ | 72/80 [06:40<00:43,  5.49s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.28e-5, train/loss_step=0.00311, global_step=1377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  91%|█████████▏| 73/80 [06:41<00:37,  5.42s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.28e-5, train/loss_step=0.00311, global_step=1377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  91%|█████████▏| 73/80 [06:41<00:37,  5.42s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.26e-5, train/loss_step=0.00271, global_step=1378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  92%|█████████▎| 74/80 [06:52<00:32,  5.49s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.26e-5, train/loss_step=0.00271, global_step=1378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  92%|█████████▎| 74/80 [06:52<00:32,  5.49s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=1.73e-5, train/loss_step=0.005, global_step=1378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]    Epoch 68:  94%|█████████▍| 75/80 [06:53<00:27,  5.44s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=1.73e-5, train/loss_step=0.005, global_step=1378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  94%|█████████▍| 75/80 [06:53<00:27,  5.44s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000767, train/loss_vlb_step=1.46e-5, train/loss_step=0.000767, global_step=1378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  95%|█████████▌| 76/80 [07:10<00:22,  5.59s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000767, train/loss_vlb_step=1.46e-5, train/loss_step=0.000767, global_step=1378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  95%|█████████▌| 76/80 [07:10<00:22,  5.59s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=5.97e-6, train/loss_step=0.000477, global_step=1378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  96%|█████████▋| 77/80 [07:10<00:16,  5.52s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=5.97e-6, train/loss_step=0.000477, global_step=1378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  96%|█████████▋| 77/80 [07:10<00:16,  5.52s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=2.01e-6, train/loss_step=0.000467, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=2.01e-6, train/loss_step=0.000467, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.07e-6, train/loss_step=0.000253, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  99%|█████████▉| 79/80 [07:11<00:05,  5.40s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.07e-6, train/loss_step=0.000253, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68:  99%|█████████▉| 79/80 [07:11<00:05,  5.40s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=4.61e-6, train/loss_step=0.000497, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=4.61e-6, train/loss_step=0.000497, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 68: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=2.53e-6, train/loss_step=0.000541, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Average Epoch time: 432.40 seconds
+Average Peak memory 29560.71MiB
+Epoch 68:   0%|          | 0/80 [00:00<00:00, 5384.22it/s, loss=0.00187, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=2.53e-6, train/loss_step=0.000541, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 69:   0%|          | 0/80 [00:00<00:00, 2014.56it/s, loss=0.00187, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=2.53e-6, train/loss_step=0.000541, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]Epoch 69:   1%|▏         | 1/80 [00:44<29:20, 22.28s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000541, train/loss_vlb_step=2.53e-6, train/loss_step=0.000541, global_step=1379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00381, train/loss_vlb_epoch=6.27e-5, train/loss_epoch=0.00381]  Epoch 69:   1%|▏         | 1/80 [00:44<29:20, 22.28s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000205, train/loss_step=0.0127, global_step=1380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:   2%|▎         | 2/80 [00:45<19:31, 15.02s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000205, train/loss_step=0.0127, global_step=1380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:   2%|▎         | 2/80 [00:45<19:31, 15.02s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000138, train/loss_vlb_step=5.84e-7, train/loss_step=0.000138, global_step=1380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:   4%|▍         | 3/80 [00:45<14:36, 11.39s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000138, train/loss_vlb_step=5.84e-7, train/loss_step=0.000138, global_step=1380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:   4%|▍         | 3/80 [00:45<14:36, 11.39s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=8.25e-6, train/loss_step=0.00131, global_step=1380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419] Epoch 69:   5%|▌         | 4/80 [00:46<11:40,  9.22s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=8.25e-6, train/loss_step=0.00131, global_step=1380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:   5%|▌         | 4/80 [00:46<11:40,  9.22s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.82e-6, train/loss_step=0.0012, global_step=1380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:   6%|▋         | 5/80 [00:46<09:42,  7.76s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.82e-6, train/loss_step=0.0012, global_step=1380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:   6%|▋         | 5/80 [00:46<09:42,  7.76s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=1.2e-5, train/loss_step=0.00141, global_step=1381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:   8%|▊         | 6/80 [00:47<08:17,  6.72s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=1.2e-5, train/loss_step=0.00141, global_step=1381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:   8%|▊         | 6/80 [00:47<08:17,  6.73s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.04e-5, train/loss_step=0.00765, global_step=1381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:   9%|▉         | 7/80 [00:47<07:14,  5.95s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.04e-5, train/loss_step=0.00765, global_step=1381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:   9%|▉         | 7/80 [00:47<07:14,  5.95s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=1.19e-5, train/loss_step=0.00125, global_step=1381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  10%|█         | 8/80 [01:16<10:13,  8.52s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=1.19e-5, train/loss_step=0.00125, global_step=1381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  10%|█         | 8/80 [01:16<10:13,  8.52s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=1.75e-6, train/loss_step=0.00051, global_step=1381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  11%|█▏        | 9/80 [01:29<10:36,  8.97s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=1.75e-6, train/loss_step=0.00051, global_step=1381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  11%|█▏        | 9/80 [01:29<10:36,  8.97s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=6.1e-6, train/loss_step=0.00149, global_step=1382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419] Epoch 69:  12%|█▎        | 10/80 [01:30<09:33,  8.20s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=6.1e-6, train/loss_step=0.00149, global_step=1382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  12%|█▎        | 10/80 [01:30<09:33,  8.20s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=2.16e-6, train/loss_step=0.000325, global_step=1382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  14%|█▍        | 11/80 [01:30<08:41,  7.56s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=2.16e-6, train/loss_step=0.000325, global_step=1382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  14%|█▍        | 11/80 [01:30<08:41,  7.56s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.43e-5, train/loss_step=0.00649, global_step=1382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  15%|█▌        | 12/80 [01:31<07:57,  7.02s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.43e-5, train/loss_step=0.00649, global_step=1382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  15%|█▌        | 12/80 [01:31<07:57,  7.02s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.54e-5, train/loss_step=0.0025, global_step=1382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  16%|█▋        | 13/80 [01:31<07:19,  6.55s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.54e-5, train/loss_step=0.0025, global_step=1382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  16%|█▋        | 13/80 [01:31<07:19,  6.55s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=4.64e-6, train/loss_step=0.00112, global_step=1383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  18%|█▊        | 14/80 [01:32<06:45,  6.15s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=4.64e-6, train/loss_step=0.00112, global_step=1383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  18%|█▊        | 14/80 [01:32<06:45,  6.15s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.00076, train/loss_vlb_step=3.81e-6, train/loss_step=0.00076, global_step=1383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  19%|█▉        | 15/80 [01:32<06:16,  5.79s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.00076, train/loss_vlb_step=3.81e-6, train/loss_step=0.00076, global_step=1383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  19%|█▉        | 15/80 [01:32<06:16,  5.80s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000705, train/loss_vlb_step=3.79e-6, train/loss_step=0.000705, global_step=1383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  20%|██        | 16/80 [01:55<07:15,  6.80s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000705, train/loss_vlb_step=3.79e-6, train/loss_step=0.000705, global_step=1383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  20%|██        | 16/80 [01:55<07:15,  6.80s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.000855, train/loss_vlb_step=5.02e-6, train/loss_step=0.000855, global_step=1383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  21%|██▏       | 17/80 [02:12<07:44,  7.37s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.000855, train/loss_vlb_step=5.02e-6, train/loss_step=0.000855, global_step=1383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  21%|██▏       | 17/80 [02:12<07:44,  7.37s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000317, train/loss_step=0.0248, global_step=1384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]   Epoch 69:  22%|██▎       | 18/80 [02:21<07:40,  7.43s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000317, train/loss_step=0.0248, global_step=1384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  22%|██▎       | 18/80 [02:21<07:40,  7.43s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000147, train/loss_vlb_step=5.69e-7, train/loss_step=0.000147, global_step=1384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  24%|██▍       | 19/80 [02:21<07:12,  7.09s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000147, train/loss_vlb_step=5.69e-7, train/loss_step=0.000147, global_step=1384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  24%|██▍       | 19/80 [02:21<07:12,  7.09s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.28e-6, train/loss_step=0.000552, global_step=1384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  25%|██▌       | 20/80 [02:22<06:46,  6.77s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.28e-6, train/loss_step=0.000552, global_step=1384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  25%|██▌       | 20/80 [02:22<06:46,  6.77s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.35e-5, train/loss_step=0.00151, global_step=1384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  26%|██▋       | 21/80 [02:22<06:22,  6.49s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.35e-5, train/loss_step=0.00151, global_step=1384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  26%|██▋       | 21/80 [02:22<06:22,  6.49s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=0.000407, train/loss_step=0.0207, global_step=1385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419] Epoch 69:  28%|██▊       | 22/80 [02:23<06:01,  6.23s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=0.000407, train/loss_step=0.0207, global_step=1385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  28%|██▊       | 22/80 [02:23<06:01,  6.23s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=1.87e-5, train/loss_step=0.000802, global_step=1385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  29%|██▉       | 23/80 [02:23<05:41,  5.99s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=1.87e-5, train/loss_step=0.000802, global_step=1385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  29%|██▉       | 23/80 [02:23<05:41,  5.99s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=1.72e-6, train/loss_step=0.000417, global_step=1385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  30%|███       | 24/80 [02:38<05:55,  6.36s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=1.72e-6, train/loss_step=0.000417, global_step=1385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  30%|███       | 24/80 [02:38<05:55,  6.36s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=5.79e-5, train/loss_step=0.00495, global_step=1385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  31%|███▏      | 25/80 [02:51<06:03,  6.61s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00495, train/loss_vlb_step=5.79e-5, train/loss_step=0.00495, global_step=1385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  31%|███▏      | 25/80 [02:51<06:03,  6.61s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000915, train/loss_vlb_step=4.14e-6, train/loss_step=0.000915, global_step=1386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  32%|███▎      | 26/80 [03:05<06:10,  6.85s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000915, train/loss_vlb_step=4.14e-6, train/loss_step=0.000915, global_step=1386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  32%|███▎      | 26/80 [03:05<06:10,  6.85s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=1.29e-6, train/loss_step=0.000293, global_step=1386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  34%|███▍      | 27/80 [03:05<05:51,  6.63s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=1.29e-6, train/loss_step=0.000293, global_step=1386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  34%|███▍      | 27/80 [03:05<05:51,  6.63s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.33e-5, train/loss_step=0.00687, global_step=1386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  35%|███▌      | 28/80 [03:06<05:33,  6.42s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.33e-5, train/loss_step=0.00687, global_step=1386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  35%|███▌      | 28/80 [03:06<05:33,  6.42s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=4.39e-6, train/loss_step=0.000945, global_step=1386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  36%|███▋      | 29/80 [03:06<05:17,  6.22s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=4.39e-6, train/loss_step=0.000945, global_step=1386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  36%|███▋      | 29/80 [03:06<05:17,  6.22s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.81e-5, train/loss_step=0.00522, global_step=1387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  38%|███▊      | 30/80 [03:07<05:01,  6.03s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=2.81e-5, train/loss_step=0.00522, global_step=1387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  38%|███▊      | 30/80 [03:07<05:01,  6.03s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=4.89e-5, train/loss_step=0.0139, global_step=1387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  39%|███▉      | 31/80 [03:07<04:47,  5.86s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=4.89e-5, train/loss_step=0.0139, global_step=1387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  39%|███▉      | 31/80 [03:07<04:47,  5.86s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000155, train/loss_vlb_step=6.09e-7, train/loss_step=0.000155, global_step=1387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  40%|████      | 32/80 [03:22<04:55,  6.15s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.000155, train/loss_vlb_step=6.09e-7, train/loss_step=0.000155, global_step=1387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  40%|████      | 32/80 [03:22<04:55,  6.15s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=5e-6, train/loss_step=0.0011, global_step=1387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]       Epoch 69:  41%|████▏     | 33/80 [03:30<04:51,  6.19s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=5e-6, train/loss_step=0.0011, global_step=1387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  41%|████▏     | 33/80 [03:30<04:51,  6.19s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000172, train/loss_vlb_step=7.3e-7, train/loss_step=0.000172, global_step=1388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  42%|████▎     | 34/80 [03:42<04:52,  6.35s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000172, train/loss_vlb_step=7.3e-7, train/loss_step=0.000172, global_step=1388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  42%|████▎     | 34/80 [03:42<04:52,  6.35s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=1.97e-5, train/loss_step=0.000604, global_step=1388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=1.97e-5, train/loss_step=0.000604, global_step=1388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=8.61e-6, train/loss_step=0.00227, global_step=1388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=8.61e-6, train/loss_step=0.00227, global_step=1388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=1.16e-6, train/loss_step=0.000222, global_step=1388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=1.16e-6, train/loss_step=0.000222, global_step=1388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.28e-5, train/loss_step=0.00176, global_step=1389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=1.28e-5, train/loss_step=0.00176, global_step=1389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000138, train/loss_vlb_step=5.76e-7, train/loss_step=0.000138, global_step=1389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000138, train/loss_vlb_step=5.76e-7, train/loss_step=0.000138, global_step=1389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=4.41e-6, train/loss_step=0.000456, global_step=1389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  50%|█████     | 40/80 [04:07<04:01,  6.04s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=4.41e-6, train/loss_step=0.000456, global_step=1389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  50%|█████     | 40/80 [04:07<04:01,  6.04s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=5.38e-6, train/loss_step=0.000462, global_step=1389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  51%|█████▏    | 41/80 [04:11<03:53,  5.99s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=5.38e-6, train/loss_step=0.000462, global_step=1389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  51%|█████▏    | 41/80 [04:11<03:53,  5.99s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=1.56e-5, train/loss_step=0.00439, global_step=1390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]   Epoch 69:  52%|█████▎    | 42/80 [04:26<03:55,  6.21s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=1.56e-5, train/loss_step=0.00439, global_step=1390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  52%|█████▎    | 42/80 [04:26<03:55,  6.21s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.02e-7, train/loss_step=0.000139, global_step=1390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  54%|█████▍    | 43/80 [04:27<03:44,  6.08s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.02e-7, train/loss_step=0.000139, global_step=1390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  54%|█████▍    | 43/80 [04:27<03:44,  6.08s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=0.000105, train/loss_step=0.00145, global_step=1390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419] Epoch 69:  55%|█████▌    | 44/80 [04:27<03:34,  5.95s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=0.000105, train/loss_step=0.00145, global_step=1390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  55%|█████▌    | 44/80 [04:27<03:34,  5.95s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.76e-5, train/loss_step=0.00769, global_step=1390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419] Epoch 69:  56%|█████▋    | 45/80 [04:28<03:24,  5.84s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.76e-5, train/loss_step=0.00769, global_step=1390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  56%|█████▋    | 45/80 [04:28<03:24,  5.84s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.05e-5, train/loss_step=0.0113, global_step=1391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  57%|█████▊    | 46/80 [04:28<03:14,  5.72s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.05e-5, train/loss_step=0.0113, global_step=1391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  57%|█████▊    | 46/80 [04:28<03:14,  5.72s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000388, train/loss_vlb_step=2.43e-6, train/loss_step=0.000388, global_step=1391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  59%|█████▉    | 47/80 [04:29<03:05,  5.61s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000388, train/loss_vlb_step=2.43e-6, train/loss_step=0.000388, global_step=1391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  59%|█████▉    | 47/80 [04:29<03:05,  5.61s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=1.98e-6, train/loss_step=0.000409, global_step=1391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  60%|██████    | 48/80 [04:45<03:06,  5.82s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=1.98e-6, train/loss_step=0.000409, global_step=1391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  60%|██████    | 48/80 [04:45<03:06,  5.82s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=3.38e-5, train/loss_step=0.010, global_step=1391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]      Epoch 69:  61%|██████▏   | 49/80 [04:45<02:57,  5.71s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=3.38e-5, train/loss_step=0.010, global_step=1391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  61%|██████▏   | 49/80 [04:45<02:57,  5.71s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.14e-5, train/loss_step=0.00493, global_step=1392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  62%|██████▎   | 50/80 [05:01<02:57,  5.90s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.14e-5, train/loss_step=0.00493, global_step=1392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  62%|██████▎   | 50/80 [05:01<02:57,  5.90s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=0.000103, train/loss_step=0.00841, global_step=1392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  64%|██████▍   | 51/80 [05:01<02:48,  5.80s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00841, train/loss_vlb_step=0.000103, train/loss_step=0.00841, global_step=1392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  64%|██████▍   | 51/80 [05:01<02:48,  5.80s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000179, train/loss_vlb_step=7.17e-7, train/loss_step=0.000179, global_step=1392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  65%|██████▌   | 52/80 [05:08<02:43,  5.83s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000179, train/loss_vlb_step=7.17e-7, train/loss_step=0.000179, global_step=1392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  65%|██████▌   | 52/80 [05:08<02:43,  5.83s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=6.31e-6, train/loss_step=0.000647, global_step=1392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419] Epoch 69:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=6.31e-6, train/loss_step=0.000647, global_step=1392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=5.9e-6, train/loss_step=0.00151, global_step=1393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  68%|██████▊   | 54/80 [05:09<02:26,  5.64s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=5.9e-6, train/loss_step=0.00151, global_step=1393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  68%|██████▊   | 54/80 [05:09<02:26,  5.64s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=9.59e-7, train/loss_step=0.000246, global_step=1393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  69%|██████▉   | 55/80 [05:10<02:18,  5.54s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=9.59e-7, train/loss_step=0.000246, global_step=1393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  69%|██████▉   | 55/80 [05:10<02:18,  5.54s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=1.87e-5, train/loss_step=0.00494, global_step=1393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  70%|███████   | 56/80 [05:31<02:19,  5.81s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=1.87e-5, train/loss_step=0.00494, global_step=1393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  70%|███████   | 56/80 [05:31<02:19,  5.81s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.29e-5, train/loss_step=0.0034, global_step=1393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.0034, train/loss_vlb_step=1.29e-5, train/loss_step=0.0034, global_step=1393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.69e-5, train/loss_step=0.00151, global_step=1394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  72%|███████▎  | 58/80 [05:47<02:09,  5.88s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=9.69e-5, train/loss_step=0.00151, global_step=1394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  72%|███████▎  | 58/80 [05:47<02:09,  5.88s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000439, train/loss_vlb_step=1.78e-6, train/loss_step=0.000439, global_step=1394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  74%|███████▍  | 59/80 [05:47<02:01,  5.79s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000439, train/loss_vlb_step=1.78e-6, train/loss_step=0.000439, global_step=1394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  74%|███████▍  | 59/80 [05:47<02:01,  5.79s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000108, train/loss_step=0.0109, global_step=1394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]   Epoch 69:  75%|███████▌  | 60/80 [06:00<01:58,  5.90s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000108, train/loss_step=0.0109, global_step=1394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  75%|███████▌  | 60/80 [06:00<01:58,  5.90s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=6.05e-6, train/loss_step=0.00139, global_step=1394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  76%|███████▋  | 61/80 [06:00<01:50,  5.82s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=6.05e-6, train/loss_step=0.00139, global_step=1394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  76%|███████▋  | 61/80 [06:00<01:50,  5.82s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=8.38e-5, train/loss_step=0.0113, global_step=1395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  78%|███████▊  | 62/80 [06:01<01:43,  5.73s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=8.38e-5, train/loss_step=0.0113, global_step=1395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  78%|███████▊  | 62/80 [06:01<01:43,  5.73s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=0.000448, train/loss_step=0.00505, global_step=1395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  79%|███████▉  | 63/80 [06:01<01:36,  5.65s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=0.000448, train/loss_step=0.00505, global_step=1395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  79%|███████▉  | 63/80 [06:01<01:36,  5.65s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=3.13e-5, train/loss_step=0.00574, global_step=1395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  80%|████████  | 64/80 [06:13<01:32,  5.75s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=3.13e-5, train/loss_step=0.00574, global_step=1395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  80%|████████  | 64/80 [06:13<01:32,  5.75s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=2.37e-5, train/loss_step=0.00057, global_step=1395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  81%|████████▏ | 65/80 [06:14<01:25,  5.67s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=2.37e-5, train/loss_step=0.00057, global_step=1395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  81%|████████▏ | 65/80 [06:14<01:25,  5.67s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=3.32e-5, train/loss_step=0.00908, global_step=1396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  82%|████████▎ | 66/80 [06:24<01:20,  5.74s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=3.32e-5, train/loss_step=0.00908, global_step=1396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  82%|████████▎ | 66/80 [06:24<01:20,  5.74s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000936, train/loss_vlb_step=2.85e-5, train/loss_step=0.000936, global_step=1396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  84%|████████▍ | 67/80 [06:24<01:13,  5.66s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000936, train/loss_vlb_step=2.85e-5, train/loss_step=0.000936, global_step=1396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  84%|████████▍ | 67/80 [06:24<01:13,  5.66s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=6.04e-6, train/loss_step=0.00143, global_step=1396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  85%|████████▌ | 68/80 [06:38<01:09,  5.78s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=6.04e-6, train/loss_step=0.00143, global_step=1396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  85%|████████▌ | 68/80 [06:38<01:09,  5.78s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.24e-5, train/loss_step=0.00362, global_step=1396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  86%|████████▋ | 69/80 [06:39<01:02,  5.70s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.24e-5, train/loss_step=0.00362, global_step=1396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  86%|████████▋ | 69/80 [06:39<01:02,  5.70s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000522, train/loss_vlb_step=3.39e-6, train/loss_step=0.000522, global_step=1397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000522, train/loss_vlb_step=3.39e-6, train/loss_step=0.000522, global_step=1397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.69e-5, train/loss_step=0.00916, global_step=1397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  89%|████████▉ | 71/80 [06:39<00:49,  5.56s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=4.69e-5, train/loss_step=0.00916, global_step=1397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  89%|████████▉ | 71/80 [06:39<00:49,  5.56s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=4.27e-5, train/loss_step=0.00956, global_step=1397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  90%|█████████ | 72/80 [06:52<00:45,  5.65s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00956, train/loss_vlb_step=4.27e-5, train/loss_step=0.00956, global_step=1397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  90%|█████████ | 72/80 [06:52<00:45,  5.65s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000475, train/loss_vlb_step=2.5e-6, train/loss_step=0.000475, global_step=1397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  91%|█████████▏| 73/80 [06:52<00:39,  5.58s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000475, train/loss_vlb_step=2.5e-6, train/loss_step=0.000475, global_step=1397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  91%|█████████▏| 73/80 [06:52<00:39,  5.58s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=0.000138, train/loss_step=0.0142, global_step=1398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 69:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=0.000138, train/loss_step=0.0142, global_step=1398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=4.42e-5, train/loss_step=0.00789, global_step=1398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  94%|█████████▍| 75/80 [06:53<00:27,  5.44s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=4.42e-5, train/loss_step=0.00789, global_step=1398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  94%|█████████▍| 75/80 [06:53<00:27,  5.44s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000771, train/loss_vlb_step=3.16e-6, train/loss_step=0.000771, global_step=1398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  95%|█████████▌| 76/80 [07:16<00:22,  5.67s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000771, train/loss_vlb_step=3.16e-6, train/loss_step=0.000771, global_step=1398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  95%|█████████▌| 76/80 [07:16<00:22,  5.67s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=1.6e-5, train/loss_step=0.00413, global_step=1398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]   Epoch 69:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00413, train/loss_vlb_step=1.6e-5, train/loss_step=0.00413, global_step=1398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=2.06e-5, train/loss_step=0.00595, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  98%|█████████▊| 78/80 [07:17<00:11,  5.54s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=2.06e-5, train/loss_step=0.00595, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  98%|█████████▊| 78/80 [07:17<00:11,  5.54s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.66e-5, train/loss_step=0.004, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]    Epoch 69:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=2.66e-5, train/loss_step=0.004, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000302, train/loss_vlb_step=1.19e-6, train/loss_step=0.000302, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000302, train/loss_vlb_step=1.19e-6, train/loss_step=0.000302, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 69: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000548, train/loss_step=0.0373, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]   Average Epoch time: 438.37 seconds
+Average Peak memory 29561.96MiB
+Epoch 69:   0%|          | 0/80 [00:00<00:00, 4443.12it/s, loss=0.0066, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000548, train/loss_step=0.0373, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 70:   0%|          | 0/80 [00:00<00:00, 1850.16it/s, loss=0.0066, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000548, train/loss_step=0.0373, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]Epoch 70:   1%|▏         | 1/80 [00:45<30:02, 22.82s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.0373, train/loss_vlb_step=0.000548, train/loss_step=0.0373, global_step=1399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000128, train/loss_epoch=0.00419]  Epoch 70:   1%|▏         | 1/80 [00:45<30:02, 22.82s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.000354, train/loss_vlb_step=1.59e-6, train/loss_step=0.000354, global_step=1400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:   2%|▎         | 2/80 [00:46<19:59, 15.37s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.000354, train/loss_vlb_step=1.59e-6, train/loss_step=0.000354, global_step=1400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:   2%|▎         | 2/80 [00:46<19:59, 15.37s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.000553, train/loss_vlb_step=5.48e-6, train/loss_step=0.000553, global_step=1400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:   4%|▍         | 3/80 [00:46<14:57, 11.65s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.000553, train/loss_vlb_step=5.48e-6, train/loss_step=0.000553, global_step=1400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:   4%|▍         | 3/80 [00:46<14:57, 11.65s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.61e-5, train/loss_step=0.00492, global_step=1400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:   5%|▌         | 4/80 [00:47<11:56,  9.43s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=2.61e-5, train/loss_step=0.00492, global_step=1400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:   5%|▌         | 4/80 [00:47<11:56,  9.43s/it, loss=0.00617, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=3.2e-5, train/loss_step=0.00838, global_step=1400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:   6%|▋         | 5/80 [00:47<09:55,  7.94s/it, loss=0.00617, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=3.2e-5, train/loss_step=0.00838, global_step=1400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:   6%|▋         | 5/80 [00:47<09:55,  7.94s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=1.63e-5, train/loss_step=0.000819, global_step=1401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:   8%|▊         | 6/80 [00:48<08:28,  6.88s/it, loss=0.00576, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=1.63e-5, train/loss_step=0.000819, global_step=1401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:   8%|▊         | 6/80 [00:48<08:28,  6.88s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=7.52e-6, train/loss_step=0.00181, global_step=1401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:   9%|▉         | 7/80 [00:48<07:23,  6.08s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=7.52e-6, train/loss_step=0.00181, global_step=1401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:   9%|▉         | 7/80 [00:48<07:23,  6.08s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=1.73e-6, train/loss_step=0.000373, global_step=1401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  10%|█         | 8/80 [01:10<09:21,  7.80s/it, loss=0.00575, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=1.73e-6, train/loss_step=0.000373, global_step=1401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  10%|█         | 8/80 [01:10<09:21,  7.80s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=2.3e-6, train/loss_step=0.000442, global_step=1401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  11%|█▏        | 9/80 [01:24<09:57,  8.41s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=2.3e-6, train/loss_step=0.000442, global_step=1401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  11%|█▏        | 9/80 [01:24<09:57,  8.41s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=2.42e-6, train/loss_step=0.00033, global_step=1402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  12%|█▎        | 10/80 [01:24<08:58,  7.69s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=2.42e-6, train/loss_step=0.00033, global_step=1402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  12%|█▎        | 10/80 [01:24<08:58,  7.69s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.06e-6, train/loss_step=0.000246, global_step=1402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  14%|█▍        | 11/80 [01:25<08:09,  7.09s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.06e-6, train/loss_step=0.000246, global_step=1402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  14%|█▍        | 11/80 [01:25<08:09,  7.09s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=5.08e-6, train/loss_step=0.000368, global_step=1402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  15%|█▌        | 12/80 [01:29<07:50,  6.92s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=5.08e-6, train/loss_step=0.000368, global_step=1402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  15%|█▌        | 12/80 [01:29<07:50,  6.92s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000113, train/loss_step=0.0165, global_step=1402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]   Epoch 70:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000113, train/loss_step=0.0165, global_step=1402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  16%|█▋        | 13/80 [01:30<07:12,  6.46s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=7.62e-6, train/loss_step=0.00225, global_step=1403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  18%|█▊        | 14/80 [01:30<06:40,  6.06s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=7.62e-6, train/loss_step=0.00225, global_step=1403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  18%|█▊        | 14/80 [01:30<06:40,  6.06s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000432, train/loss_vlb_step=3.32e-6, train/loss_step=0.000432, global_step=1403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  19%|█▉        | 15/80 [01:31<06:11,  5.71s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000432, train/loss_vlb_step=3.32e-6, train/loss_step=0.000432, global_step=1403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  19%|█▉        | 15/80 [01:31<06:11,  5.71s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=1.62e-5, train/loss_step=0.00391, global_step=1403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  20%|██        | 16/80 [01:54<07:11,  6.74s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=1.62e-5, train/loss_step=0.00391, global_step=1403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  20%|██        | 16/80 [01:54<07:11,  6.74s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000251, train/loss_step=0.0155, global_step=1403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  21%|██▏       | 17/80 [02:04<07:14,  6.89s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0155, train/loss_vlb_step=0.000251, train/loss_step=0.0155, global_step=1403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  21%|██▏       | 17/80 [02:04<07:14,  6.89s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=5.16e-5, train/loss_step=0.00887, global_step=1404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  22%|██▎       | 18/80 [02:12<07:11,  6.96s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00887, train/loss_vlb_step=5.16e-5, train/loss_step=0.00887, global_step=1404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  22%|██▎       | 18/80 [02:12<07:11,  6.96s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=1.14e-5, train/loss_step=0.000561, global_step=1404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  24%|██▍       | 19/80 [02:12<06:44,  6.64s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=1.14e-5, train/loss_step=0.000561, global_step=1404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  24%|██▍       | 19/80 [02:12<06:44,  6.64s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=1.85e-5, train/loss_step=0.00538, global_step=1404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  25%|██▌       | 20/80 [02:18<06:36,  6.62s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=1.85e-5, train/loss_step=0.00538, global_step=1404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  25%|██▌       | 20/80 [02:18<06:36,  6.62s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=1.83e-6, train/loss_step=0.00034, global_step=1404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  26%|██▋       | 21/80 [02:19<06:13,  6.34s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=1.83e-6, train/loss_step=0.00034, global_step=1404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  26%|██▋       | 21/80 [02:19<06:13,  6.34s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=7.65e-6, train/loss_step=0.000828, global_step=1405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=7.65e-6, train/loss_step=0.000828, global_step=1405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=5.44e-6, train/loss_step=0.000939, global_step=1405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000939, train/loss_vlb_step=5.44e-6, train/loss_step=0.000939, global_step=1405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=7.05e-7, train/loss_step=0.000192, global_step=1405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  30%|███       | 24/80 [02:36<05:50,  6.25s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=7.05e-7, train/loss_step=0.000192, global_step=1405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  30%|███       | 24/80 [02:36<05:50,  6.25s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.17e-5, train/loss_step=0.00766, global_step=1405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  31%|███▏      | 25/80 [02:50<05:59,  6.54s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00766, train/loss_vlb_step=3.17e-5, train/loss_step=0.00766, global_step=1405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  31%|███▏      | 25/80 [02:50<05:59,  6.54s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.36e-6, train/loss_step=0.000375, global_step=1406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  32%|███▎      | 26/80 [02:58<05:57,  6.61s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.36e-6, train/loss_step=0.000375, global_step=1406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  32%|███▎      | 26/80 [02:58<05:57,  6.61s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=4.03e-6, train/loss_step=0.000456, global_step=1406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  34%|███▍      | 27/80 [02:59<05:38,  6.39s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=4.03e-6, train/loss_step=0.000456, global_step=1406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  34%|███▍      | 27/80 [02:59<05:38,  6.39s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000126, train/loss_step=0.0144, global_step=1406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]   Epoch 70:  35%|███▌      | 28/80 [03:07<05:36,  6.47s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000126, train/loss_step=0.0144, global_step=1406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  35%|███▌      | 28/80 [03:07<05:36,  6.47s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.67e-5, train/loss_step=0.00769, global_step=1406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  36%|███▋      | 29/80 [03:08<05:19,  6.27s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.67e-5, train/loss_step=0.00769, global_step=1406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  36%|███▋      | 29/80 [03:08<05:19,  6.27s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.05e-5, train/loss_step=0.00319, global_step=1407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  38%|███▊      | 30/80 [03:08<05:04,  6.08s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.05e-5, train/loss_step=0.00319, global_step=1407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  38%|███▊      | 30/80 [03:08<05:04,  6.08s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=9.17e-5, train/loss_step=0.0135, global_step=1407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  39%|███▉      | 31/80 [03:09<04:49,  5.91s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=9.17e-5, train/loss_step=0.0135, global_step=1407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  39%|███▉      | 31/80 [03:09<04:49,  5.91s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=2.2e-6, train/loss_step=0.000446, global_step=1407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  40%|████      | 32/80 [03:12<04:40,  5.84s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=2.2e-6, train/loss_step=0.000446, global_step=1407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  40%|████      | 32/80 [03:12<04:40,  5.84s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.16e-6, train/loss_step=0.0016, global_step=1407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]   Epoch 70:  41%|████▏     | 33/80 [03:26<04:46,  6.09s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.16e-6, train/loss_step=0.0016, global_step=1407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  41%|████▏     | 33/80 [03:26<04:46,  6.09s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000112, train/loss_step=0.0133, global_step=1408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  42%|████▎     | 34/80 [03:38<04:47,  6.25s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000112, train/loss_step=0.0133, global_step=1408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  42%|████▎     | 34/80 [03:38<04:47,  6.25s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000967, train/loss_vlb_step=6.93e-6, train/loss_step=0.000967, global_step=1408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  44%|████▍     | 35/80 [03:39<04:34,  6.09s/it, loss=0.005, v_num=0, train/loss_simple_step=0.000967, train/loss_vlb_step=6.93e-6, train/loss_step=0.000967, global_step=1408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  44%|████▍     | 35/80 [03:39<04:34,  6.09s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.36e-5, train/loss_step=0.00507, global_step=1408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  45%|████▌     | 36/80 [03:53<04:37,  6.32s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=2.36e-5, train/loss_step=0.00507, global_step=1408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  45%|████▌     | 36/80 [03:53<04:37,  6.32s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=7.79e-6, train/loss_step=0.00234, global_step=1408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  46%|████▋     | 37/80 [03:54<04:25,  6.17s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00234, train/loss_vlb_step=7.79e-6, train/loss_step=0.00234, global_step=1408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  46%|████▋     | 37/80 [03:54<04:25,  6.17s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7e-5, train/loss_step=0.00114, global_step=1409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  48%|████▊     | 38/80 [03:54<04:12,  6.02s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7e-5, train/loss_step=0.00114, global_step=1409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  48%|████▊     | 38/80 [03:54<04:12,  6.02s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=4.64e-6, train/loss_step=0.000407, global_step=1409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  49%|████▉     | 39/80 [03:55<04:01,  5.88s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=4.64e-6, train/loss_step=0.000407, global_step=1409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  49%|████▉     | 39/80 [03:55<04:01,  5.88s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=3.82e-6, train/loss_step=0.000453, global_step=1409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  50%|█████     | 40/80 [03:55<03:50,  5.75s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000453, train/loss_vlb_step=3.82e-6, train/loss_step=0.000453, global_step=1409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  50%|█████     | 40/80 [03:55<03:50,  5.75s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.51e-6, train/loss_step=0.00128, global_step=1409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  51%|█████▏    | 41/80 [04:08<03:50,  5.91s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.51e-6, train/loss_step=0.00128, global_step=1409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  51%|█████▏    | 41/80 [04:08<03:50,  5.91s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=4.01e-6, train/loss_step=0.00109, global_step=1410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=4.01e-6, train/loss_step=0.00109, global_step=1410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000198, train/loss_vlb_step=1.39e-6, train/loss_step=0.000198, global_step=1410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000198, train/loss_vlb_step=1.39e-6, train/loss_step=0.000198, global_step=1410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=6.33e-6, train/loss_step=0.000381, global_step=1410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  55%|█████▌    | 44/80 [04:35<03:40,  6.12s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=6.33e-6, train/loss_step=0.000381, global_step=1410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  55%|█████▌    | 44/80 [04:35<03:40,  6.12s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.0025, train/loss_step=0.0125, global_step=1410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]     Epoch 70:  56%|█████▋    | 45/80 [04:35<03:29,  6.00s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.0025, train/loss_step=0.0125, global_step=1410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  56%|█████▋    | 45/80 [04:35<03:29,  6.00s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000656, train/loss_vlb_step=1.19e-5, train/loss_step=0.000656, global_step=1411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  57%|█████▊    | 46/80 [04:36<03:19,  5.88s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000656, train/loss_vlb_step=1.19e-5, train/loss_step=0.000656, global_step=1411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  57%|█████▊    | 46/80 [04:36<03:19,  5.88s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.22e-5, train/loss_step=0.0105, global_step=1411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]    Epoch 70:  59%|█████▉    | 47/80 [04:36<03:10,  5.77s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.22e-5, train/loss_step=0.0105, global_step=1411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  59%|█████▉    | 47/80 [04:36<03:10,  5.77s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=7.33e-6, train/loss_step=0.00204, global_step=1411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  60%|██████    | 48/80 [04:37<03:01,  5.66s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=7.33e-6, train/loss_step=0.00204, global_step=1411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  60%|██████    | 48/80 [04:37<03:01,  5.66s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=3.32e-5, train/loss_step=0.00835, global_step=1411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  61%|██████▏   | 49/80 [04:42<02:54,  5.64s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=3.32e-5, train/loss_step=0.00835, global_step=1411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  61%|██████▏   | 49/80 [04:42<02:54,  5.64s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.38e-5, train/loss_step=0.00408, global_step=1412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.38e-5, train/loss_step=0.00408, global_step=1412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000966, train/loss_vlb_step=7.77e-6, train/loss_step=0.000966, global_step=1412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  64%|██████▍   | 51/80 [05:10<02:52,  5.96s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000966, train/loss_vlb_step=7.77e-6, train/loss_step=0.000966, global_step=1412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  64%|██████▍   | 51/80 [05:10<02:52,  5.96s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=1.14e-5, train/loss_step=0.000605, global_step=1412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  65%|██████▌   | 52/80 [05:13<02:45,  5.92s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=1.14e-5, train/loss_step=0.000605, global_step=1412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  65%|██████▌   | 52/80 [05:13<02:45,  5.92s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.31e-6, train/loss_step=0.000253, global_step=1412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  66%|██████▋   | 53/80 [05:14<02:37,  5.82s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=1.31e-6, train/loss_step=0.000253, global_step=1412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  66%|██████▋   | 53/80 [05:14<02:37,  5.82s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.17e-5, train/loss_step=0.00526, global_step=1413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00526, train/loss_vlb_step=2.17e-5, train/loss_step=0.00526, global_step=1413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=7.27e-6, train/loss_step=0.000426, global_step=1413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  69%|██████▉   | 55/80 [05:16<02:21,  5.65s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=7.27e-6, train/loss_step=0.000426, global_step=1413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  69%|██████▉   | 55/80 [05:16<02:21,  5.65s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.01e-5, train/loss_step=0.00281, global_step=1413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  70%|███████   | 56/80 [05:16<02:13,  5.56s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.01e-5, train/loss_step=0.00281, global_step=1413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  70%|███████   | 56/80 [05:16<02:13,  5.56s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=0.000107, train/loss_step=0.0108, global_step=1413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  71%|███████▏  | 57/80 [05:29<02:10,  5.68s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=0.000107, train/loss_step=0.0108, global_step=1413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  71%|███████▏  | 57/80 [05:29<02:10,  5.68s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=7.18e-7, train/loss_step=0.000189, global_step=1414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  72%|███████▎  | 58/80 [05:50<02:10,  5.94s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=7.18e-7, train/loss_step=0.000189, global_step=1414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  72%|███████▎  | 58/80 [05:50<02:10,  5.94s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=1.07e-6, train/loss_step=0.000232, global_step=1414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  74%|███████▍  | 59/80 [05:50<02:02,  5.85s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=1.07e-6, train/loss_step=0.000232, global_step=1414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  74%|███████▍  | 59/80 [05:50<02:02,  5.85s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000916, train/loss_vlb_step=4.43e-5, train/loss_step=0.000916, global_step=1414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  75%|███████▌  | 60/80 [05:56<01:56,  5.84s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000916, train/loss_vlb_step=4.43e-5, train/loss_step=0.000916, global_step=1414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  75%|███████▌  | 60/80 [05:56<01:56,  5.84s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=0.00013, train/loss_step=0.00124, global_step=1414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  76%|███████▋  | 61/80 [05:56<01:49,  5.76s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=0.00013, train/loss_step=0.00124, global_step=1414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  76%|███████▋  | 61/80 [05:56<01:49,  5.76s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=3.42e-6, train/loss_step=0.000359, global_step=1415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  78%|███████▊  | 62/80 [06:00<01:42,  5.72s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=3.42e-6, train/loss_step=0.000359, global_step=1415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  78%|███████▊  | 62/80 [06:00<01:42,  5.72s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=2.67e-6, train/loss_step=0.000582, global_step=1415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  79%|███████▉  | 63/80 [06:00<01:35,  5.64s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=2.67e-6, train/loss_step=0.000582, global_step=1415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  79%|███████▉  | 63/80 [06:00<01:35,  5.64s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000445, train/loss_vlb_step=7.8e-6, train/loss_step=0.000445, global_step=1415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  80%|████████  | 64/80 [06:01<01:29,  5.56s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000445, train/loss_vlb_step=7.8e-6, train/loss_step=0.000445, global_step=1415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  80%|████████  | 64/80 [06:01<01:29,  5.56s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=0.000983, train/loss_step=0.0023, global_step=1415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  81%|████████▏ | 65/80 [06:14<01:25,  5.67s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=0.000983, train/loss_step=0.0023, global_step=1415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  81%|████████▏ | 65/80 [06:14<01:25,  5.67s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=3.49e-5, train/loss_step=0.00941, global_step=1416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  82%|████████▎ | 66/80 [06:27<01:21,  5.79s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00941, train/loss_vlb_step=3.49e-5, train/loss_step=0.00941, global_step=1416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  82%|████████▎ | 66/80 [06:27<01:21,  5.79s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.01e-5, train/loss_step=0.00392, global_step=1416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=2.01e-5, train/loss_step=0.00392, global_step=1416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=9.42e-7, train/loss_step=0.000225, global_step=1416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  85%|████████▌ | 68/80 [06:39<01:09,  5.79s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=9.42e-7, train/loss_step=0.000225, global_step=1416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  85%|████████▌ | 68/80 [06:39<01:09,  5.79s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.45e-6, train/loss_step=0.000287, global_step=1416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  86%|████████▋ | 69/80 [06:39<01:02,  5.71s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.45e-6, train/loss_step=0.000287, global_step=1416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  86%|████████▋ | 69/80 [06:39<01:02,  5.71s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=6.73e-6, train/loss_step=0.00167, global_step=1417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  88%|████████▊ | 70/80 [06:40<00:56,  5.64s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=6.73e-6, train/loss_step=0.00167, global_step=1417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  88%|████████▊ | 70/80 [06:40<00:56,  5.64s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=9.42e-6, train/loss_step=0.00232, global_step=1417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  89%|████████▉ | 71/80 [06:40<00:50,  5.57s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=9.42e-6, train/loss_step=0.00232, global_step=1417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  89%|████████▉ | 71/80 [06:40<00:50,  5.57s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.23e-6, train/loss_step=0.000251, global_step=1417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  90%|█████████ | 72/80 [06:42<00:44,  5.51s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.23e-6, train/loss_step=0.000251, global_step=1417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  90%|█████████ | 72/80 [06:42<00:44,  5.51s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.000832, train/loss_vlb_step=3.75e-6, train/loss_step=0.000832, global_step=1417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  91%|█████████▏| 73/80 [06:42<00:38,  5.44s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.000832, train/loss_vlb_step=3.75e-6, train/loss_step=0.000832, global_step=1417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  91%|█████████▏| 73/80 [06:42<00:38,  5.44s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=3.46e-6, train/loss_step=0.000331, global_step=1418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  92%|█████████▎| 74/80 [07:00<00:33,  5.61s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=3.46e-6, train/loss_step=0.000331, global_step=1418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  92%|█████████▎| 74/80 [07:00<00:33,  5.61s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.9e-6, train/loss_step=0.000348, global_step=1418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Epoch 70:  94%|█████████▍| 75/80 [07:01<00:27,  5.54s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.000348, train/loss_vlb_step=1.9e-6, train/loss_step=0.000348, global_step=1418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  94%|█████████▍| 75/80 [07:01<00:27,  5.54s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=9.27e-6, train/loss_step=0.000441, global_step=1418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=9.27e-6, train/loss_step=0.000441, global_step=1418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.00172, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.72e-5, train/loss_step=0.00801, global_step=1418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00172, v_num=0, train/loss_simple_step=0.00801, train/loss_vlb_step=3.72e-5, train/loss_step=0.00801, global_step=1418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.01e-5, train/loss_step=0.00574, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2.01e-5, train/loss_step=0.00574, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.002, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.52e-6, train/loss_step=0.00032, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 70:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.002, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.52e-6, train/loss_step=0.00032, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=9.7e-6, train/loss_step=0.000545, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=9.7e-6, train/loss_step=0.000545, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 70: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=8.24e-5, train/loss_step=0.00471, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428] Average Epoch time: 438.07 seconds
+Average Peak memory 29564.27MiB
+Epoch 70:   0%|          | 0/80 [00:00<00:00, 5614.86it/s, loss=0.00215, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=8.24e-5, train/loss_step=0.00471, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 71:   0%|          | 0/80 [00:00<00:00, 2513.06it/s, loss=0.00215, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=8.24e-5, train/loss_step=0.00471, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]Epoch 71:   1%|▏         | 1/80 [00:47<31:19, 23.80s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=8.24e-5, train/loss_step=0.00471, global_step=1419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00428, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00428]  Epoch 71:   1%|▏         | 1/80 [00:47<31:19, 23.80s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.0009, train/loss_vlb_step=4.66e-6, train/loss_step=0.0009, global_step=1420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:   2%|▎         | 2/80 [00:48<20:49, 16.02s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.0009, train/loss_vlb_step=4.66e-6, train/loss_step=0.0009, global_step=1420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:   2%|▎         | 2/80 [00:48<20:49, 16.03s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=7.08e-6, train/loss_step=0.00121, global_step=1420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:   4%|▍         | 3/80 [00:48<15:34, 12.14s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=7.08e-6, train/loss_step=0.00121, global_step=1420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:   4%|▍         | 3/80 [00:48<15:34, 12.14s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.1e-5, train/loss_step=0.00569, global_step=1420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:   5%|▌         | 4/80 [00:49<12:26,  9.82s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.1e-5, train/loss_step=0.00569, global_step=1420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:   5%|▌         | 4/80 [00:49<12:26,  9.82s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=2.86e-6, train/loss_step=0.000555, global_step=1420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:   6%|▋         | 5/80 [00:49<10:19,  8.27s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=2.86e-6, train/loss_step=0.000555, global_step=1420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:   6%|▋         | 5/80 [00:49<10:19,  8.27s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.24e-6, train/loss_step=0.000254, global_step=1421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:   8%|▊         | 6/80 [00:50<08:49,  7.16s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.24e-6, train/loss_step=0.000254, global_step=1421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:   8%|▊         | 6/80 [00:50<08:49,  7.16s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.69e-5, train/loss_step=0.00174, global_step=1421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:   9%|▉         | 7/80 [00:50<07:41,  6.32s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.69e-5, train/loss_step=0.00174, global_step=1421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:   9%|▉         | 7/80 [00:50<07:41,  6.32s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.07e-5, train/loss_step=0.00294, global_step=1421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  10%|█         | 8/80 [01:29<11:59,  9.99s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=1.07e-5, train/loss_step=0.00294, global_step=1421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  10%|█         | 8/80 [01:29<11:59,  9.99s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=7.93e-6, train/loss_step=0.0017, global_step=1421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:  11%|█▏        | 9/80 [01:30<10:41,  9.04s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=7.93e-6, train/loss_step=0.0017, global_step=1421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  11%|█▏        | 9/80 [01:30<10:41,  9.04s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=1.9e-5, train/loss_step=0.00497, global_step=1422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  12%|█▎        | 10/80 [01:30<09:38,  8.26s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=1.9e-5, train/loss_step=0.00497, global_step=1422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  12%|█▎        | 10/80 [01:30<09:38,  8.26s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=1.98e-5, train/loss_step=0.00558, global_step=1422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  14%|█▍        | 11/80 [01:31<08:45,  7.62s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=1.98e-5, train/loss_step=0.00558, global_step=1422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  14%|█▍        | 11/80 [01:31<08:45,  7.62s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=2.17e-6, train/loss_step=0.00032, global_step=1422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  15%|█▌        | 12/80 [01:31<08:00,  7.07s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=2.17e-6, train/loss_step=0.00032, global_step=1422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  15%|█▌        | 12/80 [01:31<08:00,  7.07s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=1.62e-5, train/loss_step=0.00399, global_step=1422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  16%|█▋        | 13/80 [01:32<07:22,  6.60s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=1.62e-5, train/loss_step=0.00399, global_step=1422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  16%|█▋        | 13/80 [01:32<07:22,  6.60s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=6.78e-5, train/loss_step=0.00888, global_step=1423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  18%|█▊        | 14/80 [01:32<06:48,  6.20s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=6.78e-5, train/loss_step=0.00888, global_step=1423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  18%|█▊        | 14/80 [01:32<06:48,  6.20s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.29e-6, train/loss_step=0.000311, global_step=1423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  19%|█▉        | 15/80 [01:33<06:19,  5.84s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.29e-6, train/loss_step=0.000311, global_step=1423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  19%|█▉        | 15/80 [01:33<06:19,  5.84s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00064, train/loss_step=0.0313, global_step=1423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]    Epoch 71:  20%|██        | 16/80 [02:13<08:24,  7.88s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.00064, train/loss_step=0.0313, global_step=1423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  20%|██        | 16/80 [02:13<08:24,  7.88s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.55e-5, train/loss_step=0.0106, global_step=1423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  21%|██▏       | 17/80 [02:14<07:50,  7.47s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=5.55e-5, train/loss_step=0.0106, global_step=1423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  21%|██▏       | 17/80 [02:14<07:50,  7.47s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.56e-5, train/loss_step=0.0103, global_step=1424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  22%|██▎       | 18/80 [02:14<07:20,  7.10s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.56e-5, train/loss_step=0.0103, global_step=1424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  22%|██▎       | 18/80 [02:14<07:20,  7.10s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=8.08e-6, train/loss_step=0.00224, global_step=1424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  24%|██▍       | 19/80 [02:15<06:52,  6.77s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=8.08e-6, train/loss_step=0.00224, global_step=1424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  24%|██▍       | 19/80 [02:15<06:52,  6.77s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.02e-5, train/loss_step=0.00304, global_step=1424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  25%|██▌       | 20/80 [02:15<06:28,  6.48s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.02e-5, train/loss_step=0.00304, global_step=1424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  25%|██▌       | 20/80 [02:15<06:28,  6.48s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=3.86e-5, train/loss_step=0.00341, global_step=1424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:  26%|██▋       | 21/80 [02:16<06:06,  6.20s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=3.86e-5, train/loss_step=0.00341, global_step=1424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  26%|██▋       | 21/80 [02:16<06:06,  6.20s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=1.92e-5, train/loss_step=0.00475, global_step=1425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  28%|██▊       | 22/80 [02:16<05:45,  5.96s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=1.92e-5, train/loss_step=0.00475, global_step=1425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  28%|██▊       | 22/80 [02:16<05:45,  5.96s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=7.15e-6, train/loss_step=0.00184, global_step=1425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  29%|██▉       | 23/80 [02:17<05:26,  5.73s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=7.15e-6, train/loss_step=0.00184, global_step=1425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  29%|██▉       | 23/80 [02:17<05:26,  5.73s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=7.13e-5, train/loss_step=0.0102, global_step=1425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:  30%|███       | 24/80 [03:03<06:51,  7.34s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=7.13e-5, train/loss_step=0.0102, global_step=1425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  30%|███       | 24/80 [03:03<06:51,  7.34s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.6e-5, train/loss_step=0.00337, global_step=1425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  31%|███▏      | 25/80 [03:04<06:29,  7.08s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.6e-5, train/loss_step=0.00337, global_step=1425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  31%|███▏      | 25/80 [03:04<06:29,  7.08s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.08e-5, train/loss_step=0.00303, global_step=1426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  32%|███▎      | 26/80 [03:04<06:09,  6.84s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.08e-5, train/loss_step=0.00303, global_step=1426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  32%|███▎      | 26/80 [03:04<06:09,  6.84s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=2.69e-5, train/loss_step=0.00697, global_step=1426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  34%|███▍      | 27/80 [03:05<05:50,  6.61s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=2.69e-5, train/loss_step=0.00697, global_step=1426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  34%|███▍      | 27/80 [03:05<05:50,  6.61s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=0.000144, train/loss_step=0.00191, global_step=1426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  35%|███▌      | 28/80 [03:05<05:32,  6.40s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=0.000144, train/loss_step=0.00191, global_step=1426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  35%|███▌      | 28/80 [03:05<05:32,  6.40s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=2.9e-6, train/loss_step=0.000718, global_step=1426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  36%|███▋      | 29/80 [03:06<05:16,  6.20s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=2.9e-6, train/loss_step=0.000718, global_step=1426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  36%|███▋      | 29/80 [03:06<05:16,  6.20s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.000646, train/loss_vlb_step=3.71e-6, train/loss_step=0.000646, global_step=1427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  38%|███▊      | 30/80 [03:06<05:01,  6.02s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.000646, train/loss_vlb_step=3.71e-6, train/loss_step=0.000646, global_step=1427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  38%|███▊      | 30/80 [03:06<05:01,  6.02s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=6.34e-6, train/loss_step=0.00162, global_step=1427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:  39%|███▉      | 31/80 [03:07<04:46,  5.85s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=6.34e-6, train/loss_step=0.00162, global_step=1427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  39%|███▉      | 31/80 [03:07<04:46,  5.85s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=1.95e-5, train/loss_step=0.00562, global_step=1427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  40%|████      | 32/80 [03:47<05:31,  6.90s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=1.95e-5, train/loss_step=0.00562, global_step=1427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  40%|████      | 32/80 [03:47<05:31,  6.90s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=4.82e-5, train/loss_step=0.00242, global_step=1427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  41%|████▏     | 33/80 [03:48<05:15,  6.71s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=4.82e-5, train/loss_step=0.00242, global_step=1427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  41%|████▏     | 33/80 [03:48<05:15,  6.71s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=0.000276, train/loss_step=0.00264, global_step=1428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  42%|████▎     | 34/80 [03:48<05:00,  6.54s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=0.000276, train/loss_step=0.00264, global_step=1428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  42%|████▎     | 34/80 [03:48<05:00,  6.54s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=1.28e-5, train/loss_step=0.00157, global_step=1428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:  44%|████▍     | 35/80 [03:49<04:46,  6.37s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=1.28e-5, train/loss_step=0.00157, global_step=1428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  44%|████▍     | 35/80 [03:49<04:46,  6.37s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=7.6e-5, train/loss_step=0.00966, global_step=1428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:  45%|████▌     | 36/80 [03:49<04:33,  6.21s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=7.6e-5, train/loss_step=0.00966, global_step=1428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  45%|████▌     | 36/80 [03:49<04:33,  6.21s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=5.59e-5, train/loss_step=0.00164, global_step=1428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  46%|████▋     | 37/80 [03:50<04:20,  6.06s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=5.59e-5, train/loss_step=0.00164, global_step=1428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  46%|████▋     | 37/80 [03:50<04:20,  6.06s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=3.12e-5, train/loss_step=0.00143, global_step=1429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  48%|████▊     | 38/80 [03:50<04:08,  5.92s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=3.12e-5, train/loss_step=0.00143, global_step=1429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  48%|████▊     | 38/80 [03:50<04:08,  5.92s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=0.00133, train/loss_step=0.0114, global_step=1429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]   Epoch 71:  49%|████▉     | 39/80 [03:51<03:57,  5.78s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=0.00133, train/loss_step=0.0114, global_step=1429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  49%|████▉     | 39/80 [03:51<03:57,  5.78s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6.07e-6, train/loss_step=0.00151, global_step=1429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  50%|█████     | 40/80 [04:23<04:17,  6.44s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6.07e-6, train/loss_step=0.00151, global_step=1429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  50%|█████     | 40/80 [04:23<04:17,  6.44s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=3.19e-6, train/loss_step=0.000714, global_step=1429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  51%|█████▏    | 41/80 [04:24<04:05,  6.30s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=3.19e-6, train/loss_step=0.000714, global_step=1429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  51%|█████▏    | 41/80 [04:24<04:05,  6.30s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.09e-5, train/loss_step=0.0179, global_step=1430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]    Epoch 71:  52%|█████▎    | 42/80 [04:25<03:54,  6.17s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=7.09e-5, train/loss_step=0.0179, global_step=1430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  52%|█████▎    | 42/80 [04:25<03:54,  6.17s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.31e-6, train/loss_step=0.000551, global_step=1430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  54%|█████▍    | 43/80 [04:29<03:46,  6.12s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.31e-6, train/loss_step=0.000551, global_step=1430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  54%|█████▍    | 43/80 [04:29<03:46,  6.12s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.04e-5, train/loss_step=0.00859, global_step=1430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:  55%|█████▌    | 44/80 [04:29<03:35,  5.99s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.04e-5, train/loss_step=0.00859, global_step=1430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  55%|█████▌    | 44/80 [04:29<03:35,  5.99s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=3.21e-5, train/loss_step=0.00763, global_step=1430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00763, train/loss_vlb_step=3.21e-5, train/loss_step=0.00763, global_step=1430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=2.44e-6, train/loss_step=0.000363, global_step=1431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  57%|█████▊    | 46/80 [04:30<03:15,  5.76s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=2.44e-6, train/loss_step=0.000363, global_step=1431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  57%|█████▊    | 46/80 [04:30<03:15,  5.76s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00037, train/loss_vlb_step=1.6e-6, train/loss_step=0.00037, global_step=1431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]   Epoch 71:  59%|█████▉    | 47/80 [04:31<03:06,  5.65s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00037, train/loss_vlb_step=1.6e-6, train/loss_step=0.00037, global_step=1431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  59%|█████▉    | 47/80 [04:31<03:06,  5.65s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=5.58e-6, train/loss_step=0.0015, global_step=1431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:  60%|██████    | 48/80 [05:17<03:27,  6.47s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=5.58e-6, train/loss_step=0.0015, global_step=1431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  60%|██████    | 48/80 [05:17<03:27,  6.47s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=1.73e-6, train/loss_step=0.000423, global_step=1431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  61%|██████▏   | 49/80 [05:17<03:16,  6.35s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=1.73e-6, train/loss_step=0.000423, global_step=1431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  61%|██████▏   | 49/80 [05:17<03:16,  6.35s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.55e-5, train/loss_step=0.00859, global_step=1432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]   Epoch 71:  62%|██████▎   | 50/80 [05:18<03:07,  6.24s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.55e-5, train/loss_step=0.00859, global_step=1432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  62%|██████▎   | 50/80 [05:18<03:07,  6.24s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.47e-5, train/loss_step=0.00233, global_step=1432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  64%|██████▍   | 51/80 [05:18<02:57,  6.13s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.47e-5, train/loss_step=0.00233, global_step=1432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  64%|██████▍   | 51/80 [05:18<02:57,  6.13s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.22e-5, train/loss_step=0.00624, global_step=1432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  65%|██████▌   | 52/80 [05:19<02:48,  6.02s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.22e-5, train/loss_step=0.00624, global_step=1432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  65%|██████▌   | 52/80 [05:19<02:48,  6.02s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=1.46e-5, train/loss_step=0.00421, global_step=1432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  66%|██████▋   | 53/80 [05:19<02:39,  5.92s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=1.46e-5, train/loss_step=0.00421, global_step=1432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  66%|██████▋   | 53/80 [05:19<02:39,  5.92s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.24e-5, train/loss_step=0.00356, global_step=1433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  68%|██████▊   | 54/80 [05:20<02:31,  5.82s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.24e-5, train/loss_step=0.00356, global_step=1433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  68%|██████▊   | 54/80 [05:20<02:31,  5.82s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1e-5, train/loss_step=0.00233, global_step=1433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]   Epoch 71:  69%|██████▉   | 55/80 [05:20<02:23,  5.73s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1e-5, train/loss_step=0.00233, global_step=1433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  69%|██████▉   | 55/80 [05:20<02:23,  5.73s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=2.1e-6, train/loss_step=0.000496, global_step=1433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  70%|███████   | 56/80 [05:58<02:31,  6.29s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=2.1e-6, train/loss_step=0.000496, global_step=1433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  70%|███████   | 56/80 [05:58<02:31,  6.29s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=1.93e-5, train/loss_step=0.00553, global_step=1433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:  71%|███████▏  | 57/80 [05:59<02:22,  6.20s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=1.93e-5, train/loss_step=0.00553, global_step=1433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  71%|███████▏  | 57/80 [05:59<02:22,  6.20s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.000352, train/loss_step=0.0191, global_step=1434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:  72%|███████▎  | 58/80 [06:00<02:14,  6.10s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.000352, train/loss_step=0.0191, global_step=1434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  72%|███████▎  | 58/80 [06:00<02:14,  6.10s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=8.29e-6, train/loss_step=0.0019, global_step=1434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=8.29e-6, train/loss_step=0.0019, global_step=1434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000498, train/loss_vlb_step=2.36e-6, train/loss_step=0.000498, global_step=1434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  75%|███████▌  | 60/80 [06:01<01:58,  5.92s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000498, train/loss_vlb_step=2.36e-6, train/loss_step=0.000498, global_step=1434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  75%|███████▌  | 60/80 [06:01<01:58,  5.92s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000962, train/loss_vlb_step=7.84e-6, train/loss_step=0.000962, global_step=1434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  76%|███████▋  | 61/80 [06:01<01:50,  5.83s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000962, train/loss_vlb_step=7.84e-6, train/loss_step=0.000962, global_step=1434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  76%|███████▋  | 61/80 [06:01<01:50,  5.83s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.92e-6, train/loss_step=0.000389, global_step=1435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  78%|███████▊  | 62/80 [06:02<01:43,  5.75s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.92e-6, train/loss_step=0.000389, global_step=1435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  78%|███████▊  | 62/80 [06:02<01:43,  5.75s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=2.13e-6, train/loss_step=0.000466, global_step=1435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  79%|███████▉  | 63/80 [06:02<01:36,  5.67s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=2.13e-6, train/loss_step=0.000466, global_step=1435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  79%|███████▉  | 63/80 [06:02<01:36,  5.67s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.74e-6, train/loss_step=0.00116, global_step=1435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]   Epoch 71:  80%|████████  | 64/80 [06:37<01:37,  6.12s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.74e-6, train/loss_step=0.00116, global_step=1435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  80%|████████  | 64/80 [06:37<01:37,  6.12s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000201, train/loss_step=0.0152, global_step=1435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  81%|████████▏ | 65/80 [06:38<01:30,  6.03s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=0.000201, train/loss_step=0.0152, global_step=1435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  81%|████████▏ | 65/80 [06:38<01:30,  6.03s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00332, train/loss_step=0.0312, global_step=1436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:  82%|████████▎ | 66/80 [06:43<01:24,  6.02s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.0312, train/loss_vlb_step=0.00332, train/loss_step=0.0312, global_step=1436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  82%|████████▎ | 66/80 [06:43<01:24,  6.02s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.41e-5, train/loss_step=0.00641, global_step=1436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  84%|████████▍ | 67/80 [06:43<01:17,  5.94s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=3.41e-5, train/loss_step=0.00641, global_step=1436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  84%|████████▍ | 67/80 [06:43<01:17,  5.94s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=7.07e-5, train/loss_step=0.0119, global_step=1436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:  85%|████████▌ | 68/80 [06:44<01:10,  5.86s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=7.07e-5, train/loss_step=0.0119, global_step=1436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  85%|████████▌ | 68/80 [06:44<01:10,  5.86s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=3.83e-6, train/loss_step=0.000601, global_step=1436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  86%|████████▋ | 69/80 [06:44<01:03,  5.78s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=3.83e-6, train/loss_step=0.000601, global_step=1436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  86%|████████▋ | 69/80 [06:44<01:03,  5.78s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=0.000203, train/loss_step=0.00622, global_step=1437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:  88%|████████▊ | 70/80 [06:45<00:57,  5.71s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=0.000203, train/loss_step=0.00622, global_step=1437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  88%|████████▊ | 70/80 [06:45<00:57,  5.71s/it, loss=0.00782, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000491, train/loss_step=0.0379, global_step=1437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:  89%|████████▉ | 71/80 [06:45<00:50,  5.64s/it, loss=0.00782, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.000491, train/loss_step=0.0379, global_step=1437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  89%|████████▉ | 71/80 [06:45<00:50,  5.64s/it, loss=0.00841, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000144, train/loss_step=0.018, global_step=1437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 71:  90%|█████████ | 72/80 [07:06<00:46,  5.84s/it, loss=0.00841, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000144, train/loss_step=0.018, global_step=1437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  90%|█████████ | 72/80 [07:06<00:46,  5.84s/it, loss=0.00837, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=0.00129, train/loss_step=0.00337, global_step=1437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  91%|█████████▏| 73/80 [07:06<00:40,  5.77s/it, loss=0.00837, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=0.00129, train/loss_step=0.00337, global_step=1437.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  91%|█████████▏| 73/80 [07:06<00:40,  5.77s/it, loss=0.00824, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=5.36e-5, train/loss_step=0.000969, global_step=1438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  92%|█████████▎| 74/80 [07:23<00:35,  5.92s/it, loss=0.00824, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=5.36e-5, train/loss_step=0.000969, global_step=1438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  92%|█████████▎| 74/80 [07:23<00:35,  5.92s/it, loss=0.00816, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=3.17e-6, train/loss_step=0.000831, global_step=1438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  94%|█████████▍| 75/80 [07:24<00:29,  5.84s/it, loss=0.00816, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=3.17e-6, train/loss_step=0.000831, global_step=1438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  94%|█████████▍| 75/80 [07:24<00:29,  5.84s/it, loss=0.00815, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=1.09e-6, train/loss_step=0.000263, global_step=1438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  95%|█████████▌| 76/80 [07:24<00:23,  5.78s/it, loss=0.00815, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=1.09e-6, train/loss_step=0.000263, global_step=1438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  95%|█████████▌| 76/80 [07:24<00:23,  5.78s/it, loss=0.00799, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=8.8e-6, train/loss_step=0.00229, global_step=1438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]   Epoch 71:  96%|█████████▋| 77/80 [07:25<00:17,  5.71s/it, loss=0.00799, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=8.8e-6, train/loss_step=0.00229, global_step=1438.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  96%|█████████▋| 77/80 [07:25<00:17,  5.71s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=1.1e-6, train/loss_step=0.000247, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  98%|█████████▊| 78/80 [07:25<00:11,  5.64s/it, loss=0.00704, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=1.1e-6, train/loss_step=0.000247, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  98%|█████████▊| 78/80 [07:25<00:11,  5.64s/it, loss=0.00706, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=8.78e-6, train/loss_step=0.00212, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Epoch 71:  99%|█████████▉| 79/80 [07:26<00:05,  5.58s/it, loss=0.00706, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=8.78e-6, train/loss_step=0.00212, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71:  99%|█████████▉| 79/80 [07:26<00:05,  5.58s/it, loss=0.00731, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=4.76e-5, train/loss_step=0.00567, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71: 100%|██████████| 80/80 [07:26<00:00,  5.51s/it, loss=0.00731, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=4.76e-5, train/loss_step=0.00567, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 71: 100%|██████████| 80/80 [07:26<00:00,  5.51s/it, loss=0.00728, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=2e-6, train/loss_step=0.000373, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403] Average Epoch time: 446.64 seconds
+Average Peak memory 29568.92MiB
+Epoch 71:   0%|          | 0/80 [00:00<00:00, 5011.12it/s, loss=0.00728, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=2e-6, train/loss_step=0.000373, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 72:   0%|          | 0/80 [00:00<00:00, 2058.05it/s, loss=0.00728, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=2e-6, train/loss_step=0.000373, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]Epoch 72:   1%|▏         | 1/80 [00:44<29:18, 22.26s/it, loss=0.00728, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=2e-6, train/loss_step=0.000373, global_step=1439.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000121, train/loss_epoch=0.00403]  Epoch 72:   1%|▏         | 1/80 [00:44<29:18, 22.26s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=7.22e-6, train/loss_step=0.000788, global_step=1440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   2%|▎         | 2/80 [00:45<19:30, 15.00s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=7.22e-6, train/loss_step=0.000788, global_step=1440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   2%|▎         | 2/80 [00:45<19:30, 15.00s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=3.85e-6, train/loss_step=0.000365, global_step=1440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   4%|▍         | 3/80 [00:45<14:35, 11.38s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=3.85e-6, train/loss_step=0.000365, global_step=1440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   4%|▍         | 3/80 [00:45<14:36, 11.38s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.68e-5, train/loss_step=0.00114, global_step=1440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]  Epoch 72:   5%|▌         | 4/80 [00:46<11:39,  9.21s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.68e-5, train/loss_step=0.00114, global_step=1440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   5%|▌         | 4/80 [00:46<11:39,  9.21s/it, loss=0.00665, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=8.59e-6, train/loss_step=0.00232, global_step=1440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   6%|▋         | 5/80 [00:46<09:41,  7.76s/it, loss=0.00665, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=8.59e-6, train/loss_step=0.00232, global_step=1440.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   6%|▋         | 5/80 [00:46<09:41,  7.76s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=7.87e-6, train/loss_step=0.00212, global_step=1441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:   8%|▊         | 6/80 [00:47<08:17,  6.72s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=7.87e-6, train/loss_step=0.00212, global_step=1441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   8%|▊         | 6/80 [00:47<08:17,  6.72s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=6.26e-6, train/loss_step=0.00135, global_step=1441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   9%|▉         | 7/80 [00:47<07:13,  5.94s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=6.26e-6, train/loss_step=0.00135, global_step=1441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:   9%|▉         | 7/80 [00:47<07:13,  5.94s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.36e-5, train/loss_step=0.00374, global_step=1441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  10%|█         | 8/80 [01:26<11:35,  9.65s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=2.36e-5, train/loss_step=0.00374, global_step=1441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  10%|█         | 8/80 [01:26<11:35,  9.66s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=1.08e-5, train/loss_step=0.00117, global_step=1441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  11%|█▏        | 9/80 [01:27<10:20,  8.74s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=1.08e-5, train/loss_step=0.00117, global_step=1441.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  11%|█▏        | 9/80 [01:27<10:20,  8.74s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.1e-6, train/loss_step=0.000246, global_step=1442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  12%|█▎        | 10/80 [01:27<09:19,  7.99s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.1e-6, train/loss_step=0.000246, global_step=1442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  12%|█▎        | 10/80 [01:27<09:19,  7.99s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000699, train/loss_vlb_step=7.63e-6, train/loss_step=0.000699, global_step=1442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  14%|█▍        | 11/80 [01:28<08:28,  7.37s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000699, train/loss_vlb_step=7.63e-6, train/loss_step=0.000699, global_step=1442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  14%|█▍        | 11/80 [01:28<08:28,  7.37s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.27e-6, train/loss_step=0.000323, global_step=1442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  15%|█▌        | 12/80 [01:28<07:45,  6.84s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.27e-6, train/loss_step=0.000323, global_step=1442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  15%|█▌        | 12/80 [01:28<07:45,  6.84s/it, loss=0.00137, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=4.45e-6, train/loss_step=0.000467, global_step=1442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  16%|█▋        | 13/80 [01:29<07:08,  6.39s/it, loss=0.00137, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=4.45e-6, train/loss_step=0.000467, global_step=1442.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  16%|█▋        | 13/80 [01:29<07:08,  6.39s/it, loss=0.00157, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=0.000948, train/loss_step=0.00482, global_step=1443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  18%|█▊        | 14/80 [01:29<06:35,  6.00s/it, loss=0.00157, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=0.000948, train/loss_step=0.00482, global_step=1443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  18%|█▊        | 14/80 [01:29<06:35,  6.00s/it, loss=0.00172, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=3.32e-5, train/loss_step=0.00389, global_step=1443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  19%|█▉        | 15/80 [01:30<06:07,  5.65s/it, loss=0.00172, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=3.32e-5, train/loss_step=0.00389, global_step=1443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  19%|█▉        | 15/80 [01:30<06:07,  5.65s/it, loss=0.00176, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=0.000161, train/loss_step=0.00114, global_step=1443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  20%|██        | 16/80 [02:11<08:16,  7.76s/it, loss=0.00176, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=0.000161, train/loss_step=0.00114, global_step=1443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  20%|██        | 16/80 [02:11<08:16,  7.76s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.05e-5, train/loss_step=0.00268, global_step=1443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  21%|██▏       | 17/80 [02:12<07:43,  7.35s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.05e-5, train/loss_step=0.00268, global_step=1443.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  21%|██▏       | 17/80 [02:12<07:43,  7.35s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.000244, train/loss_vlb_step=1.04e-6, train/loss_step=0.000244, global_step=1444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  22%|██▎       | 18/80 [02:13<07:17,  7.05s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.000244, train/loss_vlb_step=1.04e-6, train/loss_step=0.000244, global_step=1444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  22%|██▎       | 18/80 [02:13<07:17,  7.05s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=0.000612, train/loss_step=0.00383, global_step=1444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  24%|██▍       | 19/80 [02:14<06:50,  6.72s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.00383, train/loss_vlb_step=0.000612, train/loss_step=0.00383, global_step=1444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  24%|██▍       | 19/80 [02:14<06:50,  6.72s/it, loss=0.00163, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=4.01e-6, train/loss_step=0.000817, global_step=1444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  25%|██▌       | 20/80 [02:14<06:25,  6.43s/it, loss=0.00163, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=4.01e-6, train/loss_step=0.000817, global_step=1444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  25%|██▌       | 20/80 [02:14<06:25,  6.43s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=1.49e-5, train/loss_step=0.00381, global_step=1444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]   Epoch 72:  26%|██▋       | 21/80 [02:15<06:03,  6.16s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=1.49e-5, train/loss_step=0.00381, global_step=1444.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  26%|██▋       | 21/80 [02:15<06:03,  6.16s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.09e-6, train/loss_step=0.000256, global_step=1445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  28%|██▊       | 22/80 [02:15<05:42,  5.91s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.09e-6, train/loss_step=0.000256, global_step=1445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  28%|██▊       | 22/80 [02:15<05:42,  5.91s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=6.51e-5, train/loss_step=0.00153, global_step=1445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]  Epoch 72:  29%|██▉       | 23/80 [02:16<05:24,  5.69s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=6.51e-5, train/loss_step=0.00153, global_step=1445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  29%|██▉       | 23/80 [02:16<05:24,  5.69s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=2.15e-6, train/loss_step=0.000423, global_step=1445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  30%|███       | 24/80 [02:52<06:26,  6.90s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=2.15e-6, train/loss_step=0.000423, global_step=1445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  30%|███       | 24/80 [02:52<06:26,  6.90s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=5.79e-6, train/loss_step=0.00124, global_step=1445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]  Epoch 72:  31%|███▏      | 25/80 [02:53<06:06,  6.66s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=5.79e-6, train/loss_step=0.00124, global_step=1445.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  31%|███▏      | 25/80 [02:53<06:06,  6.66s/it, loss=0.00165, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=2.19e-6, train/loss_step=0.000356, global_step=1446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  32%|███▎      | 26/80 [03:05<06:10,  6.86s/it, loss=0.00165, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=2.19e-6, train/loss_step=0.000356, global_step=1446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  32%|███▎      | 26/80 [03:05<06:10,  6.86s/it, loss=0.00163, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=3.17e-6, train/loss_step=0.000934, global_step=1446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  34%|███▍      | 27/80 [03:05<05:51,  6.63s/it, loss=0.00163, v_num=0, train/loss_simple_step=0.000934, train/loss_vlb_step=3.17e-6, train/loss_step=0.000934, global_step=1446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  34%|███▍      | 27/80 [03:05<05:51,  6.63s/it, loss=0.00145, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=7.76e-7, train/loss_step=0.0002, global_step=1446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]    Epoch 72:  35%|███▌      | 28/80 [03:06<05:34,  6.42s/it, loss=0.00145, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=7.76e-7, train/loss_step=0.0002, global_step=1446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  35%|███▌      | 28/80 [03:06<05:34,  6.42s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.74e-5, train/loss_step=0.0101, global_step=1446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  36%|███▋      | 29/80 [03:06<05:17,  6.23s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.74e-5, train/loss_step=0.0101, global_step=1446.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  36%|███▋      | 29/80 [03:06<05:17,  6.23s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=2.4e-6, train/loss_step=0.000355, global_step=1447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  38%|███▊      | 30/80 [03:07<05:02,  6.04s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=2.4e-6, train/loss_step=0.000355, global_step=1447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  38%|███▊      | 30/80 [03:07<05:02,  6.04s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=8.36e-5, train/loss_step=0.00906, global_step=1447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  39%|███▉      | 31/80 [03:07<04:47,  5.87s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00906, train/loss_vlb_step=8.36e-5, train/loss_step=0.00906, global_step=1447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  39%|███▉      | 31/80 [03:07<04:47,  5.87s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=0.000148, train/loss_step=0.00107, global_step=1447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  40%|████      | 32/80 [03:34<05:12,  6.51s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=0.000148, train/loss_step=0.00107, global_step=1447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  40%|████      | 32/80 [03:34<05:12,  6.51s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=2.68e-5, train/loss_step=0.00742, global_step=1447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=2.68e-5, train/loss_step=0.00742, global_step=1447.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.21e-5, train/loss_step=0.00808, global_step=1448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  42%|████▎     | 34/80 [03:37<04:45,  6.21s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.21e-5, train/loss_step=0.00808, global_step=1448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  42%|████▎     | 34/80 [03:37<04:45,  6.21s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=6.63e-6, train/loss_step=0.00115, global_step=1448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  44%|████▍     | 35/80 [03:38<04:32,  6.06s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=6.63e-6, train/loss_step=0.00115, global_step=1448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  44%|████▍     | 35/80 [03:38<04:32,  6.06s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.33e-5, train/loss_step=0.0036, global_step=1448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]  Epoch 72:  45%|████▌     | 36/80 [03:38<04:19,  5.91s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.33e-5, train/loss_step=0.0036, global_step=1448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  45%|████▌     | 36/80 [03:38<04:19,  5.91s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.12e-5, train/loss_step=0.0107, global_step=1448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  46%|████▋     | 37/80 [03:39<04:07,  5.77s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.12e-5, train/loss_step=0.0107, global_step=1448.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  46%|████▋     | 37/80 [03:39<04:07,  5.77s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=6.28e-6, train/loss_step=0.00133, global_step=1449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  48%|████▊     | 38/80 [03:39<03:56,  5.63s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=6.28e-6, train/loss_step=0.00133, global_step=1449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  48%|████▊     | 38/80 [03:39<03:56,  5.63s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=7.32e-5, train/loss_step=0.00705, global_step=1449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  49%|████▉     | 39/80 [03:40<03:45,  5.50s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=7.32e-5, train/loss_step=0.00705, global_step=1449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  49%|████▉     | 39/80 [03:40<03:45,  5.50s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.29e-5, train/loss_step=0.00324, global_step=1449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  50%|█████     | 40/80 [04:20<04:13,  6.34s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.29e-5, train/loss_step=0.00324, global_step=1449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  50%|█████     | 40/80 [04:20<04:13,  6.34s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=5.04e-5, train/loss_step=0.00298, global_step=1449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  51%|█████▏    | 41/80 [04:20<04:02,  6.21s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=5.04e-5, train/loss_step=0.00298, global_step=1449.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  51%|█████▏    | 41/80 [04:20<04:02,  6.21s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=7.03e-7, train/loss_step=0.00017, global_step=1450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  52%|█████▎    | 42/80 [04:21<03:50,  6.07s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=7.03e-7, train/loss_step=0.00017, global_step=1450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  52%|█████▎    | 42/80 [04:21<03:50,  6.07s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000219, train/loss_vlb_step=8.41e-7, train/loss_step=0.000219, global_step=1450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  54%|█████▍    | 43/80 [04:21<03:40,  5.95s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000219, train/loss_vlb_step=8.41e-7, train/loss_step=0.000219, global_step=1450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  54%|█████▍    | 43/80 [04:21<03:40,  5.95s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000959, train/loss_vlb_step=4.1e-6, train/loss_step=0.000959, global_step=1450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  55%|█████▌    | 44/80 [04:22<03:29,  5.83s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000959, train/loss_vlb_step=4.1e-6, train/loss_step=0.000959, global_step=1450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  55%|█████▌    | 44/80 [04:22<03:29,  5.83s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=3.27e-5, train/loss_step=0.000834, global_step=1450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  56%|█████▋    | 45/80 [04:26<03:22,  5.79s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=3.27e-5, train/loss_step=0.000834, global_step=1450.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  56%|█████▋    | 45/80 [04:26<03:22,  5.79s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=1.45e-5, train/loss_step=0.00403, global_step=1451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]  Epoch 72:  57%|█████▊    | 46/80 [04:26<03:12,  5.68s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=1.45e-5, train/loss_step=0.00403, global_step=1451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  57%|█████▊    | 46/80 [04:26<03:12,  5.68s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.66e-5, train/loss_step=0.00452, global_step=1451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  59%|█████▉    | 47/80 [04:27<03:03,  5.57s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.66e-5, train/loss_step=0.00452, global_step=1451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  59%|█████▉    | 47/80 [04:27<03:03,  5.57s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=1.74e-5, train/loss_step=0.00442, global_step=1451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  60%|██████    | 48/80 [05:01<03:16,  6.15s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=1.74e-5, train/loss_step=0.00442, global_step=1451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  60%|██████    | 48/80 [05:01<03:16,  6.15s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=1.43e-5, train/loss_step=0.000437, global_step=1451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  61%|██████▏   | 49/80 [05:02<03:07,  6.04s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=1.43e-5, train/loss_step=0.000437, global_step=1451.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  61%|██████▏   | 49/80 [05:02<03:07,  6.04s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=0.000652, train/loss_step=0.0175, global_step=1452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]   Epoch 72:  62%|██████▎   | 50/80 [05:02<02:57,  5.93s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0175, train/loss_vlb_step=0.000652, train/loss_step=0.0175, global_step=1452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  62%|██████▎   | 50/80 [05:02<02:57,  5.93s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.53e-5, train/loss_step=0.00637, global_step=1452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  64%|██████▍   | 51/80 [05:03<02:49,  5.83s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.53e-5, train/loss_step=0.00637, global_step=1452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  64%|██████▍   | 51/80 [05:03<02:49,  5.83s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000907, train/loss_vlb_step=3.63e-6, train/loss_step=0.000907, global_step=1452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  65%|██████▌   | 52/80 [05:03<02:40,  5.73s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000907, train/loss_vlb_step=3.63e-6, train/loss_step=0.000907, global_step=1452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  65%|██████▌   | 52/80 [05:03<02:40,  5.73s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=3.87e-6, train/loss_step=0.000726, global_step=1452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=3.87e-6, train/loss_step=0.000726, global_step=1452.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.11e-6, train/loss_step=0.000237, global_step=1453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.11e-6, train/loss_step=0.000237, global_step=1453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.45e-6, train/loss_step=0.000308, global_step=1453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  69%|██████▉   | 55/80 [05:12<02:19,  5.58s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.45e-6, train/loss_step=0.000308, global_step=1453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  69%|██████▉   | 55/80 [05:12<02:19,  5.58s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=6.08e-5, train/loss_step=0.0111, global_step=1453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]    Epoch 72:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=6.08e-5, train/loss_step=0.0111, global_step=1453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000383, train/loss_vlb_step=2.62e-6, train/loss_step=0.000383, global_step=1453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  71%|███████▏  | 57/80 [05:42<02:15,  5.90s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000383, train/loss_vlb_step=2.62e-6, train/loss_step=0.000383, global_step=1453.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  71%|███████▏  | 57/80 [05:42<02:15,  5.90s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.23e-5, train/loss_step=0.00581, global_step=1454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]  Epoch 72:  72%|███████▎  | 58/80 [05:42<02:07,  5.81s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.23e-5, train/loss_step=0.00581, global_step=1454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  72%|███████▎  | 58/80 [05:42<02:07,  5.81s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=3.08e-5, train/loss_step=0.00792, global_step=1454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  74%|███████▍  | 59/80 [05:43<02:00,  5.72s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=3.08e-5, train/loss_step=0.00792, global_step=1454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  74%|███████▍  | 59/80 [05:43<02:00,  5.72s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=8.65e-6, train/loss_step=0.00233, global_step=1454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  75%|███████▌  | 60/80 [05:43<01:52,  5.64s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=8.65e-6, train/loss_step=0.00233, global_step=1454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  75%|███████▌  | 60/80 [05:43<01:52,  5.64s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=8.2e-7, train/loss_step=0.000199, global_step=1454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  76%|███████▋  | 61/80 [05:55<01:48,  5.73s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=8.2e-7, train/loss_step=0.000199, global_step=1454.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  76%|███████▋  | 61/80 [05:55<01:48,  5.73s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=8.9e-6, train/loss_step=0.00246, global_step=1455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]  Epoch 72:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=8.9e-6, train/loss_step=0.00246, global_step=1455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000849, train/loss_vlb_step=8.79e-6, train/loss_step=0.000849, global_step=1455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  79%|███████▉  | 63/80 [05:56<01:34,  5.56s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000849, train/loss_vlb_step=8.79e-6, train/loss_step=0.000849, global_step=1455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  79%|███████▉  | 63/80 [05:56<01:34,  5.56s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000134, train/loss_vlb_step=5.4e-7, train/loss_step=0.000134, global_step=1455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  80%|████████  | 64/80 [06:16<01:32,  5.79s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000134, train/loss_vlb_step=5.4e-7, train/loss_step=0.000134, global_step=1455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  80%|████████  | 64/80 [06:16<01:32,  5.79s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00078, train/loss_vlb_step=3.65e-6, train/loss_step=0.00078, global_step=1455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  81%|████████▏ | 65/80 [06:17<01:25,  5.72s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00078, train/loss_vlb_step=3.65e-6, train/loss_step=0.00078, global_step=1455.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  81%|████████▏ | 65/80 [06:17<01:25,  5.72s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=6.65e-6, train/loss_step=0.000357, global_step=1456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  82%|████████▎ | 66/80 [06:20<01:19,  5.67s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=6.65e-6, train/loss_step=0.000357, global_step=1456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  82%|████████▎ | 66/80 [06:20<01:19,  5.67s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000174, train/loss_step=0.0192, global_step=1456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]   Epoch 72:  84%|████████▍ | 67/80 [06:20<01:12,  5.60s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000174, train/loss_step=0.0192, global_step=1456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  84%|████████▍ | 67/80 [06:20<01:12,  5.60s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.24e-5, train/loss_step=0.00586, global_step=1456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  85%|████████▌ | 68/80 [06:21<01:06,  5.52s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.24e-5, train/loss_step=0.00586, global_step=1456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  85%|████████▌ | 68/80 [06:21<01:06,  5.52s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=2.38e-5, train/loss_step=0.00693, global_step=1456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  86%|████████▋ | 69/80 [06:31<01:01,  5.59s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=2.38e-5, train/loss_step=0.00693, global_step=1456.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  86%|████████▋ | 69/80 [06:31<01:01,  5.59s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000193, train/loss_step=0.0183, global_step=1457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  88%|████████▊ | 70/80 [06:32<00:55,  5.52s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000193, train/loss_step=0.0183, global_step=1457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  88%|████████▊ | 70/80 [06:32<00:55,  5.52s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.03e-5, train/loss_step=0.00268, global_step=1457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  89%|████████▉ | 71/80 [06:32<00:49,  5.45s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.03e-5, train/loss_step=0.00268, global_step=1457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  89%|████████▉ | 71/80 [06:32<00:49,  5.45s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=1.08e-6, train/loss_step=0.000236, global_step=1457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=1.08e-6, train/loss_step=0.000236, global_step=1457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000328, train/loss_vlb_step=1.6e-6, train/loss_step=0.000328, global_step=1457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  91%|█████████▏| 73/80 [06:48<00:38,  5.53s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000328, train/loss_vlb_step=1.6e-6, train/loss_step=0.000328, global_step=1457.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  91%|█████████▏| 73/80 [06:48<00:38,  5.53s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000177, train/loss_step=0.018, global_step=1458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]    Epoch 72:  92%|█████████▎| 74/80 [06:57<00:33,  5.56s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000177, train/loss_step=0.018, global_step=1458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  92%|█████████▎| 74/80 [06:57<00:33,  5.56s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000784, train/loss_vlb_step=3.94e-6, train/loss_step=0.000784, global_step=1458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  94%|█████████▍| 75/80 [06:57<00:27,  5.49s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000784, train/loss_vlb_step=3.94e-6, train/loss_step=0.000784, global_step=1458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  94%|█████████▍| 75/80 [06:57<00:27,  5.49s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=0.000199, train/loss_step=0.00566, global_step=1458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72:  95%|█████████▌| 76/80 [06:58<00:21,  5.43s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=0.000199, train/loss_step=0.00566, global_step=1458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  95%|█████████▌| 76/80 [06:58<00:21,  5.43s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.35e-5, train/loss_step=0.0121, global_step=1458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]   Epoch 72:  96%|█████████▋| 77/80 [07:02<00:16,  5.42s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=5.35e-5, train/loss_step=0.0121, global_step=1458.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  96%|█████████▋| 77/80 [07:02<00:16,  5.42s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=4.91e-7, train/loss_step=0.000139, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=4.91e-7, train/loss_step=0.000139, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  98%|█████████▊| 78/80 [07:03<00:10,  5.36s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=2.49e-5, train/loss_step=0.0072, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]    Epoch 72:  99%|█████████▉| 79/80 [07:03<00:05,  5.29s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0072, train/loss_vlb_step=2.49e-5, train/loss_step=0.0072, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72:  99%|█████████▉| 79/80 [07:03<00:05,  5.29s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.7e-6, train/loss_step=0.0012, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411] Epoch 72: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.7e-6, train/loss_step=0.0012, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 72: 100%|██████████| 80/80 [07:04<00:00,  5.24s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.76e-6, train/loss_step=0.00035, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Average Epoch time: 424.09 seconds
+Average Peak memory 29566.10MiB
+Epoch 72:   0%|          | 0/80 [00:00<00:00, 4549.14it/s, loss=0.00518, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.76e-6, train/loss_step=0.00035, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 73:   0%|          | 0/80 [00:00<00:00, 2060.07it/s, loss=0.00518, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.76e-6, train/loss_step=0.00035, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]Epoch 73:   1%|▏         | 1/80 [00:45<30:10, 22.91s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.76e-6, train/loss_step=0.00035, global_step=1459.0, lr_abs=0.0001, train/loss_simple_epoch=0.00411, train/loss_vlb_epoch=0.000149, train/loss_epoch=0.00411]  Epoch 73:   1%|▏         | 1/80 [00:45<30:10, 22.91s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.03e-5, train/loss_step=0.00593, global_step=1460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   2%|▎         | 2/80 [00:46<20:03, 15.43s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=2.03e-5, train/loss_step=0.00593, global_step=1460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   2%|▎         | 2/80 [00:46<20:03, 15.44s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=2.85e-5, train/loss_step=0.00832, global_step=1460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   4%|▍         | 3/80 [00:46<15:00, 11.70s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.00832, train/loss_vlb_step=2.85e-5, train/loss_step=0.00832, global_step=1460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   4%|▍         | 3/80 [00:46<15:00, 11.70s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00932, train/loss_vlb_step=6.11e-5, train/loss_step=0.00932, global_step=1460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   5%|▌         | 4/80 [00:47<11:59,  9.47s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00932, train/loss_vlb_step=6.11e-5, train/loss_step=0.00932, global_step=1460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   5%|▌         | 4/80 [00:47<11:59,  9.47s/it, loss=0.0062, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=7.04e-6, train/loss_step=0.00119, global_step=1460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404] Epoch 73:   6%|▋         | 5/80 [00:47<09:58,  7.97s/it, loss=0.0062, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=7.04e-6, train/loss_step=0.00119, global_step=1460.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   6%|▋         | 5/80 [00:47<09:58,  7.97s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.03e-5, train/loss_step=0.00271, global_step=1461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   8%|▊         | 6/80 [00:48<08:30,  6.90s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=1.03e-5, train/loss_step=0.00271, global_step=1461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   8%|▊         | 6/80 [00:48<08:30,  6.90s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000504, train/loss_vlb_step=2.75e-6, train/loss_step=0.000504, global_step=1461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   9%|▉         | 7/80 [00:48<07:25,  6.10s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000504, train/loss_vlb_step=2.75e-6, train/loss_step=0.000504, global_step=1461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:   9%|▉         | 7/80 [00:48<07:25,  6.10s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=4.61e-6, train/loss_step=0.000624, global_step=1461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  10%|█         | 8/80 [01:17<10:23,  8.66s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=4.61e-6, train/loss_step=0.000624, global_step=1461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  10%|█         | 8/80 [01:17<10:23,  8.66s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=6.81e-5, train/loss_step=0.00942, global_step=1461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  11%|█▏        | 9/80 [01:29<10:34,  8.93s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=6.81e-5, train/loss_step=0.00942, global_step=1461.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  11%|█▏        | 9/80 [01:29<10:34,  8.93s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000335, train/loss_vlb_step=1.32e-6, train/loss_step=0.000335, global_step=1462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  12%|█▎        | 10/80 [01:29<09:31,  8.17s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000335, train/loss_vlb_step=1.32e-6, train/loss_step=0.000335, global_step=1462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  12%|█▎        | 10/80 [01:29<09:31,  8.17s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.03e-5, train/loss_step=0.00284, global_step=1462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  14%|█▍        | 11/80 [01:30<08:39,  7.53s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.03e-5, train/loss_step=0.00284, global_step=1462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  14%|█▍        | 11/80 [01:30<08:39,  7.53s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=6.33e-6, train/loss_step=0.00168, global_step=1462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  15%|█▌        | 12/80 [01:30<07:55,  6.99s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=6.33e-6, train/loss_step=0.00168, global_step=1462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  15%|█▌        | 12/80 [01:30<07:55,  6.99s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000381, train/loss_step=0.0244, global_step=1462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404] Epoch 73:  16%|█▋        | 13/80 [01:31<07:17,  6.53s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.000381, train/loss_step=0.0244, global_step=1462.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  16%|█▋        | 13/80 [01:31<07:17,  6.53s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.41e-6, train/loss_step=0.000339, global_step=1463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  18%|█▊        | 14/80 [01:31<06:44,  6.12s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.41e-6, train/loss_step=0.000339, global_step=1463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  18%|█▊        | 14/80 [01:31<06:44,  6.12s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=5.19e-5, train/loss_step=0.00901, global_step=1463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  19%|█▉        | 15/80 [01:32<06:15,  5.77s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=5.19e-5, train/loss_step=0.00901, global_step=1463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  19%|█▉        | 15/80 [01:32<06:15,  5.77s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=4.44e-5, train/loss_step=0.00909, global_step=1463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  20%|██        | 16/80 [02:07<07:58,  7.48s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=4.44e-5, train/loss_step=0.00909, global_step=1463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  20%|██        | 16/80 [02:07<07:58,  7.48s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000145, train/loss_vlb_step=6.27e-7, train/loss_step=0.000145, global_step=1463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  21%|██▏       | 17/80 [02:19<08:09,  7.77s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000145, train/loss_vlb_step=6.27e-7, train/loss_step=0.000145, global_step=1463.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  21%|██▏       | 17/80 [02:19<08:09,  7.77s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.13e-6, train/loss_step=0.00128, global_step=1464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  22%|██▎       | 18/80 [02:20<07:37,  7.39s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.13e-6, train/loss_step=0.00128, global_step=1464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  22%|██▎       | 18/80 [02:20<07:37,  7.39s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=6.82e-6, train/loss_step=0.000589, global_step=1464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  24%|██▍       | 19/80 [02:20<07:09,  7.04s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=6.82e-6, train/loss_step=0.000589, global_step=1464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  24%|██▍       | 19/80 [02:20<07:09,  7.04s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.01e-5, train/loss_step=0.00269, global_step=1464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  25%|██▌       | 20/80 [02:21<06:43,  6.73s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=1.01e-5, train/loss_step=0.00269, global_step=1464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  25%|██▌       | 20/80 [02:21<06:43,  6.73s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.47e-5, train/loss_step=0.002, global_step=1464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]    Epoch 73:  26%|██▋       | 21/80 [02:21<06:20,  6.45s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=1.47e-5, train/loss_step=0.002, global_step=1464.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  26%|██▋       | 21/80 [02:21<06:20,  6.45s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=0.000817, train/loss_step=0.0236, global_step=1465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  28%|██▊       | 22/80 [02:22<05:58,  6.19s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.0236, train/loss_vlb_step=0.000817, train/loss_step=0.0236, global_step=1465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  28%|██▊       | 22/80 [02:22<05:58,  6.19s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=2.54e-6, train/loss_step=0.000637, global_step=1465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  29%|██▉       | 23/80 [02:22<05:39,  5.95s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=2.54e-6, train/loss_step=0.000637, global_step=1465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  29%|██▉       | 23/80 [02:22<05:39,  5.95s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.16e-5, train/loss_step=0.00569, global_step=1465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  30%|███       | 24/80 [02:44<06:07,  6.57s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00569, train/loss_vlb_step=2.16e-5, train/loss_step=0.00569, global_step=1465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  30%|███       | 24/80 [02:44<06:07,  6.57s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=7.52e-6, train/loss_step=0.00177, global_step=1465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  31%|███▏      | 25/80 [02:59<06:20,  6.92s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=7.52e-6, train/loss_step=0.00177, global_step=1465.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  31%|███▏      | 25/80 [02:59<06:20,  6.92s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.81e-5, train/loss_step=0.00615, global_step=1466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  32%|███▎      | 26/80 [03:00<06:00,  6.68s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.81e-5, train/loss_step=0.00615, global_step=1466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  32%|███▎      | 26/80 [03:00<06:00,  6.68s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000688, train/loss_vlb_step=3.08e-6, train/loss_step=0.000688, global_step=1466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  34%|███▍      | 27/80 [03:00<05:42,  6.46s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.000688, train/loss_vlb_step=3.08e-6, train/loss_step=0.000688, global_step=1466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  34%|███▍      | 27/80 [03:00<05:42,  6.46s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.00124, train/loss_step=0.015, global_step=1466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]      Epoch 73:  35%|███▌      | 28/80 [03:01<05:25,  6.26s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.00124, train/loss_step=0.015, global_step=1466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  35%|███▌      | 28/80 [03:01<05:25,  6.26s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=6.5e-6, train/loss_step=0.0017, global_step=1466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  36%|███▋      | 29/80 [03:02<05:09,  6.07s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=6.5e-6, train/loss_step=0.0017, global_step=1466.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  36%|███▋      | 29/80 [03:02<05:09,  6.07s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=8.16e-6, train/loss_step=0.00174, global_step=1467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=8.16e-6, train/loss_step=0.00174, global_step=1467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=9.61e-7, train/loss_step=0.000236, global_step=1467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  39%|███▉      | 31/80 [03:03<04:40,  5.72s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=9.61e-7, train/loss_step=0.000236, global_step=1467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  39%|███▉      | 31/80 [03:03<04:40,  5.72s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.42e-6, train/loss_step=0.000256, global_step=1467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  40%|████      | 32/80 [03:27<05:01,  6.28s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.42e-6, train/loss_step=0.000256, global_step=1467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  40%|████      | 32/80 [03:27<05:01,  6.28s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=5e-6, train/loss_step=0.000518, global_step=1467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]   Epoch 73:  41%|████▏     | 33/80 [03:48<05:15,  6.72s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=5e-6, train/loss_step=0.000518, global_step=1467.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  41%|████▏     | 33/80 [03:48<05:15,  6.72s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=3.4e-5, train/loss_step=0.00858, global_step=1468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  42%|████▎     | 34/80 [03:49<05:01,  6.54s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=3.4e-5, train/loss_step=0.00858, global_step=1468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  42%|████▎     | 34/80 [03:49<05:01,  6.54s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000766, train/loss_vlb_step=3.47e-6, train/loss_step=0.000766, global_step=1468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  44%|████▍     | 35/80 [03:49<04:46,  6.38s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000766, train/loss_vlb_step=3.47e-6, train/loss_step=0.000766, global_step=1468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  44%|████▍     | 35/80 [03:49<04:46,  6.38s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=9.22e-5, train/loss_step=0.0134, global_step=1468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]    Epoch 73:  45%|████▌     | 36/80 [03:50<04:33,  6.23s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=9.22e-5, train/loss_step=0.0134, global_step=1468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  45%|████▌     | 36/80 [03:50<04:33,  6.23s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=6.83e-6, train/loss_step=0.0017, global_step=1468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  46%|████▋     | 37/80 [03:50<04:21,  6.08s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=6.83e-6, train/loss_step=0.0017, global_step=1468.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  46%|████▋     | 37/80 [03:50<04:21,  6.08s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.17e-6, train/loss_step=0.00187, global_step=1469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  48%|████▊     | 38/80 [03:51<04:09,  5.93s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.17e-6, train/loss_step=0.00187, global_step=1469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  48%|████▊     | 38/80 [03:51<04:09,  5.93s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000216, train/loss_vlb_step=8.09e-7, train/loss_step=0.000216, global_step=1469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  49%|████▉     | 39/80 [03:51<03:57,  5.80s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000216, train/loss_vlb_step=8.09e-7, train/loss_step=0.000216, global_step=1469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  49%|████▉     | 39/80 [03:51<03:57,  5.80s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.76e-5, train/loss_step=0.00577, global_step=1469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  50%|█████     | 40/80 [04:03<03:57,  5.94s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.76e-5, train/loss_step=0.00577, global_step=1469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  50%|█████     | 40/80 [04:03<03:57,  5.94s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000112, train/loss_vlb_step=4.76e-7, train/loss_step=0.000112, global_step=1469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  51%|█████▏    | 41/80 [04:30<04:11,  6.44s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000112, train/loss_vlb_step=4.76e-7, train/loss_step=0.000112, global_step=1469.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  51%|█████▏    | 41/80 [04:30<04:11,  6.44s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000277, train/loss_vlb_step=1.25e-6, train/loss_step=0.000277, global_step=1470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  52%|█████▎    | 42/80 [04:31<03:59,  6.30s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000277, train/loss_vlb_step=1.25e-6, train/loss_step=0.000277, global_step=1470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  52%|█████▎    | 42/80 [04:31<03:59,  6.30s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=1.56e-5, train/loss_step=0.00094, global_step=1470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  54%|█████▍    | 43/80 [04:31<03:48,  6.17s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=1.56e-5, train/loss_step=0.00094, global_step=1470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  54%|█████▍    | 43/80 [04:31<03:48,  6.17s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=1.32e-5, train/loss_step=0.000424, global_step=1470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  55%|█████▌    | 44/80 [04:32<03:37,  6.05s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=1.32e-5, train/loss_step=0.000424, global_step=1470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  55%|█████▌    | 44/80 [04:32<03:37,  6.05s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000888, train/loss_vlb_step=3.96e-6, train/loss_step=0.000888, global_step=1470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000888, train/loss_vlb_step=3.96e-6, train/loss_step=0.000888, global_step=1470.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  56%|█████▋    | 45/80 [04:32<03:27,  5.93s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=8.79e-5, train/loss_step=0.0132, global_step=1471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]    Epoch 73:  57%|█████▊    | 46/80 [04:33<03:17,  5.81s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=8.79e-5, train/loss_step=0.0132, global_step=1471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  57%|█████▊    | 46/80 [04:33<03:17,  5.81s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=0.000106, train/loss_step=0.0176, global_step=1471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  59%|█████▉    | 47/80 [04:33<03:08,  5.70s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0176, train/loss_vlb_step=0.000106, train/loss_step=0.0176, global_step=1471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  59%|█████▉    | 47/80 [04:33<03:08,  5.70s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=2.77e-6, train/loss_step=0.000684, global_step=1471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  60%|██████    | 48/80 [04:58<03:14,  6.08s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=2.77e-6, train/loss_step=0.000684, global_step=1471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  60%|██████    | 48/80 [04:58<03:14,  6.08s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=8.57e-6, train/loss_step=0.00129, global_step=1471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  61%|██████▏   | 49/80 [05:12<03:13,  6.24s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=8.57e-6, train/loss_step=0.00129, global_step=1471.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  61%|██████▏   | 49/80 [05:12<03:13,  6.24s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.2e-5, train/loss_step=0.00594, global_step=1472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404] Epoch 73:  62%|██████▎   | 50/80 [05:12<03:03,  6.13s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.2e-5, train/loss_step=0.00594, global_step=1472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  62%|██████▎   | 50/80 [05:12<03:03,  6.13s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000276, train/loss_vlb_step=1.92e-6, train/loss_step=0.000276, global_step=1472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  64%|██████▍   | 51/80 [05:13<02:54,  6.02s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000276, train/loss_vlb_step=1.92e-6, train/loss_step=0.000276, global_step=1472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  64%|██████▍   | 51/80 [05:13<02:54,  6.02s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=3.15e-6, train/loss_step=0.000307, global_step=1472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  65%|██████▌   | 52/80 [05:13<02:45,  5.92s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=3.15e-6, train/loss_step=0.000307, global_step=1472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  65%|██████▌   | 52/80 [05:13<02:45,  5.92s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.0165, train/loss_step=0.0333, global_step=1472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]     Epoch 73:  66%|██████▋   | 53/80 [05:14<02:37,  5.82s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0333, train/loss_vlb_step=0.0165, train/loss_step=0.0333, global_step=1472.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  66%|██████▋   | 53/80 [05:14<02:37,  5.82s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.0156, train/loss_step=0.0322, global_step=1473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  68%|██████▊   | 54/80 [05:14<02:28,  5.72s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.0322, train/loss_vlb_step=0.0156, train/loss_step=0.0322, global_step=1473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  68%|██████▊   | 54/80 [05:14<02:28,  5.72s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=3.37e-6, train/loss_step=0.00082, global_step=1473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  69%|██████▉   | 55/80 [05:15<02:20,  5.63s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=3.37e-6, train/loss_step=0.00082, global_step=1473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  69%|██████▉   | 55/80 [05:15<02:20,  5.63s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.08e-6, train/loss_step=0.000464, global_step=1473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  70%|███████   | 56/80 [05:41<02:23,  5.98s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.08e-6, train/loss_step=0.000464, global_step=1473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  70%|███████   | 56/80 [05:41<02:23,  5.98s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.4e-5, train/loss_step=0.00222, global_step=1473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]   Epoch 73:  71%|███████▏  | 57/80 [05:57<02:21,  6.16s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=1.4e-5, train/loss_step=0.00222, global_step=1473.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  71%|███████▏  | 57/80 [05:57<02:21,  6.16s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.000548, train/loss_vlb_step=4.54e-6, train/loss_step=0.000548, global_step=1474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  72%|███████▎  | 58/80 [05:57<02:13,  6.07s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.000548, train/loss_vlb_step=4.54e-6, train/loss_step=0.000548, global_step=1474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  72%|███████▎  | 58/80 [05:57<02:13,  6.07s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=3.94e-6, train/loss_step=0.000727, global_step=1474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404] Epoch 73:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.000727, train/loss_vlb_step=3.94e-6, train/loss_step=0.000727, global_step=1474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.5e-6, train/loss_step=0.000511, global_step=1474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.5e-6, train/loss_step=0.000511, global_step=1474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  75%|███████▌  | 60/80 [05:59<01:57,  5.89s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000296, train/loss_step=0.0138, global_step=1474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  76%|███████▋  | 61/80 [05:59<01:50,  5.80s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0138, train/loss_vlb_step=0.000296, train/loss_step=0.0138, global_step=1474.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  76%|███████▋  | 61/80 [05:59<01:50,  5.80s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=2.94e-5, train/loss_step=0.00295, global_step=1475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  78%|███████▊  | 62/80 [06:00<01:42,  5.71s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=2.94e-5, train/loss_step=0.00295, global_step=1475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  78%|███████▊  | 62/80 [06:00<01:42,  5.71s/it, loss=0.00718, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=0.000243, train/loss_step=0.0156, global_step=1475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404] Epoch 73:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00718, v_num=0, train/loss_simple_step=0.0156, train/loss_vlb_step=0.000243, train/loss_step=0.0156, global_step=1475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00728, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.89e-5, train/loss_step=0.00225, global_step=1475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  80%|████████  | 64/80 [06:24<01:34,  5.92s/it, loss=0.00728, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.89e-5, train/loss_step=0.00225, global_step=1475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  80%|████████  | 64/80 [06:24<01:34,  5.92s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=0.000236, train/loss_step=0.00145, global_step=1475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  81%|████████▏ | 65/80 [06:41<01:31,  6.09s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=0.000236, train/loss_step=0.00145, global_step=1475.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  81%|████████▏ | 65/80 [06:41<01:31,  6.09s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=2.23e-6, train/loss_step=0.000494, global_step=1476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  82%|████████▎ | 66/80 [06:42<01:24,  6.00s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=2.23e-6, train/loss_step=0.000494, global_step=1476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  82%|████████▎ | 66/80 [06:42<01:24,  6.00s/it, loss=0.00654, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000323, train/loss_step=0.0151, global_step=1476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]   Epoch 73:  84%|████████▍ | 67/80 [06:42<01:17,  5.92s/it, loss=0.00654, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000323, train/loss_step=0.0151, global_step=1476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  84%|████████▍ | 67/80 [06:42<01:17,  5.92s/it, loss=0.00786, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000646, train/loss_step=0.027, global_step=1476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00786, v_num=0, train/loss_simple_step=0.027, train/loss_vlb_step=0.000646, train/loss_step=0.027, global_step=1476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00839, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=4.87e-5, train/loss_step=0.0119, global_step=1476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  86%|████████▋ | 69/80 [06:43<01:03,  5.77s/it, loss=0.00839, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=4.87e-5, train/loss_step=0.0119, global_step=1476.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  86%|████████▋ | 69/80 [06:43<01:03,  5.77s/it, loss=0.00811, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=1.64e-6, train/loss_step=0.000417, global_step=1477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  88%|████████▊ | 70/80 [06:44<00:56,  5.70s/it, loss=0.00811, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=1.64e-6, train/loss_step=0.000417, global_step=1477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  88%|████████▊ | 70/80 [06:44<00:56,  5.70s/it, loss=0.00836, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=1.96e-5, train/loss_step=0.00531, global_step=1477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  89%|████████▉ | 71/80 [06:44<00:50,  5.62s/it, loss=0.00836, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=1.96e-5, train/loss_step=0.00531, global_step=1477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  89%|████████▉ | 71/80 [06:44<00:50,  5.62s/it, loss=0.00898, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000125, train/loss_step=0.0127, global_step=1477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404] Epoch 73:  90%|█████████ | 72/80 [06:56<00:45,  5.70s/it, loss=0.00898, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000125, train/loss_step=0.0127, global_step=1477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  90%|█████████ | 72/80 [06:56<00:45,  5.70s/it, loss=0.00785, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.93e-5, train/loss_step=0.0107, global_step=1477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404] Epoch 73:  91%|█████████▏| 73/80 [07:11<00:40,  5.83s/it, loss=0.00785, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.93e-5, train/loss_step=0.0107, global_step=1477.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  91%|█████████▏| 73/80 [07:11<00:40,  5.83s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.1e-5, train/loss_step=0.00233, global_step=1478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  92%|█████████▎| 74/80 [07:12<00:34,  5.76s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.1e-5, train/loss_step=0.00233, global_step=1478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  92%|█████████▎| 74/80 [07:12<00:34,  5.76s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=6.74e-6, train/loss_step=0.00109, global_step=1478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  94%|█████████▍| 75/80 [07:12<00:28,  5.69s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=6.74e-6, train/loss_step=0.00109, global_step=1478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  94%|█████████▍| 75/80 [07:12<00:28,  5.69s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.56e-6, train/loss_step=0.000392, global_step=1478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  95%|█████████▌| 76/80 [07:13<00:22,  5.63s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.56e-6, train/loss_step=0.000392, global_step=1478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  95%|█████████▌| 76/80 [07:13<00:22,  5.63s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.84e-5, train/loss_step=0.00671, global_step=1478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  96%|█████████▋| 77/80 [07:13<00:16,  5.56s/it, loss=0.00659, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.84e-5, train/loss_step=0.00671, global_step=1478.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  96%|█████████▋| 77/80 [07:13<00:16,  5.56s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.000182, train/loss_vlb_step=6.55e-7, train/loss_step=0.000182, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  98%|█████████▊| 78/80 [07:14<00:10,  5.50s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.000182, train/loss_vlb_step=6.55e-7, train/loss_step=0.000182, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  98%|█████████▊| 78/80 [07:14<00:10,  5.50s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.53e-5, train/loss_step=0.00361, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 73:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.53e-5, train/loss_step=0.00361, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.00676, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=1.27e-5, train/loss_step=0.00122, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73: 100%|██████████| 80/80 [07:15<00:00,  5.37s/it, loss=0.00676, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=1.27e-5, train/loss_step=0.00122, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 73: 100%|██████████| 80/80 [07:15<00:00,  5.37s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.18e-6, train/loss_step=0.000333, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Average Epoch time: 435.24 seconds
+Average Peak memory 29565.04MiB
+Epoch 73:   0%|          | 0/80 [00:00<00:00, 7121.06it/s, loss=0.00608, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.18e-6, train/loss_step=0.000333, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 74:   0%|          | 0/80 [00:00<00:00, 2416.07it/s, loss=0.00608, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.18e-6, train/loss_step=0.000333, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]Epoch 74:   1%|▏         | 1/80 [00:36<24:02, 18.26s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.18e-6, train/loss_step=0.000333, global_step=1479.0, lr_abs=0.0001, train/loss_simple_epoch=0.00404, train/loss_vlb_epoch=0.000148, train/loss_epoch=0.00404]  Epoch 74:   1%|▏         | 1/80 [00:36<24:02, 18.26s/it, loss=0.00662, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000173, train/loss_step=0.0136, global_step=1480.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]   Epoch 74:   2%|▎         | 2/80 [00:40<17:41, 13.61s/it, loss=0.00662, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000173, train/loss_step=0.0136, global_step=1480.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:   2%|▎         | 2/80 [00:40<17:41, 13.61s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.000522, train/loss_vlb_step=8.95e-6, train/loss_step=0.000522, global_step=1480.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:   4%|▍         | 3/80 [00:41<13:15, 10.33s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.000522, train/loss_vlb_step=8.95e-6, train/loss_step=0.000522, global_step=1480.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:   4%|▍         | 3/80 [00:41<13:15, 10.33s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.000664, train/loss_vlb_step=3.05e-6, train/loss_step=0.000664, global_step=1480.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:   5%|▌         | 4/80 [00:43<11:05,  8.76s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.000664, train/loss_vlb_step=3.05e-6, train/loss_step=0.000664, global_step=1480.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:   5%|▌         | 4/80 [00:43<11:05,  8.76s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.04e-5, train/loss_step=0.00553, global_step=1480.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:   6%|▋         | 5/80 [00:44<09:13,  7.38s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.04e-5, train/loss_step=0.00553, global_step=1480.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:   6%|▋         | 5/80 [00:44<09:13,  7.38s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=1.21e-6, train/loss_step=0.000297, global_step=1481.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:   8%|▊         | 6/80 [00:44<07:53,  6.40s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=1.21e-6, train/loss_step=0.000297, global_step=1481.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:   8%|▊         | 6/80 [00:44<07:53,  6.40s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.93e-6, train/loss_step=0.00135, global_step=1481.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:   9%|▉         | 7/80 [00:45<06:53,  5.66s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.93e-6, train/loss_step=0.00135, global_step=1481.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:   9%|▉         | 7/80 [00:45<06:53,  5.66s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=8.45e-6, train/loss_step=0.00212, global_step=1481.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  10%|█         | 8/80 [01:08<09:11,  7.66s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=8.45e-6, train/loss_step=0.00212, global_step=1481.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  10%|█         | 8/80 [01:08<09:11,  7.66s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.53e-6, train/loss_step=0.00118, global_step=1481.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  11%|█▏        | 9/80 [01:21<09:38,  8.14s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.53e-6, train/loss_step=0.00118, global_step=1481.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  11%|█▏        | 9/80 [01:21<09:38,  8.14s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=0.000445, train/loss_step=0.0025, global_step=1482.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415] Epoch 74:  12%|█▎        | 10/80 [01:22<08:43,  7.47s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=0.000445, train/loss_step=0.0025, global_step=1482.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  12%|█▎        | 10/80 [01:22<08:43,  7.47s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000156, train/loss_step=0.015, global_step=1482.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]   Epoch 74:  14%|█▍        | 11/80 [01:22<07:55,  6.89s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000156, train/loss_step=0.015, global_step=1482.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  14%|█▍        | 11/80 [01:22<07:55,  6.89s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.86e-6, train/loss_step=0.00187, global_step=1482.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  15%|█▌        | 12/80 [01:23<07:15,  6.40s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.86e-6, train/loss_step=0.00187, global_step=1482.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  15%|█▌        | 12/80 [01:23<07:15,  6.40s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000889, train/loss_vlb_step=4.33e-6, train/loss_step=0.000889, global_step=1482.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  16%|█▋        | 13/80 [01:39<07:54,  7.08s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000889, train/loss_vlb_step=4.33e-6, train/loss_step=0.000889, global_step=1482.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  16%|█▋        | 13/80 [01:39<07:54,  7.08s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=1.72e-5, train/loss_step=0.000711, global_step=1483.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  18%|█▊        | 14/80 [01:39<07:18,  6.64s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000711, train/loss_vlb_step=1.72e-5, train/loss_step=0.000711, global_step=1483.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  18%|█▊        | 14/80 [01:39<07:18,  6.64s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=9.4e-6, train/loss_step=0.00267, global_step=1483.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]   Epoch 74:  19%|█▉        | 15/80 [01:40<06:46,  6.25s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=9.4e-6, train/loss_step=0.00267, global_step=1483.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  19%|█▉        | 15/80 [01:40<06:46,  6.25s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.22e-5, train/loss_step=0.00303, global_step=1483.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  20%|██        | 16/80 [01:47<06:45,  6.33s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.22e-5, train/loss_step=0.00303, global_step=1483.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  20%|██        | 16/80 [01:47<06:45,  6.33s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000951, train/loss_vlb_step=4.7e-6, train/loss_step=0.000951, global_step=1483.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  21%|██▏       | 17/80 [02:08<07:30,  7.15s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000951, train/loss_vlb_step=4.7e-6, train/loss_step=0.000951, global_step=1483.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  21%|██▏       | 17/80 [02:08<07:30,  7.15s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=1.91e-6, train/loss_step=0.000357, global_step=1484.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  22%|██▎       | 18/80 [02:09<07:01,  6.80s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=1.91e-6, train/loss_step=0.000357, global_step=1484.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  22%|██▎       | 18/80 [02:09<07:01,  6.80s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=1.35e-6, train/loss_step=0.000359, global_step=1484.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  24%|██▍       | 19/80 [02:09<06:35,  6.49s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=1.35e-6, train/loss_step=0.000359, global_step=1484.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  24%|██▍       | 19/80 [02:09<06:35,  6.49s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=0.000235, train/loss_step=0.0014, global_step=1484.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]   Epoch 74:  25%|██▌       | 20/80 [02:14<06:25,  6.42s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=0.000235, train/loss_step=0.0014, global_step=1484.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  25%|██▌       | 20/80 [02:14<06:25,  6.42s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.76e-5, train/loss_step=0.00428, global_step=1484.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  26%|██▋       | 21/80 [02:15<06:02,  6.15s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.76e-5, train/loss_step=0.00428, global_step=1484.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  26%|██▋       | 21/80 [02:15<06:02,  6.15s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000843, train/loss_vlb_step=5.54e-6, train/loss_step=0.000843, global_step=1485.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  28%|██▊       | 22/80 [02:15<05:42,  5.90s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000843, train/loss_vlb_step=5.54e-6, train/loss_step=0.000843, global_step=1485.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  28%|██▊       | 22/80 [02:15<05:42,  5.90s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.1e-5, train/loss_step=0.0069, global_step=1485.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]     Epoch 74:  29%|��█▉       | 23/80 [02:16<05:23,  5.68s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=3.1e-5, train/loss_step=0.0069, global_step=1485.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  29%|██▉       | 23/80 [02:16<05:23,  5.68s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=2.07e-5, train/loss_step=0.00595, global_step=1485.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  30%|███       | 24/80 [02:26<05:28,  5.86s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00595, train/loss_vlb_step=2.07e-5, train/loss_step=0.00595, global_step=1485.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  30%|███       | 24/80 [02:26<05:28,  5.86s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7.61e-6, train/loss_step=0.00114, global_step=1485.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  31%|███▏      | 25/80 [02:52<06:05,  6.65s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7.61e-6, train/loss_step=0.00114, global_step=1485.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  31%|███▏      | 25/80 [02:52<06:05,  6.65s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=2.82e-5, train/loss_step=0.00138, global_step=1486.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=2.82e-5, train/loss_step=0.00138, global_step=1486.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.84e-6, train/loss_step=0.000389, global_step=1486.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  34%|███▍      | 27/80 [02:53<05:28,  6.21s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.84e-6, train/loss_step=0.000389, global_step=1486.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  34%|███▍      | 27/80 [02:53<05:28,  6.21s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=1.4e-5, train/loss_step=0.00377, global_step=1486.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=1.4e-5, train/loss_step=0.00377, global_step=1486.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=0.000235, train/loss_step=0.00507, global_step=1486.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  36%|███▋      | 29/80 [02:54<04:57,  5.83s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=0.000235, train/loss_step=0.00507, global_step=1486.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  36%|███▋      | 29/80 [02:54<04:57,  5.83s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.74e-6, train/loss_step=0.00038, global_step=1487.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415] Epoch 74:  38%|███▊      | 30/80 [02:55<04:42,  5.66s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.74e-6, train/loss_step=0.00038, global_step=1487.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  38%|███▊      | 30/80 [02:55<04:42,  5.66s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.31e-5, train/loss_step=0.00391, global_step=1487.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  39%|███▉      | 31/80 [02:55<04:29,  5.50s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00391, train/loss_vlb_step=2.31e-5, train/loss_step=0.00391, global_step=1487.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  39%|███▉      | 31/80 [02:55<04:29,  5.50s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=2.64e-5, train/loss_step=0.0011, global_step=1487.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  40%|████      | 32/80 [03:01<04:24,  5.51s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=2.64e-5, train/loss_step=0.0011, global_step=1487.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  40%|████      | 32/80 [03:01<04:24,  5.51s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.13e-5, train/loss_step=0.00577, global_step=1487.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  41%|████▏     | 33/80 [03:32<04:54,  6.26s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=2.13e-5, train/loss_step=0.00577, global_step=1487.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  41%|████▏     | 33/80 [03:32<04:54,  6.26s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=3.06e-5, train/loss_step=0.00896, global_step=1488.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  42%|████▎     | 34/80 [03:33<04:40,  6.09s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=3.06e-5, train/loss_step=0.00896, global_step=1488.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  42%|████▎     | 34/80 [03:33<04:40,  6.09s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.95e-6, train/loss_step=0.00137, global_step=1488.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  44%|████▍     | 35/80 [03:41<04:37,  6.17s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.95e-6, train/loss_step=0.00137, global_step=1488.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  44%|████▍     | 35/80 [03:41<04:37,  6.17s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.99e-6, train/loss_step=0.000387, global_step=1488.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  45%|████▌     | 36/80 [03:42<04:24,  6.01s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.99e-6, train/loss_step=0.000387, global_step=1488.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  45%|████▌     | 36/80 [03:42<04:24,  6.01s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=7.85e-5, train/loss_step=0.0135, global_step=1488.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]    Epoch 74:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=7.85e-5, train/loss_step=0.0135, global_step=1488.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=3.59e-6, train/loss_step=0.001, global_step=1489.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=3.59e-6, train/loss_step=0.001, global_step=1489.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  48%|████▊     | 38/80 [03:44<04:01,  5.75s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000748, train/loss_step=0.0134, global_step=1489.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000748, train/loss_step=0.0134, global_step=1489.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  49%|████▉     | 39/80 [03:44<03:50,  5.62s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=3.34e-6, train/loss_step=0.000733, global_step=1489.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  50%|█████     | 40/80 [03:45<03:40,  5.50s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=3.34e-6, train/loss_step=0.000733, global_step=1489.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  50%|█████     | 40/80 [03:45<03:40,  5.50s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.91e-5, train/loss_step=0.00353, global_step=1489.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  51%|█████▏    | 41/80 [04:12<03:54,  6.01s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=1.91e-5, train/loss_step=0.00353, global_step=1489.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  51%|█████▏    | 41/80 [04:12<03:54,  6.01s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.16e-6, train/loss_step=0.000299, global_step=1490.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  52%|█████▎    | 42/80 [04:13<03:43,  5.88s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.16e-6, train/loss_step=0.000299, global_step=1490.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  52%|█████▎    | 42/80 [04:13<03:43,  5.88s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=0.000157, train/loss_step=0.00477, global_step=1490.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415] Epoch 74:  54%|█████▍    | 43/80 [04:17<03:36,  5.84s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00477, train/loss_vlb_step=0.000157, train/loss_step=0.00477, global_step=1490.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  54%|█████▍    | 43/80 [04:17<03:36,  5.84s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.91e-6, train/loss_step=0.000312, global_step=1490.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  55%|█████▌    | 44/80 [04:17<03:26,  5.72s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.91e-6, train/loss_step=0.000312, global_step=1490.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  55%|█████▌    | 44/80 [04:17<03:26,  5.72s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=8.94e-7, train/loss_step=0.000228, global_step=1490.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  56%|█████▋    | 45/80 [04:20<03:18,  5.66s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=8.94e-7, train/loss_step=0.000228, global_step=1490.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  56%|█████▋    | 45/80 [04:20<03:18,  5.66s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=2.32e-6, train/loss_step=0.000326, global_step=1491.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  57%|█████▊    | 46/80 [04:20<03:08,  5.55s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=2.32e-6, train/loss_step=0.000326, global_step=1491.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  57%|█████▊    | 46/80 [04:20<03:08,  5.55s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=9.09e-6, train/loss_step=0.00238, global_step=1491.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  59%|█████▉    | 47/80 [04:21<02:59,  5.44s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=9.09e-6, train/loss_step=0.00238, global_step=1491.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  59%|█████▉    | 47/80 [04:21<02:59,  5.44s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=6.01e-6, train/loss_step=0.000303, global_step=1491.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  60%|██████    | 48/80 [04:44<03:05,  5.80s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=6.01e-6, train/loss_step=0.000303, global_step=1491.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  60%|██████    | 48/80 [04:44<03:05,  5.80s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=9.13e-6, train/loss_step=0.0026, global_step=1491.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]    Epoch 74:  61%|██████▏   | 49/80 [04:46<02:57,  5.73s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=9.13e-6, train/loss_step=0.0026, global_step=1491.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  61%|██████▏   | 49/80 [04:46<02:57,  5.73s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=0.000108, train/loss_step=0.00716, global_step=1492.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  62%|██████▎   | 50/80 [04:47<02:48,  5.63s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=0.000108, train/loss_step=0.00716, global_step=1492.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  62%|██████▎   | 50/80 [04:47<02:48,  5.63s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=6.87e-6, train/loss_step=0.00169, global_step=1492.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  64%|██████▍   | 51/80 [05:06<02:50,  5.89s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=6.87e-6, train/loss_step=0.00169, global_step=1492.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  64%|██████▍   | 51/80 [05:06<02:50,  5.89s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=1.9e-5, train/loss_step=0.00557, global_step=1492.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415] Epoch 74:  65%|██████▌   | 52/80 [05:06<02:42,  5.79s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=1.9e-5, train/loss_step=0.00557, global_step=1492.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  65%|██████▌   | 52/80 [05:06<02:42,  5.79s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000838, train/loss_vlb_step=1.9e-5, train/loss_step=0.000838, global_step=1492.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  66%|██████▋   | 53/80 [05:07<02:33,  5.69s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000838, train/loss_vlb_step=1.9e-5, train/loss_step=0.000838, global_step=1492.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  66%|██████▋   | 53/80 [05:07<02:33,  5.69s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.33e-6, train/loss_step=0.000285, global_step=1493.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  68%|██████▊   | 54/80 [05:07<02:25,  5.60s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.33e-6, train/loss_step=0.000285, global_step=1493.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  68%|██████▊   | 54/80 [05:07<02:25,  5.60s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.56e-5, train/loss_step=0.00469, global_step=1493.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]   Epoch 74:  69%|██████▉   | 55/80 [05:08<02:17,  5.51s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.56e-5, train/loss_step=0.00469, global_step=1493.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  69%|██████▉   | 55/80 [05:08<02:17,  5.51s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000412, train/loss_step=0.0131, global_step=1493.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  70%|███████   | 56/80 [05:28<02:18,  5.77s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000412, train/loss_step=0.0131, global_step=1493.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  70%|███████   | 56/80 [05:28<02:18,  5.77s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00083, train/loss_vlb_step=2.19e-5, train/loss_step=0.00083, global_step=1493.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  71%|███████▏  | 57/80 [05:29<02:10,  5.68s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00083, train/loss_vlb_step=2.19e-5, train/loss_step=0.00083, global_step=1493.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  71%|███████▏  | 57/80 [05:29<02:10,  5.68s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.26e-6, train/loss_step=0.000303, global_step=1494.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  72%|███████▎  | 58/80 [05:29<02:03,  5.59s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.26e-6, train/loss_step=0.000303, global_step=1494.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  72%|███████▎  | 58/80 [05:29<02:03,  5.59s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000358, train/loss_vlb_step=1.89e-6, train/loss_step=0.000358, global_step=1494.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  74%|███████▍  | 59/80 [05:49<02:02,  5.83s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000358, train/loss_vlb_step=1.89e-6, train/loss_step=0.000358, global_step=1494.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  74%|███████▍  | 59/80 [05:49<02:02,  5.83s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=9.39e-7, train/loss_step=0.000236, global_step=1494.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=9.39e-7, train/loss_step=0.000236, global_step=1494.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=9.54e-7, train/loss_step=0.000218, global_step=1494.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  76%|███████▋  | 61/80 [05:57<01:49,  5.76s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=9.54e-7, train/loss_step=0.000218, global_step=1494.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  76%|███████▋  | 61/80 [05:57<01:49,  5.76s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=1.92e-5, train/loss_step=0.00148, global_step=1495.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  78%|███████▊  | 62/80 [05:57<01:42,  5.68s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=1.92e-5, train/loss_step=0.00148, global_step=1495.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  78%|███████▊  | 62/80 [05:57<01:42,  5.68s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000396, train/loss_vlb_step=2.56e-6, train/loss_step=0.000396, global_step=1495.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  79%|███████▉  | 63/80 [05:58<01:35,  5.60s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000396, train/loss_vlb_step=2.56e-6, train/loss_step=0.000396, global_step=1495.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  79%|███████▉  | 63/80 [05:58<01:35,  5.60s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000739, train/loss_vlb_step=6.4e-6, train/loss_step=0.000739, global_step=1495.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415] Epoch 74:  80%|████████  | 64/80 [06:14<01:32,  5.75s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000739, train/loss_vlb_step=6.4e-6, train/loss_step=0.000739, global_step=1495.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  80%|████████  | 64/80 [06:14<01:32,  5.75s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=3.83e-6, train/loss_step=0.000331, global_step=1495.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  81%|████████▏ | 65/80 [06:14<01:25,  5.67s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=3.83e-6, train/loss_step=0.000331, global_step=1495.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  81%|████████▏ | 65/80 [06:14<01:25,  5.67s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.16e-5, train/loss_step=0.00331, global_step=1496.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  82%|████████▎ | 66/80 [06:15<01:18,  5.60s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.16e-5, train/loss_step=0.00331, global_step=1496.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  82%|████████▎ | 66/80 [06:15<01:18,  5.60s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=8.13e-5, train/loss_step=0.0139, global_step=1496.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  84%|████████▍ | 67/80 [06:31<01:14,  5.76s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=8.13e-5, train/loss_step=0.0139, global_step=1496.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  84%|████████▍ | 67/80 [06:31<01:14,  5.76s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.26e-5, train/loss_step=0.00373, global_step=1496.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  85%|████████▌ | 68/80 [06:31<01:08,  5.68s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.26e-5, train/loss_step=0.00373, global_step=1496.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  85%|████████▌ | 68/80 [06:31<01:08,  5.68s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000757, train/loss_vlb_step=6.64e-5, train/loss_step=0.000757, global_step=1496.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000757, train/loss_vlb_step=6.64e-5, train/loss_step=0.000757, global_step=1496.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=8.45e-6, train/loss_step=0.002, global_step=1497.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]    Epoch 74:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=8.45e-6, train/loss_step=0.002, global_step=1497.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.3e-5, train/loss_step=0.00343, global_step=1497.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  89%|████████▉ | 71/80 [06:38<00:49,  5.54s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.3e-5, train/loss_step=0.00343, global_step=1497.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  89%|████████▉ | 71/80 [06:38<00:49,  5.54s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000184, train/loss_vlb_step=1.14e-6, train/loss_step=0.000184, global_step=1497.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  90%|█████████ | 72/80 [06:43<00:44,  5.52s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000184, train/loss_vlb_step=1.14e-6, train/loss_step=0.000184, global_step=1497.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  90%|█████████ | 72/80 [06:43<00:44,  5.52s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=6.91e-6, train/loss_step=0.0011, global_step=1497.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]    Epoch 74:  91%|█████████▏| 73/80 [06:43<00:38,  5.45s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=6.91e-6, train/loss_step=0.0011, global_step=1497.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  91%|█████████▏| 73/80 [06:43<00:38,  5.45s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=1.29e-6, train/loss_step=0.000293, global_step=1498.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  92%|█████████▎| 74/80 [06:44<00:32,  5.39s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=1.29e-6, train/loss_step=0.000293, global_step=1498.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  92%|█████████▎| 74/80 [06:44<00:32,  5.39s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=5.34e-5, train/loss_step=0.00882, global_step=1498.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  94%|█████████▍| 75/80 [07:06<00:28,  5.61s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=5.34e-5, train/loss_step=0.00882, global_step=1498.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  94%|█████████▍| 75/80 [07:06<00:28,  5.61s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=1.51e-5, train/loss_step=0.00444, global_step=1498.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  95%|█████████▌| 76/80 [07:06<00:22,  5.54s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=1.51e-5, train/loss_step=0.00444, global_step=1498.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  95%|█████████▌| 76/80 [07:06<00:22,  5.54s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000211, train/loss_vlb_step=9.34e-7, train/loss_step=0.000211, global_step=1498.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  96%|█████████▋| 77/80 [07:14<00:16,  5.56s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000211, train/loss_vlb_step=9.34e-7, train/loss_step=0.000211, global_step=1498.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  96%|█████████▋| 77/80 [07:14<00:16,  5.56s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=3.73e-6, train/loss_step=0.000324, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  98%|█████████▊| 78/80 [07:14<00:11,  5.50s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=3.73e-6, train/loss_step=0.000324, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  98%|█████████▊| 78/80 [07:14<00:11,  5.50s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=0.00399, train/loss_step=0.00847, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 74:  99%|█████████▉| 79/80 [07:15<00:05,  5.44s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00847, train/loss_vlb_step=0.00399, train/loss_step=0.00847, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74:  99%|█████████▉| 79/80 [07:15<00:05,  5.44s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000694, train/loss_vlb_step=1.26e-5, train/loss_step=0.000694, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74: 100%|██████████| 80/80 [07:15<00:00,  5.38s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000694, train/loss_vlb_step=1.26e-5, train/loss_step=0.000694, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 74: 100%|██████████| 80/80 [07:15<00:00,  5.38s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000158, train/loss_vlb_step=5.61e-7, train/loss_step=0.000158, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Average Epoch time: 435.65 seconds
+Average Peak memory 29563.79MiB
+Epoch 74:   0%|          | 0/80 [00:00<00:00, 5249.44it/s, loss=0.00274, v_num=0, train/loss_simple_step=0.000158, train/loss_vlb_step=5.61e-7, train/loss_step=0.000158, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 75:   0%|          | 0/80 [00:00<00:00, 2219.21it/s, loss=0.00274, v_num=0, train/loss_simple_step=0.000158, train/loss_vlb_step=5.61e-7, train/loss_step=0.000158, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]Epoch 75:   1%|▏         | 1/80 [00:39<25:41, 19.51s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000158, train/loss_vlb_step=5.61e-7, train/loss_step=0.000158, global_step=1499.0, lr_abs=0.0001, train/loss_simple_epoch=0.00415, train/loss_vlb_epoch=0.000127, train/loss_epoch=0.00415]  Epoch 75:   1%|▏         | 1/80 [00:39<25:41, 19.52s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=2.44e-5, train/loss_step=0.00208, global_step=1500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]   Epoch 75:   2%|▎         | 2/80 [00:39<17:07, 13.17s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=2.44e-5, train/loss_step=0.00208, global_step=1500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:   2%|▎         | 2/80 [00:39<17:07, 13.17s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000681, train/loss_vlb_step=3.16e-6, train/loss_step=0.000681, global_step=1500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:   4%|▍         | 3/80 [00:44<14:08, 11.02s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000681, train/loss_vlb_step=3.16e-6, train/loss_step=0.000681, global_step=1500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:   4%|▍         | 3/80 [00:44<14:08, 11.02s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.0131, train/loss_step=0.0266, global_step=1500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]     Epoch 75:   5%|▌         | 4/80 [00:44<11:18,  8.92s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.0266, train/loss_vlb_step=0.0131, train/loss_step=0.0266, global_step=1500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:   5%|▌         | 4/80 [00:44<11:18,  8.92s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.51e-6, train/loss_step=0.000295, global_step=1500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:   6%|▋         | 5/80 [00:45<09:24,  7.52s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.51e-6, train/loss_step=0.000295, global_step=1500.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:   6%|▋         | 5/80 [00:45<09:24,  7.52s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=7.76e-5, train/loss_step=0.0119, global_step=1501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]     Epoch 75:   8%|▊         | 6/80 [00:45<08:02,  6.52s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=7.76e-5, train/loss_step=0.0119, global_step=1501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:   8%|▊         | 6/80 [00:45<08:02,  6.52s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000447, train/loss_step=0.0315, global_step=1501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:   9%|▉         | 7/80 [00:46<07:00,  5.77s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0315, train/loss_vlb_step=0.000447, train/loss_step=0.0315, global_step=1501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:   9%|▉         | 7/80 [00:46<07:00,  5.77s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=8.4e-6, train/loss_step=0.00238, global_step=1501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  10%|█         | 8/80 [01:08<09:07,  7.61s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=8.4e-6, train/loss_step=0.00238, global_step=1501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  10%|█         | 8/80 [01:08<09:07,  7.61s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.000178, train/loss_vlb_step=6.41e-7, train/loss_step=0.000178, global_step=1501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  11%|█▏        | 9/80 [01:23<09:55,  8.38s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.000178, train/loss_vlb_step=6.41e-7, train/loss_step=0.000178, global_step=1501.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  11%|█▏        | 9/80 [01:23<09:55,  8.38s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=6.45e-6, train/loss_step=0.000702, global_step=1502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  12%|█▎        | 10/80 [01:24<08:56,  7.67s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=6.45e-6, train/loss_step=0.000702, global_step=1502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  12%|█▎        | 10/80 [01:24<08:56,  7.67s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=1.39e-6, train/loss_step=0.000228, global_step=1502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  14%|█▍        | 11/80 [01:24<08:08,  7.07s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=1.39e-6, train/loss_step=0.000228, global_step=1502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  14%|█▍        | 11/80 [01:24<08:08,  7.07s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.98e-6, train/loss_step=0.00133, global_step=1502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  15%|█▌        | 12/80 [01:25<07:26,  6.57s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.98e-6, train/loss_step=0.00133, global_step=1502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  15%|█▌        | 12/80 [01:25<07:26,  6.57s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.26e-5, train/loss_step=0.00363, global_step=1502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  16%|█▋        | 13/80 [01:25<06:51,  6.14s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00363, train/loss_vlb_step=1.26e-5, train/loss_step=0.00363, global_step=1502.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  16%|█▋        | 13/80 [01:25<06:51,  6.14s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000546, train/loss_vlb_step=1.5e-5, train/loss_step=0.000546, global_step=1503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  18%|█▊        | 14/80 [01:26<06:20,  5.76s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000546, train/loss_vlb_step=1.5e-5, train/loss_step=0.000546, global_step=1503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  18%|█▊        | 14/80 [01:26<06:20,  5.76s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=2.61e-6, train/loss_step=0.000376, global_step=1503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  19%|█▉        | 15/80 [01:26<05:53,  5.43s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=2.61e-6, train/loss_step=0.000376, global_step=1503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  19%|█▉        | 15/80 [01:26<05:53,  5.43s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=1.86e-6, train/loss_step=0.000349, global_step=1503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  20%|██        | 16/80 [01:50<06:57,  6.53s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=1.86e-6, train/loss_step=0.000349, global_step=1503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  20%|██        | 16/80 [01:50<06:57,  6.53s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.85e-6, train/loss_step=0.000375, global_step=1503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  21%|██▏       | 17/80 [02:04<07:16,  6.93s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=1.85e-6, train/loss_step=0.000375, global_step=1503.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  21%|██▏       | 17/80 [02:04<07:16,  6.93s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000219, train/loss_vlb_step=9.2e-7, train/loss_step=0.000219, global_step=1504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367] Epoch 75:  22%|██▎       | 18/80 [02:05<06:48,  6.59s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000219, train/loss_vlb_step=9.2e-7, train/loss_step=0.000219, global_step=1504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  22%|██▎       | 18/80 [02:05<06:48,  6.59s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.46e-6, train/loss_step=0.000308, global_step=1504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  24%|██▍       | 19/80 [02:06<06:25,  6.31s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.46e-6, train/loss_step=0.000308, global_step=1504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  24%|██▍       | 19/80 [02:06<06:25,  6.31s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.96e-5, train/loss_step=0.0112, global_step=1504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]    Epoch 75:  25%|██▌       | 20/80 [02:06<06:02,  6.05s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=5.96e-5, train/loss_step=0.0112, global_step=1504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  25%|██▌       | 20/80 [02:06<06:02,  6.05s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=6.88e-6, train/loss_step=0.000549, global_step=1504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  26%|██▋       | 21/80 [02:07<05:41,  5.80s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=6.88e-6, train/loss_step=0.000549, global_step=1504.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  26%|██▋       | 21/80 [02:07<05:41,  5.80s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000725, train/loss_vlb_step=3.13e-6, train/loss_step=0.000725, global_step=1505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367] Epoch 75:  28%|██▊       | 22/80 [02:08<05:22,  5.57s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000725, train/loss_vlb_step=3.13e-6, train/loss_step=0.000725, global_step=1505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  28%|██▊       | 22/80 [02:08<05:22,  5.57s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=2.98e-5, train/loss_step=0.00745, global_step=1505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367] Epoch 75:  29%|██▉       | 23/80 [02:08<05:05,  5.35s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=2.98e-5, train/loss_step=0.00745, global_step=1505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  29%|██▉       | 23/80 [02:08<05:05,  5.35s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.24e-6, train/loss_step=0.000279, global_step=1505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  30%|███       | 24/80 [02:35<05:49,  6.23s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.24e-6, train/loss_step=0.000279, global_step=1505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  30%|███       | 24/80 [02:35<05:49,  6.23s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.54e-5, train/loss_step=0.00433, global_step=1505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  31%|███▏      | 25/80 [02:49<05:58,  6.52s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.54e-5, train/loss_step=0.00433, global_step=1505.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  31%|███▏      | 25/80 [02:49<05:58,  6.52s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.43e-6, train/loss_step=0.000273, global_step=1506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  32%|███▎      | 26/80 [02:50<05:40,  6.30s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.43e-6, train/loss_step=0.000273, global_step=1506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  32%|███▎      | 26/80 [02:50<05:40,  6.30s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000785, train/loss_vlb_step=3.33e-5, train/loss_step=0.000785, global_step=1506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  34%|███▍      | 27/80 [02:50<05:22,  6.09s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000785, train/loss_vlb_step=3.33e-5, train/loss_step=0.000785, global_step=1506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  34%|███▍      | 27/80 [02:50<05:22,  6.09s/it, loss=0.0017, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=1.6e-6, train/loss_step=0.000243, global_step=1506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  35%|███▌      | 28/80 [02:51<05:06,  5.90s/it, loss=0.0017, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=1.6e-6, train/loss_step=0.000243, global_step=1506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  35%|███▌      | 28/80 [02:51<05:06,  5.90s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=1.39e-5, train/loss_step=0.00418, global_step=1506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367] Epoch 75:  36%|███▋      | 29/80 [02:51<04:51,  5.72s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=1.39e-5, train/loss_step=0.00418, global_step=1506.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  36%|███▋      | 29/80 [02:51<04:51,  5.72s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=0.00161, train/loss_step=0.00727, global_step=1507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  38%|███▊      | 30/80 [02:52<04:37,  5.55s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=0.00161, train/loss_step=0.00727, global_step=1507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  38%|███▊      | 30/80 [02:52<04:37,  5.55s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=4.81e-5, train/loss_step=0.0133, global_step=1507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  39%|███▉      | 31/80 [02:52<04:24,  5.40s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=4.81e-5, train/loss_step=0.0133, global_step=1507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  39%|███▉      | 31/80 [02:52<04:24,  5.40s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.16e-6, train/loss_step=0.0003, global_step=1507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  40%|████      | 32/80 [03:23<04:55,  6.16s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.16e-6, train/loss_step=0.0003, global_step=1507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  40%|████      | 32/80 [03:23<04:55,  6.16s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000435, train/loss_vlb_step=2.31e-6, train/loss_step=0.000435, global_step=1507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  41%|████▏     | 33/80 [03:30<04:51,  6.20s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000435, train/loss_vlb_step=2.31e-6, train/loss_step=0.000435, global_step=1507.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  41%|████▏     | 33/80 [03:30<04:51,  6.20s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=2.4e-5, train/loss_step=0.00617, global_step=1508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]   Epoch 75:  42%|████▎     | 34/80 [03:31<04:37,  6.04s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=2.4e-5, train/loss_step=0.00617, global_step=1508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  42%|████▎     | 34/80 [03:31<04:37,  6.04s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.12e-6, train/loss_step=0.00118, global_step=1508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367] Epoch 75:  44%|████▍     | 35/80 [03:39<04:33,  6.09s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.12e-6, train/loss_step=0.00118, global_step=1508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  44%|████▍     | 35/80 [03:39<04:33,  6.09s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.46e-6, train/loss_step=0.00108, global_step=1508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  45%|████▌     | 36/80 [03:39<04:21,  5.94s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.46e-6, train/loss_step=0.00108, global_step=1508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  45%|████▌     | 36/80 [03:39<04:21,  5.94s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=1.82e-5, train/loss_step=0.00534, global_step=1508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  46%|████▋     | 37/80 [03:40<04:09,  5.79s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=1.82e-5, train/loss_step=0.00534, global_step=1508.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  46%|████▋     | 37/80 [03:40<04:09,  5.79s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000598, train/loss_vlb_step=5.92e-6, train/loss_step=0.000598, global_step=1509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  48%|████▊     | 38/80 [03:40<03:57,  5.66s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000598, train/loss_vlb_step=5.92e-6, train/loss_step=0.000598, global_step=1509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  48%|████▊     | 38/80 [03:40<03:57,  5.66s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000122, train/loss_vlb_step=4.89e-7, train/loss_step=0.000122, global_step=1509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  49%|████▉     | 39/80 [03:41<03:46,  5.53s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000122, train/loss_vlb_step=4.89e-7, train/loss_step=0.000122, global_step=1509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  49%|████▉     | 39/80 [03:41<03:46,  5.53s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=1.47e-6, train/loss_step=0.000349, global_step=1509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  50%|█████     | 40/80 [04:01<03:56,  5.90s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=1.47e-6, train/loss_step=0.000349, global_step=1509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  50%|█████     | 40/80 [04:01<03:56,  5.90s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=2.6e-5, train/loss_step=0.00702, global_step=1509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]   Epoch 75:  51%|█████▏    | 41/80 [04:14<03:56,  6.05s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=2.6e-5, train/loss_step=0.00702, global_step=1509.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  51%|█████▏    | 41/80 [04:14<03:56,  6.05s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000354, train/loss_vlb_step=1.74e-6, train/loss_step=0.000354, global_step=1510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  52%|█████▎    | 42/80 [04:14<03:45,  5.92s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000354, train/loss_vlb_step=1.74e-6, train/loss_step=0.000354, global_step=1510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  52%|█████▎    | 42/80 [04:14<03:45,  5.92s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=9.81e-7, train/loss_step=0.000215, global_step=1510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  54%|█████▍    | 43/80 [04:16<03:35,  5.83s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=9.81e-7, train/loss_step=0.000215, global_step=1510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  54%|█████▍    | 43/80 [04:16<03:35,  5.83s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=7.77e-7, train/loss_step=0.0002, global_step=1510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]    Epoch 75:  55%|█████▌    | 44/80 [04:17<03:25,  5.71s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=7.77e-7, train/loss_step=0.0002, global_step=1510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  55%|█████▌    | 44/80 [04:17<03:25,  5.71s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=9.87e-7, train/loss_step=0.000261, global_step=1510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  56%|█████▋    | 45/80 [04:17<03:16,  5.60s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=9.87e-7, train/loss_step=0.000261, global_step=1510.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  56%|█████▋    | 45/80 [04:17<03:16,  5.60s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=8.38e-6, train/loss_step=0.00208, global_step=1511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  57%|█████▊    | 46/80 [04:18<03:06,  5.49s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=8.38e-6, train/loss_step=0.00208, global_step=1511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  57%|█████▊    | 46/80 [04:18<03:06,  5.49s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.67e-5, train/loss_step=0.00802, global_step=1511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  59%|█████▉    | 47/80 [04:18<02:57,  5.39s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00802, train/loss_vlb_step=3.67e-5, train/loss_step=0.00802, global_step=1511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  59%|█████▉    | 47/80 [04:18<02:57,  5.39s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=1.45e-5, train/loss_step=0.00434, global_step=1511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  60%|██████    | 48/80 [04:41<03:03,  5.75s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=1.45e-5, train/loss_step=0.00434, global_step=1511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  60%|██████    | 48/80 [04:41<03:03,  5.75s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000125, train/loss_vlb_step=5.15e-7, train/loss_step=0.000125, global_step=1511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000125, train/loss_vlb_step=5.15e-7, train/loss_step=0.000125, global_step=1511.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  61%|██████▏   | 49/80 [05:07<03:10,  6.15s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=1.04e-6, train/loss_step=0.000228, global_step=1512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  62%|██████▎   | 50/80 [05:07<03:01,  6.03s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=1.04e-6, train/loss_step=0.000228, global_step=1512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  62%|██████▎   | 50/80 [05:07<03:01,  6.03s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.017, train/loss_step=0.0353, global_step=1512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]      Epoch 75:  64%|██████▍   | 51/80 [05:08<02:51,  5.93s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.017, train/loss_step=0.0353, global_step=1512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  64%|██████▍   | 51/80 [05:08<02:51,  5.93s/it, loss=0.00368, v_num=0, train/loss_simple_step=9.92e-5, train/loss_vlb_step=4.3e-7, train/loss_step=9.92e-5, global_step=1512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  65%|██████▌   | 52/80 [05:09<02:43,  5.83s/it, loss=0.00368, v_num=0, train/loss_simple_step=9.92e-5, train/loss_vlb_step=4.3e-7, train/loss_step=9.92e-5, global_step=1512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  65%|██████▌   | 52/80 [05:09<02:43,  5.83s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.47e-6, train/loss_step=0.000523, global_step=1512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  66%|██████▋   | 53/80 [05:09<02:34,  5.74s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2.47e-6, train/loss_step=0.000523, global_step=1512.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  66%|██████▋   | 53/80 [05:09<02:34,  5.74s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=2.26e-6, train/loss_step=0.000407, global_step=1513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000407, train/loss_vlb_step=2.26e-6, train/loss_step=0.000407, global_step=1513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000203, train/loss_vlb_step=1.03e-6, train/loss_step=0.000203, global_step=1513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000203, train/loss_vlb_step=1.03e-6, train/loss_step=0.000203, global_step=1513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=6.81e-6, train/loss_step=0.00189, global_step=1513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  70%|███████   | 56/80 [05:24<02:16,  5.69s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00189, train/loss_vlb_step=6.81e-6, train/loss_step=0.00189, global_step=1513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  70%|███████   | 56/80 [05:24<02:16,  5.69s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=0.000248, train/loss_step=0.00139, global_step=1513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  71%|███████▏  | 57/80 [05:52<02:19,  6.08s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=0.000248, train/loss_step=0.00139, global_step=1513.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  71%|███████▏  | 57/80 [05:52<02:19,  6.08s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=3.69e-5, train/loss_step=0.00936, global_step=1514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367] Epoch 75:  72%|███████▎  | 58/80 [05:52<02:11,  5.98s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00936, train/loss_vlb_step=3.69e-5, train/loss_step=0.00936, global_step=1514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  72%|███████▎  | 58/80 [05:52<02:11,  5.98s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.49e-5, train/loss_step=0.0106, global_step=1514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  74%|███████▍  | 59/80 [05:53<02:03,  5.89s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.49e-5, train/loss_step=0.0106, global_step=1514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  74%|███████▍  | 59/80 [05:53<02:03,  5.89s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.0002, train/loss_step=0.0144, global_step=1514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367] Epoch 75:  75%|███████▌  | 60/80 [05:54<01:56,  5.81s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.0002, train/loss_step=0.0144, global_step=1514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  75%|███████▌  | 60/80 [05:54<01:56,  5.81s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=6.32e-6, train/loss_step=0.000338, global_step=1514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  76%|███████▋  | 61/80 [05:54<01:48,  5.72s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=6.32e-6, train/loss_step=0.000338, global_step=1514.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  76%|███████▋  | 61/80 [05:54<01:48,  5.72s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.35e-5, train/loss_step=0.00635, global_step=1515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00635, train/loss_vlb_step=3.35e-5, train/loss_step=0.00635, global_step=1515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=4.23e-6, train/loss_step=0.000418, global_step=1515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  79%|███████▉  | 63/80 [05:55<01:34,  5.56s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=4.23e-6, train/loss_step=0.000418, global_step=1515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  79%|███████▉  | 63/80 [05:55<01:34,  5.56s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=2.58e-6, train/loss_step=0.000433, global_step=1515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  80%|████████  | 64/80 [06:00<01:28,  5.55s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=2.58e-6, train/loss_step=0.000433, global_step=1515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  80%|████████  | 64/80 [06:00<01:28,  5.55s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.38e-5, train/loss_step=0.0164, global_step=1515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]    Epoch 75:  81%|████████▏ | 65/80 [06:35<01:29,  5.99s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.38e-5, train/loss_step=0.0164, global_step=1515.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  81%|████████▏ | 65/80 [06:35<01:29,  5.99s/it, loss=0.00634, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000131, train/loss_step=0.016, global_step=1516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367] Epoch 75:  82%|████████▎ | 66/80 [06:35<01:22,  5.91s/it, loss=0.00634, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000131, train/loss_step=0.016, global_step=1516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  82%|████████▎ | 66/80 [06:35<01:22,  5.91s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.14e-5, train/loss_step=0.00198, global_step=1516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  84%|████████▍ | 67/80 [06:36<01:15,  5.83s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=1.14e-5, train/loss_step=0.00198, global_step=1516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  84%|████████▍ | 67/80 [06:36<01:15,  5.83s/it, loss=0.00619, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.43e-5, train/loss_step=0.00735, global_step=1516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  85%|████████▌ | 68/80 [06:36<01:09,  5.75s/it, loss=0.00619, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=3.43e-5, train/loss_step=0.00735, global_step=1516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  85%|████████▌ | 68/80 [06:36<01:09,  5.75s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.000415, train/loss_vlb_step=4.04e-6, train/loss_step=0.000415, global_step=1516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.000415, train/loss_vlb_step=4.04e-6, train/loss_step=0.000415, global_step=1516.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.4e-5, train/loss_step=0.00814, global_step=1517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]    Epoch 75:  88%|████████▊ | 70/80 [06:37<00:56,  5.60s/it, loss=0.0066, v_num=0, train/loss_simple_step=0.00814, train/loss_vlb_step=3.4e-5, train/loss_step=0.00814, global_step=1517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  88%|████████▊ | 70/80 [06:37<00:56,  5.60s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.18e-5, train/loss_step=0.00335, global_step=1517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  89%|████████▉ | 71/80 [06:38<00:49,  5.53s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.18e-5, train/loss_step=0.00335, global_step=1517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  89%|████████▉ | 71/80 [06:38<00:49,  5.53s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=1.62e-6, train/loss_step=0.000322, global_step=1517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  90%|█████████ | 72/80 [06:41<00:43,  5.49s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=1.62e-6, train/loss_step=0.000322, global_step=1517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  90%|█████████ | 72/80 [06:41<00:43,  5.49s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.05e-5, train/loss_step=0.00457, global_step=1517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  91%|█████████▏| 73/80 [07:04<00:40,  5.74s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=2.05e-5, train/loss_step=0.00457, global_step=1517.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  91%|█████████▏| 73/80 [07:04<00:40,  5.74s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=5.49e-6, train/loss_step=0.000506, global_step=1518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  92%|█████████▎| 74/80 [07:05<00:34,  5.67s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=5.49e-6, train/loss_step=0.000506, global_step=1518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  92%|█████████▎| 74/80 [07:05<00:34,  5.67s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=1.12e-5, train/loss_step=0.000626, global_step=1518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  94%|█████████▍| 75/80 [07:05<00:28,  5.60s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=1.12e-5, train/loss_step=0.000626, global_step=1518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  94%|█████████▍| 75/80 [07:05<00:28,  5.60s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=3.46e-6, train/loss_step=0.000494, global_step=1518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  95%|█████████▌| 76/80 [07:06<00:22,  5.53s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=3.46e-6, train/loss_step=0.000494, global_step=1518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  95%|█████████▌| 76/80 [07:06<00:22,  5.53s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.45e-5, train/loss_step=0.00272, global_step=1518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 75:  96%|█████████▋| 77/80 [07:06<00:16,  5.47s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.45e-5, train/loss_step=0.00272, global_step=1518.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  96%|█████████▋| 77/80 [07:06<00:16,  5.47s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=0.000111, train/loss_step=0.00185, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  98%|█████████▊| 78/80 [07:07<00:10,  5.41s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=0.000111, train/loss_step=0.00185, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  98%|█████████▊| 78/80 [07:07<00:10,  5.41s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.48e-6, train/loss_step=0.00102, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367] Epoch 75:  99%|█████████▉| 79/80 [07:07<00:05,  5.35s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.48e-6, train/loss_step=0.00102, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75:  99%|█████████▉| 79/80 [07:07<00:05,  5.35s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=6.41e-5, train/loss_step=0.00573, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75: 100%|██████████| 80/80 [07:08<00:00,  5.28s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00573, train/loss_vlb_step=6.41e-5, train/loss_step=0.00573, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 75: 100%|██████████| 80/80 [07:08<00:00,  5.28s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.18e-5, train/loss_step=0.00268, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Average Epoch time: 428.10 seconds
+Average Peak memory 29567.98MiB
+Epoch 75:   0%|          | 0/80 [00:00<00:00, 4670.72it/s, loss=0.00407, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.18e-5, train/loss_step=0.00268, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 76:   0%|          | 0/80 [00:00<00:00, 1926.64it/s, loss=0.00407, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.18e-5, train/loss_step=0.00268, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]Epoch 76:   1%|▏         | 1/80 [00:38<25:03, 19.03s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.18e-5, train/loss_step=0.00268, global_step=1519.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=9.13e-5, train/loss_epoch=0.00367]  Epoch 76:   1%|▏         | 1/80 [00:38<25:03, 19.03s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000915, train/loss_vlb_step=3.17e-5, train/loss_step=0.000915, global_step=1520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   2%|▎         | 2/80 [00:46<20:13, 15.55s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000915, train/loss_vlb_step=3.17e-5, train/loss_step=0.000915, global_step=1520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   2%|▎         | 2/80 [00:46<20:13, 15.55s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.42e-5, train/loss_step=0.00374, global_step=1520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431] Epoch 76:   4%|▍         | 3/80 [00:47<15:07, 11.79s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.42e-5, train/loss_step=0.00374, global_step=1520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   4%|▍         | 3/80 [00:47<15:07, 11.79s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.79e-5, train/loss_step=0.00272, global_step=1520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   5%|▌         | 4/80 [00:47<12:04,  9.54s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.79e-5, train/loss_step=0.00272, global_step=1520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   5%|▌         | 4/80 [00:47<12:04,  9.54s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=2.37e-5, train/loss_step=0.00675, global_step=1520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431] Epoch 76:   6%|▋         | 5/80 [00:48<10:02,  8.03s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00675, train/loss_vlb_step=2.37e-5, train/loss_step=0.00675, global_step=1520.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   6%|▋         | 5/80 [00:48<10:02,  8.03s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=1.16e-5, train/loss_step=0.000712, global_step=1521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   8%|▊         | 6/80 [00:48<08:34,  6.95s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=1.16e-5, train/loss_step=0.000712, global_step=1521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   8%|▊         | 6/80 [00:48<08:34,  6.95s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.000569, train/loss_vlb_step=7.63e-6, train/loss_step=0.000569, global_step=1521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   9%|▉         | 7/80 [00:49<07:28,  6.15s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.000569, train/loss_vlb_step=7.63e-6, train/loss_step=0.000569, global_step=1521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:   9%|▉         | 7/80 [00:49<07:28,  6.15s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=3.5e-6, train/loss_step=0.000851, global_step=1521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431] Epoch 76:  10%|█         | 8/80 [01:14<09:56,  8.28s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=3.5e-6, train/loss_step=0.000851, global_step=1521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  10%|█         | 8/80 [01:14<09:56,  8.28s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=4.93e-5, train/loss_step=0.0122, global_step=1521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]   Epoch 76:  11%|█▏        | 9/80 [01:15<08:57,  7.57s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=4.93e-5, train/loss_step=0.0122, global_step=1521.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  11%|█▏        | 9/80 [01:15<08:57,  7.57s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00066, train/loss_vlb_step=2.95e-5, train/loss_step=0.00066, global_step=1522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  12%|█▎        | 10/80 [01:34<10:03,  8.62s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00066, train/loss_vlb_step=2.95e-5, train/loss_step=0.00066, global_step=1522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  12%|█▎        | 10/80 [01:34<10:03,  8.62s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=8.01e-5, train/loss_step=0.00977, global_step=1522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  14%|█▍        | 11/80 [01:35<09:07,  7.94s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00977, train/loss_vlb_step=8.01e-5, train/loss_step=0.00977, global_step=1522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  14%|█▍        | 11/80 [01:35<09:07,  7.94s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00037, train/loss_vlb_step=1.92e-6, train/loss_step=0.00037, global_step=1522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  15%|█▌        | 12/80 [01:35<08:20,  7.37s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00037, train/loss_vlb_step=1.92e-6, train/loss_step=0.00037, global_step=1522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  15%|█▌        | 12/80 [01:35<08:20,  7.37s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.42e-6, train/loss_step=0.00174, global_step=1522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  16%|█▋        | 13/80 [01:36<07:40,  6.88s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.42e-6, train/loss_step=0.00174, global_step=1522.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  16%|█▋        | 13/80 [01:36<07:40,  6.88s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.21e-5, train/loss_step=0.0033, global_step=1523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  18%|█▊        | 14/80 [01:36<07:05,  6.45s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.21e-5, train/loss_step=0.0033, global_step=1523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  18%|█▊        | 14/80 [01:36<07:05,  6.45s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.000679, train/loss_vlb_step=4.96e-6, train/loss_step=0.000679, global_step=1523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  19%|█▉        | 15/80 [01:37<06:35,  6.08s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.000679, train/loss_vlb_step=4.96e-6, train/loss_step=0.000679, global_step=1523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  19%|█▉        | 15/80 [01:37<06:35,  6.08s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=3.73e-5, train/loss_step=0.00756, global_step=1523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  20%|██        | 16/80 [02:00<07:34,  7.10s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=3.73e-5, train/loss_step=0.00756, global_step=1523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  20%|██        | 16/80 [02:00<07:34,  7.10s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.69e-5, train/loss_step=0.00278, global_step=1523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  21%|██▏       | 17/80 [02:01<07:04,  6.74s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.69e-5, train/loss_step=0.00278, global_step=1523.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  21%|██▏       | 17/80 [02:01<07:04,  6.74s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.2e-5, train/loss_step=0.0107, global_step=1524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]   Epoch 76:  22%|██▎       | 18/80 [02:12<07:13,  6.99s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.2e-5, train/loss_step=0.0107, global_step=1524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  22%|██▎       | 18/80 [02:12<07:13,  6.99s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=3.12e-6, train/loss_step=0.000641, global_step=1524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  24%|██▍       | 19/80 [02:13<06:46,  6.67s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=3.12e-6, train/loss_step=0.000641, global_step=1524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  24%|██▍       | 19/80 [02:13<06:46,  6.67s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.12e-5, train/loss_step=0.0134, global_step=1524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]    Epoch 76:  25%|██▌       | 20/80 [02:13<06:22,  6.37s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=5.12e-5, train/loss_step=0.0134, global_step=1524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  25%|██▌       | 20/80 [02:13<06:22,  6.37s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=1.02e-6, train/loss_step=0.000239, global_step=1524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=1.02e-6, train/loss_step=0.000239, global_step=1524.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  26%|██▋       | 21/80 [02:14<06:00,  6.11s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=1.28e-5, train/loss_step=0.00129, global_step=1525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  28%|██▊       | 22/80 [02:14<05:40,  5.86s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=1.28e-5, train/loss_step=0.00129, global_step=1525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  28%|██▊       | 22/80 [02:14<05:40,  5.86s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.55e-6, train/loss_step=0.00137, global_step=1525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  29%|██▉       | 23/80 [02:15<05:21,  5.64s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.55e-6, train/loss_step=0.00137, global_step=1525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  29%|██▉       | 23/80 [02:15<05:21,  5.64s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000174, train/loss_vlb_step=6.05e-7, train/loss_step=0.000174, global_step=1525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  30%|███       | 24/80 [02:44<06:07,  6.57s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000174, train/loss_vlb_step=6.05e-7, train/loss_step=0.000174, global_step=1525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  30%|███       | 24/80 [02:44<06:07,  6.57s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=2.09e-6, train/loss_step=0.000351, global_step=1525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  31%|███▏      | 25/80 [02:44<05:48,  6.34s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=2.09e-6, train/loss_step=0.000351, global_step=1525.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  31%|███▏      | 25/80 [02:44<05:48,  6.34s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=0.000597, train/loss_step=0.0221, global_step=1526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]   Epoch 76:  32%|███▎      | 26/80 [02:52<05:44,  6.38s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.0221, train/loss_vlb_step=0.000597, train/loss_step=0.0221, global_step=1526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  32%|███▎      | 26/80 [02:52<05:44,  6.38s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=2.59e-5, train/loss_step=0.0077, global_step=1526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  34%|███▍      | 27/80 [03:02<05:45,  6.52s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0077, train/loss_vlb_step=2.59e-5, train/loss_step=0.0077, global_step=1526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  34%|███▍      | 27/80 [03:02<05:45,  6.52s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000543, train/loss_vlb_step=3.02e-6, train/loss_step=0.000543, global_step=1526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  35%|███▌      | 28/80 [03:03<05:28,  6.32s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000543, train/loss_vlb_step=3.02e-6, train/loss_step=0.000543, global_step=1526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  35%|███▌      | 28/80 [03:03<05:28,  6.32s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=9.54e-6, train/loss_step=0.00248, global_step=1526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]   Epoch 76:  36%|███▋      | 29/80 [03:03<05:12,  6.12s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=9.54e-6, train/loss_step=0.00248, global_step=1526.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  36%|███▋      | 29/80 [03:03<05:12,  6.12s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000178, train/loss_vlb_step=6.66e-7, train/loss_step=0.000178, global_step=1527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  38%|███▊      | 30/80 [03:04<04:57,  5.94s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000178, train/loss_vlb_step=6.66e-7, train/loss_step=0.000178, global_step=1527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  38%|███▊      | 30/80 [03:04<04:57,  5.94s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=9.42e-6, train/loss_step=0.00212, global_step=1527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  39%|███▉      | 31/80 [03:04<04:42,  5.77s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=9.42e-6, train/loss_step=0.00212, global_step=1527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  39%|███▉      | 31/80 [03:04<04:42,  5.77s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.31e-7, train/loss_step=0.000167, global_step=1527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  40%|████      | 32/80 [03:24<04:57,  6.20s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.31e-7, train/loss_step=0.000167, global_step=1527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  40%|████      | 32/80 [03:24<04:57,  6.20s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=2.63e-5, train/loss_step=0.000574, global_step=1527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  41%|████▏     | 33/80 [03:25<04:43,  6.04s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=2.63e-5, train/loss_step=0.000574, global_step=1527.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  41%|████▏     | 33/80 [03:25<04:43,  6.04s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000406, train/loss_step=0.0273, global_step=1528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]   Epoch 76:  42%|████▎     | 34/80 [03:31<04:37,  6.03s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.0273, train/loss_vlb_step=0.000406, train/loss_step=0.0273, global_step=1528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  42%|████▎     | 34/80 [03:31<04:37,  6.03s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=4.92e-6, train/loss_step=0.000842, global_step=1528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  44%|████▍     | 35/80 [03:37<04:32,  6.05s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=4.92e-6, train/loss_step=0.000842, global_step=1528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  44%|████▍     | 35/80 [03:37<04:32,  6.05s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.01e-5, train/loss_step=0.00202, global_step=1528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  45%|████▌     | 36/80 [03:38<04:19,  5.90s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=1.01e-5, train/loss_step=0.00202, global_step=1528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  45%|████▌     | 36/80 [03:38<04:19,  5.90s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.00257, train/loss_step=0.0205, global_step=1528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  46%|████▋     | 37/80 [03:38<04:07,  5.76s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.00257, train/loss_step=0.0205, global_step=1528.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  46%|████▋     | 37/80 [03:38<04:07,  5.76s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.11e-5, train/loss_step=0.00303, global_step=1529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  48%|████▊     | 38/80 [03:39<03:56,  5.63s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.11e-5, train/loss_step=0.00303, global_step=1529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  48%|████▊     | 38/80 [03:39<03:56,  5.63s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=2.9e-6, train/loss_step=0.000451, global_step=1529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  49%|████▉     | 39/80 [03:39<03:45,  5.50s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=2.9e-6, train/loss_step=0.000451, global_step=1529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  49%|████▉     | 39/80 [03:39<03:45,  5.50s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=1.01e-5, train/loss_step=0.000763, global_step=1529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  50%|█████     | 40/80 [04:06<04:00,  6.01s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=1.01e-5, train/loss_step=0.000763, global_step=1529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  50%|█████     | 40/80 [04:06<04:00,  6.01s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=2.54e-6, train/loss_step=0.000496, global_step=1529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  51%|█████▏    | 41/80 [04:06<03:49,  5.88s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=2.54e-6, train/loss_step=0.000496, global_step=1529.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  51%|█████▏    | 41/80 [04:06<03:49,  5.88s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=5.13e-5, train/loss_step=0.010, global_step=1530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]      Epoch 76:  52%|█████▎    | 42/80 [04:08<03:39,  5.77s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=5.13e-5, train/loss_step=0.010, global_step=1530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  52%|█████▎    | 42/80 [04:08<03:39,  5.77s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=6.58e-6, train/loss_step=0.0018, global_step=1530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  54%|█████▍    | 43/80 [04:30<03:47,  6.15s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=6.58e-6, train/loss_step=0.0018, global_step=1530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  54%|█████▍    | 43/80 [04:30<03:47,  6.15s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=3.09e-5, train/loss_step=0.000987, global_step=1530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  55%|█████▌    | 44/80 [04:31<03:36,  6.03s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=3.09e-5, train/loss_step=0.000987, global_step=1530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  55%|█████▌    | 44/80 [04:31<03:36,  6.03s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.78e-5, train/loss_step=0.0144, global_step=1530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]    Epoch 76:  56%|█████▋    | 45/80 [04:31<03:26,  5.91s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.78e-5, train/loss_step=0.0144, global_step=1530.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  56%|█████▋    | 45/80 [04:31<03:26,  5.91s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=3.48e-5, train/loss_step=0.0016, global_step=1531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431] Epoch 76:  57%|█████▊    | 46/80 [04:32<03:17,  5.80s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=3.48e-5, train/loss_step=0.0016, global_step=1531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  57%|█████▊    | 46/80 [04:32<03:17,  5.80s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000142, train/loss_vlb_step=5.33e-7, train/loss_step=0.000142, global_step=1531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  59%|█████▉    | 47/80 [04:32<03:07,  5.69s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000142, train/loss_vlb_step=5.33e-7, train/loss_step=0.000142, global_step=1531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  59%|█████▉    | 47/80 [04:32<03:07,  5.69s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.06e-5, train/loss_step=0.00298, global_step=1531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  60%|██████    | 48/80 [04:46<03:07,  5.85s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.06e-5, train/loss_step=0.00298, global_step=1531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  60%|██████    | 48/80 [04:46<03:07,  5.85s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000527, train/loss_vlb_step=4.3e-6, train/loss_step=0.000527, global_step=1531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  61%|██████▏   | 49/80 [04:47<02:58,  5.74s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000527, train/loss_vlb_step=4.3e-6, train/loss_step=0.000527, global_step=1531.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  61%|██████▏   | 49/80 [04:47<02:58,  5.74s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=1.9e-5, train/loss_step=0.00536, global_step=1532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  62%|██████▎   | 50/80 [04:50<02:50,  5.69s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00536, train/loss_vlb_step=1.9e-5, train/loss_step=0.00536, global_step=1532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  62%|██████▎   | 50/80 [04:50<02:50,  5.69s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=8.14e-7, train/loss_step=0.000208, global_step=1532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  64%|██████▍   | 51/80 [05:20<02:58,  6.15s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=8.14e-7, train/loss_step=0.000208, global_step=1532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  64%|██████▍   | 51/80 [05:20<02:58,  6.15s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=2.15e-6, train/loss_step=0.000412, global_step=1532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  65%|██████▌   | 52/80 [05:20<02:49,  6.05s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=2.15e-6, train/loss_step=0.000412, global_step=1532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  65%|██████▌   | 52/80 [05:20<02:49,  6.05s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.02e-5, train/loss_step=0.00769, global_step=1532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  66%|██████▋   | 53/80 [05:21<02:40,  5.95s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.02e-5, train/loss_step=0.00769, global_step=1532.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  66%|██████▋   | 53/80 [05:21<02:40,  5.95s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000502, train/loss_vlb_step=3.31e-6, train/loss_step=0.000502, global_step=1533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  68%|██████▊   | 54/80 [05:21<02:32,  5.85s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000502, train/loss_vlb_step=3.31e-6, train/loss_step=0.000502, global_step=1533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  68%|██████▊   | 54/80 [05:21<02:32,  5.85s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=6.1e-5, train/loss_step=0.00241, global_step=1533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]   Epoch 76:  69%|██████▉   | 55/80 [05:22<02:23,  5.75s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=6.1e-5, train/loss_step=0.00241, global_step=1533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  69%|██████▉   | 55/80 [05:22<02:23,  5.75s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.19e-5, train/loss_step=0.00812, global_step=1533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  70%|███████   | 56/80 [05:23<02:16,  5.67s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=3.19e-5, train/loss_step=0.00812, global_step=1533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  70%|███████   | 56/80 [05:23<02:16,  5.67s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=7.11e-6, train/loss_step=0.00177, global_step=1533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  71%|███████▏  | 57/80 [05:23<02:08,  5.59s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=7.11e-6, train/loss_step=0.00177, global_step=1533.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  71%|███████▏  | 57/80 [05:23<02:08,  5.59s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.53e-5, train/loss_step=0.00433, global_step=1534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.53e-5, train/loss_step=0.00433, global_step=1534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  72%|███████▎  | 58/80 [05:36<02:05,  5.71s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=1.34e-5, train/loss_step=0.000968, global_step=1534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  74%|███████▍  | 59/80 [05:54<02:03,  5.90s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=1.34e-5, train/loss_step=0.000968, global_step=1534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  74%|███████▍  | 59/80 [05:54<02:03,  5.90s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=1.05e-5, train/loss_step=0.000514, global_step=1534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  75%|███████▌  | 60/80 [05:54<01:56,  5.81s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000514, train/loss_vlb_step=1.05e-5, train/loss_step=0.000514, global_step=1534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  75%|███████▌  | 60/80 [05:54<01:56,  5.81s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.33e-5, train/loss_step=0.00772, global_step=1534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  76%|███████▋  | 61/80 [05:55<01:48,  5.73s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00772, train/loss_vlb_step=3.33e-5, train/loss_step=0.00772, global_step=1534.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  76%|███████▋  | 61/80 [05:55<01:48,  5.73s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000203, train/loss_vlb_step=1.05e-6, train/loss_step=0.000203, global_step=1535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000203, train/loss_vlb_step=1.05e-6, train/loss_step=0.000203, global_step=1535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=1.63e-6, train/loss_step=0.000436, global_step=1535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  79%|███████▉  | 63/80 [05:56<01:34,  5.56s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=1.63e-6, train/loss_step=0.000436, global_step=1535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  79%|███████▉  | 63/80 [05:56<01:34,  5.56s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000743, train/loss_vlb_step=4.4e-6, train/loss_step=0.000743, global_step=1535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431] Epoch 76:  80%|████████  | 64/80 [06:02<01:29,  5.58s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000743, train/loss_vlb_step=4.4e-6, train/loss_step=0.000743, global_step=1535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  80%|████████  | 64/80 [06:02<01:29,  5.58s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=6.08e-5, train/loss_step=0.00969, global_step=1535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431] Epoch 76:  81%|████████▏ | 65/80 [06:03<01:22,  5.51s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00969, train/loss_vlb_step=6.08e-5, train/loss_step=0.00969, global_step=1535.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  81%|████████▏ | 65/80 [06:03<01:22,  5.51s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.24e-5, train/loss_step=0.00283, global_step=1536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  82%|████████▎ | 66/80 [06:10<01:17,  5.54s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.24e-5, train/loss_step=0.00283, global_step=1536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  82%|████████▎ | 66/80 [06:10<01:17,  5.54s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.74e-6, train/loss_step=0.00142, global_step=1536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.74e-6, train/loss_step=0.00142, global_step=1536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=1.35e-5, train/loss_step=0.00164, global_step=1536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  85%|████████▌ | 68/80 [06:30<01:07,  5.66s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=1.35e-5, train/loss_step=0.00164, global_step=1536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  85%|████████▌ | 68/80 [06:30<01:07,  5.66s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.000958, train/loss_vlb_step=4.5e-6, train/loss_step=0.000958, global_step=1536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  86%|████████▋ | 69/80 [06:31<01:01,  5.59s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.000958, train/loss_vlb_step=4.5e-6, train/loss_step=0.000958, global_step=1536.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  86%|████████▋ | 69/80 [06:31<01:01,  5.59s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.14e-6, train/loss_step=0.000252, global_step=1537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  88%|████████▊ | 70/80 [06:31<00:55,  5.51s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.14e-6, train/loss_step=0.000252, global_step=1537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  88%|████████▊ | 70/80 [06:31<00:55,  5.51s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.17e-5, train/loss_step=0.00257, global_step=1537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  89%|████████▉ | 71/80 [06:32<00:49,  5.44s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.17e-5, train/loss_step=0.00257, global_step=1537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  89%|████████▉ | 71/80 [06:32<00:49,  5.44s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.44e-6, train/loss_step=0.00031, global_step=1537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  90%|█████████ | 72/80 [06:42<00:44,  5.52s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=1.44e-6, train/loss_step=0.00031, global_step=1537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  90%|█████████ | 72/80 [06:42<00:44,  5.52s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.000204, train/loss_step=0.0169, global_step=1537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431] Epoch 76:  91%|█████████▏| 73/80 [06:44<00:38,  5.47s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.000204, train/loss_step=0.0169, global_step=1537.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  91%|█████████▏| 73/80 [06:44<00:38,  5.47s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000845, train/loss_vlb_step=3.82e-5, train/loss_step=0.000845, global_step=1538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  92%|█████████▎| 74/80 [06:52<00:33,  5.50s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000845, train/loss_vlb_step=3.82e-5, train/loss_step=0.000845, global_step=1538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  92%|█████████▎| 74/80 [06:52<00:33,  5.50s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.12e-5, train/loss_step=0.00296, global_step=1538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 76:  94%|█████████▍| 75/80 [06:59<00:27,  5.51s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.12e-5, train/loss_step=0.00296, global_step=1538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  94%|█████████▍| 75/80 [06:59<00:27,  5.51s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000826, train/loss_vlb_step=4.77e-6, train/loss_step=0.000826, global_step=1538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  95%|█████████▌| 76/80 [06:59<00:21,  5.45s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000826, train/loss_vlb_step=4.77e-6, train/loss_step=0.000826, global_step=1538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  95%|█████████▌| 76/80 [06:59<00:21,  5.45s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.53e-6, train/loss_step=0.000329, global_step=1538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  96%|█████████▋| 77/80 [07:00<00:16,  5.39s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.53e-6, train/loss_step=0.000329, global_step=1538.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  96%|█████████▋| 77/80 [07:00<00:16,  5.39s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000865, train/loss_step=0.0154, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]   Epoch 76:  98%|█████████▊| 78/80 [07:00<00:10,  5.32s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.000865, train/loss_step=0.0154, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  98%|█████████▊| 78/80 [07:00<00:10,  5.32s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.91e-5, train/loss_step=0.00374, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  99%|█████████▉| 79/80 [07:01<00:05,  5.26s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.91e-5, train/loss_step=0.00374, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76:  99%|█████████▉| 79/80 [07:01<00:05,  5.26s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.25e-5, train/loss_step=0.00366, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76: 100%|██████████| 80/80 [07:01<00:00,  5.20s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.25e-5, train/loss_step=0.00366, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 76: 100%|██████████| 80/80 [07:01<00:00,  5.20s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=4.85e-5, train/loss_step=0.0147, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Average Epoch time: 421.63 seconds
+Average Peak memory 29565.98MiB
+Epoch 76:   0%|          | 0/80 [00:00<00:00, 4733.98it/s, loss=0.00402, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=4.85e-5, train/loss_step=0.0147, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 77:   0%|          | 0/80 [00:00<00:00, 2006.84it/s, loss=0.00402, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=4.85e-5, train/loss_step=0.0147, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]Epoch 77:   1%|▏         | 1/80 [00:46<30:55, 23.48s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=4.85e-5, train/loss_step=0.0147, global_step=1539.0, lr_abs=0.0001, train/loss_simple_epoch=0.00431, train/loss_vlb_epoch=0.000126, train/loss_epoch=0.00431]  Epoch 77:   1%|▏         | 1/80 [00:46<30:55, 23.48s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=1.41e-6, train/loss_step=0.000331, global_step=1540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   2%|▎         | 2/80 [00:47<20:33, 15.82s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=1.41e-6, train/loss_step=0.000331, global_step=1540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   2%|▎         | 2/80 [00:47<20:33, 15.82s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.67e-5, train/loss_step=0.00458, global_step=1540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]  Epoch 77:   4%|▍         | 3/80 [00:47<15:22, 11.99s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.67e-5, train/loss_step=0.00458, global_step=1540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   4%|▍         | 3/80 [00:47<15:22, 11.99s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000486, train/loss_vlb_step=2.26e-6, train/loss_step=0.000486, global_step=1540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   5%|▌         | 4/80 [00:48<12:16,  9.69s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000486, train/loss_vlb_step=2.26e-6, train/loss_step=0.000486, global_step=1540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   5%|▌         | 4/80 [00:48<12:16,  9.69s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=6.91e-5, train/loss_step=0.0062, global_step=1540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]    Epoch 77:   6%|▋         | 5/80 [00:48<10:12,  8.16s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=6.91e-5, train/loss_step=0.0062, global_step=1540.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   6%|▋         | 5/80 [00:48<10:12,  8.16s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=3.23e-5, train/loss_step=0.00528, global_step=1541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   8%|▊         | 6/80 [00:49<08:42,  7.07s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=3.23e-5, train/loss_step=0.00528, global_step=1541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   8%|▊         | 6/80 [00:49<08:42,  7.07s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=0.000737, train/loss_step=0.00736, global_step=1541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   9%|▉         | 7/80 [00:49<07:35,  6.25s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=0.000737, train/loss_step=0.00736, global_step=1541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:   9%|▉         | 7/80 [00:49<07:35,  6.25s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=7.82e-6, train/loss_step=0.00206, global_step=1541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403] Epoch 77:  10%|█         | 8/80 [01:25<11:21,  9.47s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=7.82e-6, train/loss_step=0.00206, global_step=1541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  10%|█         | 8/80 [01:25<11:21,  9.47s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=9e-6, train/loss_step=0.00241, global_step=1541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]   Epoch 77:  11%|█▏        | 9/80 [01:36<11:25,  9.65s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=9e-6, train/loss_step=0.00241, global_step=1541.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  11%|█▏        | 9/80 [01:36<11:25,  9.66s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.00022, train/loss_step=0.0131, global_step=1542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  12%|█▎        | 10/80 [01:37<10:17,  8.82s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.00022, train/loss_step=0.0131, global_step=1542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  12%|█▎        | 10/80 [01:37<10:17,  8.82s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=4.62e-5, train/loss_step=0.00269, global_step=1542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  14%|█▍        | 11/80 [01:37<09:20,  8.13s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00269, train/loss_vlb_step=4.62e-5, train/loss_step=0.00269, global_step=1542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  14%|█▍        | 11/80 [01:37<09:20,  8.13s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=0.00111, train/loss_step=0.00282, global_step=1542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  15%|█▌        | 12/80 [01:38<08:32,  7.54s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=0.00111, train/loss_step=0.00282, global_step=1542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  15%|█▌        | 12/80 [01:38<08:32,  7.54s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.79e-6, train/loss_step=0.000377, global_step=1542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  16%|█▋        | 13/80 [01:38<07:51,  7.04s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.79e-6, train/loss_step=0.000377, global_step=1542.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  16%|█▋        | 13/80 [01:38<07:51,  7.04s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=4.33e-5, train/loss_step=0.00672, global_step=1543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]   Epoch 77:  18%|█▊        | 14/80 [01:39<07:15,  6.60s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=4.33e-5, train/loss_step=0.00672, global_step=1543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  18%|█▊        | 14/80 [01:39<07:15,  6.60s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=0.000632, train/loss_step=0.00192, global_step=1543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  19%|█▉        | 15/80 [01:39<06:44,  6.22s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=0.000632, train/loss_step=0.00192, global_step=1543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  19%|█▉        | 15/80 [01:39<06:44,  6.22s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=7.04e-5, train/loss_step=0.00939, global_step=1543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403] Epoch 77:  20%|██        | 16/80 [02:05<07:50,  7.36s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=7.04e-5, train/loss_step=0.00939, global_step=1543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  20%|██        | 16/80 [02:05<07:50,  7.36s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.42e-5, train/loss_step=0.00491, global_step=1543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403] Epoch 77:  21%|██▏       | 17/80 [02:15<07:55,  7.55s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=2.42e-5, train/loss_step=0.00491, global_step=1543.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  21%|██▏       | 17/80 [02:15<07:55,  7.55s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000879, train/loss_vlb_step=3.96e-6, train/loss_step=0.000879, global_step=1544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  22%|██▎       | 18/80 [02:16<07:24,  7.17s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000879, train/loss_vlb_step=3.96e-6, train/loss_step=0.000879, global_step=1544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  22%|██▎       | 18/80 [02:16<07:24,  7.17s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=9.36e-6, train/loss_step=0.000454, global_step=1544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  24%|██▍       | 19/80 [02:16<06:57,  6.84s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=9.36e-6, train/loss_step=0.000454, global_step=1544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  24%|██▍       | 19/80 [02:16<06:57,  6.84s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.13e-5, train/loss_step=0.0021, global_step=1544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]    Epoch 77:  25%|██▌       | 20/80 [02:17<06:34,  6.57s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.13e-5, train/loss_step=0.0021, global_step=1544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  25%|██▌       | 20/80 [02:17<06:34,  6.57s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=6.99e-6, train/loss_step=0.00193, global_step=1544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  26%|██▋       | 21/80 [02:18<06:11,  6.29s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=6.99e-6, train/loss_step=0.00193, global_step=1544.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  26%|██▋       | 21/80 [02:18<06:11,  6.29s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.38e-6, train/loss_step=0.000268, global_step=1545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  28%|██▊       | 22/80 [02:18<05:50,  6.04s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.38e-6, train/loss_step=0.000268, global_step=1545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  28%|██▊       | 22/80 [02:18<05:50,  6.04s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=3.98e-5, train/loss_step=0.00898, global_step=1545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403] Epoch 77:  29%|██▉       | 23/80 [02:19<05:31,  5.81s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=3.98e-5, train/loss_step=0.00898, global_step=1545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  29%|██▉       | 23/80 [02:19<05:31,  5.81s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=3.11e-6, train/loss_step=0.00062, global_step=1545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  30%|███       | 24/80 [02:49<06:19,  6.78s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=3.11e-6, train/loss_step=0.00062, global_step=1545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  30%|███       | 24/80 [02:49<06:19,  6.78s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=0.0003, train/loss_step=0.0222, global_step=1545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]   Epoch 77:  31%|███▏      | 25/80 [03:10<06:42,  7.31s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=0.0003, train/loss_step=0.0222, global_step=1545.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  31%|███▏      | 25/80 [03:10<06:42,  7.31s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=5.63e-5, train/loss_step=0.00915, global_step=1546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  32%|███▎      | 26/80 [03:10<06:21,  7.06s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00915, train/loss_vlb_step=5.63e-5, train/loss_step=0.00915, global_step=1546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  32%|███▎      | 26/80 [03:10<06:21,  7.06s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.55e-5, train/loss_step=0.00433, global_step=1546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  34%|███▍      | 27/80 [03:11<06:01,  6.82s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=1.55e-5, train/loss_step=0.00433, global_step=1546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  34%|███▍      | 27/80 [03:11<06:01,  6.82s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.91e-7, train/loss_step=0.000165, global_step=1546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  35%|███▌      | 28/80 [03:11<05:43,  6.61s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.91e-7, train/loss_step=0.000165, global_step=1546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  35%|███▌      | 28/80 [03:11<05:43,  6.61s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=9.25e-7, train/loss_step=0.000164, global_step=1546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  36%|███▋      | 29/80 [03:12<05:26,  6.41s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=9.25e-7, train/loss_step=0.000164, global_step=1546.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  36%|███▋      | 29/80 [03:12<05:26,  6.41s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=2.31e-5, train/loss_step=0.00307, global_step=1547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]  Epoch 77:  38%|███▊      | 30/80 [03:12<05:10,  6.21s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=2.31e-5, train/loss_step=0.00307, global_step=1547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  38%|███▊      | 30/80 [03:12<05:10,  6.21s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.43e-5, train/loss_step=0.00687, global_step=1547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  39%|███▉      | 31/80 [03:13<04:55,  6.04s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.43e-5, train/loss_step=0.00687, global_step=1547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  39%|███▉      | 31/80 [03:13<04:55,  6.04s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.11e-5, train/loss_step=0.00583, global_step=1547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  40%|████      | 32/80 [03:33<05:10,  6.48s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.11e-5, train/loss_step=0.00583, global_step=1547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  40%|████      | 32/80 [03:33<05:10,  6.48s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=3.4e-6, train/loss_step=0.000624, global_step=1547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  41%|████▏     | 33/80 [03:55<05:25,  6.92s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=3.4e-6, train/loss_step=0.000624, global_step=1547.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  41%|████▏     | 33/80 [03:55<05:25,  6.92s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=1.06e-5, train/loss_step=0.000536, global_step=1548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  42%|████▎     | 34/80 [03:55<05:09,  6.74s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=1.06e-5, train/loss_step=0.000536, global_step=1548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  42%|████▎     | 34/80 [03:55<05:09,  6.74s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000675, train/loss_vlb_step=2.6e-6, train/loss_step=0.000675, global_step=1548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403] Epoch 77:  44%|████▍     | 35/80 [03:56<04:55,  6.57s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000675, train/loss_vlb_step=2.6e-6, train/loss_step=0.000675, global_step=1548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  44%|████▍     | 35/80 [03:56<04:55,  6.57s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=3.29e-5, train/loss_step=0.00979, global_step=1548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403] Epoch 77:  45%|████▌     | 36/80 [03:56<04:41,  6.40s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=3.29e-5, train/loss_step=0.00979, global_step=1548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  45%|████▌     | 36/80 [03:56<04:41,  6.40s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=1.62e-5, train/loss_step=0.00479, global_step=1548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  46%|████▋     | 37/80 [03:57<04:28,  6.25s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=1.62e-5, train/loss_step=0.00479, global_step=1548.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  46%|████▋     | 37/80 [03:57<04:28,  6.25s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=2.09e-5, train/loss_step=0.00302, global_step=1549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  48%|████▊     | 38/80 [03:58<04:16,  6.10s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=2.09e-5, train/loss_step=0.00302, global_step=1549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  48%|████▊     | 38/80 [03:58<04:16,  6.10s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=3.86e-6, train/loss_step=0.00088, global_step=1549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403] Epoch 77:  49%|████▉     | 39/80 [03:58<04:04,  5.96s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=3.86e-6, train/loss_step=0.00088, global_step=1549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  49%|████▉     | 39/80 [03:58<04:04,  5.96s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00885, train/loss_vlb_step=4.76e-5, train/loss_step=0.00885, global_step=1549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  50%|█████     | 40/80 [04:28<04:21,  6.54s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00885, train/loss_vlb_step=4.76e-5, train/loss_step=0.00885, global_step=1549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  50%|█████     | 40/80 [04:28<04:21,  6.54s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=7.9e-6, train/loss_step=0.00192, global_step=1549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403] Epoch 77:  51%|█████▏    | 41/80 [04:38<04:18,  6.63s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=7.9e-6, train/loss_step=0.00192, global_step=1549.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  51%|█████▏    | 41/80 [04:38<04:18,  6.63s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=0.000625, train/loss_step=0.023, global_step=1550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]  Epoch 77:  52%|█████▎    | 42/80 [04:39<04:06,  6.49s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.023, train/loss_vlb_step=0.000625, train/loss_step=0.023, global_step=1550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  52%|█████▎    | 42/80 [04:39<04:06,  6.49s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=8.42e-7, train/loss_step=0.000199, global_step=1550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  54%|█████▍    | 43/80 [04:39<03:55,  6.36s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=8.42e-7, train/loss_step=0.000199, global_step=1550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  54%|█████▍    | 43/80 [04:39<03:55,  6.36s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=2.06e-6, train/loss_step=0.000496, global_step=1550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  55%|█████▌    | 44/80 [04:40<03:44,  6.23s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=2.06e-6, train/loss_step=0.000496, global_step=1550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  55%|█████▌    | 44/80 [04:40<03:44,  6.23s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=2.93e-6, train/loss_step=0.000451, global_step=1550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  56%|█████▋    | 45/80 [04:40<03:33,  6.10s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000451, train/loss_vlb_step=2.93e-6, train/loss_step=0.000451, global_step=1550.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  56%|█████▋    | 45/80 [04:40<03:33,  6.10s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=0.00272, train/loss_step=0.00588, global_step=1551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]  Epoch 77:  57%|█████▊    | 46/80 [04:41<03:23,  5.98s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=0.00272, train/loss_step=0.00588, global_step=1551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  57%|█████▊    | 46/80 [04:41<03:23,  5.98s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000184, train/loss_vlb_step=7.27e-7, train/loss_step=0.000184, global_step=1551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  59%|█████▉    | 47/80 [04:41<03:13,  5.87s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000184, train/loss_vlb_step=7.27e-7, train/loss_step=0.000184, global_step=1551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  59%|█████▉    | 47/80 [04:41<03:13,  5.87s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000457, train/loss_vlb_step=2e-6, train/loss_step=0.000457, global_step=1551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]   Epoch 77:  60%|██████    | 48/80 [05:09<03:21,  6.31s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000457, train/loss_vlb_step=2e-6, train/loss_step=0.000457, global_step=1551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  60%|██████    | 48/80 [05:09<03:21,  6.31s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=0.000243, train/loss_step=0.0137, global_step=1551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  61%|██████▏   | 49/80 [05:30<03:25,  6.61s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=0.000243, train/loss_step=0.0137, global_step=1551.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  61%|██████▏   | 49/80 [05:30<03:25,  6.61s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000849, train/loss_vlb_step=3e-5, train/loss_step=0.000849, global_step=1552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  62%|██████▎   | 50/80 [05:31<03:14,  6.49s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000849, train/loss_vlb_step=3e-5, train/loss_step=0.000849, global_step=1552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  62%|██████▎   | 50/80 [05:31<03:14,  6.49s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000643, train/loss_step=0.0254, global_step=1552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  64%|██████▍   | 51/80 [05:31<03:04,  6.38s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000643, train/loss_step=0.0254, global_step=1552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  64%|██████▍   | 51/80 [05:31<03:04,  6.38s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000578, train/loss_vlb_step=3.17e-6, train/loss_step=0.000578, global_step=1552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  65%|██████▌   | 52/80 [05:32<02:55,  6.27s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.000578, train/loss_vlb_step=3.17e-6, train/loss_step=0.000578, global_step=1552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  65%|██████▌   | 52/80 [05:32<02:55,  6.27s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.76e-5, train/loss_step=0.00716, global_step=1552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]  Epoch 77:  66%|██████▋   | 53/80 [05:32<02:46,  6.16s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00716, train/loss_vlb_step=3.76e-5, train/loss_step=0.00716, global_step=1552.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  66%|██████▋   | 53/80 [05:32<02:46,  6.16s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=8.24e-6, train/loss_step=0.000558, global_step=1553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  68%|██████▊   | 54/80 [05:33<02:37,  6.06s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=8.24e-6, train/loss_step=0.000558, global_step=1553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  68%|██████▊   | 54/80 [05:33<02:37,  6.06s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=3.49e-6, train/loss_step=0.00104, global_step=1553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]  Epoch 77:  69%|██████▉   | 55/80 [05:33<02:28,  5.96s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=3.49e-6, train/loss_step=0.00104, global_step=1553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  69%|██████▉   | 55/80 [05:33<02:28,  5.96s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.26e-5, train/loss_step=0.00374, global_step=1553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  70%|███████   | 56/80 [05:56<02:30,  6.26s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.26e-5, train/loss_step=0.00374, global_step=1553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  70%|███████   | 56/80 [05:56<02:30,  6.26s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=8.78e-5, train/loss_step=0.0137, global_step=1553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]   Epoch 77:  71%|███████▏  | 57/80 [06:03<02:24,  6.26s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=8.78e-5, train/loss_step=0.0137, global_step=1553.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  71%|███████▏  | 57/80 [06:03<02:24,  6.26s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=2.56e-5, train/loss_step=0.00712, global_step=1554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  72%|███████▎  | 58/80 [06:03<02:15,  6.16s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=2.56e-5, train/loss_step=0.00712, global_step=1554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  72%|███████▎  | 58/80 [06:03<02:15,  6.16s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.000694, train/loss_vlb_step=7.33e-6, train/loss_step=0.000694, global_step=1554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  74%|███████▍  | 59/80 [06:04<02:07,  6.07s/it, loss=0.0058, v_num=0, train/loss_simple_step=0.000694, train/loss_vlb_step=7.33e-6, train/loss_step=0.000694, global_step=1554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  74%|███████▍  | 59/80 [06:04<02:07,  6.07s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=0.000479, train/loss_step=0.0222, global_step=1554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]  Epoch 77:  75%|███████▌  | 60/80 [06:05<01:59,  5.99s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=0.000479, train/loss_step=0.0222, global_step=1554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  75%|███████▌  | 60/80 [06:05<01:59,  5.99s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=3.77e-6, train/loss_step=0.001, global_step=1554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]   Epoch 77:  76%|███████▋  | 61/80 [06:06<01:52,  5.90s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=3.77e-6, train/loss_step=0.001, global_step=1554.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  76%|███████▋  | 61/80 [06:06<01:52,  5.90s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.02e-5, train/loss_step=0.00276, global_step=1555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  78%|███████▊  | 62/80 [06:06<01:44,  5.82s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=1.02e-5, train/loss_step=0.00276, global_step=1555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  78%|███████▊  | 62/80 [06:06<01:44,  5.82s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=7.97e-7, train/loss_step=0.00019, global_step=1555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  79%|███████▉  | 63/80 [06:07<01:37,  5.74s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=7.97e-7, train/loss_step=0.00019, global_step=1555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  79%|███████▉  | 63/80 [06:07<01:37,  5.74s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=7.81e-7, train/loss_step=0.000157, global_step=1555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  80%|████████  | 64/80 [06:42<01:39,  6.19s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=7.81e-7, train/loss_step=0.000157, global_step=1555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  80%|████████  | 64/80 [06:42<01:39,  6.19s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=8.39e-5, train/loss_step=0.0128, global_step=1555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]    Epoch 77:  81%|████████▏ | 65/80 [06:58<01:35,  6.34s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=8.39e-5, train/loss_step=0.0128, global_step=1555.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  81%|████████▏ | 65/80 [06:58<01:35,  6.34s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.000385, train/loss_step=0.0241, global_step=1556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  82%|████████▎ | 66/80 [06:59<01:27,  6.26s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.0241, train/loss_vlb_step=0.000385, train/loss_step=0.0241, global_step=1556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  82%|████████▎ | 66/80 [06:59<01:27,  6.26s/it, loss=0.00728, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=2.73e-5, train/loss_step=0.00732, global_step=1556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  84%|████████▍ | 67/80 [06:59<01:20,  6.17s/it, loss=0.00728, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=2.73e-5, train/loss_step=0.00732, global_step=1556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  84%|████████▍ | 67/80 [06:59<01:20,  6.17s/it, loss=0.00767, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=4.11e-5, train/loss_step=0.00826, global_step=1556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  85%|████████▌ | 68/80 [07:00<01:13,  6.09s/it, loss=0.00767, v_num=0, train/loss_simple_step=0.00826, train/loss_vlb_step=4.11e-5, train/loss_step=0.00826, global_step=1556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  85%|████████▌ | 68/80 [07:00<01:13,  6.09s/it, loss=0.00699, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=6.75e-7, train/loss_step=0.00018, global_step=1556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  86%|████████▋ | 69/80 [07:00<01:06,  6.01s/it, loss=0.00699, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=6.75e-7, train/loss_step=0.00018, global_step=1556.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  86%|████████▋ | 69/80 [07:00<01:06,  6.01s/it, loss=0.0071, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=5.75e-5, train/loss_step=0.003, global_step=1557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]     Epoch 77:  88%|████████▊ | 70/80 [07:01<00:59,  5.93s/it, loss=0.0071, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=5.75e-5, train/loss_step=0.003, global_step=1557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  88%|████████▊ | 70/80 [07:01<00:59,  5.93s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.11e-5, train/loss_step=0.00324, global_step=1557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  89%|████████▉ | 71/80 [07:01<00:52,  5.86s/it, loss=0.00599, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.11e-5, train/loss_step=0.00324, global_step=1557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  89%|████████▉ | 71/80 [07:01<00:52,  5.86s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=2.85e-6, train/loss_step=0.000259, global_step=1557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  90%|█████████ | 72/80 [07:18<00:48,  6.00s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=2.85e-6, train/loss_step=0.000259, global_step=1557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  90%|█████████ | 72/80 [07:18<00:48,  6.00s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.000836, train/loss_vlb_step=4.5e-6, train/loss_step=0.000836, global_step=1557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403] Epoch 77:  91%|█████████▏| 73/80 [07:25<00:42,  6.01s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.000836, train/loss_vlb_step=4.5e-6, train/loss_step=0.000836, global_step=1557.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  91%|█████████▏| 73/80 [07:25<00:42,  6.01s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=1.02e-6, train/loss_step=0.000231, global_step=1558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  92%|█████████▎| 74/80 [07:25<00:35,  5.94s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=1.02e-6, train/loss_step=0.000231, global_step=1558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  92%|█████████▎| 74/80 [07:25<00:35,  5.94s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.94e-5, train/loss_step=0.00471, global_step=1558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]  Epoch 77:  94%|█████████▍| 75/80 [07:25<00:29,  5.87s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=2.94e-5, train/loss_step=0.00471, global_step=1558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  94%|█████████▍| 75/80 [07:25<00:29,  5.87s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.3e-6, train/loss_step=0.000286, global_step=1558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  95%|█████████▌| 76/80 [07:26<00:23,  5.80s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.3e-6, train/loss_step=0.000286, global_step=1558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  95%|█████████▌| 76/80 [07:26<00:23,  5.80s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.0147, train/loss_step=0.0299, global_step=1558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]    Epoch 77:  96%|█████████▋| 77/80 [07:26<00:17,  5.73s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.0299, train/loss_vlb_step=0.0147, train/loss_step=0.0299, global_step=1558.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  96%|█████████▋| 77/80 [07:26<00:17,  5.73s/it, loss=0.00617, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=1.21e-5, train/loss_step=0.00121, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  98%|█████████▊| 78/80 [07:27<00:11,  5.66s/it, loss=0.00617, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=1.21e-5, train/loss_step=0.00121, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  98%|█████████▊| 78/80 [07:27<00:11,  5.66s/it, loss=0.00655, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=3.15e-5, train/loss_step=0.00842, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  99%|█████████▉| 79/80 [07:27<00:05,  5.60s/it, loss=0.00655, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=3.15e-5, train/loss_step=0.00842, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77:  99%|█████████▉| 79/80 [07:27<00:05,  5.60s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=6.59e-5, train/loss_step=0.00857, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77: 100%|██████████| 80/80 [07:28<00:00,  5.54s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=6.59e-5, train/loss_step=0.00857, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 77: 100%|██████████| 80/80 [07:28<00:00,  5.54s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.45e-6, train/loss_step=0.000317, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Average Epoch time: 448.46 seconds
+Average Peak memory 29565.06MiB
+Epoch 77:   0%|          | 0/80 [00:00<00:00, 5077.85it/s, loss=0.00584, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.45e-6, train/loss_step=0.000317, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 78:   0%|          | 0/80 [00:00<00:00, 2136.68it/s, loss=0.00584, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.45e-6, train/loss_step=0.000317, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]Epoch 78:   1%|▏         | 1/80 [00:36<23:49, 18.09s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.45e-6, train/loss_step=0.000317, global_step=1559.0, lr_abs=0.0001, train/loss_simple_epoch=0.00403, train/loss_vlb_epoch=0.000156, train/loss_epoch=0.00403]  Epoch 78:   1%|▏         | 1/80 [00:36<23:49, 18.10s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=1.75e-5, train/loss_step=0.00492, global_step=1560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:   2%|▎         | 2/80 [00:45<19:46, 15.21s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=1.75e-5, train/loss_step=0.00492, global_step=1560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   2%|▎         | 2/80 [00:45<19:46, 15.21s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.05e-5, train/loss_step=0.00547, global_step=1560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   4%|▍         | 3/80 [00:47<15:22, 11.98s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.05e-5, train/loss_step=0.00547, global_step=1560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   4%|▍         | 3/80 [00:47<15:22, 11.98s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.04e-5, train/loss_step=0.00556, global_step=1560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   5%|▌         | 4/80 [00:48<12:16,  9.69s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=2.04e-5, train/loss_step=0.00556, global_step=1560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   5%|▌         | 4/80 [00:48<12:16,  9.69s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.69e-6, train/loss_step=0.000285, global_step=1560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   6%|▋         | 5/80 [00:48<10:12,  8.16s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.69e-6, train/loss_step=0.000285, global_step=1560.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   6%|▋         | 5/80 [00:48<10:12,  8.16s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=9.14e-5, train/loss_step=0.0132, global_step=1561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]    Epoch 78:   8%|▊         | 6/80 [00:49<08:42,  7.07s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=9.14e-5, train/loss_step=0.0132, global_step=1561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   8%|▊         | 6/80 [00:49<08:42,  7.07s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.21e-5, train/loss_step=0.00305, global_step=1561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   9%|▉         | 7/80 [00:49<07:36,  6.25s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.21e-5, train/loss_step=0.00305, global_step=1561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:   9%|▉         | 7/80 [00:49<07:36,  6.25s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.5e-5, train/loss_step=0.00451, global_step=1561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  10%|█         | 8/80 [01:21<10:48,  9.00s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.5e-5, train/loss_step=0.00451, global_step=1561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  10%|█         | 8/80 [01:21<10:48,  9.00s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=1.74e-6, train/loss_step=0.000454, global_step=1561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  11%|█▏        | 9/80 [01:21<09:38,  8.15s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.000454, train/loss_vlb_step=1.74e-6, train/loss_step=0.000454, global_step=1561.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  11%|█▏        | 9/80 [01:21<09:38,  8.15s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.92e-5, train/loss_step=0.0148, global_step=1562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]    Epoch 78:  12%|█▎        | 10/80 [01:22<08:41,  7.45s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.92e-5, train/loss_step=0.0148, global_step=1562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  12%|█▎        | 10/80 [01:22<08:41,  7.45s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000709, train/loss_vlb_step=2.15e-5, train/loss_step=0.000709, global_step=1562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  14%|█▍        | 11/80 [01:29<08:33,  7.44s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000709, train/loss_vlb_step=2.15e-5, train/loss_step=0.000709, global_step=1562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  14%|█▍        | 11/80 [01:29<08:33,  7.44s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.000146, train/loss_vlb_step=6.39e-7, train/loss_step=0.000146, global_step=1562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  15%|█▌        | 12/80 [01:37<08:27,  7.47s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.000146, train/loss_vlb_step=6.39e-7, train/loss_step=0.000146, global_step=1562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  15%|█▌        | 12/80 [01:37<08:27,  7.47s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=0.0005, train/loss_step=0.00113, global_step=1562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]    Epoch 78:  16%|█▋        | 13/80 [01:37<07:47,  6.97s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=0.0005, train/loss_step=0.00113, global_step=1562.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  16%|█▋        | 13/80 [01:37<07:47,  6.97s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=3.07e-5, train/loss_step=0.00768, global_step=1563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  18%|█▊        | 14/80 [01:38<07:11,  6.54s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=3.07e-5, train/loss_step=0.00768, global_step=1563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  18%|█▊        | 14/80 [01:38<07:11,  6.54s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000463, train/loss_vlb_step=2.72e-6, train/loss_step=0.000463, global_step=1563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  19%|█▉        | 15/80 [01:38<06:40,  6.16s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000463, train/loss_vlb_step=2.72e-6, train/loss_step=0.000463, global_step=1563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  19%|█▉        | 15/80 [01:38<06:40,  6.16s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.54e-6, train/loss_step=0.000291, global_step=1563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  20%|██        | 16/80 [02:07<07:58,  7.47s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.54e-6, train/loss_step=0.000291, global_step=1563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  20%|██        | 16/80 [02:07<07:58,  7.47s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.00665, train/loss_step=0.0276, global_step=1563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]    Epoch 78:  21%|██▏       | 17/80 [02:07<07:26,  7.09s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.00665, train/loss_step=0.0276, global_step=1563.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  21%|██▏       | 17/80 [02:07<07:26,  7.09s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000617, train/loss_vlb_step=2.91e-6, train/loss_step=0.000617, global_step=1564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  22%|██▎       | 18/80 [02:08<06:57,  6.74s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000617, train/loss_vlb_step=2.91e-6, train/loss_step=0.000617, global_step=1564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  22%|██▎       | 18/80 [02:08<06:57,  6.74s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000595, train/loss_vlb_step=3.01e-6, train/loss_step=0.000595, global_step=1564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  24%|██▍       | 19/80 [02:18<07:01,  6.91s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000595, train/loss_vlb_step=3.01e-6, train/loss_step=0.000595, global_step=1564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  24%|██▍       | 19/80 [02:18<07:01,  6.91s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000309, train/loss_vlb_step=1.61e-6, train/loss_step=0.000309, global_step=1564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  25%|██▌       | 20/80 [02:21<06:43,  6.73s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000309, train/loss_vlb_step=1.61e-6, train/loss_step=0.000309, global_step=1564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  25%|██▌       | 20/80 [02:21<06:43,  6.73s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=3.41e-5, train/loss_step=0.00901, global_step=1564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  26%|██▋       | 21/80 [02:21<06:20,  6.45s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00901, train/loss_vlb_step=3.41e-5, train/loss_step=0.00901, global_step=1564.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  26%|██▋       | 21/80 [02:21<06:20,  6.45s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=2.4e-5, train/loss_step=0.00602, global_step=1565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  28%|██▊       | 22/80 [02:22<05:59,  6.19s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00602, train/loss_vlb_step=2.4e-5, train/loss_step=0.00602, global_step=1565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  28%|██▊       | 22/80 [02:22<05:59,  6.19s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.62e-6, train/loss_step=0.0016, global_step=1565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  29%|██▉       | 23/80 [02:22<05:39,  5.95s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.62e-6, train/loss_step=0.0016, global_step=1565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  29%|██▉       | 23/80 [02:22<05:39,  5.95s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000738, train/loss_vlb_step=1.3e-5, train/loss_step=0.000738, global_step=1565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  30%|███       | 24/80 [02:44<06:09,  6.59s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000738, train/loss_vlb_step=1.3e-5, train/loss_step=0.000738, global_step=1565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  30%|███       | 24/80 [02:44<06:09,  6.59s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=8.1e-5, train/loss_step=0.0083, global_step=1565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]    Epoch 78:  31%|███▏      | 25/80 [02:45<05:49,  6.36s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.0083, train/loss_vlb_step=8.1e-5, train/loss_step=0.0083, global_step=1565.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  31%|███▏      | 25/80 [02:45<05:49,  6.36s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=7.07e-6, train/loss_step=0.00126, global_step=1566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  32%|███▎      | 26/80 [02:45<05:31,  6.14s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=7.07e-6, train/loss_step=0.00126, global_step=1566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  32%|███▎      | 26/80 [02:45<05:31,  6.14s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=1.42e-6, train/loss_step=0.000366, global_step=1566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  34%|███▍      | 27/80 [02:59<05:39,  6.41s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=1.42e-6, train/loss_step=0.000366, global_step=1566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  34%|███▍      | 27/80 [02:59<05:39,  6.41s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.96e-6, train/loss_step=0.00038, global_step=1566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  35%|███▌      | 28/80 [03:18<05:56,  6.86s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.96e-6, train/loss_step=0.00038, global_step=1566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  35%|███▌      | 28/80 [03:18<05:56,  6.86s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=1.74e-5, train/loss_step=0.00485, global_step=1566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  36%|███▋      | 29/80 [03:19<05:39,  6.65s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=1.74e-5, train/loss_step=0.00485, global_step=1566.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  36%|███▋      | 29/80 [03:19<05:39,  6.65s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.15e-5, train/loss_step=0.00799, global_step=1567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  38%|███▊      | 30/80 [03:19<05:22,  6.45s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00799, train/loss_vlb_step=3.15e-5, train/loss_step=0.00799, global_step=1567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  38%|███▊      | 30/80 [03:19<05:22,  6.45s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00027, train/loss_vlb_step=1.21e-6, train/loss_step=0.00027, global_step=1567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  39%|███▉      | 31/80 [03:20<05:06,  6.27s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00027, train/loss_vlb_step=1.21e-6, train/loss_step=0.00027, global_step=1567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  39%|███▉      | 31/80 [03:20<05:07,  6.27s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=5.19e-5, train/loss_step=0.00882, global_step=1567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  40%|████      | 32/80 [03:23<04:56,  6.17s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=5.19e-5, train/loss_step=0.00882, global_step=1567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  40%|████      | 32/80 [03:23<04:56,  6.17s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.37e-6, train/loss_step=0.00256, global_step=1567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  41%|████▏     | 33/80 [03:24<04:42,  6.00s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.37e-6, train/loss_step=0.00256, global_step=1567.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  41%|████▏     | 33/80 [03:24<04:42,  6.00s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000829, train/loss_vlb_step=4.27e-6, train/loss_step=0.000829, global_step=1568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  42%|████▎     | 34/80 [03:24<04:28,  5.85s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.000829, train/loss_vlb_step=4.27e-6, train/loss_step=0.000829, global_step=1568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  42%|████▎     | 34/80 [03:24<04:28,  5.85s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=9.31e-5, train/loss_step=0.0134, global_step=1568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]    Epoch 78:  44%|████▍     | 35/80 [03:36<04:30,  6.00s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=9.31e-5, train/loss_step=0.0134, global_step=1568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  44%|████▍     | 35/80 [03:36<04:30,  6.00s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=4.74e-6, train/loss_step=0.000521, global_step=1568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  45%|████▌     | 36/80 [04:00<04:46,  6.51s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.000521, train/loss_vlb_step=4.74e-6, train/loss_step=0.000521, global_step=1568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  45%|████▌     | 36/80 [04:00<04:46,  6.51s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.45e-5, train/loss_step=0.00738, global_step=1568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397] Epoch 78:  46%|████▋     | 37/80 [04:01<04:33,  6.35s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00738, train/loss_vlb_step=3.45e-5, train/loss_step=0.00738, global_step=1568.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  46%|████▋     | 37/80 [04:01<04:33,  6.35s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=1.84e-5, train/loss_step=0.0049, global_step=1569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  48%|████▊     | 38/80 [04:01<04:20,  6.20s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=1.84e-5, train/loss_step=0.0049, global_step=1569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  48%|████▊     | 38/80 [04:01<04:20,  6.20s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=6.2e-6, train/loss_step=0.00107, global_step=1569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  49%|████▉     | 39/80 [04:02<04:08,  6.06s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=6.2e-6, train/loss_step=0.00107, global_step=1569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  49%|████▉     | 39/80 [04:02<04:08,  6.06s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000769, train/loss_vlb_step=4.76e-5, train/loss_step=0.000769, global_step=1569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  50%|█████     | 40/80 [04:04<03:58,  5.97s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000769, train/loss_vlb_step=4.76e-5, train/loss_step=0.000769, global_step=1569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  50%|█████     | 40/80 [04:04<03:58,  5.97s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=3.18e-6, train/loss_step=0.000557, global_step=1569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  51%|█████▏    | 41/80 [04:05<03:47,  5.84s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=3.18e-6, train/loss_step=0.000557, global_step=1569.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  51%|█████▏    | 41/80 [04:05<03:47,  5.84s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=5e-6, train/loss_step=0.00113, global_step=1570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]     Epoch 78:  52%|█████▎    | 42/80 [04:05<03:37,  5.72s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=5e-6, train/loss_step=0.00113, global_step=1570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  52%|█████▎    | 42/80 [04:05<03:37,  5.72s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=3.28e-5, train/loss_step=0.0089, global_step=1570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  54%|█████▍    | 43/80 [04:15<03:34,  5.80s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=3.28e-5, train/loss_step=0.0089, global_step=1570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  54%|█████▍    | 43/80 [04:15<03:34,  5.80s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00037, train/loss_vlb_step=2.84e-6, train/loss_step=0.00037, global_step=1570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00037, train/loss_vlb_step=2.84e-6, train/loss_step=0.00037, global_step=1570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.53e-6, train/loss_step=0.00119, global_step=1570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  56%|█████▋    | 45/80 [04:39<03:32,  6.08s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=5.53e-6, train/loss_step=0.00119, global_step=1570.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  56%|█████▋    | 45/80 [04:39<03:32,  6.08s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000858, train/loss_vlb_step=3.74e-6, train/loss_step=0.000858, global_step=1571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  57%|█████▊    | 46/80 [04:40<03:22,  5.96s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000858, train/loss_vlb_step=3.74e-6, train/loss_step=0.000858, global_step=1571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  57%|█████▊    | 46/80 [04:40<03:22,  5.96s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=1.64e-5, train/loss_step=0.00397, global_step=1571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  59%|█████▉    | 47/80 [04:40<03:13,  5.85s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=1.64e-5, train/loss_step=0.00397, global_step=1571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  59%|█████▉    | 47/80 [04:40<03:13,  5.85s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=8.39e-6, train/loss_step=0.00238, global_step=1571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  60%|██████    | 48/80 [04:55<03:13,  6.04s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=8.39e-6, train/loss_step=0.00238, global_step=1571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  60%|██████    | 48/80 [04:55<03:13,  6.04s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.75e-5, train/loss_step=0.011, global_step=1571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]    Epoch 78:  61%|██████▏   | 49/80 [04:56<03:03,  5.93s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=5.75e-5, train/loss_step=0.011, global_step=1571.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  61%|██████▏   | 49/80 [04:56<03:03,  5.93s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=0.00169, train/loss_step=0.0186, global_step=1572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  62%|██████▎   | 50/80 [04:56<02:54,  5.82s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=0.00169, train/loss_step=0.0186, global_step=1572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  62%|██████▎   | 50/80 [04:56<02:54,  5.82s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.28e-6, train/loss_step=0.000252, global_step=1572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  64%|██████▍   | 51/80 [05:03<02:49,  5.83s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.28e-6, train/loss_step=0.000252, global_step=1572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  64%|██████▍   | 51/80 [05:03<02:49,  5.83s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000145, train/loss_step=0.0105, global_step=1572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]   Epoch 78:  65%|██████▌   | 52/80 [05:16<02:47,  5.97s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000145, train/loss_step=0.0105, global_step=1572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  65%|██████▌   | 52/80 [05:16<02:47,  5.97s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=1.45e-5, train/loss_step=0.00392, global_step=1572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  66%|██████▋   | 53/80 [05:16<02:38,  5.87s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=1.45e-5, train/loss_step=0.00392, global_step=1572.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  66%|██████▋   | 53/80 [05:16<02:38,  5.87s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=1.16e-6, train/loss_step=0.000301, global_step=1573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  68%|██████▊   | 54/80 [05:17<02:30,  5.77s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=1.16e-6, train/loss_step=0.000301, global_step=1573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  68%|██████▊   | 54/80 [05:17<02:30,  5.77s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.000107, train/loss_vlb_step=3.88e-7, train/loss_step=0.000107, global_step=1573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  69%|██████▉   | 55/80 [05:17<02:21,  5.68s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.000107, train/loss_vlb_step=3.88e-7, train/loss_step=0.000107, global_step=1573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  69%|██████▉   | 55/80 [05:17<02:21,  5.68s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=1.32e-5, train/loss_step=0.00382, global_step=1573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  70%|███████   | 56/80 [05:44<02:24,  6.04s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=1.32e-5, train/loss_step=0.00382, global_step=1573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  70%|███████   | 56/80 [05:44<02:24,  6.04s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=2.7e-5, train/loss_step=0.00308, global_step=1573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397] Epoch 78:  71%|███████▏  | 57/80 [05:44<02:16,  5.94s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=2.7e-5, train/loss_step=0.00308, global_step=1573.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  71%|███████▏  | 57/80 [05:44<02:16,  5.94s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=3e-5, train/loss_step=0.00888, global_step=1574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  72%|███████▎  | 58/80 [05:45<02:08,  5.85s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=3e-5, train/loss_step=0.00888, global_step=1574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  72%|███████▎  | 58/80 [05:45<02:08,  5.85s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000132, train/loss_vlb_step=5.67e-7, train/loss_step=0.000132, global_step=1574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  74%|███████▍  | 59/80 [05:49<02:02,  5.82s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000132, train/loss_vlb_step=5.67e-7, train/loss_step=0.000132, global_step=1574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  74%|███████▍  | 59/80 [05:49<02:02,  5.82s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=8.39e-6, train/loss_step=0.00252, global_step=1574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  75%|███████▌  | 60/80 [05:52<01:55,  5.79s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=8.39e-6, train/loss_step=0.00252, global_step=1574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  75%|███████▌  | 60/80 [05:52<01:55,  5.79s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=2.23e-5, train/loss_step=0.00625, global_step=1574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397] Epoch 78:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=2.23e-5, train/loss_step=0.00625, global_step=1574.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.27e-6, train/loss_step=0.000339, global_step=1575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  78%|███████▊  | 62/80 [05:53<01:41,  5.62s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=1.27e-6, train/loss_step=0.000339, global_step=1575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  78%|███████▊  | 62/80 [05:53<01:41,  5.62s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=4.41e-6, train/loss_step=0.000436, global_step=1575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  79%|███████▉  | 63/80 [05:54<01:34,  5.54s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=4.41e-6, train/loss_step=0.000436, global_step=1575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  79%|███████▉  | 63/80 [05:54<01:34,  5.54s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.46e-5, train/loss_step=0.00734, global_step=1575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  80%|████████  | 64/80 [06:21<01:33,  5.86s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00734, train/loss_vlb_step=3.46e-5, train/loss_step=0.00734, global_step=1575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  80%|████████  | 64/80 [06:21<01:33,  5.86s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000445, train/loss_vlb_step=3e-6, train/loss_step=0.000445, global_step=1575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397] Epoch 78:  81%|████████▏ | 65/80 [06:21<01:26,  5.78s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000445, train/loss_vlb_step=3e-6, train/loss_step=0.000445, global_step=1575.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  81%|████████▏ | 65/80 [06:21<01:26,  5.78s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=3.2e-5, train/loss_step=0.0081, global_step=1576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  82%|████████▎ | 66/80 [06:22<01:19,  5.70s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.0081, train/loss_vlb_step=3.2e-5, train/loss_step=0.0081, global_step=1576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  82%|████████▎ | 66/80 [06:22<01:19,  5.70s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=6.48e-7, train/loss_step=0.00018, global_step=1576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  84%|████████▍ | 67/80 [06:31<01:14,  5.75s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=6.48e-7, train/loss_step=0.00018, global_step=1576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  84%|████████▍ | 67/80 [06:31<01:14,  5.75s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=1.31e-5, train/loss_step=0.00386, global_step=1576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397] Epoch 78:  85%|████████▌ | 68/80 [06:31<01:08,  5.68s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=1.31e-5, train/loss_step=0.00386, global_step=1576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  85%|████████▌ | 68/80 [06:31<01:08,  5.68s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.25e-6, train/loss_step=0.00128, global_step=1576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  86%|████████▋ | 69/80 [06:32<01:01,  5.60s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.25e-6, train/loss_step=0.00128, global_step=1576.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  86%|████████▋ | 69/80 [06:32<01:01,  5.60s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=3.68e-6, train/loss_step=0.000377, global_step=1577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=3.68e-6, train/loss_step=0.000377, global_step=1577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  88%|████████▊ | 70/80 [06:34<00:55,  5.55s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.09e-6, train/loss_step=0.00114, global_step=1577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397] Epoch 78:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.09e-6, train/loss_step=0.00114, global_step=1577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  89%|████████▉ | 71/80 [06:34<00:49,  5.48s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=1.54e-5, train/loss_step=0.00158, global_step=1577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397] Epoch 78:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=1.54e-5, train/loss_step=0.00158, global_step=1577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=2.14e-6, train/loss_step=0.00044, global_step=1577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  91%|█████████▏| 73/80 [06:48<00:38,  5.53s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=2.14e-6, train/loss_step=0.00044, global_step=1577.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  91%|█████████▏| 73/80 [06:48<00:38,  5.53s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.54e-6, train/loss_step=0.000284, global_step=1578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.54e-6, train/loss_step=0.000284, global_step=1578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00253, v_num=0, train/loss_simple_step=8.57e-5, train/loss_vlb_step=3.9e-7, train/loss_step=8.57e-5, global_step=1578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]   Epoch 78:  94%|█████████▍| 75/80 [07:10<00:28,  5.66s/it, loss=0.00253, v_num=0, train/loss_simple_step=8.57e-5, train/loss_vlb_step=3.9e-7, train/loss_step=8.57e-5, global_step=1578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  94%|█████████▍| 75/80 [07:10<00:28,  5.66s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.000693, train/loss_vlb_step=2.69e-6, train/loss_step=0.000693, global_step=1578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  95%|█████████▌| 76/80 [07:10<00:22,  5.59s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.000693, train/loss_vlb_step=2.69e-6, train/loss_step=0.000693, global_step=1578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  95%|█████████▌| 76/80 [07:10<00:22,  5.59s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=2.52e-6, train/loss_step=0.00036, global_step=1578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 78:  96%|█████████▋| 77/80 [07:11<00:16,  5.53s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=2.52e-6, train/loss_step=0.00036, global_step=1578.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  96%|█████████▋| 77/80 [07:11<00:16,  5.53s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.92e-6, train/loss_step=0.00107, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.92e-6, train/loss_step=0.00107, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.00188, v_num=0, train/loss_simple_step=0.00092, train/loss_vlb_step=4.15e-6, train/loss_step=0.00092, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  99%|█████████▉| 79/80 [07:12<00:05,  5.40s/it, loss=0.00188, v_num=0, train/loss_simple_step=0.00092, train/loss_vlb_step=4.15e-6, train/loss_step=0.00092, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78:  99%|█████████▉| 79/80 [07:12<00:05,  5.40s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.000914, train/loss_vlb_step=6.93e-6, train/loss_step=0.000914, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.000914, train/loss_vlb_step=6.93e-6, train/loss_step=0.000914, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 78: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.0015, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=7.05e-7, train/loss_step=0.000187, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Average Epoch time: 432.70 seconds
+Average Peak memory 29563.71MiB
+Epoch 78:   0%|          | 0/80 [00:00<00:00, 4733.98it/s, loss=0.0015, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=7.05e-7, train/loss_step=0.000187, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 79:   0%|          | 0/80 [00:00<00:00, 1861.65it/s, loss=0.0015, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=7.05e-7, train/loss_step=0.000187, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]Epoch 79:   1%|▏         | 1/80 [00:42<28:01, 21.28s/it, loss=0.0015, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=7.05e-7, train/loss_step=0.000187, global_step=1579.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000143, train/loss_epoch=0.00397]  Epoch 79:   1%|▏         | 1/80 [00:42<28:01, 21.28s/it, loss=0.00164, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.16e-5, train/loss_step=0.00305, global_step=1580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:   2%|▎         | 2/80 [00:43<18:39, 14.35s/it, loss=0.00164, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.16e-5, train/loss_step=0.00305, global_step=1580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:   2%|▎         | 2/80 [00:43<18:39, 14.35s/it, loss=0.00164, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=2.48e-6, train/loss_step=0.000448, global_step=1580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:   4%|▍         | 3/80 [00:43<13:58, 10.88s/it, loss=0.00164, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=2.48e-6, train/loss_step=0.000448, global_step=1580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:   4%|▍         | 3/80 [00:43<13:58, 10.88s/it, loss=0.00132, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.21e-6, train/loss_step=0.00101, global_step=1580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:   5%|▌         | 4/80 [00:44<11:09,  8.81s/it, loss=0.00132, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.21e-6, train/loss_step=0.00101, global_step=1580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:   5%|▌         | 4/80 [00:44<11:09,  8.81s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=1.49e-5, train/loss_step=0.00436, global_step=1580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:   6%|▋         | 5/80 [00:44<09:17,  7.43s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=1.49e-5, train/loss_step=0.00436, global_step=1580.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:   6%|▋         | 5/80 [00:44<09:17,  7.43s/it, loss=0.00163, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.94e-5, train/loss_step=0.0104, global_step=1581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:   8%|▊         | 6/80 [00:45<07:56,  6.44s/it, loss=0.00163, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.94e-5, train/loss_step=0.0104, global_step=1581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:   8%|▊         | 6/80 [00:45<07:56,  6.44s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.5e-5, train/loss_step=0.00994, global_step=1581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:   9%|▉         | 7/80 [00:45<06:55,  5.69s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.00994, train/loss_vlb_step=4.5e-5, train/loss_step=0.00994, global_step=1581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:   9%|▉         | 7/80 [00:45<06:55,  5.69s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.000706, train/loss_vlb_step=3.67e-6, train/loss_step=0.000706, global_step=1581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  10%|█         | 8/80 [01:27<11:41,  9.74s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.000706, train/loss_vlb_step=3.67e-6, train/loss_step=0.000706, global_step=1581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  10%|█         | 8/80 [01:27<11:41,  9.74s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.29e-6, train/loss_step=0.000273, global_step=1581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  11%|█▏        | 9/80 [01:28<10:26,  8.82s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.29e-6, train/loss_step=0.000273, global_step=1581.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  11%|█▏        | 9/80 [01:28<10:26,  8.82s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=9.96e-7, train/loss_step=0.000181, global_step=1582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375] Epoch 79:  12%|█▎        | 10/80 [01:28<09:24,  8.06s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=9.96e-7, train/loss_step=0.000181, global_step=1582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  12%|█▎        | 10/80 [01:28<09:24,  8.06s/it, loss=0.00186, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=2.26e-6, train/loss_step=0.00031, global_step=1582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375] Epoch 79:  14%|█▍        | 11/80 [01:29<08:32,  7.43s/it, loss=0.00186, v_num=0, train/loss_simple_step=0.00031, train/loss_vlb_step=2.26e-6, train/loss_step=0.00031, global_step=1582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  14%|█▍        | 11/80 [01:29<08:32,  7.43s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=6.19e-5, train/loss_step=0.000726, global_step=1582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  15%|█▌        | 12/80 [01:29<07:49,  6.90s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=6.19e-5, train/loss_step=0.000726, global_step=1582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  15%|█▌        | 12/80 [01:29<07:49,  6.90s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.21e-6, train/loss_step=0.000326, global_step=1582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  16%|█▋        | 13/80 [01:30<07:11,  6.45s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.21e-6, train/loss_step=0.000326, global_step=1582.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  16%|█▋        | 13/80 [01:30<07:11,  6.45s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=1.01e-5, train/loss_step=0.000531, global_step=1583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  18%|█▊        | 14/80 [01:30<06:39,  6.05s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=1.01e-5, train/loss_step=0.000531, global_step=1583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  18%|█▊        | 14/80 [01:30<06:39,  6.05s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=8.38e-6, train/loss_step=0.00223, global_step=1583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  19%|█▉        | 15/80 [01:31<06:10,  5.70s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=8.38e-6, train/loss_step=0.00223, global_step=1583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  19%|█▉        | 15/80 [01:31<06:10,  5.70s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=0.00048, train/loss_step=0.0233, global_step=1583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  20%|██        | 16/80 [02:12<08:20,  7.82s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=0.00048, train/loss_step=0.0233, global_step=1583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  20%|██        | 16/80 [02:12<08:20,  7.82s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000427, train/loss_vlb_step=2.67e-6, train/loss_step=0.000427, global_step=1583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  21%|██▏       | 17/80 [02:16<07:59,  7.61s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000427, train/loss_vlb_step=2.67e-6, train/loss_step=0.000427, global_step=1583.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  21%|██▏       | 17/80 [02:16<07:59,  7.61s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=3.73e-5, train/loss_step=0.010, global_step=1584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]      Epoch 79:  22%|██▎       | 18/80 [02:17<07:28,  7.24s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=3.73e-5, train/loss_step=0.010, global_step=1584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  22%|██▎       | 18/80 [02:17<07:28,  7.24s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000408, train/loss_vlb_step=1e-5, train/loss_step=0.000408, global_step=1584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  24%|██▍       | 19/80 [02:17<07:00,  6.90s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000408, train/loss_vlb_step=1e-5, train/loss_step=0.000408, global_step=1584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  24%|██▍       | 19/80 [02:17<07:00,  6.90s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.17e-5, train/loss_step=0.00265, global_step=1584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  25%|██▌       | 20/80 [02:18<06:35,  6.59s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00265, train/loss_vlb_step=1.17e-5, train/loss_step=0.00265, global_step=1584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  25%|██▌       | 20/80 [02:18<06:35,  6.60s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.71e-6, train/loss_step=0.000377, global_step=1584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  26%|██▋       | 21/80 [02:19<06:12,  6.32s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=1.71e-6, train/loss_step=0.000377, global_step=1584.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  26%|██▋       | 21/80 [02:19<06:12,  6.32s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=4.24e-5, train/loss_step=0.00342, global_step=1585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]   Epoch 79:  28%|██▊       | 22/80 [02:19<05:51,  6.06s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=4.24e-5, train/loss_step=0.00342, global_step=1585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  28%|██▊       | 22/80 [02:19<05:51,  6.06s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=2.93e-6, train/loss_step=0.000518, global_step=1585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  29%|██▉       | 23/80 [02:19<05:32,  5.83s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=2.93e-6, train/loss_step=0.000518, global_step=1585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  29%|██▉       | 23/80 [02:19<05:32,  5.83s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=5.6e-6, train/loss_step=0.00043, global_step=1585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  30%|███       | 24/80 [02:46<06:12,  6.64s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=5.6e-6, train/loss_step=0.00043, global_step=1585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  30%|███       | 24/80 [02:46<06:12,  6.64s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000717, train/loss_vlb_step=3.83e-6, train/loss_step=0.000717, global_step=1585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  31%|███▏      | 25/80 [02:53<06:07,  6.68s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000717, train/loss_vlb_step=3.83e-6, train/loss_step=0.000717, global_step=1585.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  31%|███▏      | 25/80 [02:53<06:07,  6.68s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000404, train/loss_vlb_step=3.79e-6, train/loss_step=0.000404, global_step=1586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  32%|███▎      | 26/80 [02:54<05:48,  6.45s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000404, train/loss_vlb_step=3.79e-6, train/loss_step=0.000404, global_step=1586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  32%|███▎      | 26/80 [02:54<05:48,  6.45s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.31e-5, train/loss_step=0.00374, global_step=1586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  34%|███▍      | 27/80 [02:54<05:30,  6.24s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.31e-5, train/loss_step=0.00374, global_step=1586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  34%|███▍      | 27/80 [02:54<05:30,  6.24s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=0.000305, train/loss_step=0.0243, global_step=1586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375] Epoch 79:  35%|███▌      | 28/80 [02:55<05:14,  6.05s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.0243, train/loss_vlb_step=0.000305, train/loss_step=0.0243, global_step=1586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  35%|███▌      | 28/80 [02:55<05:14,  6.05s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=3.68e-6, train/loss_step=0.000278, global_step=1586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  36%|███▋      | 29/80 [02:55<04:58,  5.86s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=3.68e-6, train/loss_step=0.000278, global_step=1586.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  36%|███▋      | 29/80 [02:55<04:58,  5.86s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000184, train/loss_step=0.0139, global_step=1587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]   Epoch 79:  38%|███▊      | 30/80 [02:56<04:44,  5.69s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000184, train/loss_step=0.0139, global_step=1587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  38%|███▊      | 30/80 [02:56<04:44,  5.69s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000302, train/loss_vlb_step=1.3e-6, train/loss_step=0.000302, global_step=1587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  39%|███▉      | 31/80 [02:56<04:30,  5.53s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000302, train/loss_vlb_step=1.3e-6, train/loss_step=0.000302, global_step=1587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  39%|███▉      | 31/80 [02:56<04:30,  5.53s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.04e-7, train/loss_step=0.000139, global_step=1587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  40%|████      | 32/80 [03:33<05:09,  6.46s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.04e-7, train/loss_step=0.000139, global_step=1587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  40%|████      | 32/80 [03:33<05:09,  6.46s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.83e-5, train/loss_step=0.00997, global_step=1587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]   Epoch 79:  41%|████▏     | 33/80 [03:33<04:55,  6.29s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=4.83e-5, train/loss_step=0.00997, global_step=1587.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  41%|████▏     | 33/80 [03:33<04:55,  6.29s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=0.000121, train/loss_step=0.0216, global_step=1588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  42%|████▎     | 34/80 [03:34<04:41,  6.12s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.0216, train/loss_vlb_step=0.000121, train/loss_step=0.0216, global_step=1588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  42%|████▎     | 34/80 [03:34<04:41,  6.12s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=1.51e-5, train/loss_step=0.000701, global_step=1588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  44%|████▍     | 35/80 [03:34<04:28,  5.97s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=1.51e-5, train/loss_step=0.000701, global_step=1588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  44%|████▍     | 35/80 [03:34<04:28,  5.97s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000186, train/loss_step=0.0151, global_step=1588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]   Epoch 79:  45%|████▌     | 36/80 [03:35<04:16,  5.82s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=0.000186, train/loss_step=0.0151, global_step=1588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  45%|████▌     | 36/80 [03:35<04:16,  5.82s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=2.32e-6, train/loss_step=0.000544, global_step=1588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  46%|████▋     | 37/80 [03:35<04:04,  5.68s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=2.32e-6, train/loss_step=0.000544, global_step=1588.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  46%|████▋     | 37/80 [03:35<04:04,  5.68s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.000175, train/loss_step=0.0197, global_step=1589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]   Epoch 79:  48%|████▊     | 38/80 [03:36<03:53,  5.55s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.000175, train/loss_step=0.0197, global_step=1589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  48%|████▊     | 38/80 [03:36<03:53,  5.55s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=2.04e-6, train/loss_step=0.000377, global_step=1589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  49%|████▉     | 39/80 [03:36<03:42,  5.42s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=2.04e-6, train/loss_step=0.000377, global_step=1589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  49%|████▉     | 39/80 [03:36<03:42,  5.42s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.31e-6, train/loss_step=0.00056, global_step=1589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  50%|█████     | 40/80 [04:18<04:12,  6.32s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.31e-6, train/loss_step=0.00056, global_step=1589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  50%|█████     | 40/80 [04:18<04:12,  6.32s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=1.78e-6, train/loss_step=0.000313, global_step=1589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  51%|█████▏    | 41/80 [04:19<04:01,  6.18s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=1.78e-6, train/loss_step=0.000313, global_step=1589.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  51%|█████▏    | 41/80 [04:19<04:01,  6.18s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=0.00105, train/loss_step=0.0186, global_step=1590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]    Epoch 79:  52%|█████▎    | 42/80 [04:20<03:49,  6.05s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.0186, train/loss_vlb_step=0.00105, train/loss_step=0.0186, global_step=1590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  52%|█████▎    | 42/80 [04:20<03:49,  6.05s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=2.58e-6, train/loss_step=0.000505, global_step=1590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  54%|█████▍    | 43/80 [04:20<03:39,  5.92s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=2.58e-6, train/loss_step=0.000505, global_step=1590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  54%|█████▍    | 43/80 [04:20<03:39,  5.92s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.11e-5, train/loss_step=0.00274, global_step=1590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  55%|█████▌    | 44/80 [04:21<03:28,  5.80s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.11e-5, train/loss_step=0.00274, global_step=1590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  55%|█████▌    | 44/80 [04:21<03:28,  5.80s/it, loss=0.00701, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.49e-5, train/loss_step=0.00632, global_step=1590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  56%|█████▋    | 45/80 [04:21<03:19,  5.69s/it, loss=0.00701, v_num=0, train/loss_simple_step=0.00632, train/loss_vlb_step=2.49e-5, train/loss_step=0.00632, global_step=1590.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  56%|█████▋    | 45/80 [04:21<03:19,  5.69s/it, loss=0.00703, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=8.28e-5, train/loss_step=0.000887, global_step=1591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  57%|█████▊    | 46/80 [04:22<03:09,  5.58s/it, loss=0.00703, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=8.28e-5, train/loss_step=0.000887, global_step=1591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  57%|█████▊    | 46/80 [04:22<03:09,  5.58s/it, loss=0.00706, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.66e-5, train/loss_step=0.00431, global_step=1591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  59%|█████▉    | 47/80 [04:22<03:00,  5.47s/it, loss=0.00706, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=2.66e-5, train/loss_step=0.00431, global_step=1591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  59%|█████▉    | 47/80 [04:22<03:00,  5.47s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.68e-5, train/loss_step=0.00925, global_step=1591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  60%|██████    | 48/80 [04:51<03:10,  5.94s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.68e-5, train/loss_step=0.00925, global_step=1591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  60%|██████    | 48/80 [04:51<03:10,  5.94s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.05e-6, train/loss_step=0.000554, global_step=1591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  61%|██████▏   | 49/80 [04:51<03:00,  5.84s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.05e-6, train/loss_step=0.000554, global_step=1591.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  61%|██████▏   | 49/80 [04:51<03:00,  5.84s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=9.37e-6, train/loss_step=0.00212, global_step=1592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  62%|██████▎   | 50/80 [04:52<02:51,  5.73s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=9.37e-6, train/loss_step=0.00212, global_step=1592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  62%|██████▎   | 50/80 [04:52<02:51,  5.73s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=7.16e-5, train/loss_step=0.00726, global_step=1592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  64%|██████▍   | 51/80 [04:52<02:43,  5.63s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=7.16e-5, train/loss_step=0.00726, global_step=1592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  64%|██████▍   | 51/80 [04:52<02:43,  5.63s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=0.000819, train/loss_step=0.00824, global_step=1592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  65%|██████▌   | 52/80 [04:53<02:35,  5.54s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=0.000819, train/loss_step=0.00824, global_step=1592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  65%|██████▌   | 52/80 [04:53<02:35,  5.54s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.46e-6, train/loss_step=0.000303, global_step=1592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375] Epoch 79:  66%|██████▋   | 53/80 [04:54<02:27,  5.45s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.46e-6, train/loss_step=0.000303, global_step=1592.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  66%|██████▋   | 53/80 [04:54<02:27,  5.45s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=0.00031, train/loss_step=0.021, global_step=1593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]    Epoch 79:  68%|██████▊   | 54/80 [04:54<02:19,  5.36s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.021, train/loss_vlb_step=0.00031, train/loss_step=0.021, global_step=1593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  68%|██████▊   | 54/80 [04:54<02:19,  5.36s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=4.92e-6, train/loss_step=0.000471, global_step=1593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  69%|██████▉   | 55/80 [04:55<02:11,  5.27s/it, loss=0.00596, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=4.92e-6, train/loss_step=0.000471, global_step=1593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  69%|██████▉   | 55/80 [04:55<02:11,  5.27s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=9.24e-5, train/loss_step=0.000733, global_step=1593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  70%|███████   | 56/80 [05:30<02:19,  5.80s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=9.24e-5, train/loss_step=0.000733, global_step=1593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  70%|███████   | 56/80 [05:30<02:19,  5.80s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=0.000535, train/loss_step=0.00997, global_step=1593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375] Epoch 79:  71%|███████▏  | 57/80 [05:31<02:11,  5.71s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=0.000535, train/loss_step=0.00997, global_step=1593.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  71%|███████▏  | 57/80 [05:31<02:11,  5.71s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=2.63e-6, train/loss_step=0.000728, global_step=1594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  72%|███████▎  | 58/80 [05:31<02:03,  5.62s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.000728, train/loss_vlb_step=2.63e-6, train/loss_step=0.000728, global_step=1594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  72%|███████▎  | 58/80 [05:31<02:03,  5.62s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=5.86e-6, train/loss_step=0.000631, global_step=1594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  74%|███████▍  | 59/80 [05:32<01:56,  5.54s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=5.86e-6, train/loss_step=0.000631, global_step=1594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  74%|███████▍  | 59/80 [05:32<01:56,  5.54s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.04e-5, train/loss_step=0.00295, global_step=1594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]   Epoch 79:  75%|███████▌  | 60/80 [05:40<01:51,  5.58s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=1.04e-5, train/loss_step=0.00295, global_step=1594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  75%|███████▌  | 60/80 [05:40<01:51,  5.58s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=9.94e-6, train/loss_step=0.000413, global_step=1594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  76%|███████▋  | 61/80 [05:40<01:44,  5.50s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=9.94e-6, train/loss_step=0.000413, global_step=1594.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  76%|███████▋  | 61/80 [05:40<01:44,  5.50s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=5.61e-5, train/loss_step=0.00726, global_step=1595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375] Epoch 79:  78%|███████▊  | 62/80 [05:41<01:37,  5.42s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=5.61e-5, train/loss_step=0.00726, global_step=1595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  78%|███████▊  | 62/80 [05:41<01:37,  5.42s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=9.53e-6, train/loss_step=0.00274, global_step=1595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  79%|███████▉  | 63/80 [05:41<01:30,  5.34s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=9.53e-6, train/loss_step=0.00274, global_step=1595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  79%|███████▉  | 63/80 [05:41<01:30,  5.34s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000125, train/loss_step=0.011, global_step=1595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]   Epoch 79:  80%|████████  | 64/80 [06:10<01:31,  5.69s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000125, train/loss_step=0.011, global_step=1595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  80%|████████  | 64/80 [06:10<01:31,  5.69s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=2.33e-5, train/loss_step=0.00695, global_step=1595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  81%|████████▏ | 65/80 [06:11<01:24,  5.63s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00695, train/loss_vlb_step=2.33e-5, train/loss_step=0.00695, global_step=1595.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  81%|████████▏ | 65/80 [06:11<01:24,  5.63s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000607, train/loss_vlb_step=3.03e-6, train/loss_step=0.000607, global_step=1596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  82%|████████▎ | 66/80 [06:11<01:17,  5.55s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000607, train/loss_vlb_step=3.03e-6, train/loss_step=0.000607, global_step=1596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  82%|████████▎ | 66/80 [06:11<01:17,  5.55s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.01e-6, train/loss_step=0.000267, global_step=1596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  84%|████████▍ | 67/80 [06:12<01:11,  5.48s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.01e-6, train/loss_step=0.000267, global_step=1596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  84%|████████▍ | 67/80 [06:12<01:11,  5.48s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=2.7e-6, train/loss_step=0.000436, global_step=1596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375] Epoch 79:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000436, train/loss_vlb_step=2.7e-6, train/loss_step=0.000436, global_step=1596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.17e-5, train/loss_step=0.00347, global_step=1596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375] Epoch 79:  86%|████████▋ | 69/80 [06:29<01:01,  5.56s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.17e-5, train/loss_step=0.00347, global_step=1596.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  86%|████████▋ | 69/80 [06:29<01:01,  5.56s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000768, train/loss_vlb_step=3.21e-6, train/loss_step=0.000768, global_step=1597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  88%|████████▊ | 70/80 [06:29<00:54,  5.49s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000768, train/loss_vlb_step=3.21e-6, train/loss_step=0.000768, global_step=1597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  88%|████████▊ | 70/80 [06:29<00:54,  5.49s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=7.15e-7, train/loss_step=0.000164, global_step=1597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  89%|████████▉ | 71/80 [06:30<00:48,  5.42s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=7.15e-7, train/loss_step=0.000164, global_step=1597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  89%|████████▉ | 71/80 [06:30<00:48,  5.42s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=3.74e-5, train/loss_step=0.00542, global_step=1597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  90%|█████████ | 72/80 [06:47<00:44,  5.58s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00542, train/loss_vlb_step=3.74e-5, train/loss_step=0.00542, global_step=1597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  90%|█████████ | 72/80 [06:47<00:44,  5.58s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000925, train/loss_vlb_step=3.99e-5, train/loss_step=0.000925, global_step=1597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  91%|█████████▏| 73/80 [06:48<00:38,  5.52s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000925, train/loss_vlb_step=3.99e-5, train/loss_step=0.000925, global_step=1597.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  91%|█████████▏| 73/80 [06:48<00:38,  5.52s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=6.23e-6, train/loss_step=0.000395, global_step=1598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  92%|█████████▎| 74/80 [06:48<00:32,  5.45s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=6.23e-6, train/loss_step=0.000395, global_step=1598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  92%|█████████▎| 74/80 [06:48<00:32,  5.45s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.11e-5, train/loss_step=0.00581, global_step=1598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  94%|█████████▍| 75/80 [06:49<00:26,  5.38s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00581, train/loss_vlb_step=2.11e-5, train/loss_step=0.00581, global_step=1598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  94%|█████████▍| 75/80 [06:49<00:26,  5.38s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=6.57e-6, train/loss_step=0.00158, global_step=1598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=6.57e-6, train/loss_step=0.00158, global_step=1598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=1.57e-5, train/loss_step=0.00445, global_step=1598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  96%|█████████▋| 77/80 [07:10<00:16,  5.51s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00445, train/loss_vlb_step=1.57e-5, train/loss_step=0.00445, global_step=1598.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  96%|█████████▋| 77/80 [07:10<00:16,  5.51s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=3.39e-6, train/loss_step=0.000586, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=3.39e-6, train/loss_step=0.000586, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.28e-6, train/loss_step=0.00211, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 79:  99%|█████████▉| 79/80 [07:11<00:05,  5.39s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.28e-6, train/loss_step=0.00211, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79:  99%|█████████▉| 79/80 [07:11<00:05,  5.39s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=7.19e-6, train/loss_step=0.00212, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=7.19e-6, train/loss_step=0.00212, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 79: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.000163, train/loss_vlb_step=6.52e-7, train/loss_step=0.000163, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Average Epoch time: 431.62 seconds
+Average Peak memory 29569.12MiB
+Epoch 79:   0%|          | 0/80 [00:00<00:00, 3446.43it/s, loss=0.00286, v_num=0, train/loss_simple_step=0.000163, train/loss_vlb_step=6.52e-7, train/loss_step=0.000163, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 80:   0%|          | 0/80 [00:00<00:00, 1602.71it/s, loss=0.00286, v_num=0, train/loss_simple_step=0.000163, train/loss_vlb_step=6.52e-7, train/loss_step=0.000163, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]Epoch 80:   1%|▏         | 1/80 [00:44<29:21, 22.30s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.000163, train/loss_vlb_step=6.52e-7, train/loss_step=0.000163, global_step=1599.0, lr_abs=0.0001, train/loss_simple_epoch=0.00375, train/loss_vlb_epoch=7.95e-5, train/loss_epoch=0.00375]  Epoch 80:   1%|▏         | 1/80 [00:44<29:21, 22.30s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=3.3e-6, train/loss_step=0.000411, global_step=1600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   2%|▎         | 2/80 [00:45<19:32, 15.03s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=3.3e-6, train/loss_step=0.000411, global_step=1600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   2%|▎         | 2/80 [00:45<19:32, 15.03s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=5.95e-5, train/loss_step=0.0152, global_step=1600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]   Epoch 80:   4%|▍         | 3/80 [00:45<14:37, 11.39s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=5.95e-5, train/loss_step=0.0152, global_step=1600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   4%|▍         | 3/80 [00:45<14:37, 11.39s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=6.13e-5, train/loss_step=0.0111, global_step=1600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   5%|▌         | 4/80 [00:46<11:40,  9.22s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=6.13e-5, train/loss_step=0.0111, global_step=1600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   5%|▌         | 4/80 [00:46<11:40,  9.22s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.76e-5, train/loss_step=0.012, global_step=1600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]   Epoch 80:   6%|▋         | 5/80 [00:46<09:42,  7.77s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.76e-5, train/loss_step=0.012, global_step=1600.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   6%|▋         | 5/80 [00:46<09:42,  7.77s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=6.59e-6, train/loss_step=0.00106, global_step=1601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   8%|▊         | 6/80 [00:47<08:17,  6.73s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=6.59e-6, train/loss_step=0.00106, global_step=1601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   8%|▊         | 6/80 [00:47<08:17,  6.73s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=6.08e-7, train/loss_step=0.000154, global_step=1601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   9%|▉         | 7/80 [00:47<07:14,  5.95s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=6.08e-7, train/loss_step=0.000154, global_step=1601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:   9%|▉         | 7/80 [00:47<07:14,  5.95s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.24e-5, train/loss_step=0.00216, global_step=1601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]   Epoch 80:  10%|█         | 8/80 [01:26<11:32,  9.61s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=1.24e-5, train/loss_step=0.00216, global_step=1601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  10%|█         | 8/80 [01:26<11:32,  9.61s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.41e-6, train/loss_step=0.000393, global_step=1601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  11%|█▏        | 9/80 [01:32<10:54,  9.21s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000393, train/loss_vlb_step=1.41e-6, train/loss_step=0.000393, global_step=1601.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  11%|█▏        | 9/80 [01:32<10:54,  9.21s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=7.63e-6, train/loss_step=0.00185, global_step=1602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]   Epoch 80:  12%|█▎        | 10/80 [01:32<09:49,  8.42s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=7.63e-6, train/loss_step=0.00185, global_step=1602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  12%|█▎        | 10/80 [01:32<09:49,  8.42s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=5.1e-6, train/loss_step=0.000673, global_step=1602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  14%|█▍        | 11/80 [01:34<09:01,  7.85s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=5.1e-6, train/loss_step=0.000673, global_step=1602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  14%|█▍        | 11/80 [01:34<09:01,  7.85s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.95e-5, train/loss_step=0.0123, global_step=1602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]   Epoch 80:  15%|█▌        | 12/80 [01:34<08:15,  7.29s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=5.95e-5, train/loss_step=0.0123, global_step=1602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  15%|█▌        | 12/80 [01:34<08:15,  7.29s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.05e-6, train/loss_step=0.00026, global_step=1602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  16%|█▋        | 13/80 [01:35<07:36,  6.81s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.05e-6, train/loss_step=0.00026, global_step=1602.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  16%|█▋        | 13/80 [01:35<07:36,  6.81s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000188, train/loss_vlb_step=9.69e-7, train/loss_step=0.000188, global_step=1603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  18%|█▊        | 14/80 [01:35<07:01,  6.39s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000188, train/loss_vlb_step=9.69e-7, train/loss_step=0.000188, global_step=1603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  18%|█▊        | 14/80 [01:35<07:01,  6.39s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.3e-6, train/loss_step=0.000251, global_step=1603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  19%|█▉        | 15/80 [01:36<06:31,  6.02s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.3e-6, train/loss_step=0.000251, global_step=1603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  19%|█▉        | 15/80 [01:36<06:31,  6.02s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000535, train/loss_vlb_step=8.5e-6, train/loss_step=0.000535, global_step=1603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  20%|██        | 16/80 [02:01<07:38,  7.17s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000535, train/loss_vlb_step=8.5e-6, train/loss_step=0.000535, global_step=1603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  20%|██        | 16/80 [02:01<07:38,  7.17s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.00753, train/loss_step=0.0362, global_step=1603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]  Epoch 80:  21%|██▏       | 17/80 [02:09<07:31,  7.17s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0362, train/loss_vlb_step=0.00753, train/loss_step=0.0362, global_step=1603.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  21%|██▏       | 17/80 [02:09<07:31,  7.17s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.26e-5, train/loss_step=0.00561, global_step=1604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  22%|██▎       | 18/80 [02:09<07:02,  6.82s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.26e-5, train/loss_step=0.00561, global_step=1604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  22%|██▎       | 18/80 [02:09<07:02,  6.82s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.1e-5, train/loss_step=0.00303, global_step=1604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  24%|██▍       | 19/80 [02:19<07:06,  6.99s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.1e-5, train/loss_step=0.00303, global_step=1604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  24%|██▍       | 19/80 [02:19<07:06,  6.99s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.65e-5, train/loss_step=0.00332, global_step=1604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  25%|██▌       | 20/80 [02:20<06:41,  6.68s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.65e-5, train/loss_step=0.00332, global_step=1604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  25%|██▌       | 20/80 [02:20<06:41,  6.68s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.000469, train/loss_vlb_step=1.88e-6, train/loss_step=0.000469, global_step=1604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  26%|██▋       | 21/80 [02:20<06:17,  6.41s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.000469, train/loss_vlb_step=1.88e-6, train/loss_step=0.000469, global_step=1604.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  26%|██▋       | 21/80 [02:20<06:17,  6.41s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.93e-6, train/loss_step=0.00207, global_step=1605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]  Epoch 80:  28%|██▊       | 22/80 [02:21<05:56,  6.15s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.93e-6, train/loss_step=0.00207, global_step=1605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  28%|██▊       | 22/80 [02:21<05:56,  6.15s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=1.63e-5, train/loss_step=0.00434, global_step=1605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  29%|██▉       | 23/80 [02:21<05:36,  5.91s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=1.63e-5, train/loss_step=0.00434, global_step=1605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  29%|██▉       | 23/80 [02:21<05:37,  5.91s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=9.18e-7, train/loss_step=0.000235, global_step=1605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  30%|███       | 24/80 [02:44<06:07,  6.56s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=9.18e-7, train/loss_step=0.000235, global_step=1605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  30%|███       | 24/80 [02:44<06:07,  6.56s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000994, train/loss_vlb_step=4.8e-6, train/loss_step=0.000994, global_step=1605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  31%|███▏      | 25/80 [02:46<05:51,  6.39s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000994, train/loss_vlb_step=4.8e-6, train/loss_step=0.000994, global_step=1605.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  31%|███▏      | 25/80 [02:46<05:51,  6.40s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=1.95e-6, train/loss_step=0.000537, global_step=1606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  32%|███▎      | 26/80 [02:46<05:33,  6.18s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=1.95e-6, train/loss_step=0.000537, global_step=1606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  32%|███▎      | 26/80 [02:46<05:33,  6.18s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000209, train/loss_step=0.016, global_step=1606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]     Epoch 80:  34%|███▍      | 27/80 [03:10<06:00,  6.81s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000209, train/loss_step=0.016, global_step=1606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  34%|███▍      | 27/80 [03:10<06:00,  6.81s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000248, train/loss_step=0.0136, global_step=1606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  35%|███▌      | 28/80 [03:11<05:42,  6.59s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=0.000248, train/loss_step=0.0136, global_step=1606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  35%|███▌      | 28/80 [03:11<05:42,  6.59s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=2.08e-6, train/loss_step=0.000243, global_step=1606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  36%|███▋      | 29/80 [03:11<05:25,  6.39s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=2.08e-6, train/loss_step=0.000243, global_step=1606.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  36%|███▋      | 29/80 [03:11<05:25,  6.39s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=3.5e-6, train/loss_step=0.000819, global_step=1607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  38%|███▊      | 30/80 [03:12<05:10,  6.20s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000819, train/loss_vlb_step=3.5e-6, train/loss_step=0.000819, global_step=1607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  38%|███▊      | 30/80 [03:12<05:10,  6.20s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=2.19e-5, train/loss_step=0.00261, global_step=1607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  39%|███▉      | 31/80 [03:12<04:55,  6.02s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.00261, train/loss_vlb_step=2.19e-5, train/loss_step=0.00261, global_step=1607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  39%|███▉      | 31/80 [03:12<04:55,  6.02s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000137, train/loss_vlb_step=6.03e-7, train/loss_step=0.000137, global_step=1607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  40%|████      | 32/80 [03:18<04:49,  6.03s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000137, train/loss_vlb_step=6.03e-7, train/loss_step=0.000137, global_step=1607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  40%|████      | 32/80 [03:18<04:49,  6.03s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.41e-5, train/loss_step=0.00368, global_step=1607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]  Epoch 80:  41%|████▏     | 33/80 [03:29<04:49,  6.16s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=1.41e-5, train/loss_step=0.00368, global_step=1607.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  41%|████▏     | 33/80 [03:29<04:49,  6.16s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4e-5, train/loss_step=0.0093, global_step=1608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]      Epoch 80:  42%|████▎     | 34/80 [03:38<04:46,  6.23s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.0093, train/loss_vlb_step=4e-5, train/loss_step=0.0093, global_step=1608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  42%|████▎     | 34/80 [03:38<04:46,  6.23s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=2.36e-5, train/loss_step=0.00702, global_step=1608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  44%|████▍     | 35/80 [04:08<05:11,  6.91s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00702, train/loss_vlb_step=2.36e-5, train/loss_step=0.00702, global_step=1608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  44%|████▍     | 35/80 [04:08<05:11,  6.91s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=2.91e-5, train/loss_step=0.00807, global_step=1608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  45%|████▌     | 36/80 [04:09<04:56,  6.74s/it, loss=0.00592, v_num=0, train/loss_simple_step=0.00807, train/loss_vlb_step=2.91e-5, train/loss_step=0.00807, global_step=1608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  45%|████▌     | 36/80 [04:09<04:56,  6.74s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.52e-6, train/loss_step=0.000304, global_step=1608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  46%|████▋     | 37/80 [04:09<04:42,  6.57s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.52e-6, train/loss_step=0.000304, global_step=1608.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  46%|████▋     | 37/80 [04:09<04:42,  6.57s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.32e-6, train/loss_step=0.000286, global_step=1609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  48%|████▊     | 38/80 [04:10<04:29,  6.42s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.32e-6, train/loss_step=0.000286, global_step=1609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  48%|████▊     | 38/80 [04:10<04:29,  6.42s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=1.73e-5, train/loss_step=0.0015, global_step=1609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]    Epoch 80:  49%|████▉     | 39/80 [04:10<04:17,  6.27s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=1.73e-5, train/loss_step=0.0015, global_step=1609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  49%|████▉     | 39/80 [04:10<04:17,  6.27s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=5.06e-5, train/loss_step=0.00903, global_step=1609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  50%|█████     | 40/80 [04:11<04:05,  6.13s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=5.06e-5, train/loss_step=0.00903, global_step=1609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  50%|█████     | 40/80 [04:11<04:05,  6.13s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=7.74e-6, train/loss_step=0.00197, global_step=1609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  51%|█████▏    | 41/80 [04:11<03:53,  6.00s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=7.74e-6, train/loss_step=0.00197, global_step=1609.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  51%|█████▏    | 41/80 [04:11<03:53,  6.00s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=2.01e-6, train/loss_step=0.000584, global_step=1610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  52%|█████▎    | 42/80 [04:12<03:43,  5.87s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=2.01e-6, train/loss_step=0.000584, global_step=1610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  52%|█████▎    | 42/80 [04:12<03:43,  5.87s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=1.5e-5, train/loss_step=0.000987, global_step=1610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  54%|█████▍    | 43/80 [04:50<04:04,  6.61s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=1.5e-5, train/loss_step=0.000987, global_step=1610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  54%|█████▍    | 43/80 [04:50<04:04,  6.61s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.83e-6, train/loss_step=0.00105, global_step=1610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  55%|█████▌    | 44/80 [04:51<03:52,  6.47s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.83e-6, train/loss_step=0.00105, global_step=1610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  55%|█████▌    | 44/80 [04:51<03:52,  6.47s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00089, train/loss_vlb_step=3.85e-6, train/loss_step=0.00089, global_step=1610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  56%|█████▋    | 45/80 [04:52<03:42,  6.35s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00089, train/loss_vlb_step=3.85e-6, train/loss_step=0.00089, global_step=1610.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  56%|█████▋    | 45/80 [04:52<03:42,  6.35s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=1.7e-5, train/loss_step=0.00474, global_step=1611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  57%|█████▊    | 46/80 [04:52<03:31,  6.22s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=1.7e-5, train/loss_step=0.00474, global_step=1611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  57%|█████▊    | 46/80 [04:52<03:31,  6.22s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=2.63e-6, train/loss_step=0.000373, global_step=1611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  59%|█████▉    | 47/80 [04:53<03:21,  6.10s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=2.63e-6, train/loss_step=0.000373, global_step=1611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  59%|█████▉    | 47/80 [04:53<03:21,  6.10s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.96e-5, train/loss_step=0.00636, global_step=1611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]    Epoch 80:  60%|██████    | 48/80 [04:53<03:11,  5.99s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00636, train/loss_vlb_step=3.96e-5, train/loss_step=0.00636, global_step=1611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  60%|██████    | 48/80 [04:53<03:11,  5.99s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=2.97e-6, train/loss_step=0.000392, global_step=1611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  61%|██████▏   | 49/80 [04:54<03:02,  5.88s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=2.97e-6, train/loss_step=0.000392, global_step=1611.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  61%|██████▏   | 49/80 [04:54<03:02,  5.88s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=3.08e-6, train/loss_step=0.000303, global_step=1612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  62%|██████▎   | 50/80 [04:54<02:53,  5.78s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=3.08e-6, train/loss_step=0.000303, global_step=1612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  62%|██████▎   | 50/80 [04:54<02:53,  5.78s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=1.51e-5, train/loss_step=0.00381, global_step=1612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]  Epoch 80:  64%|██████▍   | 51/80 [05:33<03:06,  6.42s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=1.51e-5, train/loss_step=0.00381, global_step=1612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  64%|██████▍   | 51/80 [05:33<03:06,  6.42s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=0.000337, train/loss_step=0.0168, global_step=1612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  65%|██████▌   | 52/80 [05:34<02:56,  6.31s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=0.000337, train/loss_step=0.0168, global_step=1612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  65%|██████▌   | 52/80 [05:34<02:56,  6.31s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=2.78e-5, train/loss_step=0.00756, global_step=1612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  66%|██████▋   | 53/80 [05:34<02:47,  6.20s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=2.78e-5, train/loss_step=0.00756, global_step=1612.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  66%|██████▋   | 53/80 [05:34<02:47,  6.20s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.15e-5, train/loss_step=0.00619, global_step=1613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  68%|██████▊   | 54/80 [05:35<02:38,  6.10s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.15e-5, train/loss_step=0.00619, global_step=1613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  68%|██████▊   | 54/80 [05:35<02:38,  6.10s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000372, train/loss_vlb_step=2.14e-6, train/loss_step=0.000372, global_step=1613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  69%|██████▉   | 55/80 [05:35<02:29,  6.00s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000372, train/loss_vlb_step=2.14e-6, train/loss_step=0.000372, global_step=1613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  69%|██████▉   | 55/80 [05:35<02:29,  6.00s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000447, train/loss_vlb_step=3.55e-6, train/loss_step=0.000447, global_step=1613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  70%|███████   | 56/80 [05:36<02:21,  5.90s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000447, train/loss_vlb_step=3.55e-6, train/loss_step=0.000447, global_step=1613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  70%|███████   | 56/80 [05:36<02:21,  5.90s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.24e-5, train/loss_step=0.00212, global_step=1613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  71%|███████▏  | 57/80 [05:37<02:13,  5.81s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1.24e-5, train/loss_step=0.00212, global_step=1613.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  71%|███████▏  | 57/80 [05:37<02:13,  5.81s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.7e-6, train/loss_step=0.000308, global_step=1614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  72%|███████▎  | 58/80 [05:37<02:05,  5.72s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.7e-6, train/loss_step=0.000308, global_step=1614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  72%|███████▎  | 58/80 [05:37<02:05,  5.72s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.03e-5, train/loss_step=0.00168, global_step=1614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]  Epoch 80:  74%|███████▍  | 59/80 [06:21<02:13,  6.36s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1.03e-5, train/loss_step=0.00168, global_step=1614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  74%|███████▍  | 59/80 [06:21<02:13,  6.36s/it, loss=0.00285, v_num=0, train/loss_simple_step=9.19e-5, train/loss_vlb_step=4.05e-7, train/loss_step=9.19e-5, global_step=1614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  75%|███████▌  | 60/80 [06:22<02:05,  6.27s/it, loss=0.00285, v_num=0, train/loss_simple_step=9.19e-5, train/loss_vlb_step=4.05e-7, train/loss_step=9.19e-5, global_step=1614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  75%|███████▌  | 60/80 [06:22<02:05,  6.27s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=6.5e-5, train/loss_step=0.00551, global_step=1614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419] Epoch 80:  76%|███████▋  | 61/80 [06:22<01:57,  6.18s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=6.5e-5, train/loss_step=0.00551, global_step=1614.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  76%|███████▋  | 61/80 [06:22<01:57,  6.18s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=2.89e-5, train/loss_step=0.00714, global_step=1615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  78%|███████▊  | 62/80 [06:23<01:49,  6.09s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=2.89e-5, train/loss_step=0.00714, global_step=1615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  78%|███████▊  | 62/80 [06:23<01:49,  6.09s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000498, train/loss_vlb_step=8.28e-6, train/loss_step=0.000498, global_step=1615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  79%|███████▉  | 63/80 [06:23<01:41,  6.00s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000498, train/loss_vlb_step=8.28e-6, train/loss_step=0.000498, global_step=1615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  79%|███████▉  | 63/80 [06:23<01:41,  6.00s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.17e-5, train/loss_step=0.0144, global_step=1615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]      Epoch 80:  80%|████████  | 64/80 [06:24<01:34,  5.92s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=6.17e-5, train/loss_step=0.0144, global_step=1615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  80%|████████  | 64/80 [06:24<01:34,  5.92s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=0.000537, train/loss_step=0.0147, global_step=1615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  81%|████████▏ | 65/80 [06:25<01:27,  5.83s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=0.000537, train/loss_step=0.0147, global_step=1615.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  81%|████████▏ | 65/80 [06:25<01:27,  5.83s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.21e-6, train/loss_step=0.000278, global_step=1616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  82%|████████▎ | 66/80 [06:25<01:20,  5.75s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.21e-6, train/loss_step=0.000278, global_step=1616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  82%|████████▎ | 66/80 [06:25<01:20,  5.75s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=7.39e-5, train/loss_step=0.0117, global_step=1616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]    Epoch 80:  84%|████████▍ | 67/80 [06:50<01:18,  6.04s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=7.39e-5, train/loss_step=0.0117, global_step=1616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  84%|████████▍ | 67/80 [06:50<01:18,  6.04s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=1.32e-6, train/loss_step=0.00023, global_step=1616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  85%|████████▌ | 68/80 [06:51<01:11,  5.96s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=1.32e-6, train/loss_step=0.00023, global_step=1616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  85%|████████▌ | 68/80 [06:51<01:11,  5.96s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=1.57e-6, train/loss_step=0.000413, global_step=1616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  86%|████████▋ | 69/80 [06:52<01:04,  5.89s/it, loss=0.00473, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=1.57e-6, train/loss_step=0.000413, global_step=1616.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  86%|████████▋ | 69/80 [06:52<01:04,  5.89s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=0.000239, train/loss_step=0.0212, global_step=1617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]   Epoch 80:  88%|████████▊ | 70/80 [06:52<00:58,  5.81s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=0.000239, train/loss_step=0.0212, global_step=1617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  88%|████████▊ | 70/80 [06:52<00:58,  5.81s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000285, train/loss_step=0.0141, global_step=1617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  89%|████████▉ | 71/80 [06:52<00:51,  5.74s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000285, train/loss_step=0.0141, global_step=1617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  89%|████████▉ | 71/80 [06:52<00:51,  5.74s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.7e-6, train/loss_step=0.00142, global_step=1617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  90%|█████████ | 72/80 [06:53<00:45,  5.66s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.7e-6, train/loss_step=0.00142, global_step=1617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  90%|█████████ | 72/80 [06:53<00:45,  5.66s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=1.43e-5, train/loss_step=0.00417, global_step=1617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  91%|█████████▏| 73/80 [06:54<00:39,  5.60s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=1.43e-5, train/loss_step=0.00417, global_step=1617.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  91%|█████████▏| 73/80 [06:54<00:39,  5.60s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.000666, train/loss_vlb_step=2.61e-6, train/loss_step=0.000666, global_step=1618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  92%|█████████▎| 74/80 [06:54<00:33,  5.53s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.000666, train/loss_vlb_step=2.61e-6, train/loss_step=0.000666, global_step=1618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  92%|█████████▎| 74/80 [06:54<00:33,  5.53s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=5.31e-5, train/loss_step=0.00315, global_step=1618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]  Epoch 80:  94%|█████████▍| 75/80 [07:29<00:29,  5.92s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=5.31e-5, train/loss_step=0.00315, global_step=1618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  94%|█████████▍| 75/80 [07:29<00:29,  5.92s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000498, train/loss_vlb_step=3.39e-6, train/loss_step=0.000498, global_step=1618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  95%|█████████▌| 76/80 [07:30<00:23,  5.85s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000498, train/loss_vlb_step=3.39e-6, train/loss_step=0.000498, global_step=1618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  95%|█████████▌| 76/80 [07:30<00:23,  5.85s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=5.22e-5, train/loss_step=0.00934, global_step=1618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]  Epoch 80:  96%|█████████▋| 77/80 [07:30<00:17,  5.78s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=5.22e-5, train/loss_step=0.00934, global_step=1618.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  96%|█████████▋| 77/80 [07:30<00:17,  5.78s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.26e-5, train/loss_step=0.0031, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]  Epoch 80:  98%|█████████▊| 78/80 [07:31<00:11,  5.71s/it, loss=0.00572, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.26e-5, train/loss_step=0.0031, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  98%|█████████▊| 78/80 [07:31<00:11,  5.71s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.09e-5, train/loss_step=0.0105, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  99%|█████████▉| 79/80 [07:31<00:05,  5.65s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.09e-5, train/loss_step=0.0105, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80:  99%|█████████▉| 79/80 [07:31<00:05,  5.65s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.79e-5, train/loss_step=0.0135, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80: 100%|██████████| 80/80 [07:32<00:00,  5.58s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=5.79e-5, train/loss_step=0.0135, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 80: 100%|██████████| 80/80 [07:32<00:00,  5.58s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=9.54e-6, train/loss_step=0.00177, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Average Epoch time: 452.33 seconds
+Average Peak memory 29561.83MiB
+Epoch 80:   0%|          | 0/80 [00:00<00:00, 4755.45it/s, loss=0.00664, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=9.54e-6, train/loss_step=0.00177, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 81:   0%|          | 0/80 [00:00<00:00, 1950.84it/s, loss=0.00664, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=9.54e-6, train/loss_step=0.00177, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]Epoch 81:   1%|▏         | 1/80 [00:34<22:29, 17.08s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=9.54e-6, train/loss_step=0.00177, global_step=1619.0, lr_abs=0.0001, train/loss_simple_epoch=0.00419, train/loss_vlb_epoch=0.000102, train/loss_epoch=0.00419]  Epoch 81:   1%|▏         | 1/80 [00:34<22:29, 17.08s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=2.77e-5, train/loss_step=0.000562, global_step=1620.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   2%|▎         | 2/80 [00:44<19:12, 14.78s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=2.77e-5, train/loss_step=0.000562, global_step=1620.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   2%|▎         | 2/80 [00:44<19:12, 14.78s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.000121, train/loss_vlb_step=5.04e-7, train/loss_step=0.000121, global_step=1620.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   4%|▍         | 3/80 [00:48<15:34, 12.13s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.000121, train/loss_vlb_step=5.04e-7, train/loss_step=0.000121, global_step=1620.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   4%|▍         | 3/80 [00:48<15:34, 12.13s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=3.72e-5, train/loss_step=0.00845, global_step=1620.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]    Epoch 81:   5%|▌         | 4/80 [00:49<12:25,  9.81s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00845, train/loss_vlb_step=3.72e-5, train/loss_step=0.00845, global_step=1620.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   5%|▌         | 4/80 [00:49<12:25,  9.81s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=7.04e-6, train/loss_step=0.00197, global_step=1620.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   6%|▋         | 5/80 [00:49<10:19,  8.26s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00197, train/loss_vlb_step=7.04e-6, train/loss_step=0.00197, global_step=1620.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   6%|▋         | 5/80 [00:49<10:19,  8.26s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.37e-5, train/loss_step=0.00303, global_step=1621.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413] Epoch 81:   8%|▊         | 6/80 [00:50<08:49,  7.15s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.37e-5, train/loss_step=0.00303, global_step=1621.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   8%|▊         | 6/80 [00:50<08:49,  7.15s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=7.8e-6, train/loss_step=0.00143, global_step=1621.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   9%|▉         | 7/80 [00:50<07:41,  6.32s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=7.8e-6, train/loss_step=0.00143, global_step=1621.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:   9%|▉         | 7/80 [00:50<07:41,  6.32s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=9.86e-7, train/loss_step=0.000221, global_step=1621.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  10%|█         | 8/80 [01:16<10:09,  8.47s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=9.86e-7, train/loss_step=0.000221, global_step=1621.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  10%|█         | 8/80 [01:16<10:09,  8.47s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.05e-6, train/loss_step=0.000552, global_step=1621.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  11%|█▏        | 9/80 [01:16<09:05,  7.68s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.05e-6, train/loss_step=0.000552, global_step=1621.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  11%|█▏        | 9/80 [01:16<09:05,  7.68s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=4.61e-5, train/loss_step=0.00436, global_step=1622.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  12%|█▎        | 10/80 [01:19<08:27,  7.25s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00436, train/loss_vlb_step=4.61e-5, train/loss_step=0.00436, global_step=1622.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  12%|█▎        | 10/80 [01:19<08:27,  7.25s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=1.32e-5, train/loss_step=0.00398, global_step=1622.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  14%|█▍        | 11/80 [01:24<08:07,  7.07s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=1.32e-5, train/loss_step=0.00398, global_step=1622.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  14%|█▍        | 11/80 [01:24<08:07,  7.07s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.19e-5, train/loss_step=0.00324, global_step=1622.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  15%|█▌        | 12/80 [01:25<07:26,  6.57s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00324, train/loss_vlb_step=1.19e-5, train/loss_step=0.00324, global_step=1622.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  15%|█▌        | 12/80 [01:25<07:26,  6.57s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=7.34e-7, train/loss_step=0.00015, global_step=1622.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  16%|█▋        | 13/80 [01:32<07:21,  6.58s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=7.34e-7, train/loss_step=0.00015, global_step=1622.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  16%|█▋        | 13/80 [01:32<07:21,  6.58s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.45e-6, train/loss_step=0.000499, global_step=1623.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  18%|█▊        | 14/80 [01:32<06:47,  6.18s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.45e-6, train/loss_step=0.000499, global_step=1623.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  18%|█▊        | 14/80 [01:32<06:47,  6.18s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=2.58e-5, train/loss_step=0.00168, global_step=1623.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  19%|█▉        | 15/80 [01:33<06:18,  5.82s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=2.58e-5, train/loss_step=0.00168, global_step=1623.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  19%|█▉        | 15/80 [01:33<06:18,  5.82s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.69e-6, train/loss_step=0.00033, global_step=1623.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  20%|██        | 16/80 [01:54<07:10,  6.73s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.69e-6, train/loss_step=0.00033, global_step=1623.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  20%|██        | 16/80 [01:54<07:10,  6.73s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=9.94e-6, train/loss_step=0.00295, global_step=1623.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  21%|██▏       | 17/80 [02:05<07:18,  6.96s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00295, train/loss_vlb_step=9.94e-6, train/loss_step=0.00295, global_step=1623.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  21%|██▏       | 17/80 [02:05<07:18,  6.96s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.17e-6, train/loss_step=0.000551, global_step=1624.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  22%|██▎       | 18/80 [02:05<06:50,  6.62s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.17e-6, train/loss_step=0.000551, global_step=1624.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  22%|██▎       | 18/80 [02:05<06:50,  6.62s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000414, train/loss_vlb_step=4.25e-6, train/loss_step=0.000414, global_step=1624.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  24%|██▍       | 19/80 [02:06<06:24,  6.31s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000414, train/loss_vlb_step=4.25e-6, train/loss_step=0.000414, global_step=1624.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  24%|██▍       | 19/80 [02:06<06:24,  6.31s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.18e-5, train/loss_step=0.0078, global_step=1624.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]     Epoch 81:  25%|██▌       | 20/80 [02:06<06:02,  6.04s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.18e-5, train/loss_step=0.0078, global_step=1624.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  25%|██▌       | 20/80 [02:06<06:02,  6.04s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=1.82e-6, train/loss_step=0.000424, global_step=1624.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  26%|██▋       | 21/80 [02:13<05:57,  6.05s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=1.82e-6, train/loss_step=0.000424, global_step=1624.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  26%|██▋       | 21/80 [02:13<05:57,  6.05s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=0.000368, train/loss_step=0.00888, global_step=1625.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413] Epoch 81:  28%|██▊       | 22/80 [02:13<05:36,  5.81s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00888, train/loss_vlb_step=0.000368, train/loss_step=0.00888, global_step=1625.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  28%|██▊       | 22/80 [02:13<05:36,  5.81s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=5.62e-6, train/loss_step=0.000645, global_step=1625.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  29%|██▉       | 23/80 [02:14<05:18,  5.59s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=5.62e-6, train/loss_step=0.000645, global_step=1625.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  29%|██▉       | 23/80 [02:14<05:18,  5.59s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=8.52e-6, train/loss_step=0.00201, global_step=1625.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  30%|███       | 24/80 [02:36<05:50,  6.26s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=8.52e-6, train/loss_step=0.00201, global_step=1625.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  30%|███       | 24/80 [02:36<05:50,  6.26s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.21e-6, train/loss_step=0.000312, global_step=1625.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  31%|███▏      | 25/80 [02:52<06:05,  6.65s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.21e-6, train/loss_step=0.000312, global_step=1625.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  31%|███▏      | 25/80 [02:52<06:05,  6.65s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=7.67e-6, train/loss_step=0.0019, global_step=1626.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]    Epoch 81:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=7.67e-6, train/loss_step=0.0019, global_step=1626.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.91e-6, train/loss_step=0.000641, global_step=1626.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  34%|███▍      | 27/80 [02:53<05:28,  6.21s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.91e-6, train/loss_step=0.000641, global_step=1626.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  34%|███▍      | 27/80 [02:53<05:28,  6.21s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=2.82e-6, train/loss_step=0.000589, global_step=1626.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=2.82e-6, train/loss_step=0.000589, global_step=1626.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=3.73e-5, train/loss_step=0.00964, global_step=1626.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  36%|███▋      | 29/80 [02:55<04:57,  5.83s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=3.73e-5, train/loss_step=0.00964, global_step=1626.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  36%|███▋      | 29/80 [02:55<04:57,  5.83s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=3.17e-5, train/loss_step=0.00835, global_step=1627.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  38%|███▊      | 30/80 [02:55<04:43,  5.66s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00835, train/loss_vlb_step=3.17e-5, train/loss_step=0.00835, global_step=1627.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  38%|███▊      | 30/80 [02:55<04:43,  5.66s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.4e-6, train/loss_step=0.000291, global_step=1627.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  39%|███▉      | 31/80 [02:55<04:29,  5.50s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.4e-6, train/loss_step=0.000291, global_step=1627.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  39%|███▉      | 31/80 [02:55<04:29,  5.50s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.000163, train/loss_vlb_step=6.66e-7, train/loss_step=0.000163, global_step=1627.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  40%|████      | 32/80 [03:15<04:43,  5.91s/it, loss=0.00241, v_num=0, train/loss_simple_step=0.000163, train/loss_vlb_step=6.66e-7, train/loss_step=0.000163, global_step=1627.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  40%|████      | 32/80 [03:15<04:43,  5.91s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000676, train/loss_vlb_step=1.8e-5, train/loss_step=0.000676, global_step=1627.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413] Epoch 81:  41%|████▏     | 33/80 [03:32<04:54,  6.26s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000676, train/loss_vlb_step=1.8e-5, train/loss_step=0.000676, global_step=1627.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  41%|████▏     | 33/80 [03:32<04:54,  6.26s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=8.04e-5, train/loss_step=0.0139, global_step=1628.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]   Epoch 81:  42%|████▎     | 34/80 [03:33<04:40,  6.09s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=8.04e-5, train/loss_step=0.0139, global_step=1628.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  42%|████▎     | 34/80 [03:33<04:40,  6.09s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=1.63e-6, train/loss_step=0.000282, global_step=1628.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  44%|████▍     | 35/80 [03:33<04:27,  5.94s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=1.63e-6, train/loss_step=0.000282, global_step=1628.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  44%|████▍     | 35/80 [03:33<04:27,  5.94s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.31e-5, train/loss_step=0.00211, global_step=1628.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  45%|████▌     | 36/80 [03:35<04:16,  5.83s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=1.31e-5, train/loss_step=0.00211, global_step=1628.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  45%|████▌     | 36/80 [03:35<04:16,  5.83s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=2.92e-5, train/loss_step=0.00787, global_step=1628.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  46%|████▋     | 37/80 [03:36<04:04,  5.69s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=2.92e-5, train/loss_step=0.00787, global_step=1628.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  46%|████▋     | 37/80 [03:36<04:04,  5.69s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=5.93e-5, train/loss_step=0.0019, global_step=1629.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  48%|████▊     | 38/80 [03:36<03:53,  5.56s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=5.93e-5, train/loss_step=0.0019, global_step=1629.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  48%|████▊     | 38/80 [03:36<03:53,  5.56s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0017, train/loss_step=0.0249, global_step=1629.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413] Epoch 81:  49%|████▉     | 39/80 [03:37<03:42,  5.43s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.0017, train/loss_step=0.0249, global_step=1629.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  49%|████▉     | 39/80 [03:37<03:42,  5.43s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=6.42e-6, train/loss_step=0.000777, global_step=1629.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  50%|█████     | 40/80 [03:51<03:45,  5.64s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=6.42e-6, train/loss_step=0.000777, global_step=1629.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  50%|█████     | 40/80 [03:51<03:45,  5.64s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=6.03e-5, train/loss_step=0.00827, global_step=1629.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=6.03e-5, train/loss_step=0.00827, global_step=1629.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=4.21e-7, train/loss_step=0.000113, global_step=1630.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  52%|█████▎    | 42/80 [04:11<03:41,  5.84s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=4.21e-7, train/loss_step=0.000113, global_step=1630.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  52%|█████▎    | 42/80 [04:11<03:41,  5.84s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00968, train/loss_vlb_step=3.21e-5, train/loss_step=0.00968, global_step=1630.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  54%|█████▍    | 43/80 [04:18<03:37,  5.87s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00968, train/loss_vlb_step=3.21e-5, train/loss_step=0.00968, global_step=1630.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  54%|█████▍    | 43/80 [04:18<03:37,  5.87s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=6.12e-6, train/loss_step=0.000589, global_step=1630.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  55%|█████▌    | 44/80 [04:19<03:27,  5.76s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=6.12e-6, train/loss_step=0.000589, global_step=1630.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  55%|█████▌    | 44/80 [04:19<03:27,  5.76s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=0.000183, train/loss_step=0.00973, global_step=1630.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413] Epoch 81:  56%|█████▋    | 45/80 [04:19<03:17,  5.64s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00973, train/loss_vlb_step=0.000183, train/loss_step=0.00973, global_step=1630.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  56%|█████▋    | 45/80 [04:19<03:17,  5.64s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.00015, train/loss_step=0.0169, global_step=1631.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]   Epoch 81:  57%|█████▊    | 46/80 [04:20<03:08,  5.53s/it, loss=0.00587, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.00015, train/loss_step=0.0169, global_step=1631.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  57%|█████▊    | 46/80 [04:20<03:08,  5.53s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=6.42e-7, train/loss_step=0.000168, global_step=1631.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  59%|█████▉    | 47/80 [04:20<02:59,  5.43s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=6.42e-7, train/loss_step=0.000168, global_step=1631.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  59%|█████▉    | 47/80 [04:20<02:59,  5.43s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=3.9e-6, train/loss_step=0.000626, global_step=1631.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413] Epoch 81:  60%|██████    | 48/80 [04:33<02:58,  5.58s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=3.9e-6, train/loss_step=0.000626, global_step=1631.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  60%|██████    | 48/80 [04:33<02:58,  5.58s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=0.000169, train/loss_step=0.000747, global_step=1631.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  61%|██████▏   | 49/80 [04:52<03:01,  5.85s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=0.000169, train/loss_step=0.000747, global_step=1631.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  61%|██████▏   | 49/80 [04:52<03:01,  5.85s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=9.17e-5, train/loss_step=0.0111, global_step=1632.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]    Epoch 81:  62%|██████▎   | 50/80 [04:53<02:52,  5.75s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=9.17e-5, train/loss_step=0.0111, global_step=1632.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  62%|██████▎   | 50/80 [04:53<02:52,  5.75s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.04e-5, train/loss_step=0.003, global_step=1632.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  64%|██████▍   | 51/80 [05:01<02:48,  5.80s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.04e-5, train/loss_step=0.003, global_step=1632.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  64%|██████▍   | 51/80 [05:01<02:48,  5.80s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.01e-5, train/loss_step=0.00778, global_step=1632.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  65%|██████▌   | 52/80 [05:03<02:40,  5.73s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00778, train/loss_vlb_step=3.01e-5, train/loss_step=0.00778, global_step=1632.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  65%|██████▌   | 52/80 [05:03<02:40,  5.73s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.25e-6, train/loss_step=0.000329, global_step=1632.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  66%|██████▋   | 53/80 [05:04<02:32,  5.63s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.25e-6, train/loss_step=0.000329, global_step=1632.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  66%|██████▋   | 53/80 [05:04<02:32,  5.63s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=5.77e-7, train/loss_step=0.000144, global_step=1633.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  68%|██████▊   | 54/80 [05:04<02:23,  5.54s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=5.77e-7, train/loss_step=0.000144, global_step=1633.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  68%|██████▊   | 54/80 [05:04<02:23,  5.54s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.47e-5, train/loss_step=0.012, global_step=1633.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]      Epoch 81:  69%|██████▉   | 55/80 [05:06<02:16,  5.48s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.47e-5, train/loss_step=0.012, global_step=1633.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  69%|██████▉   | 55/80 [05:06<02:16,  5.48s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=5.7e-7, train/loss_step=0.000148, global_step=1633.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  70%|███████   | 56/80 [05:19<02:14,  5.61s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=5.7e-7, train/loss_step=0.000148, global_step=1633.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  70%|███████   | 56/80 [05:19<02:14,  5.61s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=2.15e-6, train/loss_step=0.000558, global_step=1633.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  71%|███████▏  | 57/80 [05:39<02:14,  5.85s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=2.15e-6, train/loss_step=0.000558, global_step=1633.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  71%|███████▏  | 57/80 [05:39<02:14,  5.85s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=0.000502, train/loss_step=0.00154, global_step=1634.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413] Epoch 81:  72%|███████▎  | 58/80 [05:39<02:06,  5.76s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=0.000502, train/loss_step=0.00154, global_step=1634.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  72%|███████▎  | 58/80 [05:39<02:06,  5.76s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.27e-5, train/loss_step=0.00335, global_step=1634.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413] Epoch 81:  74%|███████▍  | 59/80 [05:50<02:02,  5.83s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.27e-5, train/loss_step=0.00335, global_step=1634.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  74%|███████▍  | 59/80 [05:50<02:02,  5.83s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=1.24e-6, train/loss_step=0.000349, global_step=1634.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  75%|███████▌  | 60/80 [05:50<01:54,  5.75s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=1.24e-6, train/loss_step=0.000349, global_step=1634.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  75%|███████▌  | 60/80 [05:50<01:54,  5.75s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000196, train/loss_vlb_step=7.69e-7, train/loss_step=0.000196, global_step=1634.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  76%|███████▋  | 61/80 [05:51<01:47,  5.66s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000196, train/loss_vlb_step=7.69e-7, train/loss_step=0.000196, global_step=1634.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  76%|███████▋  | 61/80 [05:51<01:47,  5.66s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.69e-5, train/loss_step=0.0121, global_step=1635.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]    Epoch 81:  78%|███████▊  | 62/80 [05:51<01:40,  5.58s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.69e-5, train/loss_step=0.0121, global_step=1635.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  78%|███████▊  | 62/80 [05:51<01:40,  5.58s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=4.85e-6, train/loss_step=0.000606, global_step=1635.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  79%|███████▉  | 63/80 [05:52<01:33,  5.50s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=4.85e-6, train/loss_step=0.000606, global_step=1635.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  79%|███████▉  | 63/80 [05:52<01:33,  5.50s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=2.49e-5, train/loss_step=0.00638, global_step=1635.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  80%|████████  | 64/80 [05:53<01:27,  5.45s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=2.49e-5, train/loss_step=0.00638, global_step=1635.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  80%|████████  | 64/80 [05:53<01:27,  5.45s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.06e-6, train/loss_step=0.0011, global_step=1635.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  81%|████████▏ | 65/80 [06:13<01:24,  5.66s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=4.06e-6, train/loss_step=0.0011, global_step=1635.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  81%|████████▏ | 65/80 [06:13<01:24,  5.66s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=1.07e-5, train/loss_step=0.000673, global_step=1636.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  82%|████████▎ | 66/80 [06:14<01:18,  5.58s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=1.07e-5, train/loss_step=0.000673, global_step=1636.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  82%|████████▎ | 66/80 [06:14<01:18,  5.58s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=1.55e-5, train/loss_step=0.00432, global_step=1636.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  84%|████████▍ | 67/80 [06:34<01:15,  5.80s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00432, train/loss_vlb_step=1.55e-5, train/loss_step=0.00432, global_step=1636.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  84%|████████▍ | 67/80 [06:34<01:15,  5.80s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=4.56e-6, train/loss_step=0.000645, global_step=1636.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  85%|████████▌ | 68/80 [06:35<01:08,  5.73s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=4.56e-6, train/loss_step=0.000645, global_step=1636.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  85%|████████▌ | 68/80 [06:35<01:08,  5.73s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000919, train/loss_vlb_step=3.52e-6, train/loss_step=0.000919, global_step=1636.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  86%|████████▋ | 69/80 [06:35<01:02,  5.65s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000919, train/loss_vlb_step=3.52e-6, train/loss_step=0.000919, global_step=1636.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  86%|████████▋ | 69/80 [06:35<01:02,  5.65s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.14e-5, train/loss_step=0.00321, global_step=1637.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  88%|████████▊ | 70/80 [06:36<00:55,  5.58s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.14e-5, train/loss_step=0.00321, global_step=1637.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  88%|████████▊ | 70/80 [06:36<00:55,  5.58s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.42e-5, train/loss_step=0.00311, global_step=1637.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  89%|████████▉ | 71/80 [06:36<00:49,  5.51s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00311, train/loss_vlb_step=1.42e-5, train/loss_step=0.00311, global_step=1637.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  89%|████████�� | 71/80 [06:36<00:49,  5.51s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.92e-6, train/loss_step=0.00136, global_step=1637.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  90%|█████████ | 72/80 [06:37<00:43,  5.44s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.92e-6, train/loss_step=0.00136, global_step=1637.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  90%|█████████ | 72/80 [06:37<00:43,  5.44s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000957, train/loss_vlb_step=4.64e-6, train/loss_step=0.000957, global_step=1637.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  91%|█████████▏| 73/80 [06:41<00:37,  5.42s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000957, train/loss_vlb_step=4.64e-6, train/loss_step=0.000957, global_step=1637.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  91%|█████████▏| 73/80 [06:41<00:37,  5.42s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=2.65e-6, train/loss_step=0.000621, global_step=1638.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413] Epoch 81:  92%|█████████▎| 74/80 [06:41<00:32,  5.36s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=2.65e-6, train/loss_step=0.000621, global_step=1638.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  92%|█████████▎| 74/80 [06:41<00:32,  5.36s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000503, train/loss_vlb_step=4.16e-6, train/loss_step=0.000503, global_step=1638.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  94%|█████████▍| 75/80 [07:10<00:28,  5.67s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000503, train/loss_vlb_step=4.16e-6, train/loss_step=0.000503, global_step=1638.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  94%|█████████▍| 75/80 [07:10<00:28,  5.67s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=1.61e-6, train/loss_step=0.00043, global_step=1638.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 81:  95%|█████████▌| 76/80 [07:11<00:22,  5.60s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=1.61e-6, train/loss_step=0.00043, global_step=1638.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  95%|█████████▌| 76/80 [07:11<00:22,  5.60s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=6.29e-6, train/loss_step=0.000381, global_step=1638.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  96%|█████████▋| 77/80 [07:11<00:16,  5.54s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=6.29e-6, train/loss_step=0.000381, global_step=1638.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  96%|█████████▋| 77/80 [07:11<00:16,  5.54s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=7e-6, train/loss_step=0.00166, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]     Epoch 81:  98%|█████████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=7e-6, train/loss_step=0.00166, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  98%|█████████▊| 78/80 [07:12<00:10,  5.47s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=0.000565, train/loss_step=0.00503, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=0.000565, train/loss_step=0.00503, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81:  99%|█████████▉| 79/80 [07:12<00:05,  5.41s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.000358, train/loss_vlb_step=2.92e-6, train/loss_step=0.000358, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.000358, train/loss_vlb_step=2.92e-6, train/loss_step=0.000358, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 81: 100%|██████████| 80/80 [07:13<00:00,  5.35s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=3.54e-6, train/loss_step=0.00105, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Average Epoch time: 433.32 seconds
+Average Peak memory 29565.72MiB
+Epoch 81:   0%|          | 0/80 [00:00<00:00, 3371.63it/s, loss=0.00227, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=3.54e-6, train/loss_step=0.00105, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 82:   0%|          | 0/80 [00:00<00:00, 1542.02it/s, loss=0.00227, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=3.54e-6, train/loss_step=0.00105, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]Epoch 82:   1%|▏         | 1/80 [00:34<23:01, 17.49s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=3.54e-6, train/loss_step=0.00105, global_step=1639.0, lr_abs=0.0001, train/loss_simple_epoch=0.00413, train/loss_vlb_epoch=7.46e-5, train/loss_epoch=0.00413]  Epoch 82:   1%|▏         | 1/80 [00:34<23:01, 17.49s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=6.56e-7, train/loss_step=0.00017, global_step=1640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   2%|▎         | 2/80 [00:44<19:04, 14.67s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=6.56e-7, train/loss_step=0.00017, global_step=1640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   2%|▎         | 2/80 [00:44<19:04, 14.67s/it, loss=0.00169, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=4.25e-6, train/loss_step=0.000865, global_step=1640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   4%|▍         | 3/80 [00:53<17:00, 13.25s/it, loss=0.00169, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=4.25e-6, train/loss_step=0.000865, global_step=1640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   4%|▍         | 3/80 [00:53<17:00, 13.25s/it, loss=0.0014, v_num=0, train/loss_simple_step=0.000576, train/loss_vlb_step=2.81e-6, train/loss_step=0.000576, global_step=1640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369] Epoch 82:   5%|▌         | 4/80 [00:53<13:33, 10.71s/it, loss=0.0014, v_num=0, train/loss_simple_step=0.000576, train/loss_vlb_step=2.81e-6, train/loss_step=0.000576, global_step=1640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   5%|▌         | 4/80 [00:53<13:33, 10.71s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.66e-5, train/loss_step=0.0111, global_step=1640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]    Epoch 82:   6%|▋         | 5/80 [00:54<11:15,  9.01s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.66e-5, train/loss_step=0.0111, global_step=1640.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   6%|▋         | 5/80 [00:54<11:15,  9.01s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000163, train/loss_vlb_step=6.51e-7, train/loss_step=0.000163, global_step=1641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   8%|▊         | 6/80 [00:54<09:36,  7.79s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000163, train/loss_vlb_step=6.51e-7, train/loss_step=0.000163, global_step=1641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   8%|▊         | 6/80 [00:54<09:36,  7.79s/it, loss=0.00166, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=8.81e-7, train/loss_step=0.000168, global_step=1641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   9%|▉         | 7/80 [00:55<08:22,  6.88s/it, loss=0.00166, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=8.81e-7, train/loss_step=0.000168, global_step=1641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:   9%|▉         | 7/80 [00:55<08:22,  6.88s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=2.02e-5, train/loss_step=0.0059, global_step=1641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]    Epoch 82:  10%|█         | 8/80 [01:19<10:39,  8.88s/it, loss=0.00193, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=2.02e-5, train/loss_step=0.0059, global_step=1641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  10%|█         | 8/80 [01:19<10:39,  8.88s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.000699, train/loss_vlb_step=6.88e-6, train/loss_step=0.000699, global_step=1641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  11%|█▏        | 9/80 [01:20<09:31,  8.04s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.000699, train/loss_vlb_step=6.88e-6, train/loss_step=0.000699, global_step=1641.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  11%|█▏        | 9/80 [01:20<09:31,  8.04s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=3.06e-5, train/loss_step=0.00551, global_step=1642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  12%|█▎        | 10/80 [01:27<09:14,  7.92s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=3.06e-5, train/loss_step=0.00551, global_step=1642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  12%|█▎        | 10/80 [01:27<09:14,  7.92s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=7.92e-6, train/loss_step=0.00158, global_step=1642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  14%|█▍        | 11/80 [01:35<09:11,  8.00s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=7.92e-6, train/loss_step=0.00158, global_step=1642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  14%|█▍        | 11/80 [01:35<09:11,  8.00s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=9.41e-7, train/loss_step=0.000207, global_step=1642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  15%|█▌        | 12/80 [01:36<08:24,  7.42s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=9.41e-7, train/loss_step=0.000207, global_step=1642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  15%|█▌        | 12/80 [01:36<08:24,  7.42s/it, loss=0.00186, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=1.02e-6, train/loss_step=0.000227, global_step=1642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  16%|█▋        | 13/80 [01:37<07:44,  6.93s/it, loss=0.00186, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=1.02e-6, train/loss_step=0.000227, global_step=1642.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  16%|█▋        | 13/80 [01:37<07:44,  6.93s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=3.48e-6, train/loss_step=0.000399, global_step=1643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  18%|█▊        | 14/80 [01:37<07:09,  6.50s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=3.48e-6, train/loss_step=0.000399, global_step=1643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  18%|█▊        | 14/80 [01:37<07:09,  6.50s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.000107, train/loss_vlb_step=4.04e-7, train/loss_step=0.000107, global_step=1643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  19%|█▉        | 15/80 [01:37<06:38,  6.12s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.000107, train/loss_vlb_step=4.04e-7, train/loss_step=0.000107, global_step=1643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  19%|█▉        | 15/80 [01:37<06:38,  6.12s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000799, train/loss_vlb_step=3.61e-6, train/loss_step=0.000799, global_step=1643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  20%|██        | 16/80 [02:02<07:41,  7.22s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000799, train/loss_vlb_step=3.61e-6, train/loss_step=0.000799, global_step=1643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  20%|██        | 16/80 [02:02<07:41,  7.22s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.25e-6, train/loss_step=0.00028, global_step=1643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  21%|██▏       | 17/80 [02:08<07:31,  7.17s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=1.25e-6, train/loss_step=0.00028, global_step=1643.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  21%|██▏       | 17/80 [02:08<07:31,  7.17s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.58e-6, train/loss_step=0.000312, global_step=1644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  22%|██▎       | 18/80 [02:09<07:02,  6.81s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.58e-6, train/loss_step=0.000312, global_step=1644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  22%|██▎       | 18/80 [02:09<07:02,  6.81s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=7.61e-5, train/loss_step=0.015, global_step=1644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]      Epoch 82:  24%|██▍       | 19/80 [02:09<06:36,  6.50s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=7.61e-5, train/loss_step=0.015, global_step=1644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  24%|██▍       | 19/80 [02:09<06:36,  6.50s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=1.61e-5, train/loss_step=0.0048, global_step=1644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  25%|██▌       | 20/80 [02:10<06:12,  6.22s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=1.61e-5, train/loss_step=0.0048, global_step=1644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  25%|██▌       | 20/80 [02:10<06:12,  6.22s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000108, train/loss_step=0.0255, global_step=1644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  26%|██▋       | 21/80 [02:22<06:21,  6.47s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000108, train/loss_step=0.0255, global_step=1644.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  26%|██▋       | 21/80 [02:22<06:21,  6.47s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=4.47e-5, train/loss_step=0.0118, global_step=1645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  28%|██▊       | 22/80 [02:22<06:00,  6.21s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=4.47e-5, train/loss_step=0.0118, global_step=1645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  28%|██▊       | 22/80 [02:22<06:00,  6.21s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00054, train/loss_vlb_step=2.63e-5, train/loss_step=0.00054, global_step=1645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  29%|██▉       | 23/80 [02:23<05:40,  5.97s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00054, train/loss_vlb_step=2.63e-5, train/loss_step=0.00054, global_step=1645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  29%|██▉       | 23/80 [02:23<05:40,  5.97s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000704, train/loss_vlb_step=2.97e-6, train/loss_step=0.000704, global_step=1645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  30%|███       | 24/80 [02:35<05:47,  6.20s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000704, train/loss_vlb_step=2.97e-6, train/loss_step=0.000704, global_step=1645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  30%|███       | 24/80 [02:35<05:47,  6.20s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=8.79e-5, train/loss_step=0.0116, global_step=1645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]    Epoch 82:  31%|███▏      | 25/80 [02:46<05:52,  6.42s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=8.79e-5, train/loss_step=0.0116, global_step=1645.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  31%|███▏      | 25/80 [02:46<05:52,  6.42s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=4.04e-5, train/loss_step=0.00543, global_step=1646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  32%|███▎      | 26/80 [02:47<05:34,  6.20s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=4.04e-5, train/loss_step=0.00543, global_step=1646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  32%|███▎      | 26/80 [02:47<05:34,  6.20s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.49e-6, train/loss_step=0.000291, global_step=1646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  34%|███▍      | 27/80 [02:47<05:17,  5.99s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.49e-6, train/loss_step=0.000291, global_step=1646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  34%|███▍      | 27/80 [02:47<05:17,  5.99s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=6.79e-6, train/loss_step=0.0011, global_step=1646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]    Epoch 82:  35%|███▌      | 28/80 [02:48<05:02,  5.81s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=6.79e-6, train/loss_step=0.0011, global_step=1646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  35%|███▌      | 28/80 [02:48<05:02,  5.81s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=1.52e-5, train/loss_step=0.00431, global_step=1646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  36%|███▋      | 29/80 [03:07<05:19,  6.26s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=1.52e-5, train/loss_step=0.00431, global_step=1646.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  36%|███▋      | 29/80 [03:07<05:19,  6.26s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00895, train/loss_vlb_step=6.51e-5, train/loss_step=0.00895, global_step=1647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369] Epoch 82:  38%|███▊      | 30/80 [03:08<05:03,  6.08s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00895, train/loss_vlb_step=6.51e-5, train/loss_step=0.00895, global_step=1647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  38%|███▊      | 30/80 [03:08<05:03,  6.08s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=8.83e-7, train/loss_step=0.000228, global_step=1647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  39%|███▉      | 31/80 [03:08<04:49,  5.90s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=8.83e-7, train/loss_step=0.000228, global_step=1647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  39%|███▉      | 31/80 [03:08<04:49,  5.90s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=9.42e-5, train/loss_step=0.00911, global_step=1647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  40%|████      | 32/80 [03:13<04:41,  5.87s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00911, train/loss_vlb_step=9.42e-5, train/loss_step=0.00911, global_step=1647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  40%|████      | 32/80 [03:13<04:41,  5.87s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.0119, train/loss_step=0.0327, global_step=1647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]    Epoch 82:  41%|████▏     | 33/80 [03:30<04:50,  6.18s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.0327, train/loss_vlb_step=0.0119, train/loss_step=0.0327, global_step=1647.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  41%|████▏     | 33/80 [03:30<04:50,  6.18s/it, loss=0.00682, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=9.45e-6, train/loss_step=0.00271, global_step=1648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  42%|████▎     | 34/80 [03:30<04:36,  6.01s/it, loss=0.00682, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=9.45e-6, train/loss_step=0.00271, global_step=1648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  42%|████▎     | 34/80 [03:30<04:36,  6.01s/it, loss=0.00685, v_num=0, train/loss_simple_step=0.000848, train/loss_vlb_step=4.63e-6, train/loss_step=0.000848, global_step=1648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  44%|████▍     | 35/80 [03:31<04:23,  5.86s/it, loss=0.00685, v_num=0, train/loss_simple_step=0.000848, train/loss_vlb_step=4.63e-6, train/loss_step=0.000848, global_step=1648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  44%|████▍     | 35/80 [03:31<04:23,  5.86s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=1.58e-5, train/loss_step=0.00474, global_step=1648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  45%|████▌     | 36/80 [03:31<04:11,  5.72s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=1.58e-5, train/loss_step=0.00474, global_step=1648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  45%|████▌     | 36/80 [03:31<04:11,  5.72s/it, loss=0.00708, v_num=0, train/loss_simple_step=0.000781, train/loss_vlb_step=4.11e-6, train/loss_step=0.000781, global_step=1648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  46%|████▋     | 37/80 [03:52<04:22,  6.11s/it, loss=0.00708, v_num=0, train/loss_simple_step=0.000781, train/loss_vlb_step=4.11e-6, train/loss_step=0.000781, global_step=1648.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  46%|████▋     | 37/80 [03:52<04:22,  6.11s/it, loss=0.00709, v_num=0, train/loss_simple_step=0.000686, train/loss_vlb_step=9.72e-6, train/loss_step=0.000686, global_step=1649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  48%|████▊     | 38/80 [03:52<04:10,  5.97s/it, loss=0.00709, v_num=0, train/loss_simple_step=0.000686, train/loss_vlb_step=9.72e-6, train/loss_step=0.000686, global_step=1649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  48%|████▊     | 38/80 [03:52<04:10,  5.97s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.15e-6, train/loss_step=0.000256, global_step=1649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  49%|████▉     | 39/80 [03:53<03:59,  5.83s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.15e-6, train/loss_step=0.000256, global_step=1649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  49%|████▉     | 39/80 [03:53<03:59,  5.83s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.52e-6, train/loss_step=0.000237, global_step=1649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  50%|█████     | 40/80 [03:53<03:48,  5.71s/it, loss=0.00613, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.52e-6, train/loss_step=0.000237, global_step=1649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  50%|█████     | 40/80 [03:53<03:48,  5.71s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=2.76e-5, train/loss_step=0.00787, global_step=1649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  51%|█████▏    | 41/80 [04:17<03:58,  6.12s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00787, train/loss_vlb_step=2.76e-5, train/loss_step=0.00787, global_step=1649.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  51%|█████▏    | 41/80 [04:17<03:58,  6.12s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000681, train/loss_vlb_step=2.96e-6, train/loss_step=0.000681, global_step=1650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  52%|█████▎    | 42/80 [04:17<03:47,  5.99s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000681, train/loss_vlb_step=2.96e-6, train/loss_step=0.000681, global_step=1650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  52%|█████▎    | 42/80 [04:17<03:47,  5.99s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.16e-5, train/loss_step=0.0105, global_step=1650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]    Epoch 82:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.16e-5, train/loss_step=0.0105, global_step=1650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  54%|█████▍    | 43/80 [04:28<03:45,  6.10s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=3.47e-5, train/loss_step=0.0025, global_step=1650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  55%|█████▌    | 44/80 [04:29<03:35,  5.98s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=3.47e-5, train/loss_step=0.0025, global_step=1650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  55%|█████▌    | 44/80 [04:29<03:35,  5.98s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000955, train/loss_vlb_step=2.39e-5, train/loss_step=0.000955, global_step=1650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  56%|█████▋    | 45/80 [04:41<03:33,  6.11s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000955, train/loss_vlb_step=2.39e-5, train/loss_step=0.000955, global_step=1650.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  56%|█████▋    | 45/80 [04:41<03:33,  6.11s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=8.72e-6, train/loss_step=0.00102, global_step=1651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  57%|█████▊    | 46/80 [04:41<03:23,  5.99s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=8.72e-6, train/loss_step=0.00102, global_step=1651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  57%|█████▊    | 46/80 [04:41<03:23,  5.99s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.7e-6, train/loss_step=0.000641, global_step=1651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  59%|█████▉    | 47/80 [04:42<03:14,  5.88s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=2.7e-6, train/loss_step=0.000641, global_step=1651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  59%|█████▉    | 47/80 [04:42<03:14,  5.88s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=5.59e-5, train/loss_step=0.0101, global_step=1651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]   Epoch 82:  60%|██████    | 48/80 [04:43<03:04,  5.78s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=5.59e-5, train/loss_step=0.0101, global_step=1651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  60%|██████    | 48/80 [04:43<03:04,  5.78s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.06e-5, train/loss_step=0.00218, global_step=1651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  61%|██████▏   | 49/80 [04:58<03:04,  5.96s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.06e-5, train/loss_step=0.00218, global_step=1651.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  61%|██████▏   | 49/80 [04:58<03:04,  5.96s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.21e-6, train/loss_step=0.00116, global_step=1652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369] Epoch 82:  62%|██████▎   | 50/80 [04:58<02:55,  5.86s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=4.21e-6, train/loss_step=0.00116, global_step=1652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  62%|██████▎   | 50/80 [04:58<02:55,  5.86s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=2.07e-5, train/loss_step=0.000956, global_step=1652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  64%|██████▍   | 51/80 [05:07<02:51,  5.92s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000956, train/loss_vlb_step=2.07e-5, train/loss_step=0.000956, global_step=1652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  64%|██████▍   | 51/80 [05:07<02:51,  5.92s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=6.57e-6, train/loss_step=0.000928, global_step=1652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  65%|██████▌   | 52/80 [05:08<02:42,  5.82s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=6.57e-6, train/loss_step=0.000928, global_step=1652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  65%|██████▌   | 52/80 [05:08<02:42,  5.82s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=8.12e-5, train/loss_step=0.0179, global_step=1652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]    Epoch 82:  66%|██████▋   | 53/80 [05:27<02:43,  6.06s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=8.12e-5, train/loss_step=0.0179, global_step=1652.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  66%|██████▋   | 53/80 [05:27<02:43,  6.06s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=4.14e-6, train/loss_step=0.000714, global_step=1653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  68%|██████▊   | 54/80 [05:27<02:34,  5.96s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000714, train/loss_vlb_step=4.14e-6, train/loss_step=0.000714, global_step=1653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  68%|██████▊   | 54/80 [05:27<02:34,  5.96s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=4.68e-6, train/loss_step=0.000637, global_step=1653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  69%|██████▉   | 55/80 [05:28<02:26,  5.86s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000637, train/loss_vlb_step=4.68e-6, train/loss_step=0.000637, global_step=1653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  69%|██████▉   | 55/80 [05:28<02:26,  5.86s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=7.65e-6, train/loss_step=0.000678, global_step=1653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  70%|███████   | 56/80 [05:28<02:18,  5.77s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000678, train/loss_vlb_step=7.65e-6, train/loss_step=0.000678, global_step=1653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  70%|███████   | 56/80 [05:28<02:18,  5.77s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=8e-6, train/loss_step=0.00182, global_step=1653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]     Epoch 82:  71%|███████▏  | 57/80 [05:29<02:10,  5.68s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=8e-6, train/loss_step=0.00182, global_step=1653.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  71%|███████▏  | 57/80 [05:29<02:10,  5.68s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=2.77e-6, train/loss_step=0.000564, global_step=1654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  72%|███████▎  | 58/80 [05:29<02:03,  5.59s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=2.77e-6, train/loss_step=0.000564, global_step=1654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  72%|███████▎  | 58/80 [05:29<02:03,  5.59s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=0.000112, train/loss_step=0.020, global_step=1654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]      Epoch 82:  74%|███████▍  | 59/80 [05:51<02:03,  5.87s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.020, train/loss_vlb_step=0.000112, train/loss_step=0.020, global_step=1654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  74%|███████▍  | 59/80 [05:51<02:03,  5.87s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000837, train/loss_vlb_step=4.35e-6, train/loss_step=0.000837, global_step=1654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  75%|███████▌  | 60/80 [05:52<01:55,  5.78s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000837, train/loss_vlb_step=4.35e-6, train/loss_step=0.000837, global_step=1654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  75%|███████▌  | 60/80 [05:52<01:55,  5.78s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=1.26e-6, train/loss_step=0.000349, global_step=1654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  76%|███████▋  | 61/80 [06:11<01:53,  5.99s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=1.26e-6, train/loss_step=0.000349, global_step=1654.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  76%|███████▋  | 61/80 [06:11<01:53,  5.99s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00991, train/loss_vlb_step=3.67e-5, train/loss_step=0.00991, global_step=1655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  78%|███████▊  | 62/80 [06:16<01:47,  5.98s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00991, train/loss_vlb_step=3.67e-5, train/loss_step=0.00991, global_step=1655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  78%|███████▊  | 62/80 [06:16<01:47,  5.98s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=1.73e-5, train/loss_step=0.00488, global_step=1655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  79%|███████▉  | 63/80 [06:17<01:40,  5.90s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00488, train/loss_vlb_step=1.73e-5, train/loss_step=0.00488, global_step=1655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  79%|███████▉  | 63/80 [06:17<01:40,  5.90s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=2.29e-6, train/loss_step=0.000494, global_step=1655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  80%|████████  | 64/80 [06:17<01:33,  5.81s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=2.29e-6, train/loss_step=0.000494, global_step=1655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  80%|████████  | 64/80 [06:17<01:33,  5.81s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=6.12e-6, train/loss_step=0.00132, global_step=1655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  81%|████████▏ | 65/80 [06:18<01:26,  5.73s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=6.12e-6, train/loss_step=0.00132, global_step=1655.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  81%|████████▏ | 65/80 [06:18<01:26,  5.73s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.59e-5, train/loss_step=0.00452, global_step=1656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  82%|████████▎ | 66/80 [06:18<01:19,  5.66s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=2.59e-5, train/loss_step=0.00452, global_step=1656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  82%|████████▎ | 66/80 [06:18<01:19,  5.66s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.84e-6, train/loss_step=0.000422, global_step=1656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  84%|████████▍ | 67/80 [06:24<01:13,  5.66s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.84e-6, train/loss_step=0.000422, global_step=1656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  84%|████████▍ | 67/80 [06:24<01:13,  5.66s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.56e-6, train/loss_step=0.000311, global_step=1656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  85%|████████▌ | 68/80 [06:25<01:06,  5.58s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.56e-6, train/loss_step=0.000311, global_step=1656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  85%|████████▌ | 68/80 [06:25<01:06,  5.58s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=3.37e-6, train/loss_step=0.000825, global_step=1656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  86%|████████▋ | 69/80 [06:47<01:04,  5.82s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=3.37e-6, train/loss_step=0.000825, global_step=1656.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  86%|████████▋ | 69/80 [06:47<01:04,  5.82s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=6.36e-7, train/loss_step=0.00017, global_step=1657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  88%|████████▊ | 70/80 [06:49<00:57,  5.76s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=6.36e-7, train/loss_step=0.00017, global_step=1657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  88%|████████▊ | 70/80 [06:49<00:57,  5.76s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.33e-6, train/loss_step=0.000242, global_step=1657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  89%|████████▉ | 71/80 [06:49<00:51,  5.69s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.33e-6, train/loss_step=0.000242, global_step=1657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  89%|████████▉ | 71/80 [06:49<00:51,  5.69s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=7.18e-6, train/loss_step=0.00151, global_step=1657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]   Epoch 82:  90%|█████████ | 72/80 [06:50<00:44,  5.62s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=7.18e-6, train/loss_step=0.00151, global_step=1657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  90%|█████████ | 72/80 [06:50<00:44,  5.62s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=2.13e-6, train/loss_step=0.000305, global_step=1657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  91%|█████████▏| 73/80 [06:50<00:38,  5.55s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=2.13e-6, train/loss_step=0.000305, global_step=1657.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  91%|█████████▏| 73/80 [06:50<00:38,  5.55s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.09e-5, train/loss_step=0.00246, global_step=1658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 82:  92%|█████████▎| 74/80 [06:51<00:32,  5.48s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=1.09e-5, train/loss_step=0.00246, global_step=1658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  92%|█████████▎| 74/80 [06:51<00:32,  5.48s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=2.28e-6, train/loss_step=0.000381, global_step=1658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  94%|█████████▍| 75/80 [06:52<00:27,  5.43s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=2.28e-6, train/loss_step=0.000381, global_step=1658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  94%|█████████▍| 75/80 [06:52<00:27,  5.43s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=9.14e-6, train/loss_step=0.0023, global_step=1658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]   Epoch 82:  95%|█████████▌| 76/80 [06:53<00:21,  5.38s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=9.14e-6, train/loss_step=0.0023, global_step=1658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  95%|█████████▌| 76/80 [06:53<00:21,  5.38s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=2.21e-5, train/loss_step=0.0011, global_step=1658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  96%|█████████▋| 77/80 [07:23<00:17,  5.69s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=2.21e-5, train/loss_step=0.0011, global_step=1658.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  96%|█████████▋| 77/80 [07:23<00:17,  5.69s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.47e-5, train/loss_step=0.0237, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369] Epoch 82:  98%|█████████▊| 78/80 [07:24<00:11,  5.63s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.0237, train/loss_vlb_step=9.47e-5, train/loss_step=0.0237, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  98%|█████████▊| 78/80 [07:24<00:11,  5.63s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000504, train/loss_vlb_step=2.57e-6, train/loss_step=0.000504, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  99%|█████████▉| 79/80 [07:25<00:05,  5.56s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000504, train/loss_vlb_step=2.57e-6, train/loss_step=0.000504, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82:  99%|█████████▉| 79/80 [07:25<00:05,  5.56s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=8.78e-6, train/loss_step=0.000558, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82: 100%|██████████| 80/80 [07:25<00:00,  5.50s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=8.78e-6, train/loss_step=0.000558, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 82: 100%|██████████| 80/80 [07:25<00:00,  5.50s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.03e-5, train/loss_step=0.00519, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Average Epoch time: 445.58 seconds
+Average Peak memory 29562.01MiB
+Epoch 82:   0%|          | 0/80 [00:00<00:00, 3663.15it/s, loss=0.00306, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.03e-5, train/loss_step=0.00519, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 83:   0%|          | 0/80 [00:00<00:00, 1702.92it/s, loss=0.00306, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.03e-5, train/loss_step=0.00519, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]Epoch 83:   1%|▏         | 1/80 [00:45<29:49, 22.65s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=2.03e-5, train/loss_step=0.00519, global_step=1659.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=6.03e-5, train/loss_epoch=0.00369]  Epoch 83:   1%|▏         | 1/80 [00:45<29:49, 22.65s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000616, train/loss_vlb_step=4.56e-6, train/loss_step=0.000616, global_step=1660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   2%|▎         | 2/80 [00:45<19:50, 15.26s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000616, train/loss_vlb_step=4.56e-6, train/loss_step=0.000616, global_step=1660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   2%|▎         | 2/80 [00:45<19:50, 15.26s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=2.03e-5, train/loss_step=0.00607, global_step=1660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:   4%|▍         | 3/80 [00:46<14:50, 11.57s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=2.03e-5, train/loss_step=0.00607, global_step=1660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   4%|▍         | 3/80 [00:46<14:50, 11.57s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.00073, train/loss_vlb_step=8.75e-6, train/loss_step=0.00073, global_step=1660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   5%|▌         | 4/80 [00:46<11:51,  9.36s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.00073, train/loss_vlb_step=8.75e-6, train/loss_step=0.00073, global_step=1660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   5%|▌         | 4/80 [00:46<11:51,  9.36s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.09e-5, train/loss_step=0.00289, global_step=1660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   6%|▋         | 5/80 [00:47<09:51,  7.88s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00289, train/loss_vlb_step=1.09e-5, train/loss_step=0.00289, global_step=1660.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   6%|▋         | 5/80 [00:47<09:51,  7.88s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.61e-6, train/loss_step=0.00207, global_step=1661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   8%|▊         | 6/80 [00:47<08:25,  6.83s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.61e-6, train/loss_step=0.00207, global_step=1661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   8%|▊         | 6/80 [00:47<08:25,  6.83s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=9.54e-6, train/loss_step=0.00192, global_step=1661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   9%|▉         | 7/80 [00:48<07:20,  6.04s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=9.54e-6, train/loss_step=0.00192, global_step=1661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:   9%|▉         | 7/80 [00:48<07:20,  6.04s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.1e-6, train/loss_step=0.000285, global_step=1661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  10%|█         | 8/80 [01:04<08:33,  7.13s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.1e-6, train/loss_step=0.000285, global_step=1661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  10%|█         | 8/80 [01:04<08:33,  7.13s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.87e-5, train/loss_step=0.00671, global_step=1661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432] Epoch 83:  11%|█▏        | 9/80 [01:29<10:32,  8.91s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.87e-5, train/loss_step=0.00671, global_step=1661.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  11%|█▏        | 9/80 [01:29<10:32,  8.91s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.49e-6, train/loss_step=0.00155, global_step=1662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  12%|█▎        | 10/80 [01:29<09:29,  8.14s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.49e-6, train/loss_step=0.00155, global_step=1662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  12%|█▎        | 10/80 [01:29<09:29,  8.14s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=4.27e-5, train/loss_step=0.00182, global_step=1662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  14%|█▍        | 11/80 [01:30<08:37,  7.50s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=4.27e-5, train/loss_step=0.00182, global_step=1662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  14%|█▍        | 11/80 [01:30<08:37,  7.50s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=9.43e-5, train/loss_step=0.00273, global_step=1662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  15%|█▌        | 12/80 [01:30<07:54,  6.98s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=9.43e-5, train/loss_step=0.00273, global_step=1662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  15%|█▌        | 12/80 [01:30<07:54,  6.98s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=6.57e-5, train/loss_step=0.00764, global_step=1662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  16%|█▋        | 13/80 [01:31<07:16,  6.52s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=6.57e-5, train/loss_step=0.00764, global_step=1662.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  16%|█▋        | 13/80 [01:31<07:16,  6.52s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=2.6e-6, train/loss_step=0.000562, global_step=1663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  18%|█▊        | 14/80 [01:31<06:43,  6.12s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000562, train/loss_vlb_step=2.6e-6, train/loss_step=0.000562, global_step=1663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  18%|█▊        | 14/80 [01:31<06:43,  6.12s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000799, train/loss_vlb_step=8.19e-6, train/loss_step=0.000799, global_step=1663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  19%|█▉        | 15/80 [01:32<06:14,  5.77s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.000799, train/loss_vlb_step=8.19e-6, train/loss_step=0.000799, global_step=1663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  19%|█▉        | 15/80 [01:32<06:14,  5.77s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.17e-6, train/loss_step=0.000573, global_step=1663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432] Epoch 83:  20%|██        | 16/80 [01:51<06:59,  6.55s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.17e-6, train/loss_step=0.000573, global_step=1663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  20%|██        | 16/80 [01:51<06:59,  6.55s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=8.72e-6, train/loss_step=0.00166, global_step=1663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432] Epoch 83:  21%|██▏       | 17/80 [02:10<07:38,  7.27s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=8.72e-6, train/loss_step=0.00166, global_step=1663.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  21%|██▏       | 17/80 [02:10<07:38,  7.27s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000145, train/loss_step=0.0192, global_step=1664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  22%|██▎       | 18/80 [02:11<07:08,  6.92s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000145, train/loss_step=0.0192, global_step=1664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  22%|██▎       | 18/80 [02:11<07:08,  6.92s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=3.59e-5, train/loss_step=0.00951, global_step=1664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  24%|██▍       | 19/80 [02:11<06:42,  6.60s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00951, train/loss_vlb_step=3.59e-5, train/loss_step=0.00951, global_step=1664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  24%|██▍       | 19/80 [02:11<06:42,  6.60s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.04e-5, train/loss_step=0.00313, global_step=1664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  25%|██▌       | 20/80 [02:12<06:18,  6.32s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.04e-5, train/loss_step=0.00313, global_step=1664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  25%|██▌       | 20/80 [02:12<06:18,  6.32s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=3.7e-5, train/loss_step=0.00545, global_step=1664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432] Epoch 83:  26%|██▋       | 21/80 [02:13<05:57,  6.06s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=3.7e-5, train/loss_step=0.00545, global_step=1664.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  26%|██▋       | 21/80 [02:13<05:57,  6.06s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=7.69e-5, train/loss_step=0.0132, global_step=1665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432] Epoch 83:  28%|██▊       | 22/80 [02:13<05:37,  5.82s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0132, train/loss_vlb_step=7.69e-5, train/loss_step=0.0132, global_step=1665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  28%|██▊       | 22/80 [02:13<05:37,  5.82s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.37e-6, train/loss_step=0.00137, global_step=1665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  29%|██▉       | 23/80 [02:14<05:19,  5.60s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=5.37e-6, train/loss_step=0.00137, global_step=1665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  29%|██▉       | 23/80 [02:14<05:19,  5.60s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=9.55e-6, train/loss_step=0.00276, global_step=1665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  30%|███       | 24/80 [02:28<05:32,  5.94s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00276, train/loss_vlb_step=9.55e-6, train/loss_step=0.00276, global_step=1665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  30%|███       | 24/80 [02:28<05:32,  5.94s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=9.17e-7, train/loss_step=0.000208, global_step=1665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  31%|███▏      | 25/80 [02:50<06:01,  6.57s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=9.17e-7, train/loss_step=0.000208, global_step=1665.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  31%|███▏      | 25/80 [02:50<06:01,  6.57s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=9.46e-5, train/loss_step=0.0116, global_step=1666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]    Epoch 83:  32%|███▎      | 26/80 [02:51<05:42,  6.34s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=9.46e-5, train/loss_step=0.0116, global_step=1666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  32%|███▎      | 26/80 [02:51<05:42,  6.34s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.24e-6, train/loss_step=0.000298, global_step=1666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  34%|███▍      | 27/80 [02:51<05:25,  6.13s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.24e-6, train/loss_step=0.000298, global_step=1666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  34%|███▍      | 27/80 [02:51<05:25,  6.13s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=1.83e-6, train/loss_step=0.000497, global_step=1666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  35%|███▌      | 28/80 [02:52<05:08,  5.94s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=1.83e-6, train/loss_step=0.000497, global_step=1666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  35%|███▌      | 28/80 [02:52<05:08,  5.94s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=6.75e-5, train/loss_step=0.00964, global_step=1666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  36%|███▋      | 29/80 [02:58<05:02,  5.94s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=6.75e-5, train/loss_step=0.00964, global_step=1666.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  36%|███▋      | 29/80 [02:58<05:02,  5.94s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=1.83e-6, train/loss_step=0.000482, global_step=1667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  38%|███▊      | 30/80 [02:58<04:48,  5.76s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000482, train/loss_vlb_step=1.83e-6, train/loss_step=0.000482, global_step=1667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  38%|███▊      | 30/80 [02:58<04:48,  5.76s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=9.07e-5, train/loss_step=0.015, global_step=1667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]      Epoch 83:  39%|███▉      | 31/80 [02:59<04:34,  5.60s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=9.07e-5, train/loss_step=0.015, global_step=1667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  39%|███▉      | 31/80 [02:59<04:34,  5.60s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=3.49e-5, train/loss_step=0.00733, global_step=1667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  40%|████      | 32/80 [03:21<04:53,  6.12s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=3.49e-5, train/loss_step=0.00733, global_step=1667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  40%|████      | 32/80 [03:21<04:53,  6.12s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.24e-5, train/loss_step=0.0124, global_step=1667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  41%|████▏     | 33/80 [03:44<05:09,  6.59s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.24e-5, train/loss_step=0.0124, global_step=1667.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  41%|████▏     | 33/80 [03:44<05:09,  6.59s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000133, train/loss_step=0.0185, global_step=1668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  42%|████▎     | 34/80 [03:44<04:55,  6.42s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000133, train/loss_step=0.0185, global_step=1668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  42%|████▎     | 34/80 [03:44<04:55,  6.42s/it, loss=0.00666, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=5.92e-6, train/loss_step=0.000433, global_step=1668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  44%|████▍     | 35/80 [03:45<04:41,  6.26s/it, loss=0.00666, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=5.92e-6, train/loss_step=0.000433, global_step=1668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  44%|████▍     | 35/80 [03:45<04:41,  6.26s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.62e-5, train/loss_step=0.013, global_step=1668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]      Epoch 83:  45%|████▌     | 36/80 [03:45<04:28,  6.10s/it, loss=0.00729, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.62e-5, train/loss_step=0.013, global_step=1668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  45%|████▌     | 36/80 [03:45<04:28,  6.10s/it, loss=0.00738, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.38e-5, train/loss_step=0.00364, global_step=1668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  46%|████▋     | 37/80 [03:46<04:16,  5.95s/it, loss=0.00738, v_num=0, train/loss_simple_step=0.00364, train/loss_vlb_step=1.38e-5, train/loss_step=0.00364, global_step=1668.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  46%|████▋     | 37/80 [03:46<04:16,  5.95s/it, loss=0.00698, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.39e-5, train/loss_step=0.0111, global_step=1669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  48%|████▊     | 38/80 [03:46<04:04,  5.81s/it, loss=0.00698, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.39e-5, train/loss_step=0.0111, global_step=1669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  48%|████▊     | 38/80 [03:46<04:04,  5.81s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.000111, train/loss_vlb_step=4.35e-7, train/loss_step=0.000111, global_step=1669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  49%|████▉     | 39/80 [03:47<03:52,  5.68s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.000111, train/loss_vlb_step=4.35e-7, train/loss_step=0.000111, global_step=1669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  49%|████▉     | 39/80 [03:47<03:52,  5.68s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=1.49e-5, train/loss_step=0.00438, global_step=1669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  50%|█████     | 40/80 [03:55<03:49,  5.75s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=1.49e-5, train/loss_step=0.00438, global_step=1669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  50%|█████     | 40/80 [03:55<03:49,  5.75s/it, loss=0.00634, v_num=0, train/loss_simple_step=0.000758, train/loss_vlb_step=1.51e-5, train/loss_step=0.000758, global_step=1669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  51%|█████▏    | 41/80 [04:24<04:05,  6.30s/it, loss=0.00634, v_num=0, train/loss_simple_step=0.000758, train/loss_vlb_step=1.51e-5, train/loss_step=0.000758, global_step=1669.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  51%|█████▏    | 41/80 [04:24<04:05,  6.30s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=4.45e-6, train/loss_step=0.000968, global_step=1670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  52%|█████▎    | 42/80 [04:24<03:54,  6.16s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=4.45e-6, train/loss_step=0.000968, global_step=1670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  52%|█████▎    | 42/80 [04:24<03:54,  6.16s/it, loss=0.00693, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000359, train/loss_step=0.0254, global_step=1670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]   Epoch 83:  54%|█████▍    | 43/80 [04:25<03:43,  6.03s/it, loss=0.00693, v_num=0, train/loss_simple_step=0.0254, train/loss_vlb_step=0.000359, train/loss_step=0.0254, global_step=1670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  54%|█████▍    | 43/80 [04:25<03:43,  6.03s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.00067, train/loss_vlb_step=3.65e-6, train/loss_step=0.00067, global_step=1670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  55%|█████▌    | 44/80 [04:26<03:32,  5.91s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.00067, train/loss_vlb_step=3.65e-6, train/loss_step=0.00067, global_step=1670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  55%|█████▌    | 44/80 [04:26<03:32,  5.91s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=1.69e-5, train/loss_step=0.00474, global_step=1670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  56%|█████▋    | 45/80 [04:26<03:22,  5.80s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.00474, train/loss_vlb_step=1.69e-5, train/loss_step=0.00474, global_step=1670.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  56%|█████▋    | 45/80 [04:26<03:22,  5.80s/it, loss=0.00732, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000142, train/loss_step=0.017, global_step=1671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]   Epoch 83:  57%|█████▊    | 46/80 [04:27<03:13,  5.68s/it, loss=0.00732, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000142, train/loss_step=0.017, global_step=1671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  57%|█████▊    | 46/80 [04:27<03:13,  5.68s/it, loss=0.00732, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=2.06e-6, train/loss_step=0.000332, global_step=1671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  59%|█████▉    | 47/80 [04:27<03:03,  5.58s/it, loss=0.00732, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=2.06e-6, train/loss_step=0.000332, global_step=1671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  59%|█████▉    | 47/80 [04:27<03:03,  5.58s/it, loss=0.00731, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.62e-7, train/loss_step=0.000207, global_step=1671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  60%|██████    | 48/80 [04:38<03:01,  5.69s/it, loss=0.00731, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.62e-7, train/loss_step=0.000207, global_step=1671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  60%|██████    | 48/80 [04:38<03:01,  5.69s/it, loss=0.00716, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=2.55e-5, train/loss_step=0.00667, global_step=1671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  61%|██████▏   | 49/80 [05:06<03:09,  6.12s/it, loss=0.00716, v_num=0, train/loss_simple_step=0.00667, train/loss_vlb_step=2.55e-5, train/loss_step=0.00667, global_step=1671.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  61%|██████▏   | 49/80 [05:06<03:09,  6.12s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=2.22e-6, train/loss_step=0.000351, global_step=1672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  62%|██████▎   | 50/80 [05:06<03:00,  6.01s/it, loss=0.00715, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=2.22e-6, train/loss_step=0.000351, global_step=1672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  62%|██████▎   | 50/80 [05:06<03:00,  6.01s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=8.63e-6, train/loss_step=0.00203, global_step=1672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]   Epoch 83:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=8.63e-6, train/loss_step=0.00203, global_step=1672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  64%|██████▍   | 51/80 [05:07<02:51,  5.91s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=1.01e-6, train/loss_step=0.000227, global_step=1672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  65%|██████▌   | 52/80 [05:07<02:42,  5.81s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=1.01e-6, train/loss_step=0.000227, global_step=1672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  65%|██████▌   | 52/80 [05:07<02:42,  5.81s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=1.28e-6, train/loss_step=0.000288, global_step=1672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  66%|██████▋   | 53/80 [05:08<02:34,  5.71s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=1.28e-6, train/loss_step=0.000288, global_step=1672.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  66%|██████▋   | 53/80 [05:08<02:34,  5.71s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.43e-6, train/loss_step=0.00056, global_step=1673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  68%|██████▊   | 54/80 [05:08<02:25,  5.61s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=2.43e-6, train/loss_step=0.00056, global_step=1673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  68%|██████▊   | 54/80 [05:08<02:25,  5.61s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=3.05e-5, train/loss_step=0.00897, global_step=1673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  69%|██████▉   | 55/80 [05:09<02:18,  5.52s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00897, train/loss_vlb_step=3.05e-5, train/loss_step=0.00897, global_step=1673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  69%|██████▉   | 55/80 [05:09<02:18,  5.52s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000491, train/loss_vlb_step=7.41e-6, train/loss_step=0.000491, global_step=1673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  70%|███████   | 56/80 [05:30<02:19,  5.79s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000491, train/loss_vlb_step=7.41e-6, train/loss_step=0.000491, global_step=1673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  70%|███████   | 56/80 [05:30<02:19,  5.79s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000217, train/loss_vlb_step=1.07e-6, train/loss_step=0.000217, global_step=1673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  71%|███████▏  | 57/80 [05:43<02:16,  5.93s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000217, train/loss_vlb_step=1.07e-6, train/loss_step=0.000217, global_step=1673.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  71%|███████▏  | 57/80 [05:43<02:16,  5.93s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=8.44e-5, train/loss_step=0.000623, global_step=1674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  72%|███████▎  | 58/80 [05:44<02:08,  5.83s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=8.44e-5, train/loss_step=0.000623, global_step=1674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  72%|███████▎  | 58/80 [05:44<02:08,  5.83s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=7.57e-5, train/loss_step=0.00104, global_step=1674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]   Epoch 83:  74%|███████▍  | 59/80 [05:44<02:00,  5.75s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=7.57e-5, train/loss_step=0.00104, global_step=1674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  74%|███████▍  | 59/80 [05:44<02:00,  5.75s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000182, train/loss_vlb_step=8.06e-7, train/loss_step=0.000182, global_step=1674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  75%|███████▌  | 60/80 [05:45<01:53,  5.66s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000182, train/loss_vlb_step=8.06e-7, train/loss_step=0.000182, global_step=1674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  75%|███████▌  | 60/80 [05:45<01:53,  5.66s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=1.03e-5, train/loss_step=0.000437, global_step=1674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  76%|███████▋  | 61/80 [05:46<01:46,  5.58s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=1.03e-5, train/loss_step=0.000437, global_step=1674.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  76%|███████▋  | 61/80 [05:46<01:46,  5.58s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=2.39e-6, train/loss_step=0.000331, global_step=1675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  78%|███████▊  | 62/80 [05:46<01:39,  5.50s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000331, train/loss_vlb_step=2.39e-6, train/loss_step=0.000331, global_step=1675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  78%|███████▊  | 62/80 [05:46<01:39,  5.50s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.38e-5, train/loss_step=0.00362, global_step=1675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  79%|███████▉  | 63/80 [05:47<01:32,  5.42s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.38e-5, train/loss_step=0.00362, global_step=1675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  79%|███████▉  | 63/80 [05:47<01:32,  5.42s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=6.18e-6, train/loss_step=0.00112, global_step=1675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  80%|████████  | 64/80 [06:15<01:32,  5.77s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=6.18e-6, train/loss_step=0.00112, global_step=1675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  80%|████████  | 64/80 [06:15<01:32,  5.77s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.000432, train/loss_vlb_step=1.89e-6, train/loss_step=0.000432, global_step=1675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  81%|████████▏ | 65/80 [06:23<01:27,  5.80s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.000432, train/loss_vlb_step=1.89e-6, train/loss_step=0.000432, global_step=1675.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  81%|████████▏ | 65/80 [06:23<01:27,  5.80s/it, loss=0.00141, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=6.92e-7, train/loss_step=0.000166, global_step=1676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  82%|████████▎ | 66/80 [06:23<01:20,  5.72s/it, loss=0.00141, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=6.92e-7, train/loss_step=0.000166, global_step=1676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  82%|████████▎ | 66/80 [06:23<01:20,  5.72s/it, loss=0.00143, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=2.33e-6, train/loss_step=0.000635, global_step=1676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  84%|████████▍ | 67/80 [06:24<01:13,  5.65s/it, loss=0.00143, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=2.33e-6, train/loss_step=0.000635, global_step=1676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  84%|████████▍ | 67/80 [06:24<01:13,  5.65s/it, loss=0.00168, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=1.86e-5, train/loss_step=0.00515, global_step=1676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  85%|████████▌ | 68/80 [06:24<01:06,  5.57s/it, loss=0.00168, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=1.86e-5, train/loss_step=0.00515, global_step=1676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  85%|████████▌ | 68/80 [06:24<01:06,  5.57s/it, loss=0.00137, v_num=0, train/loss_simple_step=0.000585, train/loss_vlb_step=3.45e-6, train/loss_step=0.000585, global_step=1676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  86%|████████▋ | 69/80 [06:25<01:00,  5.50s/it, loss=0.00137, v_num=0, train/loss_simple_step=0.000585, train/loss_vlb_step=3.45e-6, train/loss_step=0.000585, global_step=1676.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  86%|████████▋ | 69/80 [06:25<01:00,  5.50s/it, loss=0.00136, v_num=0, train/loss_simple_step=0.000162, train/loss_vlb_step=7.79e-7, train/loss_step=0.000162, global_step=1677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  88%|████████▊ | 70/80 [06:25<00:54,  5.43s/it, loss=0.00136, v_num=0, train/loss_simple_step=0.000162, train/loss_vlb_step=7.79e-7, train/loss_step=0.000162, global_step=1677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  88%|████████▊ | 70/80 [06:25<00:54,  5.43s/it, loss=0.0015, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.1e-5, train/loss_step=0.0047, global_step=1677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]      Epoch 83:  89%|████████▉ | 71/80 [06:26<00:48,  5.36s/it, loss=0.0015, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=2.1e-5, train/loss_step=0.0047, global_step=1677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  89%|████████▉ | 71/80 [06:26<00:48,  5.36s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000102, train/loss_step=0.0134, global_step=1677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  90%|█████████ | 72/80 [06:54<00:45,  5.67s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000102, train/loss_step=0.0134, global_step=1677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  90%|█████████ | 72/80 [06:54<00:45,  5.67s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.05e-5, train/loss_step=0.000387, global_step=1677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  91%|█████████▏| 73/80 [06:58<00:39,  5.66s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.05e-5, train/loss_step=0.000387, global_step=1677.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  91%|█████████▏| 73/80 [06:58<00:39,  5.66s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=8.53e-7, train/loss_step=0.000204, global_step=1678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  92%|█████████▎| 74/80 [06:59<00:33,  5.59s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=8.53e-7, train/loss_step=0.000204, global_step=1678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  92%|█████████▎| 74/80 [06:59<00:33,  5.59s/it, loss=0.00171, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.32e-6, train/loss_step=0.000333, global_step=1678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  94%|█████████▍| 75/80 [06:59<00:27,  5.52s/it, loss=0.00171, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.32e-6, train/loss_step=0.000333, global_step=1678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  94%|█████████▍| 75/80 [06:59<00:27,  5.52s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.5e-5, train/loss_step=0.00761, global_step=1678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]   Epoch 83:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.00761, train/loss_vlb_step=3.5e-5, train/loss_step=0.00761, global_step=1678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  95%|█████████▌| 76/80 [07:00<00:21,  5.46s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=1.99e-6, train/loss_step=0.000426, global_step=1678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  96%|█████████▋| 77/80 [07:00<00:16,  5.39s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=1.99e-6, train/loss_step=0.000426, global_step=1678.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  96%|█████████▋| 77/80 [07:00<00:16,  5.39s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=1.37e-6, train/loss_step=0.000227, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  98%|█████████▊| 78/80 [07:01<00:10,  5.33s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=1.37e-6, train/loss_step=0.000227, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  98%|█████████▊| 78/80 [07:01<00:10,  5.33s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=2.33e-5, train/loss_step=0.00659, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 83:  99%|█████████▉| 79/80 [07:01<00:05,  5.27s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=2.33e-5, train/loss_step=0.00659, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83:  99%|█████████▉| 79/80 [07:01<00:05,  5.27s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000742, train/loss_step=0.0125, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432] Epoch 83: 100%|██████████| 80/80 [07:05<00:00,  5.25s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000742, train/loss_step=0.0125, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 83: 100%|██████████| 80/80 [07:05<00:00,  5.25s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=2.97e-5, train/loss_step=0.00874, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Average Epoch time: 425.18 seconds
+Average Peak memory 29562.51MiB
+Epoch 83:   0%|          | 0/80 [00:00<00:00, 3728.27it/s, loss=0.00336, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=2.97e-5, train/loss_step=0.00874, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 84:   0%|          | 0/80 [00:00<00:00, 1885.93it/s, loss=0.00336, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=2.97e-5, train/loss_step=0.00874, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]Epoch 84:   1%|▏         | 1/80 [00:44<29:26, 22.35s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=2.97e-5, train/loss_step=0.00874, global_step=1679.0, lr_abs=0.0001, train/loss_simple_epoch=0.00432, train/loss_vlb_epoch=7.67e-5, train/loss_epoch=0.00432]  Epoch 84:   1%|▏         | 1/80 [00:44<29:26, 22.36s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.1e-6, train/loss_step=0.000259, global_step=1680.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   2%|▎         | 2/80 [00:45<19:34, 15.06s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.1e-6, train/loss_step=0.000259, global_step=1680.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   2%|▎         | 2/80 [00:45<19:34, 15.06s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.05e-5, train/loss_step=0.003, global_step=1680.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]     Epoch 84:   4%|▍         | 3/80 [00:45<14:39, 11.42s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.05e-5, train/loss_step=0.003, global_step=1680.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   4%|▍         | 3/80 [00:45<14:39, 11.42s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.98e-6, train/loss_step=0.00111, global_step=1680.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   5%|▌         | 4/80 [00:46<11:48,  9.32s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.98e-6, train/loss_step=0.00111, global_step=1680.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   5%|▌         | 4/80 [00:46<11:48,  9.32s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=1.96e-5, train/loss_step=0.0054, global_step=1680.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:   6%|▋         | 5/80 [00:47<09:49,  7.86s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0054, train/loss_vlb_step=1.96e-5, train/loss_step=0.0054, global_step=1680.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   6%|▋         | 5/80 [00:47<09:49,  7.86s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=2.18e-5, train/loss_step=0.00597, global_step=1681.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   8%|▊         | 6/80 [00:47<08:23,  6.81s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=2.18e-5, train/loss_step=0.00597, global_step=1681.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   8%|▊         | 6/80 [00:47<08:23,  6.81s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.98e-6, train/loss_step=0.000452, global_step=1681.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   9%|▉         | 7/80 [00:50<07:41,  6.32s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=2.98e-6, train/loss_step=0.000452, global_step=1681.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:   9%|▉         | 7/80 [00:50<07:41,  6.32s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1e-5, train/loss_step=0.00212, global_step=1681.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]      Epoch 84:  10%|█         | 8/80 [01:14<09:58,  8.32s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=1e-5, train/loss_step=0.00212, global_step=1681.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  10%|█         | 8/80 [01:14<09:58,  8.32s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.65e-6, train/loss_step=0.000255, global_step=1681.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  11%|█▏        | 9/80 [01:22<09:48,  8.29s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.65e-6, train/loss_step=0.000255, global_step=1681.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  11%|█▏        | 9/80 [01:22<09:48,  8.29s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.27e-5, train/loss_step=0.0015, global_step=1682.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]    Epoch 84:  12%|█▎        | 10/80 [01:23<08:50,  7.58s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.27e-5, train/loss_step=0.0015, global_step=1682.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  12%|█▎        | 10/80 [01:23<08:50,  7.58s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000597, train/loss_vlb_step=1.07e-5, train/loss_step=0.000597, global_step=1682.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  14%|█▍        | 11/80 [01:23<08:02,  6.99s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000597, train/loss_vlb_step=1.07e-5, train/loss_step=0.000597, global_step=1682.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  14%|█▍        | 11/80 [01:23<08:02,  6.99s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=1.79e-5, train/loss_step=0.00485, global_step=1682.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  15%|█▌        | 12/80 [01:24<07:21,  6.49s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=1.79e-5, train/loss_step=0.00485, global_step=1682.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  15%|█▌        | 12/80 [01:24<07:21,  6.49s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.32e-6, train/loss_step=0.000299, global_step=1682.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  16%|█▋        | 13/80 [01:29<07:10,  6.42s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.32e-6, train/loss_step=0.000299, global_step=1682.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  16%|█▋        | 13/80 [01:29<07:10,  6.42s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=3.88e-5, train/loss_step=0.00945, global_step=1683.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  18%|█▊        | 14/80 [01:30<06:37,  6.03s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=3.88e-5, train/loss_step=0.00945, global_step=1683.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  18%|█▊        | 14/80 [01:30<06:37,  6.03s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.59e-5, train/loss_step=0.0065, global_step=1683.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  19%|█▉        | 15/80 [01:38<06:41,  6.18s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.0065, train/loss_vlb_step=3.59e-5, train/loss_step=0.0065, global_step=1683.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  19%|█▉        | 15/80 [01:38<06:41,  6.18s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=1.83e-5, train/loss_step=0.00421, global_step=1683.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  20%|██        | 16/80 [01:53<07:06,  6.67s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=1.83e-5, train/loss_step=0.00421, global_step=1683.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  20%|██        | 16/80 [01:53<07:06,  6.67s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=2.88e-5, train/loss_step=0.00783, global_step=1683.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  21%|██▏       | 17/80 [02:04<07:17,  6.94s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00783, train/loss_vlb_step=2.88e-5, train/loss_step=0.00783, global_step=1683.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  21%|██▏       | 17/80 [02:04<07:17,  6.94s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=1.99e-6, train/loss_step=0.000497, global_step=1684.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  22%|██▎       | 18/80 [02:05<06:49,  6.60s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=1.99e-6, train/loss_step=0.000497, global_step=1684.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  22%|██▎       | 18/80 [02:05<06:49,  6.60s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.86e-6, train/loss_step=0.0014, global_step=1684.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]   Epoch 84:  24%|██▍       | 19/80 [02:05<06:24,  6.30s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.86e-6, train/loss_step=0.0014, global_step=1684.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  24%|██▍       | 19/80 [02:05<06:24,  6.30s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=7.84e-6, train/loss_step=0.00184, global_step=1684.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  25%|██▌       | 20/80 [02:06<06:02,  6.04s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=7.84e-6, train/loss_step=0.00184, global_step=1684.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  25%|██▌       | 20/80 [02:06<06:02,  6.04s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.28e-5, train/loss_step=0.0115, global_step=1684.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  26%|██▋       | 21/80 [02:15<06:04,  6.17s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.28e-5, train/loss_step=0.0115, global_step=1684.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  26%|██▋       | 21/80 [02:15<06:04,  6.17s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=8.59e-7, train/loss_step=0.000213, global_step=1685.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  28%|██▊       | 22/80 [02:16<05:43,  5.93s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=8.59e-7, train/loss_step=0.000213, global_step=1685.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  28%|██▊       | 22/80 [02:16<05:43,  5.93s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=5.62e-6, train/loss_step=0.000537, global_step=1685.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  29%|██▉       | 23/80 [02:16<05:24,  5.70s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=5.62e-6, train/loss_step=0.000537, global_step=1685.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  29%|██▉       | 23/80 [02:16<05:24,  5.70s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=1.94e-6, train/loss_step=0.000536, global_step=1685.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427] Epoch 84:  30%|███       | 24/80 [02:31<05:40,  6.08s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000536, train/loss_vlb_step=1.94e-6, train/loss_step=0.000536, global_step=1685.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  30%|███       | 24/80 [02:31<05:40,  6.08s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.31e-6, train/loss_step=0.00239, global_step=1685.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427] Epoch 84:  31%|███▏      | 25/80 [02:49<05:58,  6.51s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.31e-6, train/loss_step=0.00239, global_step=1685.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  31%|███▏      | 25/80 [02:49<05:58,  6.51s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.21e-5, train/loss_step=0.00372, global_step=1686.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  32%|███▎      | 26/80 [02:49<05:39,  6.29s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=2.21e-5, train/loss_step=0.00372, global_step=1686.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  32%|███▎      | 26/80 [02:49<05:39,  6.29s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=7.75e-6, train/loss_step=0.00213, global_step=1686.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  34%|███▍      | 27/80 [02:50<05:22,  6.08s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=7.75e-6, train/loss_step=0.00213, global_step=1686.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  34%|███▍      | 27/80 [02:50<05:22,  6.08s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=9.69e-6, train/loss_step=0.00262, global_step=1686.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  35%|███▌      | 28/80 [02:51<05:07,  5.92s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=9.69e-6, train/loss_step=0.00262, global_step=1686.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  35%|███▌      | 28/80 [02:51<05:07,  5.92s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=1.57e-6, train/loss_step=0.000381, global_step=1686.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  36%|███▋      | 29/80 [03:05<05:15,  6.19s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=1.57e-6, train/loss_step=0.000381, global_step=1686.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  36%|███▋      | 29/80 [03:05<05:15,  6.19s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=8.54e-7, train/loss_step=0.000183, global_step=1687.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  38%|███▊      | 30/80 [03:06<05:00,  6.01s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=8.54e-7, train/loss_step=0.000183, global_step=1687.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  38%|███▊      | 30/80 [03:06<05:00,  6.01s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=7.41e-6, train/loss_step=0.00134, global_step=1687.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  39%|███▉      | 31/80 [03:06<04:45,  5.84s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=7.41e-6, train/loss_step=0.00134, global_step=1687.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  39%|███▉      | 31/80 [03:06<04:45,  5.84s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=8.05e-6, train/loss_step=0.00121, global_step=1687.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  40%|████      | 32/80 [03:16<04:46,  5.97s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=8.05e-6, train/loss_step=0.00121, global_step=1687.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  40%|████      | 32/80 [03:16<04:46,  5.97s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.19e-5, train/loss_step=0.00327, global_step=1687.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  41%|████▏     | 33/80 [03:41<05:06,  6.51s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00327, train/loss_vlb_step=1.19e-5, train/loss_step=0.00327, global_step=1687.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  41%|████▏     | 33/80 [03:41<05:06,  6.51s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.42e-6, train/loss_step=0.000323, global_step=1688.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  42%|████▎     | 34/80 [03:41<04:51,  6.34s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=1.42e-6, train/loss_step=0.000323, global_step=1688.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  42%|████▎     | 34/80 [03:41<04:51,  6.34s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=4.17e-6, train/loss_step=0.000567, global_step=1688.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  44%|████▍     | 35/80 [03:42<04:38,  6.18s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=4.17e-6, train/loss_step=0.000567, global_step=1688.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  44%|████▍     | 35/80 [03:42<04:38,  6.18s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=3.72e-6, train/loss_step=0.000805, global_step=1688.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  45%|████▌     | 36/80 [03:42<04:25,  6.03s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=3.72e-6, train/loss_step=0.000805, global_step=1688.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  45%|████▌     | 36/80 [03:42<04:25,  6.03s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=2.83e-6, train/loss_step=0.000438, global_step=1688.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  46%|████▋     | 37/80 [03:46<04:16,  5.96s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=2.83e-6, train/loss_step=0.000438, global_step=1688.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  46%|████▋     | 37/80 [03:46<04:16,  5.96s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=4.81e-6, train/loss_step=0.000825, global_step=1689.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  48%|████▊     | 38/80 [03:46<04:04,  5.82s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000825, train/loss_vlb_step=4.81e-6, train/loss_step=0.000825, global_step=1689.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  48%|████▊     | 38/80 [03:46<04:04,  5.82s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=2.89e-5, train/loss_step=0.00739, global_step=1689.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  49%|████▉     | 39/80 [03:47<03:52,  5.68s/it, loss=0.00211, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=2.89e-5, train/loss_step=0.00739, global_step=1689.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  49%|████▉     | 39/80 [03:47<03:52,  5.68s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.31e-5, train/loss_step=0.00665, global_step=1689.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  50%|█████     | 40/80 [03:56<03:50,  5.77s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00665, train/loss_vlb_step=3.31e-5, train/loss_step=0.00665, global_step=1689.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  50%|█████     | 40/80 [03:56<03:50,  5.77s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.14e-6, train/loss_step=0.00187, global_step=1689.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  51%|█████▏    | 41/80 [04:23<04:04,  6.28s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.14e-6, train/loss_step=0.00187, global_step=1689.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  51%|█████▏    | 41/80 [04:23<04:04,  6.28s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.39e-6, train/loss_step=0.0003, global_step=1690.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  52%|█████▎    | 42/80 [04:24<03:53,  6.14s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.39e-6, train/loss_step=0.0003, global_step=1690.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  52%|█████▎    | 42/80 [04:24<03:53,  6.14s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=8.43e-6, train/loss_step=0.00244, global_step=1690.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  54%|█████▍    | 43/80 [04:24<03:42,  6.01s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.00244, train/loss_vlb_step=8.43e-6, train/loss_step=0.00244, global_step=1690.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  54%|█████▍    | 43/80 [04:24<03:42,  6.01s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.49e-5, train/loss_step=0.00174, global_step=1690.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  55%|█████▌    | 44/80 [04:25<03:32,  5.89s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=1.49e-5, train/loss_step=0.00174, global_step=1690.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  55%|█████▌    | 44/80 [04:25<03:32,  5.89s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.000546, train/loss_step=0.0107, global_step=1690.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427] Epoch 84:  56%|█████▋    | 45/80 [04:25<03:22,  5.78s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.000546, train/loss_step=0.0107, global_step=1690.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  56%|█████▋    | 45/80 [04:25<03:22,  5.78s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=6.85e-6, train/loss_step=0.00133, global_step=1691.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  57%|█████▊    | 46/80 [04:26<03:12,  5.67s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=6.85e-6, train/loss_step=0.00133, global_step=1691.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  57%|█████▊    | 46/80 [04:26<03:12,  5.67s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=2.27e-5, train/loss_step=0.00656, global_step=1691.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  59%|█████▉    | 47/80 [04:27<03:03,  5.56s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00656, train/loss_vlb_step=2.27e-5, train/loss_step=0.00656, global_step=1691.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  59%|█████▉    | 47/80 [04:27<03:03,  5.56s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.000291, train/loss_step=0.0157, global_step=1691.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  60%|██████    | 48/80 [04:38<03:01,  5.68s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.000291, train/loss_step=0.0157, global_step=1691.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  60%|██████    | 48/80 [04:38<03:01,  5.68s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.35e-5, train/loss_step=0.0131, global_step=1691.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  61%|██████▏   | 49/80 [05:05<03:09,  6.10s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=5.35e-5, train/loss_step=0.0131, global_step=1691.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  61%|██████▏   | 49/80 [05:05<03:09,  6.10s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.18e-5, train/loss_step=0.00565, global_step=1692.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  62%|██████▎   | 50/80 [05:05<02:59,  5.99s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.18e-5, train/loss_step=0.00565, global_step=1692.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  62%|██████▎   | 50/80 [05:05<02:59,  5.99s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=2.72e-6, train/loss_step=0.000589, global_step=1692.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  64%|██████▍   | 51/80 [05:06<02:50,  5.89s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=2.72e-6, train/loss_step=0.000589, global_step=1692.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  64%|██████▍   | 51/80 [05:06<02:50,  5.89s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=3.98e-6, train/loss_step=0.000999, global_step=1692.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  65%|██████▌   | 52/80 [05:06<02:42,  5.79s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000999, train/loss_vlb_step=3.98e-6, train/loss_step=0.000999, global_step=1692.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  65%|██████▌   | 52/80 [05:06<02:42,  5.79s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=5.81e-6, train/loss_step=0.0016, global_step=1692.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]    Epoch 84:  66%|██████▋   | 53/80 [05:07<02:33,  5.69s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=5.81e-6, train/loss_step=0.0016, global_step=1692.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  66%|██████▋   | 53/80 [05:07<02:33,  5.69s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000277, train/loss_step=0.0134, global_step=1693.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  68%|██████▊   | 54/80 [05:07<02:25,  5.60s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000277, train/loss_step=0.0134, global_step=1693.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  68%|██████▊   | 54/80 [05:07<02:25,  5.60s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.16e-6, train/loss_step=0.000278, global_step=1693.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  69%|██████▉   | 55/80 [05:08<02:17,  5.51s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.16e-6, train/loss_step=0.000278, global_step=1693.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  69%|██████▉   | 55/80 [05:08<02:17,  5.51s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=1.31e-6, train/loss_step=0.00034, global_step=1693.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  70%|███████   | 56/80 [05:21<02:15,  5.64s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=1.31e-6, train/loss_step=0.00034, global_step=1693.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  70%|███████   | 56/80 [05:21<02:15,  5.64s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=6.1e-5, train/loss_step=0.0123, global_step=1693.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]   Epoch 84:  71%|███████▏  | 57/80 [05:48<02:18,  6.01s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=6.1e-5, train/loss_step=0.0123, global_step=1693.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  71%|███████▏  | 57/80 [05:48<02:18,  6.01s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=2.49e-5, train/loss_step=0.0069, global_step=1694.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  72%|███████▎  | 58/80 [05:49<02:10,  5.92s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.0069, train/loss_vlb_step=2.49e-5, train/loss_step=0.0069, global_step=1694.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  72%|███████▎  | 58/80 [05:49<02:10,  5.92s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.03e-6, train/loss_step=0.000271, global_step=1694.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  74%|███████▍  | 59/80 [05:49<02:02,  5.83s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.03e-6, train/loss_step=0.000271, global_step=1694.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  74%|███████▍  | 59/80 [05:49<02:02,  5.83s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00053, train/loss_vlb_step=2.36e-6, train/loss_step=0.00053, global_step=1694.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00053, train/loss_vlb_step=2.36e-6, train/loss_step=0.00053, global_step=1694.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=8.95e-6, train/loss_step=0.00247, global_step=1694.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  76%|███████▋  | 61/80 [05:50<01:47,  5.66s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=8.95e-6, train/loss_step=0.00247, global_step=1694.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  76%|███████▋  | 61/80 [05:50<01:47,  5.66s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=3.03e-6, train/loss_step=0.000748, global_step=1695.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  78%|███████▊  | 62/80 [05:51<01:40,  5.58s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=3.03e-6, train/loss_step=0.000748, global_step=1695.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  78%|███████▊  | 62/80 [05:51<01:40,  5.58s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=2.05e-6, train/loss_step=0.000421, global_step=1695.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  79%|███████▉  | 63/80 [05:51<01:33,  5.50s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000421, train/loss_vlb_step=2.05e-6, train/loss_step=0.000421, global_step=1695.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  79%|███████▉  | 63/80 [05:51<01:33,  5.50s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=8.35e-6, train/loss_step=0.00238, global_step=1695.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  80%|████████  | 64/80 [06:14<01:32,  5.77s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=8.35e-6, train/loss_step=0.00238, global_step=1695.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  80%|████████  | 64/80 [06:14<01:32,  5.77s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000569, train/loss_vlb_step=4.76e-6, train/loss_step=0.000569, global_step=1695.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  81%|████████▏ | 65/80 [06:22<01:26,  5.79s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000569, train/loss_vlb_step=4.76e-6, train/loss_step=0.000569, global_step=1695.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  81%|████████▏ | 65/80 [06:22<01:26,  5.79s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=1.16e-6, train/loss_step=0.000232, global_step=1696.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=1.16e-6, train/loss_step=0.000232, global_step=1696.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=8.96e-7, train/loss_step=0.00021, global_step=1696.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  84%|████████▍ | 67/80 [06:23<01:13,  5.63s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=8.96e-7, train/loss_step=0.00021, global_step=1696.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  84%|████████▍ | 67/80 [06:23<01:13,  5.63s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.48e-5, train/loss_step=0.00191, global_step=1696.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  85%|████████▌ | 68/80 [06:23<01:06,  5.56s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=1.48e-5, train/loss_step=0.00191, global_step=1696.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  85%|████████▌ | 68/80 [06:23<01:06,  5.56s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000892, train/loss_vlb_step=4.14e-6, train/loss_step=0.000892, global_step=1696.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  86%|████████▋ | 69/80 [06:24<01:00,  5.49s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000892, train/loss_vlb_step=4.14e-6, train/loss_step=0.000892, global_step=1696.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  86%|████████▋ | 69/80 [06:24<01:00,  5.49s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000937, train/loss_vlb_step=3.55e-6, train/loss_step=0.000937, global_step=1697.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427] Epoch 84:  88%|████████▊ | 70/80 [06:24<00:54,  5.42s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000937, train/loss_vlb_step=3.55e-6, train/loss_step=0.000937, global_step=1697.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  88%|████████▊ | 70/80 [06:24<00:54,  5.42s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000159, train/loss_vlb_step=7.2e-7, train/loss_step=0.000159, global_step=1697.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  89%|████████▉ | 71/80 [06:25<00:48,  5.35s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000159, train/loss_vlb_step=7.2e-7, train/loss_step=0.000159, global_step=1697.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  89%|████████▉ | 71/80 [06:25<00:48,  5.35s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000205, train/loss_step=0.0131, global_step=1697.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84:  90%|█████████ | 72/80 [06:44<00:44,  5.54s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.000205, train/loss_step=0.0131, global_step=1697.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  90%|█████████ | 72/80 [06:44<00:44,  5.54s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.17e-6, train/loss_step=0.00103, global_step=1697.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  91%|█████████▏| 73/80 [06:54<00:39,  5.61s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.17e-6, train/loss_step=0.00103, global_step=1697.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  91%|████████���▏| 73/80 [06:54<00:39,  5.61s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.8e-6, train/loss_step=0.00114, global_step=1698.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427] Epoch 84:  92%|█████████▎| 74/80 [06:57<00:33,  5.56s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.8e-6, train/loss_step=0.00114, global_step=1698.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  92%|█████████▎| 74/80 [06:57<00:33,  5.56s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=2.59e-6, train/loss_step=0.000287, global_step=1698.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  94%|█████████▍| 75/80 [06:57<00:27,  5.50s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=2.59e-6, train/loss_step=0.000287, global_step=1698.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  94%|█████████▍| 75/80 [06:57<00:27,  5.50s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=0.000249, train/loss_step=0.00381, global_step=1698.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427] Epoch 84:  95%|█████████▌| 76/80 [06:58<00:21,  5.43s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00381, train/loss_vlb_step=0.000249, train/loss_step=0.00381, global_step=1698.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  95%|█████████▌| 76/80 [06:58<00:21,  5.43s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=2.49e-5, train/loss_step=0.00693, global_step=1698.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427] Epoch 84:  96%|█████████▋| 77/80 [06:58<00:16,  5.37s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=2.49e-5, train/loss_step=0.00693, global_step=1698.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  96%|█████████▋| 77/80 [06:58<00:16,  5.37s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.26e-5, train/loss_step=0.00765, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  98%|█████████▊| 78/80 [06:59<00:10,  5.31s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.00765, train/loss_vlb_step=3.26e-5, train/loss_step=0.00765, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  98%|█████████▊| 78/80 [06:59<00:10,  5.31s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.14e-5, train/loss_step=0.00323, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  99%|█████████▉| 79/80 [06:59<00:05,  5.25s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.14e-5, train/loss_step=0.00323, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84:  99%|█████████▉| 79/80 [06:59<00:05,  5.25s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.14e-5, train/loss_step=0.0107, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]  Epoch 84: 100%|██████████| 80/80 [07:00<00:00,  5.19s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.14e-5, train/loss_step=0.0107, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 84: 100%|██████████| 80/80 [07:00<00:00,  5.19s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.04e-5, train/loss_step=0.00229, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Average Epoch time: 420.40 seconds
+Average Peak memory 29565.21MiB
+Epoch 84:   0%|          | 0/80 [00:00<00:00, 343.18it/s, loss=0.00293, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.04e-5, train/loss_step=0.00229, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 85:   0%|          | 0/80 [00:00<00:00, 307.77it/s, loss=0.00293, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.04e-5, train/loss_step=0.00229, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427]Epoch 85:   1%|▏         | 1/80 [00:50<33:30, 25.45s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=1.04e-5, train/loss_step=0.00229, global_step=1699.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=8.84e-5, train/loss_epoch=0.00427] Epoch 85:   1%|▏         | 1/80 [00:50<33:30, 25.45s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.14e-6, train/loss_step=0.000267, global_step=1700.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   2%|▎         | 2/80 [00:51<22:15, 17.12s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.14e-6, train/loss_step=0.000267, global_step=1700.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   2%|▎         | 2/80 [00:51<22:15, 17.12s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=8.36e-6, train/loss_step=0.00183, global_step=1700.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:   4%|▍         | 3/80 [00:51<16:38, 12.97s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=8.36e-6, train/loss_step=0.00183, global_step=1700.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   4%|▍         | 3/80 [00:51<16:38, 12.97s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=1.2e-6, train/loss_step=0.000231, global_step=1700.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   5%|▌         | 4/80 [00:52<13:16, 10.48s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=1.2e-6, train/loss_step=0.000231, global_step=1700.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   5%|▌         | 4/80 [00:52<13:16, 10.48s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.3e-6, train/loss_step=0.000242, global_step=1700.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   6%|▋         | 5/80 [00:52<11:01,  8.81s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.3e-6, train/loss_step=0.000242, global_step=1700.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   6%|▋         | 5/80 [00:52<11:01,  8.82s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0004, train/loss_vlb_step=1.46e-6, train/loss_step=0.0004, global_step=1701.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]   Epoch 85:   8%|▊         | 6/80 [00:53<09:24,  7.63s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0004, train/loss_vlb_step=1.46e-6, train/loss_step=0.0004, global_step=1701.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   8%|▊         | 6/80 [00:53<09:24,  7.63s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=3.15e-5, train/loss_step=0.00834, global_step=1701.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   9%|▉         | 7/80 [00:53<08:11,  6.73s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=3.15e-5, train/loss_step=0.00834, global_step=1701.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:   9%|▉         | 7/80 [00:53<08:11,  6.73s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000479, train/loss_vlb_step=2.11e-6, train/loss_step=0.000479, global_step=1701.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  10%|█         | 8/80 [01:25<11:23,  9.49s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000479, train/loss_vlb_step=2.11e-6, train/loss_step=0.000479, global_step=1701.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  10%|█         | 8/80 [01:25<11:23,  9.49s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=5.39e-6, train/loss_step=0.00141, global_step=1701.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  11%|█▏        | 9/80 [01:26<10:11,  8.61s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=5.39e-6, train/loss_step=0.00141, global_step=1701.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  11%|█▏        | 9/80 [01:26<10:11,  8.61s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=7.59e-6, train/loss_step=0.002, global_step=1702.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]    Epoch 85:  12%|█▎        | 10/80 [01:26<09:11,  7.87s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.002, train/loss_vlb_step=7.59e-6, train/loss_step=0.002, global_step=1702.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  12%|█▎        | 10/80 [01:26<09:11,  7.87s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000889, train/loss_vlb_step=3.21e-5, train/loss_step=0.000889, global_step=1702.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  14%|█▍        | 11/80 [01:27<08:20,  7.26s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000889, train/loss_vlb_step=3.21e-5, train/loss_step=0.000889, global_step=1702.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  14%|█▍        | 11/80 [01:27<08:20,  7.26s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=1.19e-6, train/loss_step=0.0002, global_step=1702.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]    Epoch 85:  15%|█▌        | 12/80 [01:27<07:40,  6.77s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=1.19e-6, train/loss_step=0.0002, global_step=1702.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  15%|█▌        | 12/80 [01:27<07:40,  6.77s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=3.69e-6, train/loss_step=0.00075, global_step=1702.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  16%|█▋        | 13/80 [01:28<07:03,  6.32s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=3.69e-6, train/loss_step=0.00075, global_step=1702.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  16%|█▋        | 13/80 [01:28<07:03,  6.32s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=4.54e-6, train/loss_step=0.000413, global_step=1703.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  18%|█▊        | 14/80 [01:28<06:31,  5.93s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=4.54e-6, train/loss_step=0.000413, global_step=1703.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  18%|█▊        | 14/80 [01:28<06:31,  5.93s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.98e-6, train/loss_step=0.00041, global_step=1703.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:  19%|█▉        | 15/80 [01:29<06:03,  5.59s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.98e-6, train/loss_step=0.00041, global_step=1703.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  19%|█▉        | 15/80 [01:29<06:03,  5.59s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=9.24e-7, train/loss_step=0.000167, global_step=1703.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  20%|██        | 16/80 [02:16<08:33,  8.02s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=9.24e-7, train/loss_step=0.000167, global_step=1703.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  20%|██        | 16/80 [02:16<08:33,  8.02s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000785, train/loss_vlb_step=2.72e-6, train/loss_step=0.000785, global_step=1703.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  21%|██▏       | 17/80 [02:16<07:58,  7.60s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000785, train/loss_vlb_step=2.72e-6, train/loss_step=0.000785, global_step=1703.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  21%|██▏       | 17/80 [02:16<07:58,  7.60s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=3.42e-5, train/loss_step=0.00918, global_step=1704.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:  22%|██▎       | 18/80 [02:17<07:27,  7.23s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00918, train/loss_vlb_step=3.42e-5, train/loss_step=0.00918, global_step=1704.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  22%|██▎       | 18/80 [02:17<07:27,  7.23s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000177, train/loss_vlb_step=8.87e-7, train/loss_step=0.000177, global_step=1704.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  24%|██▍       | 19/80 [02:17<07:00,  6.89s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000177, train/loss_vlb_step=8.87e-7, train/loss_step=0.000177, global_step=1704.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  24%|██▍       | 19/80 [02:17<07:00,  6.89s/it, loss=0.00155, v_num=0, train/loss_simple_step=0.00064, train/loss_vlb_step=2.83e-6, train/loss_step=0.00064, global_step=1704.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:  25%|██▌       | 20/80 [02:18<06:35,  6.59s/it, loss=0.00155, v_num=0, train/loss_simple_step=0.00064, train/loss_vlb_step=2.83e-6, train/loss_step=0.00064, global_step=1704.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  25%|██▌       | 20/80 [02:18<06:35,  6.59s/it, loss=0.00153, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=4.24e-5, train/loss_step=0.00175, global_step=1704.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  26%|██▋       | 21/80 [02:18<06:12,  6.31s/it, loss=0.00153, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=4.24e-5, train/loss_step=0.00175, global_step=1704.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  26%|██▋       | 21/80 [02:18<06:12,  6.31s/it, loss=0.0016, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.58e-6, train/loss_step=0.00174, global_step=1705.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  28%|██▊       | 22/80 [02:19<05:51,  6.06s/it, loss=0.0016, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.58e-6, train/loss_step=0.00174, global_step=1705.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  28%|██▊       | 22/80 [02:19<05:51,  6.06s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.45e-5, train/loss_step=0.0114, global_step=1705.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  29%|██▉       | 23/80 [02:19<05:32,  5.83s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.45e-5, train/loss_step=0.0114, global_step=1705.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  29%|██▉       | 23/80 [02:19<05:32,  5.83s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=3.31e-6, train/loss_step=0.000285, global_step=1705.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  30%|███       | 24/80 [03:00<06:43,  7.20s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=3.31e-6, train/loss_step=0.000285, global_step=1705.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  30%|███       | 24/80 [03:00<06:43,  7.20s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000124, train/loss_step=0.0125, global_step=1705.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]    Epoch 85:  31%|███▏      | 25/80 [03:00<06:22,  6.95s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000124, train/loss_step=0.0125, global_step=1705.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  31%|███▏      | 25/80 [03:00<06:22,  6.95s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.000173, train/loss_step=0.0197, global_step=1706.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  32%|███▎      | 26/80 [03:01<06:02,  6.71s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=0.000173, train/loss_step=0.0197, global_step=1706.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  32%|███▎      | 26/80 [03:01<06:02,  6.71s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=3.47e-6, train/loss_step=0.000697, global_step=1706.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  34%|███▍      | 27/80 [03:01<05:43,  6.49s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000697, train/loss_vlb_step=3.47e-6, train/loss_step=0.000697, global_step=1706.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  34%|███▍      | 27/80 [03:01<05:43,  6.49s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.41e-6, train/loss_step=0.000251, global_step=1706.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  35%|███▌      | 28/80 [03:02<05:26,  6.28s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.41e-6, train/loss_step=0.000251, global_step=1706.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  35%|███▌      | 28/80 [03:02<05:26,  6.28s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=4.15e-5, train/loss_step=0.00198, global_step=1706.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]   Epoch 85:  36%|███▋      | 29/80 [03:02<05:10,  6.09s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=4.15e-5, train/loss_step=0.00198, global_step=1706.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  36%|███▋      | 29/80 [03:02<05:10,  6.09s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.00146, train/loss_step=0.0255, global_step=1707.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  38%|███▊      | 30/80 [03:03<04:55,  5.91s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.00146, train/loss_step=0.0255, global_step=1707.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  38%|███▊      | 30/80 [03:03<04:55,  5.91s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=2.75e-5, train/loss_step=0.00704, global_step=1707.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  39%|███▉      | 31/80 [03:03<04:41,  5.74s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=2.75e-5, train/loss_step=0.00704, global_step=1707.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  39%|███▉      | 31/80 [03:03<04:41,  5.74s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=0.000155, train/loss_step=0.0033, global_step=1707.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  40%|████      | 32/80 [03:45<05:27,  6.82s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=0.000155, train/loss_step=0.0033, global_step=1707.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  40%|████      | 32/80 [03:45<05:27,  6.82s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.000396, train/loss_vlb_step=4.98e-6, train/loss_step=0.000396, global_step=1707.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  41%|████▏     | 33/80 [03:45<05:11,  6.64s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.000396, train/loss_vlb_step=4.98e-6, train/loss_step=0.000396, global_step=1707.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  41%|████▏     | 33/80 [03:45<05:11,  6.64s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=8.78e-6, train/loss_step=0.000551, global_step=1708.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  42%|████▎     | 34/80 [03:46<04:57,  6.46s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=8.78e-6, train/loss_step=0.000551, global_step=1708.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  42%|████▎     | 34/80 [03:46<04:57,  6.46s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=8.15e-6, train/loss_step=0.00193, global_step=1708.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]    Epoch 85:  44%|████▍     | 35/80 [03:46<04:43,  6.30s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=8.15e-6, train/loss_step=0.00193, global_step=1708.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  44%|████▍     | 35/80 [03:46<04:43,  6.30s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=4.46e-5, train/loss_step=0.00837, global_step=1708.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  45%|████▌     | 36/80 [03:47<04:30,  6.15s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=4.46e-5, train/loss_step=0.00837, global_step=1708.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  45%|████▌     | 36/80 [03:47<04:30,  6.15s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=3.85e-6, train/loss_step=0.00086, global_step=1708.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  46%|████▋     | 37/80 [03:48<04:18,  6.01s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=3.85e-6, train/loss_step=0.00086, global_step=1708.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  46%|████▋     | 37/80 [03:48<04:18,  6.01s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=2.76e-5, train/loss_step=0.00768, global_step=1709.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  48%|████▊     | 38/80 [03:48<04:06,  5.86s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00768, train/loss_vlb_step=2.76e-5, train/loss_step=0.00768, global_step=1709.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  48%|████▊     | 38/80 [03:48<04:06,  5.86s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.78e-6, train/loss_step=0.000321, global_step=1709.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  49%|████▉     | 39/80 [03:49<03:54,  5.73s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.78e-6, train/loss_step=0.000321, global_step=1709.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  49%|████▉     | 39/80 [03:49<03:54,  5.73s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.78e-5, train/loss_step=0.00615, global_step=1709.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:  50%|█████     | 40/80 [04:17<04:11,  6.29s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.78e-5, train/loss_step=0.00615, global_step=1709.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  50%|█████     | 40/80 [04:17<04:11,  6.29s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=2.6e-5, train/loss_step=0.00689, global_step=1709.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  51%|█████▏    | 41/80 [04:21<04:03,  6.23s/it, loss=0.00588, v_num=0, train/loss_simple_step=0.00689, train/loss_vlb_step=2.6e-5, train/loss_step=0.00689, global_step=1709.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  51%|█████▏    | 41/80 [04:21<04:03,  6.23s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.5e-5, train/loss_step=0.00375, global_step=1710.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  52%|█████▎    | 42/80 [04:22<03:51,  6.10s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.5e-5, train/loss_step=0.00375, global_step=1710.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  52%|█████▎    | 42/80 [04:22<03:51,  6.10s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=5.62e-6, train/loss_step=0.000459, global_step=1710.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  54%|█████▍    | 43/80 [04:25<03:43,  6.04s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=5.62e-6, train/loss_step=0.000459, global_step=1710.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  54%|█████▍    | 43/80 [04:25<03:43,  6.04s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=7.31e-6, train/loss_step=0.00161, global_step=1710.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]   Epoch 85:  55%|█████▌    | 44/80 [04:26<03:32,  5.92s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=7.31e-6, train/loss_step=0.00161, global_step=1710.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  55%|█████▌    | 44/80 [04:26<03:32,  5.92s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=2.66e-5, train/loss_step=0.00648, global_step=1710.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  56%|█████▋    | 45/80 [04:26<03:22,  5.80s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00648, train/loss_vlb_step=2.66e-5, train/loss_step=0.00648, global_step=1710.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  56%|█████▋    | 45/80 [04:26<03:22,  5.80s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=2.43e-5, train/loss_step=0.00617, global_step=1711.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  57%|█████▊    | 46/80 [04:27<03:13,  5.69s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00617, train/loss_vlb_step=2.43e-5, train/loss_step=0.00617, global_step=1711.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  57%|█████▊    | 46/80 [04:27<03:13,  5.69s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000439, train/loss_vlb_step=3.11e-6, train/loss_step=0.000439, global_step=1711.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  59%|█████▉    | 47/80 [04:27<03:04,  5.58s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000439, train/loss_vlb_step=3.11e-6, train/loss_step=0.000439, global_step=1711.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  59%|█████▉    | 47/80 [04:27<03:04,  5.58s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=5.85e-6, train/loss_step=0.0015, global_step=1711.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]    Epoch 85:  60%|██████    | 48/80 [04:59<03:15,  6.11s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=5.85e-6, train/loss_step=0.0015, global_step=1711.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  60%|██████    | 48/80 [04:59<03:15,  6.11s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=3.5e-6, train/loss_step=0.000428, global_step=1711.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  61%|██████▏   | 49/80 [05:05<03:09,  6.11s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=3.5e-6, train/loss_step=0.000428, global_step=1711.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  61%|██████▏   | 49/80 [05:05<03:09,  6.11s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.94e-6, train/loss_step=0.00135, global_step=1712.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  62%|██████▎   | 50/80 [05:06<03:00,  6.00s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.94e-6, train/loss_step=0.00135, global_step=1712.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  62%|██████▎   | 50/80 [05:06<03:00,  6.00s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.65e-6, train/loss_step=0.00133, global_step=1712.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:  64%|██████▍   | 51/80 [05:06<02:50,  5.90s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=5.65e-6, train/loss_step=0.00133, global_step=1712.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  64%|██████▍   | 51/80 [05:06<02:50,  5.90s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=2.76e-6, train/loss_step=0.00038, global_step=1712.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  65%|██████▌   | 52/80 [05:07<02:42,  5.80s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=2.76e-6, train/loss_step=0.00038, global_step=1712.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  65%|██████▌   | 52/80 [05:07<02:42,  5.80s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.31e-5, train/loss_step=0.00357, global_step=1712.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  66%|██████▋   | 53/80 [05:07<02:33,  5.70s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=1.31e-5, train/loss_step=0.00357, global_step=1712.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  66%|██████▋   | 53/80 [05:07<02:33,  5.70s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000293, train/loss_step=0.0139, global_step=1713.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  68%|██████▊   | 54/80 [05:10<02:26,  5.65s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000293, train/loss_step=0.0139, global_step=1713.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  68%|██████▊   | 54/80 [05:10<02:26,  5.65s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=9.49e-6, train/loss_step=0.00226, global_step=1713.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=9.49e-6, train/loss_step=0.00226, global_step=1713.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5e-5, train/loss_step=0.0118, global_step=1713.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]    Epoch 85:  70%|███████   | 56/80 [05:48<02:26,  6.12s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5e-5, train/loss_step=0.0118, global_step=1713.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  70%|███████   | 56/80 [05:48<02:26,  6.12s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=7.7e-6, train/loss_step=0.0021, global_step=1713.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  71%|███████▏  | 57/80 [05:49<02:18,  6.02s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=7.7e-6, train/loss_step=0.0021, global_step=1713.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  71%|███████▏  | 57/80 [05:49<02:18,  6.02s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.78e-6, train/loss_step=0.00136, global_step=1714.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  72%|███████▎  | 58/80 [05:49<02:10,  5.93s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.78e-6, train/loss_step=0.00136, global_step=1714.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  72%|███████▎  | 58/80 [05:49<02:10,  5.93s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=2.64e-6, train/loss_step=0.000661, global_step=1714.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  74%|███████▍  | 59/80 [05:53<02:03,  5.88s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=2.64e-6, train/loss_step=0.000661, global_step=1714.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  74%|███████▍  | 59/80 [05:53<02:03,  5.88s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=0.000174, train/loss_step=0.0045, global_step=1714.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]   Epoch 85:  75%|███████▌  | 60/80 [05:53<01:55,  5.80s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=0.000174, train/loss_step=0.0045, global_step=1714.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  75%|███████▌  | 60/80 [05:53<01:55,  5.80s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=8.77e-7, train/loss_step=0.000218, global_step=1714.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  76%|███████▋  | 61/80 [05:54<01:48,  5.71s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=8.77e-7, train/loss_step=0.000218, global_step=1714.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  76%|███████▋  | 61/80 [05:54<01:48,  5.71s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=1.32e-5, train/loss_step=0.00379, global_step=1715.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:  78%|███████▊  | 62/80 [05:54<01:41,  5.63s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00379, train/loss_vlb_step=1.32e-5, train/loss_step=0.00379, global_step=1715.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  78%|███████▊  | 62/80 [05:54<01:41,  5.63s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=2.23e-5, train/loss_step=0.00589, global_step=1715.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  79%|███████▉  | 63/80 [05:55<01:34,  5.55s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=2.23e-5, train/loss_step=0.00589, global_step=1715.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  79%|███████▉  | 63/80 [05:55<01:34,  5.55s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=6.56e-7, train/loss_step=0.000154, global_step=1715.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  80%|████████  | 64/80 [06:32<01:36,  6.04s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=6.56e-7, train/loss_step=0.000154, global_step=1715.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  80%|████████  | 64/80 [06:32<01:36,  6.04s/it, loss=0.00309, v_num=0, train/loss_simple_step=9.38e-5, train/loss_vlb_step=4.25e-7, train/loss_step=9.38e-5, global_step=1715.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:  81%|████████▏ | 65/80 [06:33<01:29,  5.96s/it, loss=0.00309, v_num=0, train/loss_simple_step=9.38e-5, train/loss_vlb_step=4.25e-7, train/loss_step=9.38e-5, global_step=1715.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  81%|████████▏ | 65/80 [06:33<01:29,  5.96s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=2.2e-5, train/loss_step=0.00611, global_step=1716.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  82%|████████▎ | 66/80 [06:33<01:22,  5.88s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=2.2e-5, train/loss_step=0.00611, global_step=1716.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  82%|████████▎ | 66/80 [06:33<01:22,  5.88s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=2.12e-5, train/loss_step=0.000851, global_step=1716.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  84%|████████▍ | 67/80 [06:42<01:17,  5.92s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=2.12e-5, train/loss_step=0.000851, global_step=1716.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  84%|████████▍ | 67/80 [06:42<01:17,  5.92s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=6.58e-5, train/loss_step=0.00899, global_step=1716.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00899, train/loss_vlb_step=6.58e-5, train/loss_step=0.00899, global_step=1716.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  85%|████████▌ | 68/80 [06:43<01:10,  5.85s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000104, train/loss_vlb_step=3.83e-7, train/loss_step=0.000104, global_step=1716.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  86%|████████▋ | 69/80 [06:43<01:03,  5.77s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000104, train/loss_vlb_step=3.83e-7, train/loss_step=0.000104, global_step=1716.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  86%|████████▋ | 69/80 [06:43<01:03,  5.77s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000257, train/loss_vlb_step=3.66e-6, train/loss_step=0.000257, global_step=1717.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  88%|████████▊ | 70/80 [06:44<00:56,  5.70s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000257, train/loss_vlb_step=3.66e-6, train/loss_step=0.000257, global_step=1717.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  88%|████████▊ | 70/80 [06:44<00:56,  5.70s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000172, train/loss_vlb_step=7.6e-7, train/loss_step=0.000172, global_step=1717.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  89%|████████▉ | 71/80 [06:44<00:50,  5.62s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000172, train/loss_vlb_step=7.6e-7, train/loss_step=0.000172, global_step=1717.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  89%|████████▉ | 71/80 [06:44<00:50,  5.62s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=7.49e-6, train/loss_step=0.00173, global_step=1717.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  90%|█████████ | 72/80 [07:05<00:46,  5.83s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=7.49e-6, train/loss_step=0.00173, global_step=1717.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  90%|█████████ | 72/80 [07:05<00:46,  5.83s/it, loss=0.00325, v_num=0, train/loss_simple_step=9.56e-5, train/loss_vlb_step=4.26e-7, train/loss_step=9.56e-5, global_step=1717.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  91%|█████████▏| 73/80 [07:06<00:40,  5.76s/it, loss=0.00325, v_num=0, train/loss_simple_step=9.56e-5, train/loss_vlb_step=4.26e-7, train/loss_step=9.56e-5, global_step=1717.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  91%|█████████▏| 73/80 [07:06<00:40,  5.76s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.13e-5, train/loss_step=0.00279, global_step=1718.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  92%|█████████▎| 74/80 [07:06<00:34,  5.69s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00279, train/loss_vlb_step=1.13e-5, train/loss_step=0.00279, global_step=1718.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  92%|█████████▎| 74/80 [07:06<00:34,  5.69s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=6.25e-6, train/loss_step=0.000567, global_step=1718.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  94%|█████████▍| 75/80 [07:15<00:28,  5.73s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=6.25e-6, train/loss_step=0.000567, global_step=1718.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  94%|█████████▍| 75/80 [07:15<00:28,  5.73s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=1.77e-5, train/loss_step=0.000619, global_step=1718.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=1.77e-5, train/loss_step=0.000619, global_step=1718.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=1.36e-5, train/loss_step=0.00403, global_step=1718.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 85:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00403, train/loss_vlb_step=1.36e-5, train/loss_step=0.00403, global_step=1718.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000202, train/loss_vlb_step=1.24e-6, train/loss_step=0.000202, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000202, train/loss_vlb_step=1.24e-6, train/loss_step=0.000202, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=4.41e-6, train/loss_step=0.000793, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038] Epoch 85:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=4.41e-6, train/loss_step=0.000793, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=2.55e-6, train/loss_step=0.000273, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=2.55e-6, train/loss_step=0.000273, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 85: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=6.89e-7, train/loss_step=0.000195, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Average Epoch time: 438.09 seconds
+Average Peak memory 29567.81MiB
+Epoch 85:   0%|          | 0/80 [00:00<00:00, 3410.00it/s, loss=0.00189, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=6.89e-7, train/loss_step=0.000195, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 86:   0%|          | 0/80 [00:00<00:00, 1687.17it/s, loss=0.00189, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=6.89e-7, train/loss_step=0.000195, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]Epoch 86:   1%|▏         | 1/80 [00:41<27:08, 20.61s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=6.89e-7, train/loss_step=0.000195, global_step=1719.0, lr_abs=0.0001, train/loss_simple_epoch=0.0038, train/loss_vlb_epoch=9.56e-5, train/loss_epoch=0.0038]  Epoch 86:   1%|▏         | 1/80 [00:41<27:08, 20.61s/it, loss=0.0017, v_num=0, train/loss_simple_step=0.000137, train/loss_vlb_step=5.71e-7, train/loss_step=0.000137, global_step=1720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   2%|▎         | 2/80 [00:41<18:04, 13.90s/it, loss=0.0017, v_num=0, train/loss_simple_step=0.000137, train/loss_vlb_step=5.71e-7, train/loss_step=0.000137, global_step=1720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   2%|▎         | 2/80 [00:41<18:04, 13.90s/it, loss=0.00144, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=2.53e-6, train/loss_step=0.00059, global_step=1720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365] Epoch 86:   4%|▍         | 3/80 [00:49<15:44, 12.26s/it, loss=0.00144, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=2.53e-6, train/loss_step=0.00059, global_step=1720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   4%|▍         | 3/80 [00:49<15:44, 12.26s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=2.25e-5, train/loss_step=0.00622, global_step=1720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   5%|▌         | 4/80 [00:49<12:33,  9.91s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.00622, train/loss_vlb_step=2.25e-5, train/loss_step=0.00622, global_step=1720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   5%|▌         | 4/80 [00:49<12:33,  9.91s/it, loss=0.00175, v_num=0, train/loss_simple_step=0.000371, train/loss_vlb_step=1.93e-6, train/loss_step=0.000371, global_step=1720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   6%|▋         | 5/80 [00:50<10:25,  8.35s/it, loss=0.00175, v_num=0, train/loss_simple_step=0.000371, train/loss_vlb_step=1.93e-6, train/loss_step=0.000371, global_step=1720.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   6%|▋         | 5/80 [00:50<10:25,  8.35s/it, loss=0.00147, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.75e-6, train/loss_step=0.000326, global_step=1721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   8%|▊         | 6/80 [00:50<08:54,  7.22s/it, loss=0.00147, v_num=0, train/loss_simple_step=0.000326, train/loss_vlb_step=1.75e-6, train/loss_step=0.000326, global_step=1721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   8%|▊         | 6/80 [00:50<08:54,  7.22s/it, loss=0.00148, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.96e-6, train/loss_step=0.00104, global_step=1721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:   9%|▉         | 7/80 [00:51<07:45,  6.38s/it, loss=0.00148, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.96e-6, train/loss_step=0.00104, global_step=1721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:   9%|▉         | 7/80 [00:51<07:45,  6.38s/it, loss=0.00105, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=2.24e-6, train/loss_step=0.00044, global_step=1721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  10%|█         | 8/80 [01:14<09:52,  8.23s/it, loss=0.00105, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=2.24e-6, train/loss_step=0.00044, global_step=1721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  10%|█         | 8/80 [01:14<09:52,  8.23s/it, loss=0.00109, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.45e-6, train/loss_step=0.00102, global_step=1721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  11%|█▏        | 9/80 [01:25<10:05,  8.53s/it, loss=0.00109, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.45e-6, train/loss_step=0.00102, global_step=1721.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  11%|█▏        | 9/80 [01:25<10:05,  8.53s/it, loss=0.00111, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=3.53e-6, train/loss_step=0.000635, global_step=1722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  12%|█▎        | 10/80 [01:25<09:05,  7.80s/it, loss=0.00111, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=3.53e-6, train/loss_step=0.000635, global_step=1722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  12%|█▎        | 10/80 [01:25<09:05,  7.80s/it, loss=0.00113, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=6.34e-6, train/loss_step=0.000606, global_step=1722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  14%|█▍        | 11/80 [01:27<08:22,  7.28s/it, loss=0.00113, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=6.34e-6, train/loss_step=0.000606, global_step=1722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  14%|█▍        | 11/80 [01:27<08:22,  7.28s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=9.9e-5, train/loss_step=0.0148, global_step=1722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]     Epoch 86:  15%|█▌        | 12/80 [01:27<07:39,  6.76s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=9.9e-5, train/loss_step=0.0148, global_step=1722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  15%|█▌        | 12/80 [01:27<07:39,  6.76s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=1.77e-6, train/loss_step=0.000431, global_step=1722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  16%|█▋        | 13/80 [01:28<07:03,  6.32s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=1.77e-6, train/loss_step=0.000431, global_step=1722.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  16%|█▋        | 13/80 [01:28<07:03,  6.32s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=8.86e-7, train/loss_step=0.000218, global_step=1723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  18%|█▊        | 14/80 [01:28<06:31,  5.93s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=8.86e-7, train/loss_step=0.000218, global_step=1723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  18%|█▊        | 14/80 [01:28<06:31,  5.93s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.000581, train/loss_vlb_step=5.05e-6, train/loss_step=0.000581, global_step=1723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  19%|█▉        | 15/80 [01:29<06:03,  5.59s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.000581, train/loss_vlb_step=5.05e-6, train/loss_step=0.000581, global_step=1723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  19%|█▉        | 15/80 [01:29<06:03,  5.59s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=5.2e-5, train/loss_step=0.00978, global_step=1723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]   Epoch 86:  20%|██        | 16/80 [01:55<07:13,  6.78s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00978, train/loss_vlb_step=5.2e-5, train/loss_step=0.00978, global_step=1723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  20%|██        | 16/80 [01:55<07:13,  6.78s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.000565, train/loss_vlb_step=3.28e-6, train/loss_step=0.000565, global_step=1723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  21%|██▏       | 17/80 [02:14<07:49,  7.45s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.000565, train/loss_vlb_step=3.28e-6, train/loss_step=0.000565, global_step=1723.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  21%|██▏       | 17/80 [02:14<07:49,  7.45s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=1.32e-5, train/loss_step=0.00378, global_step=1724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  22%|██▎       | 18/80 [02:14<07:19,  7.09s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.00378, train/loss_vlb_step=1.32e-5, train/loss_step=0.00378, global_step=1724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  22%|██▎       | 18/80 [02:14<07:19,  7.09s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=2.43e-5, train/loss_step=0.000474, global_step=1724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  24%|██▍       | 19/80 [02:15<06:52,  6.76s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=2.43e-5, train/loss_step=0.000474, global_step=1724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  24%|██▍       | 19/80 [02:15<06:52,  6.76s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=3.6e-6, train/loss_step=0.000294, global_step=1724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365] Epoch 86:  25%|██▌       | 20/80 [02:15<06:27,  6.46s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=3.6e-6, train/loss_step=0.000294, global_step=1724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  25%|██▌       | 20/80 [02:15<06:27,  6.46s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.83e-5, train/loss_step=0.0107, global_step=1724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]   Epoch 86:  26%|██▋       | 21/80 [02:16<06:05,  6.19s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.83e-5, train/loss_step=0.0107, global_step=1724.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  26%|██▋       | 21/80 [02:16<06:05,  6.19s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000283, train/loss_vlb_step=1.41e-6, train/loss_step=0.000283, global_step=1725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  28%|██▊       | 22/80 [02:16<05:44,  5.94s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000283, train/loss_vlb_step=1.41e-6, train/loss_step=0.000283, global_step=1725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  28%|██▊       | 22/80 [02:16<05:44,  5.94s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.34e-6, train/loss_step=0.000255, global_step=1725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  29%|██▉       | 23/80 [02:17<05:25,  5.72s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.34e-6, train/loss_step=0.000255, global_step=1725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  29%|██▉       | 23/80 [02:17<05:25,  5.72s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=0.00126, train/loss_step=0.0222, global_step=1725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]    Epoch 86:  30%|███       | 24/80 [02:43<06:07,  6.56s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.0222, train/loss_vlb_step=0.00126, train/loss_step=0.0222, global_step=1725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  30%|███       | 24/80 [02:43<06:07,  6.56s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000449, train/loss_vlb_step=2.9e-6, train/loss_step=0.000449, global_step=1725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  31%|███▏      | 25/80 [02:58<06:18,  6.88s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000449, train/loss_vlb_step=2.9e-6, train/loss_step=0.000449, global_step=1725.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  31%|███▏      | 25/80 [02:58<06:18,  6.88s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=4.27e-6, train/loss_step=0.000366, global_step=1726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  32%|███▎      | 26/80 [02:59<05:58,  6.65s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=4.27e-6, train/loss_step=0.000366, global_step=1726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  32%|███▎      | 26/80 [02:59<05:58,  6.65s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.84e-5, train/loss_step=0.00115, global_step=1726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  34%|███▍      | 27/80 [02:59<05:40,  6.43s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.84e-5, train/loss_step=0.00115, global_step=1726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  34%|███▍      | 27/80 [02:59<05:40,  6.43s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=1.04e-6, train/loss_step=0.000232, global_step=1726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  35%|███▌      | 28/80 [03:00<05:23,  6.23s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=1.04e-6, train/loss_step=0.000232, global_step=1726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  35%|███▌      | 28/80 [03:00<05:23,  6.23s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=1.3e-5, train/loss_step=0.00382, global_step=1726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]   Epoch 86:  36%|███▋      | 29/80 [03:01<05:09,  6.07s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=1.3e-5, train/loss_step=0.00382, global_step=1726.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  36%|███▋      | 29/80 [03:01<05:09,  6.07s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.43e-5, train/loss_step=0.007, global_step=1727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]    Epoch 86:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.43e-5, train/loss_step=0.007, global_step=1727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=8.3e-6, train/loss_step=0.00187, global_step=1727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  39%|███▉      | 31/80 [03:02<04:40,  5.72s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=8.3e-6, train/loss_step=0.00187, global_step=1727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  39%|███▉      | 31/80 [03:02<04:40,  5.72s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=6.7e-6, train/loss_step=0.000623, global_step=1727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  40%|████      | 32/80 [03:27<05:02,  6.30s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=6.7e-6, train/loss_step=0.000623, global_step=1727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  40%|████      | 32/80 [03:27<05:02,  6.30s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000723, train/loss_vlb_step=5.51e-6, train/loss_step=0.000723, global_step=1727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  41%|████▏     | 33/80 [03:42<05:07,  6.54s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000723, train/loss_vlb_step=5.51e-6, train/loss_step=0.000723, global_step=1727.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  41%|████▏     | 33/80 [03:42<05:07,  6.54s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000974, train/loss_step=0.014, global_step=1728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]     Epoch 86:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000974, train/loss_step=0.014, global_step=1728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=8.2e-5, train/loss_step=0.0116, global_step=1728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  44%|████▍     | 35/80 [03:43<04:39,  6.20s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=8.2e-5, train/loss_step=0.0116, global_step=1728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  44%|████▍     | 35/80 [03:43<04:39,  6.20s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=2.51e-5, train/loss_step=0.00758, global_step=1728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  45%|████▌     | 36/80 [03:43<04:26,  6.05s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=2.51e-5, train/loss_step=0.00758, global_step=1728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  45%|████▌     | 36/80 [03:43<04:26,  6.05s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.21e-5, train/loss_step=0.00521, global_step=1728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  46%|████▋     | 37/80 [03:44<04:14,  5.91s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=2.21e-5, train/loss_step=0.00521, global_step=1728.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  46%|████▋     | 37/80 [03:44<04:14,  5.91s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=0.000286, train/loss_step=0.0225, global_step=1729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365] Epoch 86:  48%|████▊     | 38/80 [03:44<04:02,  5.77s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=0.000286, train/loss_step=0.0225, global_step=1729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  48%|████▊     | 38/80 [03:44<04:02,  5.77s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=2.15e-6, train/loss_step=0.000448, global_step=1729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  49%|████▉     | 39/80 [03:45<03:51,  5.64s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=2.15e-6, train/loss_step=0.000448, global_step=1729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  49%|████▉     | 39/80 [03:45<03:51,  5.64s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.41e-5, train/loss_step=0.00591, global_step=1729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  50%|█████     | 40/80 [04:24<04:17,  6.45s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.41e-5, train/loss_step=0.00591, global_step=1729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  50%|█████     | 40/80 [04:24<04:17,  6.45s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=6.13e-5, train/loss_step=0.00221, global_step=1729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  51%|█████▏    | 41/80 [04:25<04:06,  6.33s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=6.13e-5, train/loss_step=0.00221, global_step=1729.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  51%|█████▏    | 41/80 [04:25<04:06,  6.33s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.52e-5, train/loss_step=0.00451, global_step=1730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  52%|█████▎    | 42/80 [04:26<03:55,  6.20s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.52e-5, train/loss_step=0.00451, global_step=1730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  52%|█████▎    | 42/80 [04:26<03:55,  6.20s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=9.4e-6, train/loss_step=0.0024, global_step=1730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]   Epoch 86:  54%|█████▍    | 43/80 [04:26<03:44,  6.07s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=9.4e-6, train/loss_step=0.0024, global_step=1730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  54%|█████▍    | 43/80 [04:26<03:44,  6.07s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=1.56e-6, train/loss_step=0.000183, global_step=1730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  55%|█████▌    | 44/80 [04:27<03:33,  5.94s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=1.56e-6, train/loss_step=0.000183, global_step=1730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  55%|█████▌    | 44/80 [04:27<03:33,  5.94s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000155, train/loss_vlb_step=7e-7, train/loss_step=0.000155, global_step=1730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]   Epoch 86:  56%|█████▋    | 45/80 [04:28<03:24,  5.83s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000155, train/loss_vlb_step=7e-7, train/loss_step=0.000155, global_step=1730.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  56%|█████▋    | 45/80 [04:28<03:24,  5.83s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=8.26e-5, train/loss_step=0.0113, global_step=1731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365] Epoch 86:  57%|█████▊    | 46/80 [04:28<03:14,  5.72s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=8.26e-5, train/loss_step=0.0113, global_step=1731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  57%|█████▊    | 46/80 [04:28<03:14,  5.72s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000115, train/loss_vlb_step=4.11e-7, train/loss_step=0.000115, global_step=1731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  59%|█████▉    | 47/80 [04:29<03:05,  5.61s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000115, train/loss_vlb_step=4.11e-7, train/loss_step=0.000115, global_step=1731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  59%|█████▉    | 47/80 [04:29<03:05,  5.61s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000272, train/loss_vlb_step=1.91e-6, train/loss_step=0.000272, global_step=1731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  60%|██████    | 48/80 [04:58<03:15,  6.10s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000272, train/loss_vlb_step=1.91e-6, train/loss_step=0.000272, global_step=1731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  60%|██████    | 48/80 [04:58<03:15,  6.10s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=2.27e-5, train/loss_step=0.00607, global_step=1731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  61%|██████▏   | 49/80 [04:59<03:05,  5.99s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.00607, train/loss_vlb_step=2.27e-5, train/loss_step=0.00607, global_step=1731.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  61%|██████▏   | 49/80 [04:59<03:05,  5.99s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00014, train/loss_vlb_step=5.54e-7, train/loss_step=0.00014, global_step=1732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  62%|██████▎   | 50/80 [05:00<02:56,  5.88s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00014, train/loss_vlb_step=5.54e-7, train/loss_step=0.00014, global_step=1732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  62%|██████▎   | 50/80 [05:00<02:56,  5.88s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000283, train/loss_vlb_step=3.41e-6, train/loss_step=0.000283, global_step=1732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  64%|██████▍   | 51/80 [05:03<02:49,  5.83s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000283, train/loss_vlb_step=3.41e-6, train/loss_step=0.000283, global_step=1732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  64%|██████▍   | 51/80 [05:03<02:49,  5.83s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=9.57e-5, train/loss_step=0.0149, global_step=1732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]    Epoch 86:  65%|██████▌   | 52/80 [05:03<02:40,  5.73s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=9.57e-5, train/loss_step=0.0149, global_step=1732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  65%|██████▌   | 52/80 [05:03<02:40,  5.73s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=3.78e-5, train/loss_step=0.00315, global_step=1732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  66%|██████▋   | 53/80 [05:04<02:32,  5.63s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=3.78e-5, train/loss_step=0.00315, global_step=1732.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  66%|██████▋   | 53/80 [05:04<02:32,  5.63s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=7.34e-5, train/loss_step=0.0123, global_step=1733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  68%|██████▊   | 54/80 [05:04<02:24,  5.54s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=7.34e-5, train/loss_step=0.0123, global_step=1733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  68%|██████▊   | 54/80 [05:04<02:24,  5.54s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.11e-5, train/loss_step=0.00326, global_step=1733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  69%|██████▉   | 55/80 [05:05<02:16,  5.46s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.11e-5, train/loss_step=0.00326, global_step=1733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  69%|██████▉   | 55/80 [05:05<02:16,  5.46s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=7.02e-6, train/loss_step=0.00102, global_step=1733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=7.02e-6, train/loss_step=0.00102, global_step=1733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=2.97e-5, train/loss_step=0.00808, global_step=1733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  71%|███████▏  | 57/80 [05:42<02:15,  5.90s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=2.97e-5, train/loss_step=0.00808, global_step=1733.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  71%|███████▏  | 57/80 [05:42<02:15,  5.90s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=5.19e-5, train/loss_step=0.00839, global_step=1734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  72%|███████▎  | 58/80 [05:42<02:07,  5.81s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00839, train/loss_vlb_step=5.19e-5, train/loss_step=0.00839, global_step=1734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  72%|███████▎  | 58/80 [05:42<02:07,  5.81s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=9.33e-6, train/loss_step=0.00235, global_step=1734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  74%|███████▍  | 59/80 [05:48<02:01,  5.80s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=9.33e-6, train/loss_step=0.00235, global_step=1734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  74%|███████▍  | 59/80 [05:48<02:01,  5.80s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=4.27e-5, train/loss_step=0.00779, global_step=1734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  75%|███████▌  | 60/80 [05:48<01:54,  5.72s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00779, train/loss_vlb_step=4.27e-5, train/loss_step=0.00779, global_step=1734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  75%|███████▌  | 60/80 [05:48<01:54,  5.72s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=2.59e-6, train/loss_step=0.0002, global_step=1734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  76%|███████▋  | 61/80 [05:49<01:47,  5.63s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=2.59e-6, train/loss_step=0.0002, global_step=1734.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  76%|███████▋  | 61/80 [05:49<01:47,  5.63s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=2.62e-5, train/loss_step=0.00727, global_step=1735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  78%|███████▊  | 62/80 [05:49<01:39,  5.55s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00727, train/loss_vlb_step=2.62e-5, train/loss_step=0.00727, global_step=1735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  78%|███████▊  | 62/80 [05:49<01:39,  5.55s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000639, train/loss_step=0.0125, global_step=1735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365] Epoch 86:  79%|███████▉  | 63/80 [05:50<01:33,  5.47s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000639, train/loss_step=0.0125, global_step=1735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  79%|███████▉  | 63/80 [05:50<01:33,  5.47s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=2.58e-6, train/loss_step=0.00057, global_step=1735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365] Epoch 86:  80%|████████  | 64/80 [06:15<01:32,  5.78s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=2.58e-6, train/loss_step=0.00057, global_step=1735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  80%|████████  | 64/80 [06:15<01:32,  5.78s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.31e-6, train/loss_step=0.000325, global_step=1735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  81%|████████▏ | 65/80 [06:25<01:27,  5.84s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.31e-6, train/loss_step=0.000325, global_step=1735.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  81%|████████▏ | 65/80 [06:25<01:27,  5.84s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=7.35e-6, train/loss_step=0.00221, global_step=1736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  82%|████████▎ | 66/80 [06:25<01:20,  5.76s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=7.35e-6, train/loss_step=0.00221, global_step=1736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  82%|████████▎ | 66/80 [06:25<01:20,  5.76s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=4.11e-6, train/loss_step=0.000968, global_step=1736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  84%|████████▍ | 67/80 [06:40<01:16,  5.89s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=4.11e-6, train/loss_step=0.000968, global_step=1736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  84%|████████▍ | 67/80 [06:40<01:16,  5.89s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=2.3e-6, train/loss_step=0.00042, global_step=1736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  85%|████████▌ | 68/80 [06:41<01:09,  5.81s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=2.3e-6, train/loss_step=0.00042, global_step=1736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  85%|████████▌ | 68/80 [06:41<01:09,  5.81s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.11e-5, train/loss_step=0.00315, global_step=1736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  86%|████████▋ | 69/80 [06:41<01:03,  5.74s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.11e-5, train/loss_step=0.00315, global_step=1736.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  86%|████████▋ | 69/80 [06:41<01:03,  5.74s/it, loss=0.00609, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.0163, train/loss_step=0.0326, global_step=1737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]   Epoch 86:  88%|████████▊ | 70/80 [06:42<00:56,  5.66s/it, loss=0.00609, v_num=0, train/loss_simple_step=0.0326, train/loss_vlb_step=0.0163, train/loss_step=0.0326, global_step=1737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  88%|████████▊ | 70/80 [06:42<00:56,  5.66s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=8.32e-5, train/loss_step=0.00214, global_step=1737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  89%|████████▉ | 71/80 [06:42<00:50,  5.59s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=8.32e-5, train/loss_step=0.00214, global_step=1737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  89%|████████▉ | 71/80 [06:42<00:50,  5.59s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=8.32e-6, train/loss_step=0.00223, global_step=1737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  90%|█████████ | 72/80 [06:45<00:44,  5.56s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=8.32e-6, train/loss_step=0.00223, global_step=1737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  90%|█████████ | 72/80 [06:45<00:44,  5.56s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=1.37e-6, train/loss_step=0.00019, global_step=1737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365] Epoch 86:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=1.37e-6, train/loss_step=0.00019, global_step=1737.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000743, train/loss_vlb_step=3.83e-6, train/loss_step=0.000743, global_step=1738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  92%|█████████▎| 74/80 [06:58<00:33,  5.58s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000743, train/loss_vlb_step=3.83e-6, train/loss_step=0.000743, global_step=1738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  92%|█████████▎| 74/80 [06:58<00:33,  5.58s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.09e-5, train/loss_step=0.00322, global_step=1738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  94%|█████████▍| 75/80 [07:11<00:28,  5.68s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.09e-5, train/loss_step=0.00322, global_step=1738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  94%|█████████▍| 75/80 [07:11<00:28,  5.68s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.00202, train/loss_step=0.0276, global_step=1738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 86:  95%|█████████▌| 76/80 [07:12<00:22,  5.62s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.0276, train/loss_vlb_step=0.00202, train/loss_step=0.0276, global_step=1738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  95%|█████████▌| 76/80 [07:12<00:22,  5.62s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=4.52e-5, train/loss_step=0.00165, global_step=1738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  96%|█████████▋| 77/80 [07:12<00:16,  5.55s/it, loss=0.00583, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=4.52e-5, train/loss_step=0.00165, global_step=1738.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  96%|█████████▋| 77/80 [07:12<00:16,  5.55s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=3e-5, train/loss_step=0.0043, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]     Epoch 86:  98%|█████████▊| 78/80 [07:13<00:10,  5.49s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=3e-5, train/loss_step=0.0043, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  98%|█████████▊| 78/80 [07:13<00:10,  5.49s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=0.000433, train/loss_step=0.00114, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  99%|█████████▉| 79/80 [07:13<00:05,  5.42s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=0.000433, train/loss_step=0.00114, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86:  99%|█████████▉| 79/80 [07:13<00:05,  5.42s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.14e-6, train/loss_step=0.000312, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86: 100%|██████████| 80/80 [07:14<00:00,  5.36s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.14e-6, train/loss_step=0.000312, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 86: 100%|██████████| 80/80 [07:14<00:00,  5.36s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=1.9e-5, train/loss_step=0.00568, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]   Average Epoch time: 434.33 seconds
+Average Peak memory 29562.90MiB
+Epoch 86:   0%|          | 0/80 [00:00<00:00, 7294.44it/s, loss=0.00546, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=1.9e-5, train/loss_step=0.00568, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 87:   0%|          | 0/80 [00:00<00:00, 2676.65it/s, loss=0.00546, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=1.9e-5, train/loss_step=0.00568, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]Epoch 87:   1%|▏         | 1/80 [00:41<27:20, 20.77s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=1.9e-5, train/loss_step=0.00568, global_step=1739.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=6.92e-5, train/loss_epoch=0.00365]  Epoch 87:   1%|▏         | 1/80 [00:41<27:20, 20.77s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=2.46e-6, train/loss_step=0.000434, global_step=1740.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004] Epoch 87:   2%|▎         | 2/80 [00:44<19:13, 14.79s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=2.46e-6, train/loss_step=0.000434, global_step=1740.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:   2%|▎         | 2/80 [00:44<19:13, 14.79s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.86e-5, train/loss_step=0.00873, global_step=1740.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:   4%|▍         | 3/80 [00:44<14:23, 11.21s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.86e-5, train/loss_step=0.00873, global_step=1740.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:   4%|▍         | 3/80 [00:44<14:23, 11.21s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.28e-6, train/loss_step=0.00032, global_step=1740.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:   5%|▌         | 4/80 [00:45<11:29,  9.07s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.28e-6, train/loss_step=0.00032, global_step=1740.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:   5%|▌         | 4/80 [00:45<11:29,  9.07s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=7.4e-6, train/loss_step=0.00136, global_step=1740.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004] Epoch 87:   6%|▋         | 5/80 [00:45<09:33,  7.65s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=7.4e-6, train/loss_step=0.00136, global_step=1740.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:   6%|▋         | 5/80 [00:45<09:33,  7.65s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.84e-6, train/loss_step=0.0012, global_step=1741.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004] Epoch 87:   8%|▊         | 6/80 [00:46<08:10,  6.62s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.84e-6, train/loss_step=0.0012, global_step=1741.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:   8%|▊         | 6/80 [00:46<08:10,  6.62s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000306, train/loss_vlb_step=1.24e-6, train/loss_step=0.000306, global_step=1741.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:   9%|▉         | 7/80 [00:46<07:07,  5.86s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000306, train/loss_vlb_step=1.24e-6, train/loss_step=0.000306, global_step=1741.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:   9%|▉         | 7/80 [00:46<07:07,  5.86s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.28e-6, train/loss_step=0.000315, global_step=1741.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  10%|█         | 8/80 [01:07<08:56,  7.45s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.28e-6, train/loss_step=0.000315, global_step=1741.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  10%|█         | 8/80 [01:07<08:56,  7.46s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.57e-5, train/loss_step=0.0046, global_step=1741.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]    Epoch 87:  11%|█▏        | 9/80 [01:21<09:41,  8.18s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.57e-5, train/loss_step=0.0046, global_step=1741.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  11%|█▏        | 9/80 [01:21<09:41,  8.18s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=4.57e-6, train/loss_step=0.00034, global_step=1742.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  12%|█▎        | 10/80 [01:27<09:14,  7.92s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=4.57e-6, train/loss_step=0.00034, global_step=1742.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  12%|█▎        | 10/80 [01:27<09:14,  7.92s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=8.83e-6, train/loss_step=0.00251, global_step=1742.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  14%|█▍        | 11/80 [01:27<08:23,  7.30s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=8.83e-6, train/loss_step=0.00251, global_step=1742.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  14%|█▍        | 11/80 [01:27<08:23,  7.30s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=6.97e-7, train/loss_step=0.000171, global_step=1742.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  15%|█▌        | 12/80 [01:28<07:40,  6.78s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=6.97e-7, train/loss_step=0.000171, global_step=1742.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  15%|█▌        | 12/80 [01:28<07:40,  6.78s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=7.54e-7, train/loss_step=0.000181, global_step=1742.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  16%|█▋        | 13/80 [01:28<07:04,  6.33s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=7.54e-7, train/loss_step=0.000181, global_step=1742.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  16%|█▋        | 13/80 [01:28<07:04,  6.33s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000666, train/loss_vlb_step=4.47e-6, train/loss_step=0.000666, global_step=1743.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  18%|█▊        | 14/80 [01:29<06:32,  5.94s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000666, train/loss_vlb_step=4.47e-6, train/loss_step=0.000666, global_step=1743.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  18%|█▊        | 14/80 [01:29<06:32,  5.94s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=2.13e-6, train/loss_step=0.000368, global_step=1743.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  19%|█▉        | 15/80 [01:29<06:04,  5.60s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=2.13e-6, train/loss_step=0.000368, global_step=1743.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  19%|█▉        | 15/80 [01:29<06:04,  5.60s/it, loss=0.00175, v_num=0, train/loss_simple_step=0.000361, train/loss_vlb_step=2.84e-6, train/loss_step=0.000361, global_step=1743.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  20%|██        | 16/80 [01:53<07:07,  6.69s/it, loss=0.00175, v_num=0, train/loss_simple_step=0.000361, train/loss_vlb_step=2.84e-6, train/loss_step=0.000361, global_step=1743.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  20%|██        | 16/80 [01:53<07:07,  6.69s/it, loss=0.00173, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=4.95e-6, train/loss_step=0.00136, global_step=1743.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  21%|██▏       | 17/80 [02:03<07:10,  6.83s/it, loss=0.00173, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=4.95e-6, train/loss_step=0.00136, global_step=1743.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  21%|██▏       | 17/80 [02:03<07:10,  6.83s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.020, train/loss_step=0.0439, global_step=1744.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]    Epoch 87:  22%|██▎       | 18/80 [02:04<06:45,  6.54s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0439, train/loss_vlb_step=0.020, train/loss_step=0.0439, global_step=1744.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  22%|██▎       | 18/80 [02:04<06:45,  6.54s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1e-6, train/loss_step=0.000242, global_step=1744.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  24%|██▍       | 19/80 [02:04<06:20,  6.24s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1e-6, train/loss_step=0.000242, global_step=1744.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  24%|██▍       | 19/80 [02:04<06:20,  6.24s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=2.62e-5, train/loss_step=0.00144, global_step=1744.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  25%|██▌       | 20/80 [02:05<05:57,  5.96s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=2.62e-5, train/loss_step=0.00144, global_step=1744.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  25%|██▌       | 20/80 [02:05<05:57,  5.96s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000484, train/loss_vlb_step=1.06e-5, train/loss_step=0.000484, global_step=1744.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  26%|██▋       | 21/80 [02:05<05:37,  5.72s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000484, train/loss_vlb_step=1.06e-5, train/loss_step=0.000484, global_step=1744.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  26%|██▋       | 21/80 [02:05<05:37,  5.72s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.16e-5, train/loss_step=0.00312, global_step=1745.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]   Epoch 87:  28%|██▊       | 22/80 [02:06<05:18,  5.50s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.16e-5, train/loss_step=0.00312, global_step=1745.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  28%|██▊       | 22/80 [02:06<05:18,  5.50s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=5.53e-5, train/loss_step=0.0102, global_step=1745.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004] Epoch 87:  29%|██▉       | 23/80 [02:06<05:01,  5.29s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=5.53e-5, train/loss_step=0.0102, global_step=1745.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  29%|██▉       | 23/80 [02:06<05:01,  5.29s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.78e-6, train/loss_step=0.00144, global_step=1745.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  30%|███       | 24/80 [02:31<05:39,  6.06s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=5.78e-6, train/loss_step=0.00144, global_step=1745.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  30%|███       | 24/80 [02:31<05:39,  6.06s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=5.71e-6, train/loss_step=0.00122, global_step=1745.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  31%|███▏      | 25/80 [02:48<05:56,  6.48s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=5.71e-6, train/loss_step=0.00122, global_step=1745.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  31%|███▏      | 25/80 [02:48<05:56,  6.48s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000873, train/loss_vlb_step=1.25e-5, train/loss_step=0.000873, global_step=1746.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  32%|███▎      | 26/80 [02:49<05:39,  6.29s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000873, train/loss_vlb_step=1.25e-5, train/loss_step=0.000873, global_step=1746.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  32%|███▎      | 26/80 [02:49<05:39,  6.29s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=6.23e-6, train/loss_step=0.00146, global_step=1746.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004] Epoch 87:  34%|███▍      | 27/80 [02:50<05:22,  6.08s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=6.23e-6, train/loss_step=0.00146, global_step=1746.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  34%|███▍      | 27/80 [02:50<05:22,  6.08s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.34e-5, train/loss_step=0.00945, global_step=1746.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  35%|███▌      | 28/80 [02:50<05:06,  5.89s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00945, train/loss_vlb_step=4.34e-5, train/loss_step=0.00945, global_step=1746.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  35%|███▌      | 28/80 [02:50<05:06,  5.89s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=1.48e-5, train/loss_step=0.00406, global_step=1746.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  36%|███▋      | 29/80 [02:51<04:51,  5.71s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.00406, train/loss_vlb_step=1.48e-5, train/loss_step=0.00406, global_step=1746.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  36%|███▋      | 29/80 [02:51<04:51,  5.71s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=3.62e-6, train/loss_step=0.000623, global_step=1747.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  38%|███▊      | 30/80 [02:51<04:37,  5.54s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=3.62e-6, train/loss_step=0.000623, global_step=1747.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  38%|███▊      | 30/80 [02:51<04:37,  5.54s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000937, train/loss_vlb_step=3.5e-5, train/loss_step=0.000937, global_step=1747.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  39%|███▉      | 31/80 [02:52<04:23,  5.38s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000937, train/loss_vlb_step=3.5e-5, train/loss_step=0.000937, global_step=1747.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  39%|███▉      | 31/80 [02:52<04:23,  5.38s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.07e-5, train/loss_step=0.003, global_step=1747.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]     Epoch 87:  40%|████      | 32/80 [03:20<04:51,  6.07s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.07e-5, train/loss_step=0.003, global_step=1747.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  40%|████      | 32/80 [03:20<04:51,  6.07s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.39e-6, train/loss_step=0.000552, global_step=1747.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  41%|████▏     | 33/80 [03:25<04:44,  6.06s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000552, train/loss_vlb_step=2.39e-6, train/loss_step=0.000552, global_step=1747.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  41%|████▏     | 33/80 [03:25<04:44,  6.06s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000281, train/loss_step=0.0133, global_step=1748.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]   Epoch 87:  42%|████▎     | 34/80 [03:33<04:40,  6.10s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=0.000281, train/loss_step=0.0133, global_step=1748.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  42%|████▎     | 34/80 [03:33<04:40,  6.10s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.84e-6, train/loss_step=0.000303, global_step=1748.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  44%|████▍     | 35/80 [03:33<04:27,  5.94s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.84e-6, train/loss_step=0.000303, global_step=1748.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  44%|████▍     | 35/80 [03:33<04:27,  5.94s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=2.9e-5, train/loss_step=0.00769, global_step=1748.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]   Epoch 87:  45%|████▌     | 36/80 [03:34<04:14,  5.79s/it, loss=0.00528, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=2.9e-5, train/loss_step=0.00769, global_step=1748.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  45%|████▌     | 36/80 [03:34<04:14,  5.79s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=7.94e-5, train/loss_step=0.00908, global_step=1748.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  46%|████▋     | 37/80 [03:34<04:03,  5.66s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=7.94e-5, train/loss_step=0.00908, global_step=1748.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  46%|████▋     | 37/80 [03:34<04:03,  5.66s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.35e-6, train/loss_step=0.000273, global_step=1749.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  48%|████▊     | 38/80 [03:35<03:51,  5.52s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=1.35e-6, train/loss_step=0.000273, global_step=1749.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  48%|████▊     | 38/80 [03:35<03:51,  5.52s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=8.37e-6, train/loss_step=0.00075, global_step=1749.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  49%|████▉     | 39/80 [03:35<03:41,  5.40s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=8.37e-6, train/loss_step=0.00075, global_step=1749.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  49%|████▉     | 39/80 [03:35<03:41,  5.40s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000576, train/loss_vlb_step=7.91e-6, train/loss_step=0.000576, global_step=1749.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  50%|█████     | 40/80 [04:02<03:56,  5.90s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000576, train/loss_vlb_step=7.91e-6, train/loss_step=0.000576, global_step=1749.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  50%|█████     | 40/80 [04:02<03:56,  5.90s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=1.37e-5, train/loss_step=0.00397, global_step=1749.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  51%|█████▏    | 41/80 [04:17<03:59,  6.14s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00397, train/loss_vlb_step=1.37e-5, train/loss_step=0.00397, global_step=1749.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  51%|█████▏    | 41/80 [04:17<03:59,  6.14s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.46e-6, train/loss_step=0.000367, global_step=1750.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  52%|█████▎    | 42/80 [04:21<03:50,  6.07s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.46e-6, train/loss_step=0.000367, global_step=1750.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  52%|█████▎    | 42/80 [04:21<03:50,  6.07s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000173, train/loss_vlb_step=7.39e-7, train/loss_step=0.000173, global_step=1750.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004] Epoch 87:  54%|█████▍    | 43/80 [04:21<03:39,  5.94s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000173, train/loss_vlb_step=7.39e-7, train/loss_step=0.000173, global_step=1750.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  54%|█████▍    | 43/80 [04:21<03:39,  5.94s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=8.83e-6, train/loss_step=0.00245, global_step=1750.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  55%|█████▌    | 44/80 [04:22<03:29,  5.82s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=8.83e-6, train/loss_step=0.00245, global_step=1750.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  55%|█████▌    | 44/80 [04:22<03:29,  5.82s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=2.98e-5, train/loss_step=0.00883, global_step=1750.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  56%|█████▋    | 45/80 [04:22<03:19,  5.71s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00883, train/loss_vlb_step=2.98e-5, train/loss_step=0.00883, global_step=1750.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  56%|█████▋    | 45/80 [04:22<03:19,  5.71s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000669, train/loss_vlb_step=4.51e-6, train/loss_step=0.000669, global_step=1751.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  57%|█████▊    | 46/80 [04:23<03:10,  5.60s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000669, train/loss_vlb_step=4.51e-6, train/loss_step=0.000669, global_step=1751.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  57%|█████▊    | 46/80 [04:23<03:10,  5.60s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.18e-5, train/loss_step=0.00313, global_step=1751.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  59%|█████▉    | 47/80 [04:23<03:01,  5.49s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.18e-5, train/loss_step=0.00313, global_step=1751.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  59%|█████▉    | 47/80 [04:23<03:01,  5.49s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=9.12e-6, train/loss_step=0.00201, global_step=1751.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  60%|██████    | 48/80 [04:39<03:02,  5.71s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=9.12e-6, train/loss_step=0.00201, global_step=1751.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  60%|██████    | 48/80 [04:39<03:02,  5.71s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=2.5e-5, train/loss_step=0.00345, global_step=1751.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  61%|██████▏   | 49/80 [05:08<03:11,  6.18s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=2.5e-5, train/loss_step=0.00345, global_step=1751.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  61%|██████▏   | 49/80 [05:08<03:11,  6.18s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=5.45e-6, train/loss_step=0.000339, global_step=1752.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=5.45e-6, train/loss_step=0.000339, global_step=1752.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=7.71e-7, train/loss_step=0.000171, global_step=1752.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  64%|██████▍   | 51/80 [05:09<02:52,  5.96s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=7.71e-7, train/loss_step=0.000171, global_step=1752.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  64%|██████▍   | 51/80 [05:09<02:52,  5.96s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.95e-6, train/loss_step=0.000291, global_step=1752.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.95e-6, train/loss_step=0.000291, global_step=1752.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000832, train/loss_vlb_step=7.47e-6, train/loss_step=0.000832, global_step=1752.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  66%|██████▋   | 53/80 [05:10<02:35,  5.76s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000832, train/loss_vlb_step=7.47e-6, train/loss_step=0.000832, global_step=1752.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  66%|██████▋   | 53/80 [05:10<02:35,  5.76s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=1.57e-5, train/loss_step=0.00434, global_step=1753.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  68%|██████▊   | 54/80 [05:11<02:27,  5.66s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00434, train/loss_vlb_step=1.57e-5, train/loss_step=0.00434, global_step=1753.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  68%|██████▊   | 54/80 [05:11<02:27,  5.66s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000981, train/loss_vlb_step=4.11e-6, train/loss_step=0.000981, global_step=1753.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  69%|██████▉   | 55/80 [05:11<02:19,  5.57s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000981, train/loss_vlb_step=4.11e-6, train/loss_step=0.000981, global_step=1753.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  69%|██████▉   | 55/80 [05:11<02:19,  5.57s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=2.25e-5, train/loss_step=0.00641, global_step=1753.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  70%|███████   | 56/80 [05:19<02:14,  5.61s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.00641, train/loss_vlb_step=2.25e-5, train/loss_step=0.00641, global_step=1753.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  70%|███████   | 56/80 [05:19<02:14,  5.61s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.000509, train/loss_vlb_step=3.57e-6, train/loss_step=0.000509, global_step=1753.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  71%|███████▏  | 57/80 [05:57<02:21,  6.16s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.000509, train/loss_vlb_step=3.57e-6, train/loss_step=0.000509, global_step=1753.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  71%|███████▏  | 57/80 [05:57<02:21,  6.16s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=2.47e-5, train/loss_step=0.00693, global_step=1754.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  72%|███████▎  | 58/80 [05:57<02:13,  6.06s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00693, train/loss_vlb_step=2.47e-5, train/loss_step=0.00693, global_step=1754.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  72%|███████▎  | 58/80 [05:57<02:13,  6.06s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000212, train/loss_vlb_step=7.98e-7, train/loss_step=0.000212, global_step=1754.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000212, train/loss_vlb_step=7.98e-7, train/loss_step=0.000212, global_step=1754.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=4.05e-6, train/loss_step=0.000467, global_step=1754.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  75%|███████▌  | 60/80 [05:58<01:57,  5.88s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=4.05e-6, train/loss_step=0.000467, global_step=1754.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  75%|███████▌  | 60/80 [05:58<01:57,  5.88s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=1.64e-6, train/loss_step=0.000263, global_step=1754.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  76%|███████▋  | 61/80 [05:59<01:50,  5.79s/it, loss=0.00214, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=1.64e-6, train/loss_step=0.000263, global_step=1754.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  76%|███████▋  | 61/80 [05:59<01:50,  5.79s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=1.42e-5, train/loss_step=0.000476, global_step=1755.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  78%|███████▊  | 62/80 [05:59<01:42,  5.71s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000476, train/loss_vlb_step=1.42e-5, train/loss_step=0.000476, global_step=1755.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  78%|███████▊  | 62/80 [05:59<01:42,  5.71s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=9.75e-7, train/loss_step=0.000245, global_step=1755.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=9.75e-7, train/loss_step=0.000245, global_step=1755.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2e-6, train/loss_step=0.000523, global_step=1755.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]   Epoch 87:  80%|████████  | 64/80 [06:07<01:30,  5.65s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=2e-6, train/loss_step=0.000523, global_step=1755.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  80%|████████  | 64/80 [06:07<01:30,  5.65s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.00876, train/loss_vlb_step=4.79e-5, train/loss_step=0.00876, global_step=1755.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  81%|████████▏ | 65/80 [06:35<01:29,  6.00s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.00876, train/loss_vlb_step=4.79e-5, train/loss_step=0.00876, global_step=1755.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  81%|████████▏ | 65/80 [06:35<01:29,  6.00s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=8.18e-7, train/loss_step=0.000187, global_step=1756.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  82%|████████▎ | 66/80 [06:36<01:22,  5.91s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=8.18e-7, train/loss_step=0.000187, global_step=1756.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  82%|████████▎ | 66/80 [06:36<01:22,  5.91s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.18e-6, train/loss_step=0.00102, global_step=1756.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  84%|████████▍ | 67/80 [06:36<01:15,  5.83s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.18e-6, train/loss_step=0.00102, global_step=1756.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  84%|████████▍ | 67/80 [06:36<01:15,  5.83s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.55e-5, train/loss_step=0.00447, global_step=1756.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.00447, train/loss_vlb_step=1.55e-5, train/loss_step=0.00447, global_step=1756.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.06e-5, train/loss_step=0.00304, global_step=1756.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.06e-5, train/loss_step=0.00304, global_step=1756.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=2e-6, train/loss_step=0.000248, global_step=1757.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004] Epoch 87:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=2e-6, train/loss_step=0.000248, global_step=1757.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  88%|████████▊ | 70/80 [06:38<00:56,  5.61s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=0.000136, train/loss_step=0.0161, global_step=1757.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  89%|████████▉ | 71/80 [06:38<00:49,  5.54s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=0.000136, train/loss_step=0.0161, global_step=1757.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  89%|████████▉ | 71/80 [06:38<00:49,  5.54s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=2.12e-5, train/loss_step=0.0059, global_step=1757.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 87:  90%|█████████ | 72/80 [06:53<00:45,  5.66s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=2.12e-5, train/loss_step=0.0059, global_step=1757.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  90%|█████████ | 72/80 [06:53<00:45,  5.66s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=2.39e-6, train/loss_step=0.000561, global_step=1757.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  91%|█████████▏| 73/80 [07:01<00:39,  5.70s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=2.39e-6, train/loss_step=0.000561, global_step=1757.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  91%|█████████▏| 73/80 [07:01<00:39,  5.70s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=2.45e-6, train/loss_step=0.000545, global_step=1758.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  92%|█████████▎| 74/80 [07:02<00:33,  5.63s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=2.45e-6, train/loss_step=0.000545, global_step=1758.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  92%|█████████▎| 74/80 [07:02<00:33,  5.63s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.00018, train/loss_step=0.0134, global_step=1758.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]    Epoch 87:  94%|█████████▍| 75/80 [07:02<00:27,  5.56s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.00018, train/loss_step=0.0134, global_step=1758.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  94%|█████████▍| 75/80 [07:02<00:27,  5.56s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.38e-6, train/loss_step=0.000255, global_step=1758.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  95%|█████████▌| 76/80 [07:03<00:21,  5.49s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.38e-6, train/loss_step=0.000255, global_step=1758.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  95%|█████████▌| 76/80 [07:03<00:21,  5.49s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000391, train/loss_vlb_step=3.97e-6, train/loss_step=0.000391, global_step=1758.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004] Epoch 87:  96%|█████████▋| 77/80 [07:03<00:16,  5.43s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000391, train/loss_vlb_step=3.97e-6, train/loss_step=0.000391, global_step=1758.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  96%|█████████▋| 77/80 [07:03<00:16,  5.43s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=1.65e-5, train/loss_step=0.00476, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004] Epoch 87:  98%|█████████▊| 78/80 [07:04<00:10,  5.37s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=1.65e-5, train/loss_step=0.00476, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  98%|█████████▊| 78/80 [07:04<00:10,  5.37s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=1.81e-5, train/loss_step=0.00527, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  99%|█████████▉| 79/80 [07:04<00:05,  5.31s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=1.81e-5, train/loss_step=0.00527, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87:  99%|█████████▉| 79/80 [07:04<00:05,  5.31s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000211, train/loss_step=0.018, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]   Epoch 87: 100%|██████████| 80/80 [07:04<00:00,  5.25s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.018, train/loss_vlb_step=0.000211, train/loss_step=0.018, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 87: 100%|██████████| 80/80 [07:04<00:00,  5.25s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=1.8e-5, train/loss_step=0.0053, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Average Epoch time: 425.00 seconds
+Average Peak memory 29564.86MiB
+Epoch 87:   0%|          | 0/80 [00:00<00:00, 6657.63it/s, loss=0.00447, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=1.8e-5, train/loss_step=0.0053, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 88:   0%|          | 0/80 [00:00<00:00, 2369.66it/s, loss=0.00447, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=1.8e-5, train/loss_step=0.0053, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]Epoch 88:   1%|▏         | 1/80 [00:33<21:53, 16.63s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.0053, train/loss_vlb_step=1.8e-5, train/loss_step=0.0053, global_step=1759.0, lr_abs=0.0001, train/loss_simple_epoch=0.004, train/loss_vlb_epoch=9.24e-5, train/loss_epoch=0.004]  Epoch 88:   1%|▏         | 1/80 [00:33<21:53, 16.63s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000181, train/loss_step=0.0144, global_step=1760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   2%|▎         | 2/80 [00:48<20:58, 16.14s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000181, train/loss_step=0.0144, global_step=1760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   2%|▎         | 2/80 [00:48<20:58, 16.14s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.26e-6, train/loss_step=0.000286, global_step=1760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   4%|▍         | 3/80 [00:48<15:41, 12.23s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.26e-6, train/loss_step=0.000286, global_step=1760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   4%|▍         | 3/80 [00:48<15:41, 12.23s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.45e-5, train/loss_step=0.0043, global_step=1760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]    Epoch 88:   5%|▌         | 4/80 [00:49<12:31,  9.88s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.45e-5, train/loss_step=0.0043, global_step=1760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   5%|▌         | 4/80 [00:49<12:31,  9.88s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=1.58e-6, train/loss_step=0.000413, global_step=1760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   6%|▋         | 5/80 [00:49<10:24,  8.32s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.000413, train/loss_vlb_step=1.58e-6, train/loss_step=0.000413, global_step=1760.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   6%|▋         | 5/80 [00:49<10:24,  8.32s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=1.86e-5, train/loss_step=0.00554, global_step=1761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:   8%|▊         | 6/80 [00:50<08:53,  7.20s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=1.86e-5, train/loss_step=0.00554, global_step=1761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   8%|▊         | 6/80 [00:50<08:53,  7.20s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.63e-7, train/loss_step=0.000165, global_step=1761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   9%|▉         | 7/80 [00:50<07:44,  6.37s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.63e-7, train/loss_step=0.000165, global_step=1761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:   9%|▉         | 7/80 [00:50<07:44,  6.37s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=0.00401, train/loss_step=0.0239, global_step=1761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]    Epoch 88:  10%|█         | 8/80 [01:12<09:39,  8.05s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.0239, train/loss_vlb_step=0.00401, train/loss_step=0.0239, global_step=1761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  10%|█         | 8/80 [01:12<09:39,  8.05s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.95e-6, train/loss_step=0.00113, global_step=1761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  11%|█▏        | 9/80 [01:20<09:30,  8.04s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.95e-6, train/loss_step=0.00113, global_step=1761.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  11%|█▏        | 9/80 [01:20<09:30,  8.04s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=9.56e-6, train/loss_step=0.00214, global_step=1762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  12%|█▎        | 10/80 [01:32<09:46,  8.38s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=9.56e-6, train/loss_step=0.00214, global_step=1762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  12%|█▎        | 10/80 [01:32<09:46,  8.38s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=3.65e-5, train/loss_step=0.00884, global_step=1762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  14%|█▍        | 11/80 [01:32<08:52,  7.72s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=3.65e-5, train/loss_step=0.00884, global_step=1762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  14%|█▍        | 11/80 [01:32<08:52,  7.72s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=6.88e-6, train/loss_step=0.00184, global_step=1762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  15%|█▌        | 12/80 [01:33<08:07,  7.17s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=6.88e-6, train/loss_step=0.00184, global_step=1762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  15%|█▌        | 12/80 [01:33<08:07,  7.17s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.33e-5, train/loss_step=0.00366, global_step=1762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  16%|█▋        | 13/80 [01:33<07:28,  6.69s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.33e-5, train/loss_step=0.00366, global_step=1762.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  16%|█▋        | 13/80 [01:33<07:28,  6.69s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=3.8e-6, train/loss_step=0.000494, global_step=1763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  18%|█▊        | 14/80 [01:34<06:54,  6.28s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=3.8e-6, train/loss_step=0.000494, global_step=1763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  18%|█▊        | 14/80 [01:34<06:54,  6.28s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.09e-5, train/loss_step=0.00309, global_step=1763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391] Epoch 88:  19%|█▉        | 15/80 [01:34<06:24,  5.92s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.09e-5, train/loss_step=0.00309, global_step=1763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  19%|█▉        | 15/80 [01:34<06:24,  5.92s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=1.68e-5, train/loss_step=0.00501, global_step=1763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  20%|██        | 16/80 [01:56<07:19,  6.87s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00501, train/loss_vlb_step=1.68e-5, train/loss_step=0.00501, global_step=1763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  20%|██        | 16/80 [01:56<07:19,  6.87s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=9.49e-6, train/loss_step=0.00108, global_step=1763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  21%|██▏       | 17/80 [01:58<06:56,  6.61s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=9.49e-6, train/loss_step=0.00108, global_step=1763.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  21%|██▏       | 17/80 [01:58<06:56,  6.61s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=1.79e-6, train/loss_step=0.00052, global_step=1764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  22%|██▎       | 18/80 [02:12<07:12,  6.98s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=1.79e-6, train/loss_step=0.00052, global_step=1764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  22%|██▎       | 18/80 [02:12<07:12,  6.98s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.37e-5, train/loss_step=0.0107, global_step=1764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  24%|██▍       | 19/80 [02:13<06:48,  6.69s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=6.37e-5, train/loss_step=0.0107, global_step=1764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  24%|██▍       | 19/80 [02:13<06:48,  6.69s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=3.07e-6, train/loss_step=0.000647, global_step=1764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  25%|██▌       | 20/80 [02:15<06:26,  6.45s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=3.07e-6, train/loss_step=0.000647, global_step=1764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  25%|██▌       | 20/80 [02:15<06:26,  6.45s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.11e-5, train/loss_step=0.0029, global_step=1764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]    Epoch 88:  26%|██▋       | 21/80 [02:15<06:04,  6.18s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.11e-5, train/loss_step=0.0029, global_step=1764.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  26%|██▋       | 21/80 [02:15<06:04,  6.18s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.81e-5, train/loss_step=0.0022, global_step=1765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  28%|██▊       | 22/80 [02:16<05:44,  5.93s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.81e-5, train/loss_step=0.0022, global_step=1765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  28%|██▊       | 22/80 [02:16<05:44,  5.93s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.28e-6, train/loss_step=0.000573, global_step=1765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  29%|██▉       | 23/80 [02:16<05:25,  5.70s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.28e-6, train/loss_step=0.000573, global_step=1765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  29%|██▉       | 23/80 [02:16<05:25,  5.71s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=2.63e-6, train/loss_step=0.000673, global_step=1765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  30%|███       | 24/80 [02:33<05:42,  6.12s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=2.63e-6, train/loss_step=0.000673, global_step=1765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  30%|███       | 24/80 [02:33<05:42,  6.12s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000653, train/loss_vlb_step=2.4e-6, train/loss_step=0.000653, global_step=1765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391] Epoch 88:  31%|███▏      | 25/80 [02:44<05:47,  6.32s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000653, train/loss_vlb_step=2.4e-6, train/loss_step=0.000653, global_step=1765.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  31%|███▏      | 25/80 [02:44<05:47,  6.32s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=2.59e-6, train/loss_step=0.000273, global_step=1766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  32%|███▎      | 26/80 [03:02<06:04,  6.76s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000273, train/loss_vlb_step=2.59e-6, train/loss_step=0.000273, global_step=1766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  32%|███▎      | 26/80 [03:02<06:04,  6.76s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.63e-6, train/loss_step=0.000422, global_step=1766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  34%|███▍      | 27/80 [03:02<05:46,  6.53s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=1.63e-6, train/loss_step=0.000422, global_step=1766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  34%|███▍      | 27/80 [03:02<05:46,  6.53s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000905, train/loss_vlb_step=3.54e-6, train/loss_step=0.000905, global_step=1766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  35%|███▌      | 28/80 [03:03<05:28,  6.33s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000905, train/loss_vlb_step=3.54e-6, train/loss_step=0.000905, global_step=1766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  35%|███▌      | 28/80 [03:03<05:28,  6.33s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=0.000475, train/loss_step=0.0048, global_step=1766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]   Epoch 88:  36%|███▋      | 29/80 [03:03<05:12,  6.13s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.0048, train/loss_vlb_step=0.000475, train/loss_step=0.0048, global_step=1766.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  36%|███▋      | 29/80 [03:03<05:12,  6.13s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=4.41e-5, train/loss_step=0.00937, global_step=1767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  38%|███▊      | 30/80 [03:04<04:57,  5.95s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=4.41e-5, train/loss_step=0.00937, global_step=1767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  38%|███▊      | 30/80 [03:04<04:57,  5.95s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=0.000233, train/loss_step=0.0122, global_step=1767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  39%|███▉      | 31/80 [03:04<04:43,  5.78s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=0.000233, train/loss_step=0.0122, global_step=1767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  39%|███▉      | 31/80 [03:04<04:43,  5.78s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=2.4e-6, train/loss_step=0.000304, global_step=1767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  40%|████      | 32/80 [03:14<04:42,  5.88s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=2.4e-6, train/loss_step=0.000304, global_step=1767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  40%|████      | 32/80 [03:14<04:42,  5.88s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.69e-5, train/loss_step=0.00283, global_step=1767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391] Epoch 88:  41%|████▏     | 33/80 [03:40<05:04,  6.47s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=1.69e-5, train/loss_step=0.00283, global_step=1767.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  41%|████▏     | 33/80 [03:40<05:04,  6.47s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000174, train/loss_step=0.0139, global_step=1768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391] Epoch 88:  42%|████▎     | 34/80 [03:40<04:49,  6.30s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000174, train/loss_step=0.0139, global_step=1768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  42%|████▎     | 34/80 [03:40<04:49,  6.30s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.43e-6, train/loss_step=0.000267, global_step=1768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  44%|████▍     | 35/80 [03:41<04:36,  6.14s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=1.43e-6, train/loss_step=0.000267, global_step=1768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  44%|████▍     | 35/80 [03:41<04:36,  6.14s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.38e-5, train/loss_step=0.00844, global_step=1768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  45%|████▌     | 36/80 [03:41<04:23,  5.99s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.38e-5, train/loss_step=0.00844, global_step=1768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  45%|████▌     | 36/80 [03:41<04:23,  5.99s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=4.6e-6, train/loss_step=0.000433, global_step=1768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  46%|████▋     | 37/80 [03:42<04:11,  5.85s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=4.6e-6, train/loss_step=0.000433, global_step=1768.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  46%|████▋     | 37/80 [03:42<04:11,  5.85s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=0.000979, train/loss_step=0.0233, global_step=1769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  48%|████▊     | 38/80 [03:42<03:59,  5.71s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=0.000979, train/loss_step=0.0233, global_step=1769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  48%|████▊     | 38/80 [03:42<03:59,  5.71s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=2.53e-6, train/loss_step=0.000329, global_step=1769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  49%|████▉     | 39/80 [03:43<03:48,  5.58s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=2.53e-6, train/loss_step=0.000329, global_step=1769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  49%|████▉     | 39/80 [03:43<03:48,  5.58s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=3.73e-6, train/loss_step=0.000624, global_step=1769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  50%|█████     | 40/80 [03:48<03:42,  5.57s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=3.73e-6, train/loss_step=0.000624, global_step=1769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  50%|█████     | 40/80 [03:48<03:42,  5.57s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=6.92e-6, train/loss_step=0.00147, global_step=1769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]   Epoch 88:  51%|█████▏    | 41/80 [04:12<03:54,  6.01s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=6.92e-6, train/loss_step=0.00147, global_step=1769.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  51%|█████▏    | 41/80 [04:12<03:54,  6.01s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000153, train/loss_vlb_step=5.64e-7, train/loss_step=0.000153, global_step=1770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  52%|█████▎    | 42/80 [04:12<03:43,  5.88s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000153, train/loss_vlb_step=5.64e-7, train/loss_step=0.000153, global_step=1770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  52%|█████▎    | 42/80 [04:12<03:43,  5.88s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=7.59e-5, train/loss_step=0.0107, global_step=1770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]     Epoch 88:  54%|█████▍    | 43/80 [04:17<03:36,  5.85s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=7.59e-5, train/loss_step=0.0107, global_step=1770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  54%|█████▍    | 43/80 [04:17<03:36,  5.85s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=9.98e-6, train/loss_step=0.00142, global_step=1770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  55%|█████▌    | 44/80 [04:22<03:29,  5.82s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=9.98e-6, train/loss_step=0.00142, global_step=1770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  55%|█████▌    | 44/80 [04:22<03:29,  5.82s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.61e-6, train/loss_step=0.00108, global_step=1770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  56%|█████▋    | 45/80 [04:22<03:19,  5.71s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=4.61e-6, train/loss_step=0.00108, global_step=1770.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  56%|█████▋    | 45/80 [04:22<03:19,  5.71s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=7.48e-6, train/loss_step=0.00201, global_step=1771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  57%|█████▊    | 46/80 [04:23<03:10,  5.60s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=7.48e-6, train/loss_step=0.00201, global_step=1771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  57%|█████▊    | 46/80 [04:23<03:10,  5.60s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.000612, train/loss_vlb_step=3.77e-6, train/loss_step=0.000612, global_step=1771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  59%|█████▉    | 47/80 [04:23<03:01,  5.49s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.000612, train/loss_vlb_step=3.77e-6, train/loss_step=0.000612, global_step=1771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  59%|█████▉    | 47/80 [04:23<03:01,  5.49s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00743, train/loss_vlb_step=4.41e-5, train/loss_step=0.00743, global_step=1771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  60%|██████    | 48/80 [04:30<02:56,  5.53s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.00743, train/loss_vlb_step=4.41e-5, train/loss_step=0.00743, global_step=1771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  60%|██████    | 48/80 [04:30<02:56,  5.53s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.39e-5, train/loss_step=0.0115, global_step=1771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  61%|██████▏   | 49/80 [04:58<03:04,  5.96s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.39e-5, train/loss_step=0.0115, global_step=1771.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  61%|██████▏   | 49/80 [04:58<03:04,  5.96s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.00135, train/loss_step=0.029, global_step=1772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]   Epoch 88:  62%|██████▎   | 50/80 [04:58<02:55,  5.85s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.029, train/loss_vlb_step=0.00135, train/loss_step=0.029, global_step=1772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  62%|██████▎   | 50/80 [04:58<02:55,  5.85s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=2.29e-6, train/loss_step=0.000462, global_step=1772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  64%|██████▍   | 51/80 [04:59<02:46,  5.75s/it, loss=0.00581, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=2.29e-6, train/loss_step=0.000462, global_step=1772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  64%|██████▍   | 51/80 [04:59<02:46,  5.75s/it, loss=0.00609, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.12e-5, train/loss_step=0.00588, global_step=1772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  65%|██████▌   | 52/80 [05:05<02:41,  5.77s/it, loss=0.00609, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=2.12e-5, train/loss_step=0.00588, global_step=1772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  65%|██████▌   | 52/80 [05:05<02:41,  5.77s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.4e-5, train/loss_step=0.00605, global_step=1772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391] Epoch 88:  66%|██████▋   | 53/80 [05:06<02:33,  5.67s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.00605, train/loss_vlb_step=2.4e-5, train/loss_step=0.00605, global_step=1772.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  66%|██████▋   | 53/80 [05:06<02:33,  5.67s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.16e-6, train/loss_step=0.000248, global_step=1773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  68%|██████▊   | 54/80 [05:06<02:25,  5.58s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.16e-6, train/loss_step=0.000248, global_step=1773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  68%|██████▊   | 54/80 [05:06<02:25,  5.58s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=4.76e-6, train/loss_step=0.000641, global_step=1773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  69%|██████▉   | 55/80 [05:07<02:17,  5.49s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=4.76e-6, train/loss_step=0.000641, global_step=1773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  69%|██████▉   | 55/80 [05:07<02:17,  5.49s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=2.82e-5, train/loss_step=0.00707, global_step=1773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  70%|███████   | 56/80 [05:18<02:14,  5.60s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00707, train/loss_vlb_step=2.82e-5, train/loss_step=0.00707, global_step=1773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  70%|███████   | 56/80 [05:18<02:14,  5.60s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=1.31e-5, train/loss_step=0.00389, global_step=1773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  71%|███████▏  | 57/80 [05:40<02:15,  5.88s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00389, train/loss_vlb_step=1.31e-5, train/loss_step=0.00389, global_step=1773.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  71%|███████▏  | 57/80 [05:40<02:15,  5.88s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=6.76e-6, train/loss_step=0.00177, global_step=1774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  72%|███████▎  | 58/80 [05:41<02:07,  5.79s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=6.76e-6, train/loss_step=0.00177, global_step=1774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  72%|███████▎  | 58/80 [05:41<02:07,  5.79s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=6.41e-6, train/loss_step=0.0012, global_step=1774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=6.41e-6, train/loss_step=0.0012, global_step=1774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=3.22e-6, train/loss_step=0.000712, global_step=1774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  75%|███████▌  | 60/80 [05:43<01:52,  5.63s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=3.22e-6, train/loss_step=0.000712, global_step=1774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  75%|███████▌  | 60/80 [05:43<01:52,  5.63s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.14e-5, train/loss_step=0.00333, global_step=1774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  76%|███████▋  | 61/80 [05:50<01:47,  5.66s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00333, train/loss_vlb_step=1.14e-5, train/loss_step=0.00333, global_step=1774.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  76%|███████▋  | 61/80 [05:50<01:47,  5.66s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.49e-5, train/loss_step=0.000426, global_step=1775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  78%|███████▊  | 62/80 [05:51<01:40,  5.57s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000426, train/loss_vlb_step=2.49e-5, train/loss_step=0.000426, global_step=1775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  78%|███████▊  | 62/80 [05:51<01:40,  5.57s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=1.46e-5, train/loss_step=0.00386, global_step=1775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  79%|███████▉  | 63/80 [05:51<01:33,  5.49s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=1.46e-5, train/loss_step=0.00386, global_step=1775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  79%|███████▉  | 63/80 [05:51<01:33,  5.49s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=1.76e-5, train/loss_step=0.00502, global_step=1775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  80%|████████  | 64/80 [05:53<01:27,  5.45s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=1.76e-5, train/loss_step=0.00502, global_step=1775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  80%|████████  | 64/80 [05:53<01:27,  5.45s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000853, train/loss_vlb_step=0.000164, train/loss_step=0.000853, global_step=1775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  81%|████████▏ | 65/80 [06:20<01:26,  5.76s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000853, train/loss_vlb_step=0.000164, train/loss_step=0.000853, global_step=1775.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  81%|████████▏ | 65/80 [06:20<01:26,  5.76s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.05e-5, train/loss_step=0.0031, global_step=1776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]    Epoch 88:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.05e-5, train/loss_step=0.0031, global_step=1776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=1.88e-6, train/loss_step=0.000363, global_step=1776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  84%|████████▍ | 67/80 [06:23<01:13,  5.64s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=1.88e-6, train/loss_step=0.000363, global_step=1776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  84%|████████▍ | 67/80 [06:23<01:13,  5.64s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.05e-5, train/loss_step=0.00193, global_step=1776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  85%|████████▌ | 68/80 [06:23<01:06,  5.56s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=1.05e-5, train/loss_step=0.00193, global_step=1776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  85%|████████▌ | 68/80 [06:23<01:06,  5.56s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.36e-6, train/loss_step=0.00167, global_step=1776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  86%|████████▋ | 69/80 [06:25<01:00,  5.51s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.36e-6, train/loss_step=0.00167, global_step=1776.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  86%|████████▋ | 69/80 [06:25<01:00,  5.51s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.3e-5, train/loss_step=0.00546, global_step=1777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  88%|████████▊ | 70/80 [06:26<00:54,  5.44s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00546, train/loss_vlb_step=2.3e-5, train/loss_step=0.00546, global_step=1777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  88%|████████▊ | 70/80 [06:26<00:54,  5.44s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.0001, train/loss_step=0.0178, global_step=1777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391] Epoch 88:  89%|████████▉ | 71/80 [06:26<00:48,  5.37s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.0001, train/loss_step=0.0178, global_step=1777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  89%|████████▉ | 71/80 [06:26<00:48,  5.37s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=6.31e-5, train/loss_step=0.000632, global_step=1777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  90%|█████████ | 72/80 [06:35<00:43,  5.41s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=6.31e-5, train/loss_step=0.000632, global_step=1777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  90%|█████████ | 72/80 [06:35<00:43,  5.41s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000302, train/loss_vlb_step=1.48e-6, train/loss_step=0.000302, global_step=1777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  91%|█████████▏| 73/80 [06:57<00:39,  5.65s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000302, train/loss_vlb_step=1.48e-6, train/loss_step=0.000302, global_step=1777.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  91%|█████████▏| 73/80 [06:57<00:39,  5.65s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.01e-6, train/loss_step=0.000242, global_step=1778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  92%|█████████▎| 74/80 [06:58<00:33,  5.58s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.01e-6, train/loss_step=0.000242, global_step=1778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  92%|█████████▎| 74/80 [06:58<00:33,  5.58s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.02e-6, train/loss_step=0.00115, global_step=1778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  94%|█████████▍| 75/80 [06:58<00:27,  5.51s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.02e-6, train/loss_step=0.00115, global_step=1778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  94%|█████████▍| 75/80 [06:58<00:27,  5.51s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.3e-6, train/loss_step=0.00106, global_step=1778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391] Epoch 88:  95%|█████████▌| 76/80 [07:05<00:22,  5.53s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.3e-6, train/loss_step=0.00106, global_step=1778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  95%|█████████▌| 76/80 [07:05<00:22,  5.53s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=7.84e-5, train/loss_step=0.014, global_step=1778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]   Epoch 88:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=7.84e-5, train/loss_step=0.014, global_step=1778.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=0.000186, train/loss_step=0.00762, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=0.000186, train/loss_step=0.00762, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.7e-5, train/loss_step=0.00321, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 88:  99%|█████████▉| 79/80 [07:06<00:05,  5.34s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00321, train/loss_vlb_step=1.7e-5, train/loss_step=0.00321, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88:  99%|█████████▉| 79/80 [07:06<00:05,  5.34s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=3.82e-6, train/loss_step=0.000558, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=3.82e-6, train/loss_step=0.000558, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 88: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=1.48e-6, train/loss_step=0.000292, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Average Epoch time: 427.39 seconds
+Average Peak memory 29561.87MiB
+Epoch 88:   0%|          | 0/80 [00:00<00:00, 5497.12it/s, loss=0.00348, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=1.48e-6, train/loss_step=0.000292, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 89:   0%|          | 0/80 [00:00<00:00, 2068.20it/s, loss=0.00348, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=1.48e-6, train/loss_step=0.000292, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]Epoch 89:   1%|▏         | 1/80 [00:45<29:47, 22.63s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=1.48e-6, train/loss_step=0.000292, global_step=1779.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00391]  Epoch 89:   1%|▏         | 1/80 [00:45<29:47, 22.63s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.33e-6, train/loss_step=0.00106, global_step=1780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]   Epoch 89:   2%|▎         | 2/80 [00:45<19:49, 15.25s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=4.33e-6, train/loss_step=0.00106, global_step=1780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:   2%|▎         | 2/80 [00:45<19:49, 15.25s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.0176, train/loss_step=0.0355, global_step=1780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]   Epoch 89:   4%|▍         | 3/80 [00:46<14:50, 11.56s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0355, train/loss_vlb_step=0.0176, train/loss_step=0.0355, global_step=1780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:   4%|▍         | 3/80 [00:46<14:50, 11.56s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000967, train/loss_vlb_step=7.36e-6, train/loss_step=0.000967, global_step=1780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:   5%|▌         | 4/80 [00:48<12:09,  9.60s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000967, train/loss_vlb_step=7.36e-6, train/loss_step=0.000967, global_step=1780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:   5%|▌         | 4/80 [00:48<12:09,  9.60s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=0.000114, train/loss_step=0.00086, global_step=1780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386] Epoch 89:   6%|▋         | 5/80 [00:48<10:06,  8.09s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=0.000114, train/loss_step=0.00086, global_step=1780.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:   6%|▋         | 5/80 [00:48<10:06,  8.09s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=8.23e-6, train/loss_step=0.00124, global_step=1781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:   8%|▊         | 6/80 [00:49<08:38,  7.00s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=8.23e-6, train/loss_step=0.00124, global_step=1781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:   8%|▊         | 6/80 [00:49<08:38,  7.00s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.22e-5, train/loss_step=0.00923, global_step=1781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:   9%|▉         | 7/80 [00:49<07:31,  6.19s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.00923, train/loss_vlb_step=4.22e-5, train/loss_step=0.00923, global_step=1781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:   9%|▉         | 7/80 [00:49<07:31,  6.19s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.22e-5, train/loss_step=0.00325, global_step=1781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  10%|█         | 8/80 [01:26<11:28,  9.56s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.00325, train/loss_vlb_step=1.22e-5, train/loss_step=0.00325, global_step=1781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  10%|█         | 8/80 [01:26<11:28,  9.56s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.41e-6, train/loss_step=0.000274, global_step=1781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  11%|█▏        | 9/80 [01:29<10:32,  8.91s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.41e-6, train/loss_step=0.000274, global_step=1781.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  11%|█▏        | 9/80 [01:29<10:32,  8.91s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.19e-5, train/loss_step=0.0035, global_step=1782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]    Epoch 89:  12%|█▎        | 10/80 [01:29<09:30,  8.15s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=1.19e-5, train/loss_step=0.0035, global_step=1782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  12%|█▎        | 10/80 [01:29<09:30,  8.15s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=1.58e-5, train/loss_step=0.00471, global_step=1782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  14%|█▍        | 11/80 [01:30<08:38,  7.51s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=1.58e-5, train/loss_step=0.00471, global_step=1782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  14%|█▍        | 11/80 [01:30<08:38,  7.51s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.27e-5, train/loss_step=0.00367, global_step=1782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  15%|█▌        | 12/80 [01:32<08:06,  7.15s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00367, train/loss_vlb_step=1.27e-5, train/loss_step=0.00367, global_step=1782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  15%|█▌        | 12/80 [01:32<08:06,  7.15s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=6.54e-7, train/loss_step=0.000181, global_step=1782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  16%|█▋        | 13/80 [01:33<07:27,  6.68s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=6.54e-7, train/loss_step=0.000181, global_step=1782.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  16%|█▋        | 13/80 [01:33<07:27,  6.68s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.39e-5, train/loss_step=0.00637, global_step=1783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  18%|█▊        | 14/80 [01:33<06:53,  6.26s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.39e-5, train/loss_step=0.00637, global_step=1783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  18%|█▊        | 14/80 [01:33<06:53,  6.26s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=2.17e-5, train/loss_step=0.00582, global_step=1783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  19%|█▉        | 15/80 [01:34<06:23,  5.90s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00582, train/loss_vlb_step=2.17e-5, train/loss_step=0.00582, global_step=1783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  19%|█▉        | 15/80 [01:34<06:23,  5.90s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.47e-5, train/loss_step=0.00725, global_step=1783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  20%|██        | 16/80 [02:04<07:48,  7.32s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00725, train/loss_vlb_step=2.47e-5, train/loss_step=0.00725, global_step=1783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  20%|██        | 16/80 [02:04<07:48,  7.32s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=1.07e-5, train/loss_step=0.00123, global_step=1783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  21%|██▏       | 17/80 [02:05<07:17,  6.95s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=1.07e-5, train/loss_step=0.00123, global_step=1783.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  21%|██▏       | 17/80 [02:05<07:17,  6.95s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000479, train/loss_vlb_step=9.08e-6, train/loss_step=0.000479, global_step=1784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  22%|██▎       | 18/80 [02:21<07:41,  7.44s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000479, train/loss_vlb_step=9.08e-6, train/loss_step=0.000479, global_step=1784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  22%|██▎       | 18/80 [02:21<07:41,  7.44s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=2.63e-5, train/loss_step=0.00705, global_step=1784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  24%|██▍       | 19/80 [02:21<07:12,  7.09s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=2.63e-5, train/loss_step=0.00705, global_step=1784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  24%|██▍       | 19/80 [02:21<07:12,  7.09s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=4.53e-5, train/loss_step=0.00742, global_step=1784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  25%|██▌       | 20/80 [02:22<06:47,  6.79s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00742, train/loss_vlb_step=4.53e-5, train/loss_step=0.00742, global_step=1784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  25%|██▌       | 20/80 [02:22<06:47,  6.79s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000173, train/loss_vlb_step=9.5e-7, train/loss_step=0.000173, global_step=1784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  26%|██▋       | 21/80 [02:23<06:24,  6.51s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000173, train/loss_vlb_step=9.5e-7, train/loss_step=0.000173, global_step=1784.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  26%|██▋       | 21/80 [02:23<06:24,  6.51s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=2.04e-6, train/loss_step=0.00023, global_step=1785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386] Epoch 89:  28%|██▊       | 22/80 [02:23<06:02,  6.25s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=2.04e-6, train/loss_step=0.00023, global_step=1785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  28%|██▊       | 22/80 [02:23<06:02,  6.25s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000129, train/loss_vlb_step=4.73e-7, train/loss_step=0.000129, global_step=1785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  29%|██▉       | 23/80 [02:24<05:42,  6.01s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000129, train/loss_vlb_step=4.73e-7, train/loss_step=0.000129, global_step=1785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  29%|██▉       | 23/80 [02:24<05:42,  6.01s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.82e-5, train/loss_step=0.00484, global_step=1785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  30%|███       | 24/80 [02:46<06:12,  6.64s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00484, train/loss_vlb_step=1.82e-5, train/loss_step=0.00484, global_step=1785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  30%|███       | 24/80 [02:46<06:12,  6.64s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.95e-6, train/loss_step=0.000271, global_step=1785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  31%|███▏      | 25/80 [02:56<06:14,  6.81s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.95e-6, train/loss_step=0.000271, global_step=1785.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  31%|███▏      | 25/80 [02:56<06:14,  6.81s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.2e-5, train/loss_step=0.00315, global_step=1786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]   Epoch 89:  32%|███▎      | 26/80 [03:07<06:14,  6.94s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00315, train/loss_vlb_step=1.2e-5, train/loss_step=0.00315, global_step=1786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  32%|███▎      | 26/80 [03:07<06:14,  6.94s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.0184, train/loss_step=0.0379, global_step=1786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  34%|███▍      | 27/80 [03:07<05:55,  6.71s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.0184, train/loss_step=0.0379, global_step=1786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  34%|███▍      | 27/80 [03:07<05:55,  6.71s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000272, train/loss_vlb_step=1.1e-6, train/loss_step=0.000272, global_step=1786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  35%|███▌      | 28/80 [03:08<05:37,  6.50s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000272, train/loss_vlb_step=1.1e-6, train/loss_step=0.000272, global_step=1786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  35%|███▌      | 28/80 [03:08<05:37,  6.50s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=1.92e-5, train/loss_step=0.00462, global_step=1786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386] Epoch 89:  36%|███▋      | 29/80 [03:08<05:21,  6.30s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=1.92e-5, train/loss_step=0.00462, global_step=1786.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  36%|███▋      | 29/80 [03:08<05:21,  6.30s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000527, train/loss_vlb_step=6.76e-6, train/loss_step=0.000527, global_step=1787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  38%|███▊      | 30/80 [03:09<05:05,  6.11s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000527, train/loss_vlb_step=6.76e-6, train/loss_step=0.000527, global_step=1787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  38%|███▊      | 30/80 [03:09<05:05,  6.11s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.00011, train/loss_step=0.0134, global_step=1787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]    Epoch 89:  39%|███▉      | 31/80 [03:09<04:50,  5.94s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.00011, train/loss_step=0.0134, global_step=1787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  39%|███▉      | 31/80 [03:09<04:50,  5.94s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=5.72e-7, train/loss_step=0.000113, global_step=1787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  40%|████      | 32/80 [03:27<05:01,  6.29s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=5.72e-7, train/loss_step=0.000113, global_step=1787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  40%|████      | 32/80 [03:27<05:01,  6.29s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.19e-6, train/loss_step=0.000259, global_step=1787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  41%|████▏     | 33/80 [03:37<05:00,  6.39s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.19e-6, train/loss_step=0.000259, global_step=1787.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  41%|████▏     | 33/80 [03:37<05:00,  6.39s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000388, train/loss_vlb_step=1.9e-6, train/loss_step=0.000388, global_step=1788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386] Epoch 89:  42%|████▎     | 34/80 [03:44<04:55,  6.42s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000388, train/loss_vlb_step=1.9e-6, train/loss_step=0.000388, global_step=1788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  42%|████▎     | 34/80 [03:44<04:55,  6.42s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=5.83e-6, train/loss_step=0.00165, global_step=1788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386] Epoch 89:  44%|████▍     | 35/80 [03:45<04:41,  6.26s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=5.83e-6, train/loss_step=0.00165, global_step=1788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  44%|████▍     | 35/80 [03:45<04:41,  6.26s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00723, train/loss_vlb_step=2.62e-5, train/loss_step=0.00723, global_step=1788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  45%|████▌     | 36/80 [03:45<04:28,  6.10s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00723, train/loss_vlb_step=2.62e-5, train/loss_step=0.00723, global_step=1788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  45%|████▌     | 36/80 [03:45<04:28,  6.10s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.31e-5, train/loss_step=0.00979, global_step=1788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  46%|████▋     | 37/80 [03:46<04:16,  5.96s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.00979, train/loss_vlb_step=4.31e-5, train/loss_step=0.00979, global_step=1788.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  46%|████▋     | 37/80 [03:46<04:16,  5.96s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000362, train/loss_vlb_step=2.13e-6, train/loss_step=0.000362, global_step=1789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  48%|████▊     | 38/80 [03:46<04:04,  5.82s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000362, train/loss_vlb_step=2.13e-6, train/loss_step=0.000362, global_step=1789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  48%|████▊     | 38/80 [03:46<04:04,  5.82s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.000801, train/loss_vlb_step=4.9e-6, train/loss_step=0.000801, global_step=1789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386] Epoch 89:  49%|████▉     | 39/80 [03:47<03:53,  5.68s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.000801, train/loss_vlb_step=4.9e-6, train/loss_step=0.000801, global_step=1789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  49%|████▉     | 39/80 [03:47<03:53,  5.68s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000198, train/loss_step=0.0144, global_step=1789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  50%|█████     | 40/80 [04:04<03:58,  5.96s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=0.000198, train/loss_step=0.0144, global_step=1789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  50%|█████     | 40/80 [04:04<03:58,  5.96s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=6.99e-5, train/loss_step=0.0192, global_step=1789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386] Epoch 89:  51%|█████▏    | 41/80 [04:15<03:57,  6.08s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=6.99e-5, train/loss_step=0.0192, global_step=1789.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  51%|█████▏    | 41/80 [04:15<03:57,  6.08s/it, loss=0.00671, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.00015, train/loss_step=0.0149, global_step=1790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  52%|█████▎    | 42/80 [04:22<03:51,  6.10s/it, loss=0.00671, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.00015, train/loss_step=0.0149, global_step=1790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  52%|█████▎    | 42/80 [04:22<03:51,  6.10s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=6.8e-7, train/loss_step=0.000186, global_step=1790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  54%|█████▍    | 43/80 [04:22<03:41,  5.97s/it, loss=0.00672, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=6.8e-7, train/loss_step=0.000186, global_step=1790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  54%|█████▍    | 43/80 [04:22<03:41,  5.97s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.69e-6, train/loss_step=0.00102, global_step=1790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386] Epoch 89:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00652, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.69e-6, train/loss_step=0.00102, global_step=1790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=5.68e-6, train/loss_step=0.00131, global_step=1790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  56%|█████▋    | 45/80 [04:23<03:20,  5.74s/it, loss=0.00658, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=5.68e-6, train/loss_step=0.00131, global_step=1790.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  56%|█████▋    | 45/80 [04:23<03:20,  5.74s/it, loss=0.00662, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.36e-5, train/loss_step=0.00409, global_step=1791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  57%|█████▊    | 46/80 [04:24<03:11,  5.63s/it, loss=0.00662, v_num=0, train/loss_simple_step=0.00409, train/loss_vlb_step=1.36e-5, train/loss_step=0.00409, global_step=1791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  57%|█████▊    | 46/80 [04:24<03:11,  5.63s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000953, train/loss_vlb_step=3.97e-6, train/loss_step=0.000953, global_step=1791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  59%|█████▉    | 47/80 [04:24<03:02,  5.52s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000953, train/loss_vlb_step=3.97e-6, train/loss_step=0.000953, global_step=1791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  59%|█████▉    | 47/80 [04:24<03:02,  5.52s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=5.68e-6, train/loss_step=0.00143, global_step=1791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  60%|██████    | 48/80 [04:42<03:04,  5.77s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=5.68e-6, train/loss_step=0.00143, global_step=1791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  60%|██████    | 48/80 [04:42<03:04,  5.77s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=9.36e-5, train/loss_step=0.00294, global_step=1791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  61%|██████▏   | 49/80 [04:48<02:58,  5.77s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00294, train/loss_vlb_step=9.36e-5, train/loss_step=0.00294, global_step=1791.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  61%|██████▏   | 49/80 [04:48<02:58,  5.77s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=3.37e-6, train/loss_step=0.000505, global_step=1792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  62%|██████▎   | 50/80 [04:58<02:55,  5.85s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000505, train/loss_vlb_step=3.37e-6, train/loss_step=0.000505, global_step=1792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  62%|██████▎   | 50/80 [04:58<02:55,  5.85s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000821, train/loss_vlb_step=3.63e-6, train/loss_step=0.000821, global_step=1792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  64%|██████▍   | 51/80 [05:03<02:49,  5.85s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000821, train/loss_vlb_step=3.63e-6, train/loss_step=0.000821, global_step=1792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  64%|██████▍   | 51/80 [05:03<02:49,  5.85s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000217, train/loss_vlb_step=1.15e-6, train/loss_step=0.000217, global_step=1792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  65%|██████▌   | 52/80 [05:04<02:40,  5.75s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000217, train/loss_vlb_step=1.15e-6, train/loss_step=0.000217, global_step=1792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  65%|██████▌   | 52/80 [05:04<02:40,  5.75s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.31e-6, train/loss_step=0.000418, global_step=1792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  66%|██████▋   | 53/80 [05:05<02:32,  5.65s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.31e-6, train/loss_step=0.000418, global_step=1792.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  66%|██████▋   | 53/80 [05:05<02:32,  5.65s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=1.47e-6, train/loss_step=0.00029, global_step=1793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  68%|██████▊   | 54/80 [05:05<02:24,  5.55s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=1.47e-6, train/loss_step=0.00029, global_step=1793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  68%|██████▊   | 54/80 [05:05<02:24,  5.55s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=5.65e-6, train/loss_step=0.00126, global_step=1793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  69%|██████▉   | 55/80 [05:06<02:16,  5.46s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=5.65e-6, train/loss_step=0.00126, global_step=1793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  69%|██████▉   | 55/80 [05:06<02:16,  5.46s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.16e-5, train/loss_step=0.0059, global_step=1793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  70%|███████   | 56/80 [05:23<02:16,  5.68s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0059, train/loss_vlb_step=3.16e-5, train/loss_step=0.0059, global_step=1793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  70%|███████   | 56/80 [05:23<02:16,  5.68s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=4.93e-6, train/loss_step=0.00133, global_step=1793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  71%|███████▏  | 57/80 [05:35<02:12,  5.78s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=4.93e-6, train/loss_step=0.00133, global_step=1793.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  71%|███████▏  | 57/80 [05:35<02:12,  5.78s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=9.45e-7, train/loss_step=0.000201, global_step=1794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  72%|███████▎  | 58/80 [05:47<02:09,  5.88s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=9.45e-7, train/loss_step=0.000201, global_step=1794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  72%|███████▎  | 58/80 [05:47<02:09,  5.88s/it, loss=0.00358, v_num=0, train/loss_simple_step=7.49e-5, train/loss_vlb_step=2.8e-7, train/loss_step=7.49e-5, global_step=1794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]   Epoch 89:  74%|███████▍  | 59/80 [05:48<02:02,  5.81s/it, loss=0.00358, v_num=0, train/loss_simple_step=7.49e-5, train/loss_vlb_step=2.8e-7, train/loss_step=7.49e-5, global_step=1794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  74%|███████▍  | 59/80 [05:48<02:02,  5.81s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=1.88e-5, train/loss_step=0.00566, global_step=1794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  75%|███████▌  | 60/80 [05:49<01:54,  5.73s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=1.88e-5, train/loss_step=0.00566, global_step=1794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  75%|███████▌  | 60/80 [05:49<01:54,  5.73s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=2.22e-6, train/loss_step=0.000324, global_step=1794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  76%|███████▋  | 61/80 [05:49<01:47,  5.64s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=2.22e-6, train/loss_step=0.000324, global_step=1794.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  76%|███████▋  | 61/80 [05:49<01:47,  5.64s/it, loss=0.00155, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=6.83e-6, train/loss_step=0.00199, global_step=1795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  78%|███████▊  | 62/80 [05:50<01:40,  5.56s/it, loss=0.00155, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=6.83e-6, train/loss_step=0.00199, global_step=1795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  78%|███████▊  | 62/80 [05:50<01:40,  5.56s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.03e-5, train/loss_step=0.00461, global_step=1795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  79%|███████▉  | 63/80 [05:50<01:33,  5.48s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.00461, train/loss_vlb_step=2.03e-5, train/loss_step=0.00461, global_step=1795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  79%|███████▉  | 63/80 [05:50<01:33,  5.48s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=1.11e-5, train/loss_step=0.00152, global_step=1795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  80%|████████  | 64/80 [06:01<01:29,  5.57s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=1.11e-5, train/loss_step=0.00152, global_step=1795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  80%|████████  | 64/80 [06:01<01:29,  5.57s/it, loss=0.00173, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=1.28e-6, train/loss_step=0.000175, global_step=1795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  81%|████████▏ | 65/80 [06:16<01:25,  5.71s/it, loss=0.00173, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=1.28e-6, train/loss_step=0.000175, global_step=1795.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  81%|████████▏ | 65/80 [06:16<01:25,  5.71s/it, loss=0.00157, v_num=0, train/loss_simple_step=0.000691, train/loss_vlb_step=2.51e-6, train/loss_step=0.000691, global_step=1796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  82%|████████▎ | 66/80 [06:17<01:18,  5.64s/it, loss=0.00157, v_num=0, train/loss_simple_step=0.000691, train/loss_vlb_step=2.51e-6, train/loss_step=0.000691, global_step=1796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  82%|████████▎ | 66/80 [06:17<01:18,  5.64s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=3.71e-5, train/loss_step=0.00757, global_step=1796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]   Epoch 89:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00757, train/loss_vlb_step=3.71e-5, train/loss_step=0.00757, global_step=1796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=1.34e-6, train/loss_step=0.000366, global_step=1796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  85%|████████▌ | 68/80 [06:29<01:07,  5.64s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=1.34e-6, train/loss_step=0.000366, global_step=1796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  85%|████████▌ | 68/80 [06:29<01:07,  5.64s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.04e-5, train/loss_step=0.00296, global_step=1796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  86%|████████▋ | 69/80 [06:29<01:01,  5.57s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=1.04e-5, train/loss_step=0.00296, global_step=1796.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  86%|████████▋ | 69/80 [06:29<01:01,  5.57s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000931, train/loss_vlb_step=1.81e-5, train/loss_step=0.000931, global_step=1797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  88%|████████▊ | 70/80 [06:30<00:54,  5.50s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000931, train/loss_vlb_step=1.81e-5, train/loss_step=0.000931, global_step=1797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  88%|████████▊ | 70/80 [06:30<00:54,  5.50s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000985, train/loss_vlb_step=4.49e-6, train/loss_step=0.000985, global_step=1797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  89%|████████▉ | 71/80 [06:30<00:48,  5.43s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000985, train/loss_vlb_step=4.49e-6, train/loss_step=0.000985, global_step=1797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  89%|████████▉ | 71/80 [06:30<00:48,  5.43s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=0.000124, train/loss_step=0.00746, global_step=1797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386] Epoch 89:  90%|█████████ | 72/80 [06:49<00:44,  5.61s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=0.000124, train/loss_step=0.00746, global_step=1797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  90%|█████████ | 72/80 [06:49<00:44,  5.61s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.000693, train/loss_vlb_step=3.03e-6, train/loss_step=0.000693, global_step=1797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  91%|█████████▏| 73/80 [06:56<00:39,  5.63s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.000693, train/loss_vlb_step=3.03e-6, train/loss_step=0.000693, global_step=1797.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  91%|█████████▏| 73/80 [06:56<00:39,  5.63s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000741, train/loss_vlb_step=3.16e-6, train/loss_step=0.000741, global_step=1798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  92%|█████████▎| 74/80 [06:56<00:33,  5.56s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000741, train/loss_vlb_step=3.16e-6, train/loss_step=0.000741, global_step=1798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  92%|█████████▎| 74/80 [06:56<00:33,  5.56s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=4.19e-5, train/loss_step=0.00838, global_step=1798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  94%|█████████▍| 75/80 [06:57<00:27,  5.49s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00838, train/loss_vlb_step=4.19e-5, train/loss_step=0.00838, global_step=1798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  94%|█████████▍| 75/80 [06:57<00:27,  5.49s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=6.16e-6, train/loss_step=0.000506, global_step=1798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  95%|█████████▌| 76/80 [07:01<00:21,  5.48s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=6.16e-6, train/loss_step=0.000506, global_step=1798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  95%|█████████▌| 76/80 [07:01<00:21,  5.48s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.09e-5, train/loss_step=0.00292, global_step=1798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  96%|█████████▋| 77/80 [07:02<00:16,  5.41s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.09e-5, train/loss_step=0.00292, global_step=1798.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  96%|█████████▋| 77/80 [07:02<00:16,  5.41s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.63e-5, train/loss_step=0.0112, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 89:  98%|█████████▊| 78/80 [07:02<00:10,  5.35s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.63e-5, train/loss_step=0.0112, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  98%|█████████▊| 78/80 [07:02<00:10,  5.35s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.76e-6, train/loss_step=0.00113, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  99%|█████████▉| 79/80 [07:03<00:05,  5.29s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.76e-6, train/loss_step=0.00113, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89:  99%|█████████▉| 79/80 [07:03<00:05,  5.29s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=4.61e-6, train/loss_step=0.00126, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89: 100%|██████████| 80/80 [07:03<00:00,  5.23s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=4.61e-6, train/loss_step=0.00126, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 89: 100%|██████████| 80/80 [07:03<00:00,  5.23s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=0.00174, train/loss_step=0.00355, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Average Epoch time: 423.97 seconds
+Average Peak memory 29562.11MiB
+Epoch 89:   0%|          | 0/80 [00:00<00:00, 5005.14it/s, loss=0.00298, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=0.00174, train/loss_step=0.00355, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 90:   0%|          | 0/80 [00:00<00:00, 1959.96it/s, loss=0.00298, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=0.00174, train/loss_step=0.00355, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]Epoch 90:   1%|▏         | 1/80 [00:34<22:30, 17.10s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00355, train/loss_vlb_step=0.00174, train/loss_step=0.00355, global_step=1799.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.38e-5, train/loss_epoch=0.00386]  Epoch 90:   1%|▏         | 1/80 [00:34<22:30, 17.10s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=5.15e-6, train/loss_step=0.000317, global_step=1800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   2%|▎         | 2/80 [00:36<15:45, 12.12s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=5.15e-6, train/loss_step=0.000317, global_step=1800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   2%|▎         | 2/80 [00:36<15:45, 12.12s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000203, train/loss_vlb_step=9.8e-7, train/loss_step=0.000203, global_step=1800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   4%|▍         | 3/80 [00:39<12:32,  9.78s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000203, train/loss_vlb_step=9.8e-7, train/loss_step=0.000203, global_step=1800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   4%|▍         | 3/80 [00:39<12:32,  9.78s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=1.24e-5, train/loss_step=0.000523, global_step=1800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   5%|▌         | 4/80 [00:39<10:02,  7.93s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=1.24e-5, train/loss_step=0.000523, global_step=1800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   5%|▌         | 4/80 [00:39<10:02,  7.93s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000318, train/loss_step=0.0298, global_step=1800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]   Epoch 90:   6%|▋         | 5/80 [00:40<08:21,  6.69s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.0298, train/loss_vlb_step=0.000318, train/loss_step=0.0298, global_step=1800.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   6%|▋         | 5/80 [00:40<08:21,  6.69s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=3.81e-6, train/loss_step=0.000802, global_step=1801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   8%|▊         | 6/80 [00:41<07:17,  5.91s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=3.81e-6, train/loss_step=0.000802, global_step=1801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   8%|▊         | 6/80 [00:41<07:17,  5.91s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=3.52e-6, train/loss_step=0.000344, global_step=1801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   9%|▉         | 7/80 [00:41<06:21,  5.23s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=3.52e-6, train/loss_step=0.000344, global_step=1801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:   9%|▉         | 7/80 [00:41<06:21,  5.23s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000319, train/loss_vlb_step=1.42e-6, train/loss_step=0.000319, global_step=1801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  10%|█         | 8/80 [01:11<09:29,  7.91s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000319, train/loss_vlb_step=1.42e-6, train/loss_step=0.000319, global_step=1801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  10%|█         | 8/80 [01:11<09:29,  7.91s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000172, train/loss_vlb_step=7.19e-7, train/loss_step=0.000172, global_step=1801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  11%|█▏        | 9/80 [01:22<09:44,  8.23s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000172, train/loss_vlb_step=7.19e-7, train/loss_step=0.000172, global_step=1801.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  11%|█▏        | 9/80 [01:22<09:44,  8.23s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000826, train/loss_vlb_step=2.26e-5, train/loss_step=0.000826, global_step=1802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  12%|█▎        | 10/80 [01:22<08:46,  7.52s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000826, train/loss_vlb_step=2.26e-5, train/loss_step=0.000826, global_step=1802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  12%|█▎        | 10/80 [01:22<08:46,  7.52s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000353, train/loss_vlb_step=5.73e-6, train/loss_step=0.000353, global_step=1802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  14%|█▍        | 11/80 [01:23<07:58,  6.94s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000353, train/loss_vlb_step=5.73e-6, train/loss_step=0.000353, global_step=1802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  14%|█▍        | 11/80 [01:23<07:58,  6.94s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.23e-5, train/loss_step=0.00624, global_step=1802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  15%|█▌        | 12/80 [01:24<07:22,  6.50s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=3.23e-5, train/loss_step=0.00624, global_step=1802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  15%|█▌        | 12/80 [01:24<07:22,  6.50s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.27e-6, train/loss_step=0.000307, global_step=1802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  16%|█▋        | 13/80 [01:25<06:47,  6.07s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.27e-6, train/loss_step=0.000307, global_step=1802.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  16%|█▋        | 13/80 [01:25<06:47,  6.07s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=3.84e-5, train/loss_step=0.00139, global_step=1803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402] Epoch 90:  18%|█▊        | 14/80 [01:33<06:53,  6.27s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00139, train/loss_vlb_step=3.84e-5, train/loss_step=0.00139, global_step=1803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  18%|█▊        | 14/80 [01:33<06:53,  6.27s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.11e-5, train/loss_step=0.00307, global_step=1803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  19%|█▉        | 15/80 [01:34<06:23,  5.91s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=1.11e-5, train/loss_step=0.00307, global_step=1803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  19%|█▉        | 15/80 [01:34<06:23,  5.91s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=2.72e-6, train/loss_step=0.000275, global_step=1803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  20%|██        | 16/80 [02:03<07:44,  7.26s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=2.72e-6, train/loss_step=0.000275, global_step=1803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  20%|██        | 16/80 [02:03<07:44,  7.26s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.09e-5, train/loss_step=0.00511, global_step=1803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  21%|██▏       | 17/80 [02:06<07:22,  7.02s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=2.09e-5, train/loss_step=0.00511, global_step=1803.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  21%|██▏       | 17/80 [02:06<07:22,  7.02s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=8.75e-6, train/loss_step=0.0017, global_step=1804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  22%|██▎       | 18/80 [02:11<07:10,  6.94s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=8.75e-6, train/loss_step=0.0017, global_step=1804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  22%|██▎       | 18/80 [02:11<07:10,  6.94s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=9.76e-6, train/loss_step=0.00266, global_step=1804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  24%|██▍       | 19/80 [02:12<06:43,  6.61s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.00266, train/loss_vlb_step=9.76e-6, train/loss_step=0.00266, global_step=1804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  24%|██▍       | 19/80 [02:12<06:43,  6.61s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000383, train/loss_vlb_step=1.75e-6, train/loss_step=0.000383, global_step=1804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  25%|██▌       | 20/80 [02:12<06:19,  6.32s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000383, train/loss_vlb_step=1.75e-6, train/loss_step=0.000383, global_step=1804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  25%|██▌       | 20/80 [02:12<06:19,  6.32s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=2e-6, train/loss_step=0.00029, global_step=1804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]     Epoch 90:  26%|██▋       | 21/80 [02:13<05:57,  6.06s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=2e-6, train/loss_step=0.00029, global_step=1804.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  26%|██▋       | 21/80 [02:13<05:57,  6.06s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=1.42e-5, train/loss_step=0.0042, global_step=1805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  28%|██▊       | 22/80 [02:24<06:05,  6.30s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.0042, train/loss_vlb_step=1.42e-5, train/loss_step=0.0042, global_step=1805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  28%|██▊       | 22/80 [02:24<06:05,  6.30s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=7.39e-6, train/loss_step=0.00155, global_step=1805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  29%|██▉       | 23/80 [02:25<05:45,  6.06s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=7.39e-6, train/loss_step=0.00155, global_step=1805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  29%|██▉       | 23/80 [02:25<05:45,  6.06s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=4.97e-5, train/loss_step=0.0014, global_step=1805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  30%|███       | 24/80 [02:34<05:46,  6.19s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=4.97e-5, train/loss_step=0.0014, global_step=1805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  30%|███       | 24/80 [02:34<05:46,  6.19s/it, loss=0.00161, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=3.26e-6, train/loss_step=0.000726, global_step=1805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  31%|███▏      | 25/80 [02:49<05:58,  6.52s/it, loss=0.00161, v_num=0, train/loss_simple_step=0.000726, train/loss_vlb_step=3.26e-6, train/loss_step=0.000726, global_step=1805.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  31%|███▏      | 25/80 [02:49<05:58,  6.52s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=7.48e-5, train/loss_step=0.00663, global_step=1806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]   Epoch 90:  32%|███▎      | 26/80 [02:50<05:41,  6.32s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.00663, train/loss_vlb_step=7.48e-5, train/loss_step=0.00663, global_step=1806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  32%|███▎      | 26/80 [02:50<05:41,  6.32s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=5.85e-6, train/loss_step=0.00161, global_step=1806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  34%|███▍      | 27/80 [02:51<05:24,  6.11s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.00161, train/loss_vlb_step=5.85e-6, train/loss_step=0.00161, global_step=1806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  34%|███▍      | 27/80 [02:51<05:24,  6.11s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000707, train/loss_vlb_step=6.91e-6, train/loss_step=0.000707, global_step=1806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  35%|███▌      | 28/80 [02:59<05:21,  6.18s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000707, train/loss_vlb_step=6.91e-6, train/loss_step=0.000707, global_step=1806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  35%|███▌      | 28/80 [02:59<05:21,  6.18s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=1.82e-5, train/loss_step=0.00534, global_step=1806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  36%|███▋      | 29/80 [02:59<05:05,  6.00s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=1.82e-5, train/loss_step=0.00534, global_step=1806.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  36%|███▋      | 29/80 [02:59<05:05,  6.00s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=6.03e-5, train/loss_step=0.00571, global_step=1807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  38%|███▊      | 30/80 [03:10<05:07,  6.16s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=6.03e-5, train/loss_step=0.00571, global_step=1807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  38%|███▊      | 30/80 [03:10<05:07,  6.16s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=4.13e-6, train/loss_step=0.00117, global_step=1807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  39%|███▉      | 31/80 [03:11<04:53,  5.98s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=4.13e-6, train/loss_step=0.00117, global_step=1807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  39%|███▉      | 31/80 [03:11<04:53,  5.98s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=1.83e-6, train/loss_step=0.000467, global_step=1807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  40%|████      | 32/80 [03:17<04:47,  6.00s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=1.83e-6, train/loss_step=0.000467, global_step=1807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  40%|████      | 32/80 [03:17<04:47,  6.00s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1e-5, train/loss_step=0.00168, global_step=1807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]      Epoch 90:  41%|████▏     | 33/80 [03:40<05:04,  6.47s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=1e-5, train/loss_step=0.00168, global_step=1807.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  41%|████▏     | 33/80 [03:40<05:04,  6.47s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=2.99e-6, train/loss_step=0.000477, global_step=1808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  42%|████▎     | 34/80 [03:40<04:50,  6.31s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=2.99e-6, train/loss_step=0.000477, global_step=1808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  42%|████▎     | 34/80 [03:40<04:50,  6.31s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.4e-6, train/loss_step=0.000367, global_step=1808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402] Epoch 90:  44%|████▍     | 35/80 [03:41<04:36,  6.15s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.4e-6, train/loss_step=0.000367, global_step=1808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  44%|████▍     | 35/80 [03:41<04:36,  6.15s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000113, train/loss_step=0.0105, global_step=1808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  45%|████▌     | 36/80 [03:41<04:23,  5.99s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=0.000113, train/loss_step=0.0105, global_step=1808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  45%|████▌     | 36/80 [03:41<04:23,  5.99s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=7.92e-5, train/loss_step=0.0123, global_step=1808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402] Epoch 90:  46%|████▋     | 37/80 [03:42<04:11,  5.85s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=7.92e-5, train/loss_step=0.0123, global_step=1808.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  46%|████▋     | 37/80 [03:42<04:11,  5.85s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=7.37e-6, train/loss_step=0.00159, global_step=1809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  48%|████▊     | 38/80 [03:49<04:07,  5.89s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00159, train/loss_vlb_step=7.37e-6, train/loss_step=0.00159, global_step=1809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  48%|████▊     | 38/80 [03:49<04:07,  5.89s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=3.29e-6, train/loss_step=0.000802, global_step=1809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  49%|████▉     | 39/80 [03:50<03:56,  5.76s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=3.29e-6, train/loss_step=0.000802, global_step=1809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  49%|████▉     | 39/80 [03:50<03:56,  5.76s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00054, train/loss_vlb_step=2.63e-6, train/loss_step=0.00054, global_step=1809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]   Epoch 90:  50%|█████     | 40/80 [03:57<03:51,  5.80s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00054, train/loss_vlb_step=2.63e-6, train/loss_step=0.00054, global_step=1809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  50%|█████     | 40/80 [03:57<03:51,  5.80s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=6.94e-6, train/loss_step=0.00196, global_step=1809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  51%|█████▏    | 41/80 [04:25<04:06,  6.33s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=6.94e-6, train/loss_step=0.00196, global_step=1809.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  51%|█████▏    | 41/80 [04:25<04:06,  6.33s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.58e-6, train/loss_step=0.000455, global_step=1810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  52%|█████▎    | 42/80 [04:30<03:58,  6.29s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.58e-6, train/loss_step=0.000455, global_step=1810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  52%|█████▎    | 42/80 [04:30<03:58,  6.29s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.22e-5, train/loss_step=0.0033, global_step=1810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]   Epoch 90:  54%|█████▍    | 43/80 [04:30<03:47,  6.15s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.22e-5, train/loss_step=0.0033, global_step=1810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  54%|█████▍    | 43/80 [04:30<03:47,  6.15s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.00013, train/loss_step=0.011, global_step=1810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  55%|█████▌    | 44/80 [04:31<03:37,  6.03s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.00013, train/loss_step=0.011, global_step=1810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  55%|█████▌    | 44/80 [04:31<03:37,  6.03s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=3.33e-6, train/loss_step=0.000605, global_step=1810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  56%|█████▋    | 45/80 [04:31<03:26,  5.91s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=3.33e-6, train/loss_step=0.000605, global_step=1810.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  56%|█████▋    | 45/80 [04:31<03:26,  5.91s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000318, train/loss_vlb_step=2.17e-6, train/loss_step=0.000318, global_step=1811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  57%|█████▊    | 46/80 [04:32<03:16,  5.79s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000318, train/loss_vlb_step=2.17e-6, train/loss_step=0.000318, global_step=1811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  57%|█████▊    | 46/80 [04:32<03:16,  5.79s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.75e-5, train/loss_step=0.0057, global_step=1811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]    Epoch 90:  59%|█████▉    | 47/80 [04:32<03:07,  5.68s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.0057, train/loss_vlb_step=2.75e-5, train/loss_step=0.0057, global_step=1811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  59%|█████▉    | 47/80 [04:32<03:07,  5.68s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=0.000116, train/loss_step=0.00086, global_step=1811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  60%|██████    | 48/80 [04:44<03:06,  5.81s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00086, train/loss_vlb_step=0.000116, train/loss_step=0.00086, global_step=1811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  60%|██████    | 48/80 [04:44<03:06,  5.81s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.07e-5, train/loss_step=0.00808, global_step=1811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402] Epoch 90:  61%|██████▏   | 49/80 [05:17<03:16,  6.35s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00808, train/loss_vlb_step=3.07e-5, train/loss_step=0.00808, global_step=1811.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  61%|██████▏   | 49/80 [05:17<03:16,  6.35s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.04e-5, train/loss_step=0.00144, global_step=1812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  62%|██████▎   | 50/80 [05:17<03:07,  6.23s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.04e-5, train/loss_step=0.00144, global_step=1812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  62%|██████▎   | 50/80 [05:17<03:07,  6.23s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=0.0001, train/loss_step=0.0104, global_step=1812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]   Epoch 90:  64%|██████▍   | 51/80 [05:18<02:57,  6.12s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=0.0001, train/loss_step=0.0104, global_step=1812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  64%|██████▍   | 51/80 [05:18<02:57,  6.12s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.21e-5, train/loss_step=0.00313, global_step=1812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  65%|██████▌   | 52/80 [05:18<02:48,  6.02s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.21e-5, train/loss_step=0.00313, global_step=1812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  65%|██████▌   | 52/80 [05:18<02:48,  6.02s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=5.68e-5, train/loss_step=0.00926, global_step=1812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  66%|██████▋   | 53/80 [05:19<02:39,  5.92s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=5.68e-5, train/loss_step=0.00926, global_step=1812.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  66%|██████▋   | 53/80 [05:19<02:39,  5.92s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.48e-5, train/loss_step=0.00192, global_step=1813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  68%|█��████▊   | 54/80 [05:19<02:31,  5.82s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00192, train/loss_vlb_step=1.48e-5, train/loss_step=0.00192, global_step=1813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  68%|██████▊   | 54/80 [05:19<02:31,  5.82s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=5.4e-7, train/loss_step=0.000154, global_step=1813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  69%|██████▉   | 55/80 [05:20<02:23,  5.72s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=5.4e-7, train/loss_step=0.000154, global_step=1813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  69%|██████▉   | 55/80 [05:20<02:23,  5.72s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.59e-6, train/loss_step=0.000718, global_step=1813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  70%|███████   | 56/80 [05:32<02:20,  5.84s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.59e-6, train/loss_step=0.000718, global_step=1813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  70%|███████   | 56/80 [05:32<02:20,  5.84s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=2.65e-6, train/loss_step=0.00068, global_step=1813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  71%|███████▏  | 57/80 [05:51<02:19,  6.07s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=2.65e-6, train/loss_step=0.00068, global_step=1813.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  71%|███████▏  | 57/80 [05:51<02:19,  6.07s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000134, train/loss_vlb_step=5.99e-7, train/loss_step=0.000134, global_step=1814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  72%|███████▎  | 58/80 [05:52<02:11,  5.97s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000134, train/loss_vlb_step=5.99e-7, train/loss_step=0.000134, global_step=1814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  72%|███████▎  | 58/80 [05:52<02:11,  5.97s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000217, train/loss_vlb_step=9.59e-7, train/loss_step=0.000217, global_step=1814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  74%|███████▍  | 59/80 [05:52<02:03,  5.88s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.000217, train/loss_vlb_step=9.59e-7, train/loss_step=0.000217, global_step=1814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  74%|███████▍  | 59/80 [05:52<02:03,  5.88s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=2.06e-6, train/loss_step=0.000329, global_step=1814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  75%|███████▌  | 60/80 [05:53<01:55,  5.80s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=2.06e-6, train/loss_step=0.000329, global_step=1814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  75%|███████▌  | 60/80 [05:53<01:55,  5.80s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.56e-5, train/loss_step=0.0118, global_step=1814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]    Epoch 90:  76%|███████▋  | 61/80 [05:54<01:48,  5.72s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=5.56e-5, train/loss_step=0.0118, global_step=1814.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  76%|███████▋  | 61/80 [05:54<01:48,  5.72s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.11e-5, train/loss_step=0.00323, global_step=1815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  78%|███████▊  | 62/80 [05:59<01:42,  5.71s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.11e-5, train/loss_step=0.00323, global_step=1815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  78%|███████▊  | 62/80 [05:59<01:42,  5.71s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=3.05e-6, train/loss_step=0.000409, global_step=1815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=3.05e-6, train/loss_step=0.000409, global_step=1815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000404, train/loss_vlb_step=2.32e-6, train/loss_step=0.000404, global_step=1815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  80%|████████  | 64/80 [06:13<01:31,  5.74s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000404, train/loss_vlb_step=2.32e-6, train/loss_step=0.000404, global_step=1815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  80%|████████  | 64/80 [06:13<01:31,  5.74s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.07e-5, train/loss_step=0.00205, global_step=1815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  81%|████████▏ | 65/80 [06:34<01:29,  5.98s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.07e-5, train/loss_step=0.00205, global_step=1815.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  81%|████████▏ | 65/80 [06:34<01:29,  5.98s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.42e-5, train/loss_step=0.0105, global_step=1816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  82%|████████▎ | 66/80 [06:35<01:22,  5.90s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.42e-5, train/loss_step=0.0105, global_step=1816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  82%|████████▎ | 66/80 [06:35<01:22,  5.90s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.79e-5, train/loss_step=0.00302, global_step=1816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  84%|████████▍ | 67/80 [06:35<01:15,  5.82s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00302, train/loss_vlb_step=1.79e-5, train/loss_step=0.00302, global_step=1816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  84%|████████▍ | 67/80 [06:35<01:15,  5.82s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=9.42e-6, train/loss_step=0.0027, global_step=1816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  85%|████████▌ | 68/80 [06:36<01:08,  5.75s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=9.42e-6, train/loss_step=0.0027, global_step=1816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  85%|████████▌ | 68/80 [06:36<01:08,  5.75s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=3.22e-5, train/loss_step=0.00747, global_step=1816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  86%|████████▋ | 69/80 [06:37<01:02,  5.67s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=3.22e-5, train/loss_step=0.00747, global_step=1816.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  86%|████████▋ | 69/80 [06:37<01:02,  5.67s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000597, train/loss_vlb_step=2.87e-6, train/loss_step=0.000597, global_step=1817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000597, train/loss_vlb_step=2.87e-6, train/loss_step=0.000597, global_step=1817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.99e-6, train/loss_step=0.000317, global_step=1817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.99e-6, train/loss_step=0.000317, global_step=1817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000137, train/loss_vlb_step=6.22e-7, train/loss_step=0.000137, global_step=1817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402] Epoch 90:  90%|█████████ | 72/80 [06:50<00:45,  5.63s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000137, train/loss_vlb_step=6.22e-7, train/loss_step=0.000137, global_step=1817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  90%|█████████ | 72/80 [06:50<00:45,  5.63s/it, loss=0.00234, v_num=0, train/loss_simple_step=9.54e-5, train/loss_vlb_step=3.8e-7, train/loss_step=9.54e-5, global_step=1817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 90:  91%|█████████▏| 73/80 [07:04<00:40,  5.74s/it, loss=0.00234, v_num=0, train/loss_simple_step=9.54e-5, train/loss_vlb_step=3.8e-7, train/loss_step=9.54e-5, global_step=1817.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  91%|█████████▏| 73/80 [07:04<00:40,  5.74s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=8.7e-6, train/loss_step=0.000586, global_step=1818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  92%|█████████▎| 74/80 [07:04<00:33,  5.67s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=8.7e-6, train/loss_step=0.000586, global_step=1818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  92%|█████████▎| 74/80 [07:04<00:33,  5.67s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=2.18e-5, train/loss_step=0.0014, global_step=1818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]   Epoch 90:  94%|█████████▍| 75/80 [07:05<00:27,  5.60s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=2.18e-5, train/loss_step=0.0014, global_step=1818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  94%|█████████▍| 75/80 [07:05<00:27,  5.60s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=3.78e-5, train/loss_step=0.00529, global_step=1818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00529, train/loss_vlb_step=3.78e-5, train/loss_step=0.00529, global_step=1818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000994, train/loss_vlb_step=1.95e-5, train/loss_step=0.000994, global_step=1818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000994, train/loss_vlb_step=1.95e-5, train/loss_step=0.000994, global_step=1818.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=7.16e-6, train/loss_step=0.0012, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]    Epoch 90:  98%|█████████▊| 78/80 [07:16<00:11,  5.53s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=7.16e-6, train/loss_step=0.0012, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  98%|█████████▊| 78/80 [07:16<00:11,  5.53s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.48e-6, train/loss_step=0.000315, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=1.48e-6, train/loss_step=0.000315, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=5.46e-6, train/loss_step=0.000802, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90: 100%|██████████| 80/80 [07:17<00:00,  5.41s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000802, train/loss_vlb_step=5.46e-6, train/loss_step=0.000802, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 90: 100%|██████████| 80/80 [07:17<00:00,  5.41s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.48e-6, train/loss_step=0.00038, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Average Epoch time: 437.95 seconds
+Average Peak memory 29569.32MiB
+Epoch 90:   0%|          | 0/80 [00:00<00:00, 4315.13it/s, loss=0.00209, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.48e-6, train/loss_step=0.00038, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 91:   0%|          | 0/80 [00:00<00:00, 1918.71it/s, loss=0.00209, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.48e-6, train/loss_step=0.00038, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]Epoch 91:   1%|▏         | 1/80 [00:39<25:58, 19.73s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.48e-6, train/loss_step=0.00038, global_step=1819.0, lr_abs=0.0001, train/loss_simple_epoch=0.00402, train/loss_vlb_epoch=0.000139, train/loss_epoch=0.00402]  Epoch 91:   1%|▏         | 1/80 [00:39<25:58, 19.73s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.45e-5, train/loss_step=0.00394, global_step=1820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:   2%|▎         | 2/80 [00:41<17:48, 13.70s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.45e-5, train/loss_step=0.00394, global_step=1820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   2%|▎         | 2/80 [00:41<17:48, 13.70s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=6.92e-6, train/loss_step=0.00114, global_step=1820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   4%|▍         | 3/80 [00:41<13:20, 10.40s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=6.92e-6, train/loss_step=0.00114, global_step=1820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   4%|▍         | 3/80 [00:41<13:20, 10.40s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=5.65e-5, train/loss_step=0.00863, global_step=1820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   5%|▌         | 4/80 [00:42<10:39,  8.42s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=5.65e-5, train/loss_step=0.00863, global_step=1820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   5%|▌         | 4/80 [00:42<10:39,  8.42s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=0.000182, train/loss_step=0.00664, global_step=1820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   6%|▋         | 5/80 [00:42<08:52,  7.10s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=0.000182, train/loss_step=0.00664, global_step=1820.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   6%|▋         | 5/80 [00:42<08:52,  7.10s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.66e-5, train/loss_step=0.0103, global_step=1821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]    Epoch 91:   8%|▊         | 6/80 [00:43<07:35,  6.16s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.66e-5, train/loss_step=0.0103, global_step=1821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   8%|▊         | 6/80 [00:43<07:35,  6.16s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.31e-5, train/loss_step=0.00433, global_step=1821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   9%|▉         | 7/80 [00:43<06:38,  5.45s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.31e-5, train/loss_step=0.00433, global_step=1821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:   9%|▉         | 7/80 [00:43<06:38,  5.45s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1e-5, train/loss_step=0.00286, global_step=1821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]   Epoch 91:  10%|█         | 8/80 [01:25<11:23,  9.49s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00286, train/loss_vlb_step=1e-5, train/loss_step=0.00286, global_step=1821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  10%|█         | 8/80 [01:25<11:23,  9.49s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=6.59e-5, train/loss_step=0.0109, global_step=1821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  11%|█▏        | 9/80 [01:30<10:44,  9.08s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=6.59e-5, train/loss_step=0.0109, global_step=1821.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  11%|█▏        | 9/80 [01:30<10:44,  9.08s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=3.64e-5, train/loss_step=0.00916, global_step=1822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  12%|█▎        | 10/80 [01:31<09:40,  8.29s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=3.64e-5, train/loss_step=0.00916, global_step=1822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  12%|█▎        | 10/80 [01:31<09:40,  8.29s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=3.47e-5, train/loss_step=0.00884, global_step=1822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  14%|█▍        | 11/80 [01:31<08:47,  7.64s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00884, train/loss_vlb_step=3.47e-5, train/loss_step=0.00884, global_step=1822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  14%|█▍        | 11/80 [01:31<08:47,  7.64s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.00363, train/loss_step=0.0217, global_step=1822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  15%|█▌        | 12/80 [01:32<08:02,  7.10s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.00363, train/loss_step=0.0217, global_step=1822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  15%|█▌        | 12/80 [01:32<08:02,  7.10s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=8.89e-7, train/loss_step=0.000208, global_step=1822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  16%|█▋        | 13/80 [01:32<07:24,  6.63s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=8.89e-7, train/loss_step=0.000208, global_step=1822.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  16%|█▋        | 13/80 [01:32<07:24,  6.63s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=2.61e-5, train/loss_step=0.00353, global_step=1823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]  Epoch 91:  18%|█▊        | 14/80 [01:33<06:50,  6.22s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00353, train/loss_vlb_step=2.61e-5, train/loss_step=0.00353, global_step=1823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  18%|█▊        | 14/80 [01:33<06:50,  6.22s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=4.66e-5, train/loss_step=0.0123, global_step=1823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]  Epoch 91:  19%|█▉        | 15/80 [01:33<06:21,  5.86s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=4.66e-5, train/loss_step=0.0123, global_step=1823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  19%|█▉        | 15/80 [01:33<06:21,  5.86s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=6.65e-6, train/loss_step=0.00172, global_step=1823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  20%|██        | 16/80 [02:13<08:24,  7.88s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=6.65e-6, train/loss_step=0.00172, global_step=1823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  20%|██        | 16/80 [02:13<08:24,  7.88s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000104, train/loss_vlb_step=4.07e-7, train/loss_step=0.000104, global_step=1823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  21%|██▏       | 17/80 [02:14<07:50,  7.47s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000104, train/loss_vlb_step=4.07e-7, train/loss_step=0.000104, global_step=1823.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  21%|██▏       | 17/80 [02:14<07:50,  7.47s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.52e-5, train/loss_step=0.0025, global_step=1824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]    Epoch 91:  22%|██▎       | 18/80 [02:14<07:20,  7.10s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=1.52e-5, train/loss_step=0.0025, global_step=1824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  22%|██▎       | 18/80 [02:14<07:20,  7.10s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.76e-5, train/loss_step=0.00156, global_step=1824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  24%|██▍       | 19/80 [02:15<06:53,  6.77s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.76e-5, train/loss_step=0.00156, global_step=1824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  24%|██▍       | 19/80 [02:15<06:53,  6.77s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=9.72e-5, train/loss_step=0.0097, global_step=1824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]  Epoch 91:  25%|██▌       | 20/80 [02:16<06:30,  6.52s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=9.72e-5, train/loss_step=0.0097, global_step=1824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  25%|██▌       | 20/80 [02:16<06:30,  6.52s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.000698, train/loss_vlb_step=2.9e-6, train/loss_step=0.000698, global_step=1824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  26%|██▋       | 21/80 [02:17<06:08,  6.24s/it, loss=0.00604, v_num=0, train/loss_simple_step=0.000698, train/loss_vlb_step=2.9e-6, train/loss_step=0.000698, global_step=1824.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  26%|██▋       | 21/80 [02:17<06:08,  6.24s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=8.97e-7, train/loss_step=0.000224, global_step=1825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  28%|██▊       | 22/80 [02:17<05:47,  5.99s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=8.97e-7, train/loss_step=0.000224, global_step=1825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  28%|██▊       | 22/80 [02:17<05:47,  5.99s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=1.83e-5, train/loss_step=0.00527, global_step=1825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]  Epoch 91:  29%|██▉       | 23/80 [02:18<05:28,  5.76s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=1.83e-5, train/loss_step=0.00527, global_step=1825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  29%|██▉       | 23/80 [02:18<05:28,  5.76s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=1.6e-5, train/loss_step=0.000749, global_step=1825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  30%|███       | 24/80 [02:52<06:26,  6.91s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=1.6e-5, train/loss_step=0.000749, global_step=1825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  30%|███       | 24/80 [02:52<06:26,  6.91s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=9.37e-5, train/loss_step=0.00103, global_step=1825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  31%|███▏      | 25/80 [02:53<06:06,  6.67s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=9.37e-5, train/loss_step=0.00103, global_step=1825.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  31%|███▏      | 25/80 [02:53<06:06,  6.67s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=2.88e-5, train/loss_step=0.00796, global_step=1826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  32%|███▎      | 26/80 [02:53<05:47,  6.44s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=2.88e-5, train/loss_step=0.00796, global_step=1826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  32%|███▎      | 26/80 [02:53<05:47,  6.44s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.43e-6, train/loss_step=0.000329, global_step=1826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  34%|███▍      | 27/80 [02:54<05:29,  6.22s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.43e-6, train/loss_step=0.000329, global_step=1826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  34%|███▍      | 27/80 [02:54<05:29,  6.22s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00552, train/loss_vlb_step=2.46e-5, train/loss_step=0.00552, global_step=1826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]   Epoch 91:  35%|███▌      | 28/80 [02:54<05:13,  6.03s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00552, train/loss_vlb_step=2.46e-5, train/loss_step=0.00552, global_step=1826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  35%|███▌      | 28/80 [02:54<05:13,  6.03s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=1.13e-6, train/loss_step=0.000208, global_step=1826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  36%|███▋      | 29/80 [02:55<04:58,  5.85s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000208, train/loss_vlb_step=1.13e-6, train/loss_step=0.000208, global_step=1826.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  36%|███▋      | 29/80 [02:55<04:58,  5.85s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.5e-5, train/loss_step=0.00502, global_step=1827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]   Epoch 91:  38%|███▊      | 30/80 [02:58<04:47,  5.76s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=2.5e-5, train/loss_step=0.00502, global_step=1827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  38%|███▊      | 30/80 [02:58<04:47,  5.76s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.14e-5, train/loss_step=0.0112, global_step=1827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  39%|███▉      | 31/80 [02:58<04:34,  5.59s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=4.14e-5, train/loss_step=0.0112, global_step=1827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  39%|███▉      | 31/80 [02:58<04:34,  5.59s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=2e-5, train/loss_step=0.00147, global_step=1827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  40%|████      | 32/80 [03:47<05:30,  6.89s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00147, train/loss_vlb_step=2e-5, train/loss_step=0.00147, global_step=1827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  40%|████      | 32/80 [03:47<05:30,  6.89s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.58e-5, train/loss_step=0.0115, global_step=1827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  41%|████▏     | 33/80 [03:47<05:14,  6.70s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=4.58e-5, train/loss_step=0.0115, global_step=1827.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  41%|████▏     | 33/80 [03:47<05:14,  6.70s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=5.05e-5, train/loss_step=0.00909, global_step=1828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  42%|████▎     | 34/80 [03:48<05:00,  6.52s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=5.05e-5, train/loss_step=0.00909, global_step=1828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  42%|████▎     | 34/80 [03:48<05:00,  6.52s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000491, train/loss_vlb_step=1.57e-5, train/loss_step=0.000491, global_step=1828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  44%|████▍     | 35/80 [03:48<04:46,  6.36s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000491, train/loss_vlb_step=1.57e-5, train/loss_step=0.000491, global_step=1828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  44%|████▍     | 35/80 [03:48<04:46,  6.36s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000814, train/loss_vlb_step=3.81e-6, train/loss_step=0.000814, global_step=1828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  45%|████▌     | 36/80 [03:49<04:32,  6.20s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000814, train/loss_vlb_step=3.81e-6, train/loss_step=0.000814, global_step=1828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  45%|████▌     | 36/80 [03:49<04:32,  6.20s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.85e-6, train/loss_step=0.000311, global_step=1828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  46%|████▋     | 37/80 [03:49<04:20,  6.05s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.85e-6, train/loss_step=0.000311, global_step=1828.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  46%|████▋     | 37/80 [03:49<04:20,  6.05s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.96e-5, train/loss_step=0.00218, global_step=1829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]  Epoch 91:  48%|████▊     | 38/80 [03:50<04:08,  5.91s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.96e-5, train/loss_step=0.00218, global_step=1829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  48%|████▊     | 38/80 [03:50<04:08,  5.91s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=0.000109, train/loss_step=0.00213, global_step=1829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  49%|████▉     | 39/80 [03:50<03:56,  5.77s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=0.000109, train/loss_step=0.00213, global_step=1829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  49%|████▉     | 39/80 [03:50<03:56,  5.77s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=1.57e-5, train/loss_step=0.00471, global_step=1829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  50%|█████     | 40/80 [04:26<04:19,  6.49s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00471, train/loss_vlb_step=1.57e-5, train/loss_step=0.00471, global_step=1829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  50%|█████     | 40/80 [04:26<04:19,  6.49s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.04e-5, train/loss_step=0.0031, global_step=1829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]  Epoch 91:  51%|█████▏    | 41/80 [04:26<04:07,  6.35s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0031, train/loss_vlb_step=1.04e-5, train/loss_step=0.0031, global_step=1829.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  51%|█████▏    | 41/80 [04:26<04:07,  6.35s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00011, train/loss_vlb_step=5.19e-7, train/loss_step=0.00011, global_step=1830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  52%|█████▎    | 42/80 [04:27<03:56,  6.21s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00011, train/loss_vlb_step=5.19e-7, train/loss_step=0.00011, global_step=1830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  52%|█████▎    | 42/80 [04:27<03:56,  6.21s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.53e-5, train/loss_step=0.00576, global_step=1830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  54%|█████▍    | 43/80 [04:27<03:45,  6.08s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00576, train/loss_vlb_step=2.53e-5, train/loss_step=0.00576, global_step=1830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  54%|█████▍    | 43/80 [04:27<03:45,  6.08s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.00103, train/loss_step=0.026, global_step=1830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]    Epoch 91:  55%|█████▌    | 44/80 [04:28<03:34,  5.96s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.00103, train/loss_step=0.026, global_step=1830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  55%|█████▌    | 44/80 [04:28<03:34,  5.96s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=0.000841, train/loss_step=0.00476, global_step=1830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  56%|█████▋    | 45/80 [04:28<03:24,  5.85s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=0.000841, train/loss_step=0.00476, global_step=1830.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  56%|█████▋    | 45/80 [04:28<03:24,  5.85s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.49e-6, train/loss_step=0.000278, global_step=1831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  57%|█████▊    | 46/80 [04:29<03:14,  5.73s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.49e-6, train/loss_step=0.000278, global_step=1831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  57%|█████▊    | 46/80 [04:29<03:14,  5.73s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=5.66e-5, train/loss_step=0.0061, global_step=1831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]    Epoch 91:  59%|█████▉    | 47/80 [04:29<03:05,  5.62s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=5.66e-5, train/loss_step=0.0061, global_step=1831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  59%|█████▉    | 47/80 [04:29<03:05,  5.62s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.19e-5, train/loss_step=0.00278, global_step=1831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  60%|██████    | 48/80 [05:19<03:28,  6.53s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00278, train/loss_vlb_step=1.19e-5, train/loss_step=0.00278, global_step=1831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  60%|██████    | 48/80 [05:19<03:28,  6.53s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=9.9e-6, train/loss_step=0.00283, global_step=1831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  61%|██████▏   | 49/80 [05:20<03:18,  6.41s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=9.9e-6, train/loss_step=0.00283, global_step=1831.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  61%|██████▏   | 49/80 [05:20<03:18,  6.41s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=1.67e-5, train/loss_step=0.00464, global_step=1832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  62%|██████▎   | 50/80 [05:20<03:08,  6.29s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=1.67e-5, train/loss_step=0.00464, global_step=1832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  62%|██████▎   | 50/80 [05:20<03:08,  6.29s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=5.8e-6, train/loss_step=0.00111, global_step=1832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  64%|██████▍   | 51/80 [05:21<02:59,  6.18s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=5.8e-6, train/loss_step=0.00111, global_step=1832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  64%|██████▍   | 51/80 [05:21<02:59,  6.18s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.07e-5, train/loss_step=0.0136, global_step=1832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  65%|██████▌   | 52/80 [05:21<02:50,  6.07s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=5.07e-5, train/loss_step=0.0136, global_step=1832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  65%|██████▌   | 52/80 [05:21<02:50,  6.07s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.34e-5, train/loss_step=0.00369, global_step=1832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  66%|██████▋   | 53/80 [05:22<02:41,  5.97s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=1.34e-5, train/loss_step=0.00369, global_step=1832.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  66%|██████▋   | 53/80 [05:22<02:41,  5.97s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.96e-5, train/loss_step=0.00671, global_step=1833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  68%|██████▊   | 54/80 [05:22<02:32,  5.87s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.96e-5, train/loss_step=0.00671, global_step=1833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  68%|██████▊   | 54/80 [05:22<02:32,  5.87s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=8.64e-6, train/loss_step=0.00245, global_step=1833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  69%|██████▉   | 55/80 [05:23<02:24,  5.78s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=8.64e-6, train/loss_step=0.00245, global_step=1833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  69%|██████▉   | 55/80 [05:23<02:24,  5.78s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.65e-5, train/loss_step=0.00769, global_step=1833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  70%|███████   | 56/80 [06:07<02:34,  6.44s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00769, train/loss_vlb_step=3.65e-5, train/loss_step=0.00769, global_step=1833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  70%|███████   | 56/80 [06:07<02:34,  6.44s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=3.4e-6, train/loss_step=0.000387, global_step=1833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  71%|███████▏  | 57/80 [06:07<02:25,  6.34s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=3.4e-6, train/loss_step=0.000387, global_step=1833.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  71%|███████▏  | 57/80 [06:07<02:25,  6.34s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=9.1e-6, train/loss_step=0.00228, global_step=1834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]  Epoch 91:  72%|███████▎  | 58/80 [06:08<02:17,  6.24s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=9.1e-6, train/loss_step=0.00228, global_step=1834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  72%|███████▎  | 58/80 [06:08<02:17,  6.24s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000395, train/loss_step=0.0311, global_step=1834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  74%|███████▍  | 59/80 [06:08<02:09,  6.15s/it, loss=0.0065, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.000395, train/loss_step=0.0311, global_step=1834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  74%|███████▍  | 59/80 [06:08<02:09,  6.15s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.000975, train/loss_vlb_step=4.69e-6, train/loss_step=0.000975, global_step=1834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  75%|███████▌  | 60/80 [06:09<02:01,  6.06s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.000975, train/loss_vlb_step=4.69e-6, train/loss_step=0.000975, global_step=1834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  75%|███████▌  | 60/80 [06:09<02:01,  6.06s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=1.9e-5, train/loss_step=0.00571, global_step=1834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]   Epoch 91:  76%|███████▋  | 61/80 [06:09<01:53,  5.97s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00571, train/loss_vlb_step=1.9e-5, train/loss_step=0.00571, global_step=1834.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  76%|███████▋  | 61/80 [06:09<01:53,  5.97s/it, loss=0.00649, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=5.56e-6, train/loss_step=0.000857, global_step=1835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  78%|███████▊  | 62/80 [06:10<01:45,  5.88s/it, loss=0.00649, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=5.56e-6, train/loss_step=0.000857, global_step=1835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  78%|███████▊  | 62/80 [06:10<01:45,  5.88s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=3.4e-5, train/loss_step=0.00942, global_step=1835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]   Epoch 91:  79%|███████▉  | 63/80 [06:10<01:38,  5.79s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.00942, train/loss_vlb_step=3.4e-5, train/loss_step=0.00942, global_step=1835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  79%|███████▉  | 63/80 [06:10<01:38,  5.79s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=3.04e-6, train/loss_step=0.000294, global_step=1835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  80%|████████  | 64/80 [06:44<01:39,  6.22s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=3.04e-6, train/loss_step=0.000294, global_step=1835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  80%|████████  | 64/80 [06:44<01:39,  6.22s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.04e-5, train/loss_step=0.00554, global_step=1835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]  Epoch 91:  81%|████████▏ | 65/80 [06:45<01:32,  6.14s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=2.04e-5, train/loss_step=0.00554, global_step=1835.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  81%|████████▏ | 65/80 [06:45<01:32,  6.14s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.33e-5, train/loss_step=0.00604, global_step=1836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  82%|████████▎ | 66/80 [06:45<01:24,  6.06s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.33e-5, train/loss_step=0.00604, global_step=1836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  82%|████████▎ | 66/80 [06:45<01:24,  6.06s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.7e-5, train/loss_step=0.00175, global_step=1836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  84%|████████▍ | 67/80 [06:46<01:17,  5.97s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=1.7e-5, train/loss_step=0.00175, global_step=1836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  84%|████████▍ | 67/80 [06:46<01:17,  5.97s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=6.64e-5, train/loss_step=0.00412, global_step=1836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  85%|████████▌ | 68/80 [06:46<01:10,  5.90s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00412, train/loss_vlb_step=6.64e-5, train/loss_step=0.00412, global_step=1836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  85%|████████▌ | 68/80 [06:46<01:10,  5.90s/it, loss=0.00542, v_num=0, train/loss_simple_step=8.44e-5, train/loss_vlb_step=3.18e-7, train/loss_step=8.44e-5, global_step=1836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  86%|████████▋ | 69/80 [06:47<01:04,  5.82s/it, loss=0.00542, v_num=0, train/loss_simple_step=8.44e-5, train/loss_vlb_step=3.18e-7, train/loss_step=8.44e-5, global_step=1836.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  86%|████████▋ | 69/80 [06:47<01:04,  5.82s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=3.02e-5, train/loss_step=0.00905, global_step=1837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  88%|████████▊ | 70/80 [06:47<00:57,  5.74s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=3.02e-5, train/loss_step=0.00905, global_step=1837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  88%|████████▊ | 70/80 [06:47<00:57,  5.74s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=5.48e-6, train/loss_step=0.000497, global_step=1837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  89%|████████▉ | 71/80 [06:48<00:51,  5.67s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=5.48e-6, train/loss_step=0.000497, global_step=1837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  89%|████████▉ | 71/80 [06:48<00:51,  5.67s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.000129, train/loss_vlb_step=5.28e-7, train/loss_step=0.000129, global_step=1837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  90%|█████████ | 72/80 [07:21<00:48,  6.05s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.000129, train/loss_vlb_step=5.28e-7, train/loss_step=0.000129, global_step=1837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  90%|█████████ | 72/80 [07:21<00:48,  6.05s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=1.64e-6, train/loss_step=0.000247, global_step=1837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  91%|█████████▏| 73/80 [07:21<00:41,  5.97s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000247, train/loss_vlb_step=1.64e-6, train/loss_step=0.000247, global_step=1837.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  91%|█████████▏| 73/80 [07:21<00:41,  5.97s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=3.57e-6, train/loss_step=0.000295, global_step=1838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  92%|█████████▎| 74/80 [07:22<00:35,  5.90s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=3.57e-6, train/loss_step=0.000295, global_step=1838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  92%|█████████▎| 74/80 [07:22<00:35,  5.90s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=6.12e-6, train/loss_step=0.00145, global_step=1838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]   Epoch 91:  94%|█████████▍| 75/80 [07:22<00:29,  5.83s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=6.12e-6, train/loss_step=0.00145, global_step=1838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  94%|█████████▍| 75/80 [07:22<00:29,  5.83s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=7e-5, train/loss_step=0.011, global_step=1838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]      Epoch 91:  95%|█████████▌| 76/80 [07:23<00:23,  5.76s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=7e-5, train/loss_step=0.011, global_step=1838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  95%|█████████▌| 76/80 [07:23<00:23,  5.76s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=1.85e-5, train/loss_step=0.00544, global_step=1838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  96%|█████████▋| 77/80 [07:23<00:17,  5.69s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=1.85e-5, train/loss_step=0.00544, global_step=1838.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  96%|█████████▋| 77/80 [07:23<00:17,  5.69s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=1.3e-5, train/loss_step=0.00146, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  98%|█████████▊| 78/80 [07:24<00:11,  5.62s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=1.3e-5, train/loss_step=0.00146, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  98%|█████████▊| 78/80 [07:24<00:11,  5.62s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=7.63e-5, train/loss_step=0.0102, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353] Epoch 91:  99%|█████████▉| 79/80 [07:24<00:05,  5.56s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=7.63e-5, train/loss_step=0.0102, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91:  99%|█████████▉| 79/80 [07:24<00:05,  5.56s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=9.08e-6, train/loss_step=0.00125, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91: 100%|██████████| 80/80 [07:25<00:00,  5.50s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=9.08e-6, train/loss_step=0.00125, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 91: 100%|██████████| 80/80 [07:25<00:00,  5.50s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=5.46e-6, train/loss_step=0.00156, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Average Epoch time: 445.32 seconds
+Average Peak memory 29567.12MiB
+Epoch 91:   0%|          | 0/80 [00:00<00:00, 4568.96it/s, loss=0.00354, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=5.46e-6, train/loss_step=0.00156, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 92:   0%|          | 0/80 [00:00<00:00, 2129.09it/s, loss=0.00354, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=5.46e-6, train/loss_step=0.00156, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]Epoch 92:   1%|▏         | 1/80 [00:39<26:04, 19.81s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=5.46e-6, train/loss_step=0.00156, global_step=1839.0, lr_abs=0.0001, train/loss_simple_epoch=0.00353, train/loss_vlb_epoch=5.82e-5, train/loss_epoch=0.00353]  Epoch 92:   1%|▏         | 1/80 [00:39<26:04, 19.81s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=1.74e-6, train/loss_step=0.000282, global_step=1840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   2%|▎         | 2/80 [00:40<17:22, 13.37s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=1.74e-6, train/loss_step=0.000282, global_step=1840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   2%|▎         | 2/80 [00:40<17:22, 13.37s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=2.43e-6, train/loss_step=0.000441, global_step=1840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   4%|▍         | 3/80 [00:40<13:03, 10.17s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=2.43e-6, train/loss_step=0.000441, global_step=1840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   4%|▍         | 3/80 [00:40<13:03, 10.17s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.00188, train/loss_step=0.0232, global_step=1840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]     Epoch 92:   5%|▌         | 4/80 [00:41<10:26,  8.24s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.00188, train/loss_step=0.0232, global_step=1840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   5%|▌         | 4/80 [00:41<10:26,  8.24s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=3.5e-6, train/loss_step=0.000496, global_step=1840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   6%|▋         | 5/80 [00:44<09:20,  7.47s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000496, train/loss_vlb_step=3.5e-6, train/loss_step=0.000496, global_step=1840.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   6%|▋         | 5/80 [00:44<09:20,  7.47s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=5.51e-5, train/loss_step=0.0101, global_step=1841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]   Epoch 92:   8%|▊         | 6/80 [00:45<07:58,  6.47s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=5.51e-5, train/loss_step=0.0101, global_step=1841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   8%|▊         | 6/80 [00:45<07:58,  6.47s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=0.00094, train/loss_step=0.0226, global_step=1841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   9%|▉         | 7/80 [00:48<07:18,  6.00s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.0226, train/loss_vlb_step=0.00094, train/loss_step=0.0226, global_step=1841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:   9%|▉         | 7/80 [00:48<07:18,  6.00s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=5.71e-6, train/loss_step=0.000749, global_step=1841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  10%|█         | 8/80 [01:13<09:51,  8.21s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=5.71e-6, train/loss_step=0.000749, global_step=1841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  10%|█         | 8/80 [01:13<09:51,  8.21s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00087, train/loss_vlb_step=3.76e-6, train/loss_step=0.00087, global_step=1841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  11%|█▏        | 9/80 [01:20<09:33,  8.08s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00087, train/loss_vlb_step=3.76e-6, train/loss_step=0.00087, global_step=1841.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  11%|█▏        | 9/80 [01:20<09:33,  8.08s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.16e-5, train/loss_step=0.00204, global_step=1842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  12%|█��        | 10/80 [01:21<08:37,  7.39s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=1.16e-5, train/loss_step=0.00204, global_step=1842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  12%|█▎        | 10/80 [01:21<08:37,  7.39s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.14e-5, train/loss_step=0.00155, global_step=1842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  14%|█▍        | 11/80 [01:22<07:53,  6.86s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=1.14e-5, train/loss_step=0.00155, global_step=1842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  14%|█▍        | 11/80 [01:22<07:53,  6.86s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=2.59e-5, train/loss_step=0.0062, global_step=1842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  15%|█▌        | 12/80 [01:26<07:31,  6.64s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0062, train/loss_vlb_step=2.59e-5, train/loss_step=0.0062, global_step=1842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  15%|█▌        | 12/80 [01:26<07:31,  6.64s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=4.19e-6, train/loss_step=0.000857, global_step=1842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  16%|█▋        | 13/80 [01:26<06:55,  6.20s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.000857, train/loss_vlb_step=4.19e-6, train/loss_step=0.000857, global_step=1842.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  16%|█▋        | 13/80 [01:26<06:55,  6.20s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=3.04e-5, train/loss_step=0.00141, global_step=1843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  18%|█▊        | 14/80 [01:27<06:23,  5.82s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=3.04e-5, train/loss_step=0.00141, global_step=1843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  18%|█▊        | 14/80 [01:27<06:23,  5.82s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=5.28e-5, train/loss_step=0.00175, global_step=1843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  19%|█▉        | 15/80 [01:27<05:56,  5.49s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00175, train/loss_vlb_step=5.28e-5, train/loss_step=0.00175, global_step=1843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  19%|█▉        | 15/80 [01:27<05:56,  5.49s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=2.21e-5, train/loss_step=0.00157, global_step=1843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  20%|██        | 16/80 [01:57<07:20,  6.89s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=2.21e-5, train/loss_step=0.00157, global_step=1843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  20%|██        | 16/80 [01:57<07:20,  6.89s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.99e-6, train/loss_step=0.00166, global_step=1843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  21%|██▏       | 17/80 [01:59<06:56,  6.61s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=9.99e-6, train/loss_step=0.00166, global_step=1843.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  21%|██▏       | 17/80 [01:59<06:56,  6.61s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=5.43e-6, train/loss_step=0.00155, global_step=1844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  22%|██▎       | 18/80 [01:59<06:30,  6.29s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=5.43e-6, train/loss_step=0.00155, global_step=1844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  22%|██▎       | 18/80 [01:59<06:30,  6.29s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=1.31e-5, train/loss_step=0.00133, global_step=1844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  24%|██▍       | 19/80 [02:01<06:10,  6.08s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=1.31e-5, train/loss_step=0.00133, global_step=1844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  24%|██▍       | 19/80 [02:01<06:10,  6.08s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00072, train/loss_vlb_step=7.08e-6, train/loss_step=0.00072, global_step=1844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  25%|██▌       | 20/80 [02:02<05:48,  5.82s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00072, train/loss_vlb_step=7.08e-6, train/loss_step=0.00072, global_step=1844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  25%|██▌       | 20/80 [02:02<05:49,  5.82s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.49e-5, train/loss_step=0.00671, global_step=1844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  26%|██▋       | 21/80 [02:15<06:03,  6.15s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00671, train/loss_vlb_step=2.49e-5, train/loss_step=0.00671, global_step=1844.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  26%|██▋       | 21/80 [02:15<06:03,  6.15s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=4.39e-6, train/loss_step=0.000606, global_step=1845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  28%|██▊       | 22/80 [02:15<05:42,  5.91s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=4.39e-6, train/loss_step=0.000606, global_step=1845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  28%|██▊       | 22/80 [02:15<05:42,  5.91s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=2.4e-5, train/loss_step=0.00674, global_step=1845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]   Epoch 92:  29%|██▉       | 23/80 [02:16<05:23,  5.68s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=2.4e-5, train/loss_step=0.00674, global_step=1845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  29%|██▉       | 23/80 [02:16<05:23,  5.68s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.22e-5, train/loss_step=0.00366, global_step=1845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  30%|███       | 24/80 [02:41<06:01,  6.45s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.22e-5, train/loss_step=0.00366, global_step=1845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  30%|███       | 24/80 [02:41<06:01,  6.45s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=0.000345, train/loss_step=0.0179, global_step=1845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  31%|███▏      | 25/80 [02:41<05:42,  6.22s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.0179, train/loss_vlb_step=0.000345, train/loss_step=0.0179, global_step=1845.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  31%|███▏      | 25/80 [02:41<05:42,  6.22s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=0.000878, train/loss_step=0.0171, global_step=1846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  32%|███▎      | 26/80 [02:42<05:24,  6.01s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.0171, train/loss_vlb_step=0.000878, train/loss_step=0.0171, global_step=1846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  32%|███▎      | 26/80 [02:42<05:24,  6.01s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.36e-5, train/loss_step=0.00292, global_step=1846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  34%|███▍      | 27/80 [02:53<05:28,  6.21s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.36e-5, train/loss_step=0.00292, global_step=1846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  34%|███▍      | 27/80 [02:53<05:28,  6.21s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000959, train/loss_vlb_step=5.43e-6, train/loss_step=0.000959, global_step=1846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000959, train/loss_vlb_step=5.43e-6, train/loss_step=0.000959, global_step=1846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000372, train/loss_vlb_step=2.17e-6, train/loss_step=0.000372, global_step=1846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  36%|███▋      | 29/80 [02:55<04:57,  5.84s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000372, train/loss_vlb_step=2.17e-6, train/loss_step=0.000372, global_step=1846.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  36%|███▋      | 29/80 [02:55<04:57,  5.84s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=2.31e-6, train/loss_step=0.000547, global_step=1847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  38%|███▊      | 30/80 [02:55<04:43,  5.67s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=2.31e-6, train/loss_step=0.000547, global_step=1847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  38%|███▊      | 30/80 [02:55<04:43,  5.67s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=2.39e-6, train/loss_step=0.000296, global_step=1847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  39%|███▉      | 31/80 [02:56<04:29,  5.50s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=2.39e-6, train/loss_step=0.000296, global_step=1847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  39%|███▉      | 31/80 [02:56<04:29,  5.50s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=2.67e-5, train/loss_step=0.00792, global_step=1847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  40%|████      | 32/80 [03:34<05:12,  6.51s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00792, train/loss_vlb_step=2.67e-5, train/loss_step=0.00792, global_step=1847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  40%|████      | 32/80 [03:34<05:12,  6.51s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.43e-6, train/loss_step=0.000286, global_step=1847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.43e-6, train/loss_step=0.000286, global_step=1847.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000492, train/loss_vlb_step=5.07e-6, train/loss_step=0.000492, global_step=1848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  42%|████▎     | 34/80 [03:35<04:43,  6.17s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000492, train/loss_vlb_step=5.07e-6, train/loss_step=0.000492, global_step=1848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  42%|████▎     | 34/80 [03:35<04:43,  6.17s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.4e-5, train/loss_step=0.0078, global_step=1848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]     Epoch 92:  44%|████▍     | 35/80 [03:36<04:30,  6.01s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=3.4e-5, train/loss_step=0.0078, global_step=1848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  44%|████▍     | 35/80 [03:36<04:30,  6.01s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=5.45e-6, train/loss_step=0.000737, global_step=1848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  45%|████▌     | 36/80 [03:37<04:18,  5.87s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=5.45e-6, train/loss_step=0.000737, global_step=1848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  45%|████▌     | 36/80 [03:37<04:18,  5.87s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=0.00017, train/loss_step=0.00948, global_step=1848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  46%|████▋     | 37/80 [03:40<04:09,  5.79s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=0.00017, train/loss_step=0.00948, global_step=1848.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  46%|████▋     | 37/80 [03:40<04:09,  5.79s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=3.26e-5, train/loss_step=0.00747, global_step=1849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  48%|████▊     | 38/80 [03:40<03:57,  5.66s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00747, train/loss_vlb_step=3.26e-5, train/loss_step=0.00747, global_step=1849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  48%|████▊     | 38/80 [03:40<03:57,  5.66s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=9.4e-5, train/loss_step=0.0201, global_step=1849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  49%|████▉     | 39/80 [03:41<03:46,  5.53s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=9.4e-5, train/loss_step=0.0201, global_step=1849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  49%|████▉     | 39/80 [03:41<03:46,  5.53s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.12e-6, train/loss_step=0.00207, global_step=1849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  50%|█████     | 40/80 [04:21<04:14,  6.37s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=8.12e-6, train/loss_step=0.00207, global_step=1849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  50%|█████     | 40/80 [04:21<04:14,  6.37s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.76e-5, train/loss_step=0.0103, global_step=1849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  51%|█████▏    | 41/80 [04:21<04:02,  6.23s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=5.76e-5, train/loss_step=0.0103, global_step=1849.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  51%|█████▏    | 41/80 [04:21<04:02,  6.23s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.24e-5, train/loss_step=0.00177, global_step=1850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  52%|█████▎    | 42/80 [04:22<03:51,  6.10s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.24e-5, train/loss_step=0.00177, global_step=1850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  52%|█████▎    | 42/80 [04:22<03:51,  6.10s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.26e-6, train/loss_step=0.000312, global_step=1850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.00562, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.26e-6, train/loss_step=0.000312, global_step=1850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000746, train/loss_vlb_step=2.92e-6, train/loss_step=0.000746, global_step=1850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000746, train/loss_vlb_step=2.92e-6, train/loss_step=0.000746, global_step=1850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.59e-6, train/loss_step=0.00154, global_step=1850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  56%|█████▋    | 45/80 [04:23<03:20,  5.73s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.59e-6, train/loss_step=0.00154, global_step=1850.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  56%|█████▋    | 45/80 [04:23<03:20,  5.73s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=1.03e-6, train/loss_step=0.000199, global_step=1851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  57%|█████▊    | 46/80 [04:24<03:11,  5.62s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=1.03e-6, train/loss_step=0.000199, global_step=1851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  57%|█████▊    | 46/80 [04:24<03:11,  5.62s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000179, train/loss_vlb_step=7.46e-7, train/loss_step=0.000179, global_step=1851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  59%|█████▉    | 47/80 [04:24<03:01,  5.51s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000179, train/loss_vlb_step=7.46e-7, train/loss_step=0.000179, global_step=1851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  59%|█████▉    | 47/80 [04:24<03:01,  5.51s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.39e-5, train/loss_step=0.00676, global_step=1851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  60%|██████    | 48/80 [04:54<03:12,  6.01s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00676, train/loss_vlb_step=2.39e-5, train/loss_step=0.00676, global_step=1851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  60%|██████    | 48/80 [04:54<03:12,  6.01s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.32e-6, train/loss_step=0.000271, global_step=1851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  61%|██████▏   | 49/80 [04:55<03:03,  5.90s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.32e-6, train/loss_step=0.000271, global_step=1851.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  61%|██████▏   | 49/80 [04:55<03:03,  5.90s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.74e-5, train/loss_step=0.00452, global_step=1852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  62%|██████▎   | 50/80 [04:55<02:53,  5.80s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.74e-5, train/loss_step=0.00452, global_step=1852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  62%|██████▎   | 50/80 [04:55<02:53,  5.80s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=4.34e-5, train/loss_step=0.0089, global_step=1852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  64%|██████▍   | 51/80 [04:58<02:46,  5.75s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=4.34e-5, train/loss_step=0.0089, global_step=1852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  64%|██████▍   | 51/80 [04:58<02:46,  5.75s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=2.27e-5, train/loss_step=0.00668, global_step=1852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  65%|██████▌   | 52/80 [04:59<02:38,  5.65s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=2.27e-5, train/loss_step=0.00668, global_step=1852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  65%|██████▌   | 52/80 [04:59<02:38,  5.65s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000401, train/loss_vlb_step=6.44e-6, train/loss_step=0.000401, global_step=1852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  66%|██████▋   | 53/80 [05:00<02:30,  5.56s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000401, train/loss_vlb_step=6.44e-6, train/loss_step=0.000401, global_step=1852.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  66%|██████▋   | 53/80 [05:00<02:30,  5.56s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=4.74e-6, train/loss_step=0.00117, global_step=1853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  68%|██████▊   | 54/80 [05:00<02:22,  5.46s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=4.74e-6, train/loss_step=0.00117, global_step=1853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  68%|██████▊   | 54/80 [05:00<02:22,  5.46s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=4.38e-5, train/loss_step=0.000793, global_step=1853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  69%|██████▉   | 55/80 [05:01<02:14,  5.38s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000793, train/loss_vlb_step=4.38e-5, train/loss_step=0.000793, global_step=1853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  69%|██████▉   | 55/80 [05:01<02:14,  5.38s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=3.66e-5, train/loss_step=0.00354, global_step=1853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  70%|███████   | 56/80 [05:31<02:19,  5.81s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=3.66e-5, train/loss_step=0.00354, global_step=1853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  70%|███████   | 56/80 [05:31<02:19,  5.81s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.58e-5, train/loss_step=0.0046, global_step=1853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=1.58e-5, train/loss_step=0.0046, global_step=1853.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  71%|███████▏  | 57/80 [05:31<02:11,  5.72s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000191, train/loss_vlb_step=7.4e-7, train/loss_step=0.000191, global_step=1854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  72%|███████▎  | 58/80 [05:32<02:03,  5.63s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000191, train/loss_vlb_step=7.4e-7, train/loss_step=0.000191, global_step=1854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  72%|███████▎  | 58/80 [05:32<02:03,  5.63s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=1.79e-5, train/loss_step=0.00531, global_step=1854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  74%|███████▍  | 59/80 [05:38<01:58,  5.64s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00531, train/loss_vlb_step=1.79e-5, train/loss_step=0.00531, global_step=1854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  74%|███████▍  | 59/80 [05:38<01:58,  5.64s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=2.12e-6, train/loss_step=0.000399, global_step=1854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  75%|███████▌  | 60/80 [05:38<01:51,  5.56s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000399, train/loss_vlb_step=2.12e-6, train/loss_step=0.000399, global_step=1854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  75%|███████▌  | 60/80 [05:38<01:51,  5.56s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.06e-5, train/loss_step=0.00751, global_step=1854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  76%|███████▋  | 61/80 [05:39<01:44,  5.48s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00751, train/loss_vlb_step=3.06e-5, train/loss_step=0.00751, global_step=1854.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  76%|███████▋  | 61/80 [05:39<01:44,  5.48s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000371, train/loss_vlb_step=2.96e-6, train/loss_step=0.000371, global_step=1855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  78%|███████▊  | 62/80 [05:39<01:37,  5.40s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000371, train/loss_vlb_step=2.96e-6, train/loss_step=0.000371, global_step=1855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  78%|███████▊  | 62/80 [05:39<01:37,  5.40s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=4.8e-6, train/loss_step=0.000518, global_step=1855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  79%|███████▉  | 63/80 [05:40<01:30,  5.32s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=4.8e-6, train/loss_step=0.000518, global_step=1855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  79%|███████▉  | 63/80 [05:40<01:30,  5.32s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=6.14e-5, train/loss_step=0.00834, global_step=1855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  80%|████████  | 64/80 [06:10<01:31,  5.70s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00834, train/loss_vlb_step=6.14e-5, train/loss_step=0.00834, global_step=1855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  80%|████████  | 64/80 [06:10<01:31,  5.70s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.69e-6, train/loss_step=0.000573, global_step=1855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  81%|████████▏ | 65/80 [06:11<01:24,  5.63s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.69e-6, train/loss_step=0.000573, global_step=1855.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  81%|████████▏ | 65/80 [06:11<01:24,  5.63s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=1.66e-6, train/loss_step=0.00034, global_step=1856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  82%|████████▎ | 66/80 [06:11<01:17,  5.55s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=1.66e-6, train/loss_step=0.00034, global_step=1856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  82%|████████▎ | 66/80 [06:11<01:17,  5.55s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000776, train/loss_vlb_step=1.7e-5, train/loss_step=0.000776, global_step=1856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  84%|████████▍ | 67/80 [06:17<01:12,  5.55s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000776, train/loss_vlb_step=1.7e-5, train/loss_step=0.000776, global_step=1856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  84%|████████▍ | 67/80 [06:17<01:12,  5.55s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.16e-5, train/loss_step=0.00207, global_step=1856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  85%|████████▌ | 68/80 [06:18<01:05,  5.48s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.00207, train/loss_vlb_step=1.16e-5, train/loss_step=0.00207, global_step=1856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  85%|████████▌ | 68/80 [06:18<01:05,  5.48s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.77e-5, train/loss_step=0.00706, global_step=1856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  86%|████████▋ | 69/80 [06:21<00:59,  5.45s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.77e-5, train/loss_step=0.00706, global_step=1856.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  86%|████████▋ | 69/80 [06:21<00:59,  5.45s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=9.52e-6, train/loss_step=0.00216, global_step=1857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  88%|████████▊ | 70/80 [06:21<00:53,  5.38s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=9.52e-6, train/loss_step=0.00216, global_step=1857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  88%|████████▊ | 70/80 [06:21<00:53,  5.38s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=2.92e-5, train/loss_step=0.00699, global_step=1857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  89%|████████▉ | 71/80 [06:22<00:47,  5.31s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00699, train/loss_vlb_step=2.92e-5, train/loss_step=0.00699, global_step=1857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  89%|████████▉ | 71/80 [06:22<00:47,  5.31s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000163, train/loss_step=0.0242, global_step=1857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  90%|█████████ | 72/80 [06:49<00:44,  5.61s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000163, train/loss_step=0.0242, global_step=1857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  90%|█████████ | 72/80 [06:49<00:44,  5.61s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.43e-6, train/loss_step=0.000299, global_step=1857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  91%|█████████▏| 73/80 [06:50<00:38,  5.55s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.43e-6, train/loss_step=0.000299, global_step=1857.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  91%|█████████▏| 73/80 [06:50<00:38,  5.55s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=2.17e-5, train/loss_step=0.0064, global_step=1858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]    Epoch 92:  92%|█████████▎| 74/80 [06:51<00:32,  5.49s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.0064, train/loss_vlb_step=2.17e-5, train/loss_step=0.0064, global_step=1858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  92%|█████████▎| 74/80 [06:51<00:32,  5.49s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=6.06e-6, train/loss_step=0.000456, global_step=1858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  94%|█████████▍| 75/80 [06:51<00:27,  5.42s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=6.06e-6, train/loss_step=0.000456, global_step=1858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  94%|█████████▍| 75/80 [06:51<00:27,  5.42s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000469, train/loss_vlb_step=4.2e-6, train/loss_step=0.000469, global_step=1858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  95%|█████████▌| 76/80 [06:52<00:21,  5.36s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.000469, train/loss_vlb_step=4.2e-6, train/loss_step=0.000469, global_step=1858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  95%|█████████▌| 76/80 [06:52<00:21,  5.36s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=2.6e-5, train/loss_step=0.00721, global_step=1858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92:  96%|█████████▋| 77/80 [06:57<00:16,  5.35s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=2.6e-5, train/loss_step=0.00721, global_step=1858.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  96%|█████���███▋| 77/80 [06:57<00:16,  5.35s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.06e-5, train/loss_step=0.0111, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406] Epoch 92:  98%|█████████▊| 78/80 [06:57<00:10,  5.28s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0111, train/loss_vlb_step=5.06e-5, train/loss_step=0.0111, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  98%|█████████▊| 78/80 [06:57<00:10,  5.28s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=4.01e-6, train/loss_step=0.000591, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  99%|█████████▉| 79/80 [06:57<00:05,  5.22s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=4.01e-6, train/loss_step=0.000591, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92:  99%|█████████▉| 79/80 [06:57<00:05,  5.22s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.37e-6, train/loss_step=0.00166, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 92: 100%|██████████| 80/80 [06:58<00:00,  5.17s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.37e-6, train/loss_step=0.00166, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 92: 100%|██████████| 80/80 [06:58<00:00,  5.17s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=5.78e-5, train/loss_step=0.0164, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]   Average Epoch time: 418.49 seconds
+Average Peak memory 29567.84MiB
+Epoch 92:   0%|          | 0/80 [00:00<00:00, 7108.99it/s, loss=0.0049, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=5.78e-5, train/loss_step=0.0164, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 93:   0%|          | 0/80 [00:00<00:00, 2657.99it/s, loss=0.0049, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=5.78e-5, train/loss_step=0.0164, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]Epoch 93:   1%|▏         | 1/80 [00:46<30:34, 23.22s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=5.78e-5, train/loss_step=0.0164, global_step=1859.0, lr_abs=0.0001, train/loss_simple_epoch=0.00406, train/loss_vlb_epoch=9.02e-5, train/loss_epoch=0.00406]  Epoch 93:   1%|▏         | 1/80 [00:46<30:34, 23.22s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=5.82e-6, train/loss_step=0.00131, global_step=1860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   2%|▎         | 2/80 [00:46<20:20, 15.64s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=5.82e-6, train/loss_step=0.00131, global_step=1860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   2%|▎         | 2/80 [00:46<20:20, 15.64s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=2.27e-5, train/loss_step=0.00628, global_step=1860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   4%|▍         | 3/80 [00:47<15:12, 11.85s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.00628, train/loss_vlb_step=2.27e-5, train/loss_step=0.00628, global_step=1860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   4%|▍         | 3/80 [00:47<15:12, 11.85s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=0.00184, train/loss_step=0.0234, global_step=1860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:   5%|▌         | 4/80 [00:47<12:08,  9.59s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.0234, train/loss_vlb_step=0.00184, train/loss_step=0.0234, global_step=1860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   5%|▌         | 4/80 [00:47<12:08,  9.59s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=8.46e-6, train/loss_step=0.00191, global_step=1860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   6%|▋         | 5/80 [00:48<10:05,  8.07s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=8.46e-6, train/loss_step=0.00191, global_step=1860.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   6%|▋         | 5/80 [00:48<10:05,  8.07s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.75e-5, train/loss_step=0.00361, global_step=1861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   8%|▊         | 6/80 [00:48<08:37,  6.99s/it, loss=0.00621, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=2.75e-5, train/loss_step=0.00361, global_step=1861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   8%|▊         | 6/80 [00:48<08:37,  6.99s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=7.93e-6, train/loss_step=0.00186, global_step=1861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   9%|▉         | 7/80 [00:49<07:30,  6.18s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=7.93e-6, train/loss_step=0.00186, global_step=1861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:   9%|▉         | 7/80 [00:49<07:30,  6.18s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.33e-5, train/loss_step=0.00255, global_step=1861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  10%|█         | 8/80 [01:34<12:35, 10.49s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=1.33e-5, train/loss_step=0.00255, global_step=1861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  10%|█         | 8/80 [01:34<12:35, 10.49s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.000424, train/loss_step=0.0107, global_step=1861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427] Epoch 93:  11%|█▏        | 9/80 [01:34<11:13,  9.49s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.000424, train/loss_step=0.0107, global_step=1861.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  11%|█▏        | 9/80 [01:34<11:13,  9.49s/it, loss=0.00641, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=3.55e-6, train/loss_step=0.000876, global_step=1862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  12%|█▎        | 10/80 [01:35<10:07,  8.67s/it, loss=0.00641, v_num=0, train/loss_simple_step=0.000876, train/loss_vlb_step=3.55e-6, train/loss_step=0.000876, global_step=1862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  12%|█▎        | 10/80 [01:35<10:07,  8.67s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=1.61e-6, train/loss_step=0.000468, global_step=1862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  14%|█▍        | 11/80 [01:35<09:11,  7.99s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=1.61e-6, train/loss_step=0.000468, global_step=1862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  14%|█▍        | 11/80 [01:35<09:11,  7.99s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.45e-6, train/loss_step=0.000268, global_step=1862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  15%|█▌        | 12/80 [01:36<08:24,  7.42s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=1.45e-6, train/loss_step=0.000268, global_step=1862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  15%|█▌        | 12/80 [01:36<08:24,  7.42s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=6.17e-6, train/loss_step=0.000702, global_step=1862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  16%|█▋        | 13/80 [01:36<07:43,  6.92s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000702, train/loss_vlb_step=6.17e-6, train/loss_step=0.000702, global_step=1862.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  16%|█▋        | 13/80 [01:36<07:43,  6.92s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=3.01e-6, train/loss_step=0.00032, global_step=1863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  18%|█▊        | 14/80 [01:37<07:08,  6.49s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=3.01e-6, train/loss_step=0.00032, global_step=1863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  18%|█▊        | 14/80 [01:37<07:08,  6.49s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000318, train/loss_step=0.0143, global_step=1863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  19%|█▉        | 15/80 [01:37<06:37,  6.12s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000318, train/loss_step=0.0143, global_step=1863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  19%|█▉        | 15/80 [01:37<06:37,  6.12s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.00158, train/loss_step=0.0247, global_step=1863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  20%|██        | 16/80 [02:10<08:10,  7.67s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.00158, train/loss_step=0.0247, global_step=1863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  20%|██        | 16/80 [02:10<08:10,  7.67s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.09e-5, train/loss_step=0.0032, global_step=1863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  21%|██▏       | 17/80 [02:10<07:38,  7.27s/it, loss=0.00631, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.09e-5, train/loss_step=0.0032, global_step=1863.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  21%|██▏       | 17/80 [02:10<07:38,  7.27s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.000669, train/loss_vlb_step=3.5e-6, train/loss_step=0.000669, global_step=1864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  22%|██▎       | 18/80 [02:11<07:08,  6.92s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.000669, train/loss_vlb_step=3.5e-6, train/loss_step=0.000669, global_step=1864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  22%|██▎       | 18/80 [02:11<07:08,  6.92s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=7.29e-6, train/loss_step=0.00056, global_step=1864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427] Epoch 93:  24%|██▍       | 19/80 [02:11<06:42,  6.60s/it, loss=0.00578, v_num=0, train/loss_simple_step=0.00056, train/loss_vlb_step=7.29e-6, train/loss_step=0.00056, global_step=1864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  24%|██▍       | 19/80 [02:11<06:42,  6.60s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=5.06e-5, train/loss_step=0.0145, global_step=1864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  25%|██▌       | 20/80 [02:12<06:18,  6.31s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=5.06e-5, train/loss_step=0.0145, global_step=1864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  25%|██▌       | 20/80 [02:12<06:18,  6.31s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000143, train/loss_vlb_step=5.81e-7, train/loss_step=0.000143, global_step=1864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  26%|██▋       | 21/80 [02:13<05:56,  6.05s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000143, train/loss_vlb_step=5.81e-7, train/loss_step=0.000143, global_step=1864.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  26%|██▋       | 21/80 [02:13<05:56,  6.05s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000455, train/loss_step=0.014, global_step=1865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]     Epoch 93:  28%|██▊       | 22/80 [02:13<05:36,  5.81s/it, loss=0.00625, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000455, train/loss_step=0.014, global_step=1865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  28%|██▊       | 22/80 [02:13<05:36,  5.81s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=1865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  29%|██▉       | 23/80 [02:14<05:18,  5.59s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=1.03e-5, train/loss_step=0.00171, global_step=1865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  29%|██▉       | 23/80 [02:14<05:18,  5.59s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000111, train/loss_vlb_step=4.91e-7, train/loss_step=0.000111, global_step=1865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  30%|███       | 24/80 [02:46<06:13,  6.68s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.000111, train/loss_vlb_step=4.91e-7, train/loss_step=0.000111, global_step=1865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  30%|███       | 24/80 [02:46<06:13,  6.68s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=8.05e-5, train/loss_step=0.0136, global_step=1865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]    Epoch 93:  31%|███▏      | 25/80 [02:47<05:55,  6.46s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=8.05e-5, train/loss_step=0.0136, global_step=1865.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  31%|███▏      | 25/80 [02:47<05:55,  6.46s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=3.6e-5, train/loss_step=0.00309, global_step=1866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  32%|███▎      | 26/80 [02:48<05:36,  6.24s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=3.6e-5, train/loss_step=0.00309, global_step=1866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  32%|███▎      | 26/80 [02:48<05:36,  6.24s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.08e-6, train/loss_step=0.00026, global_step=1866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  34%|███▍      | 27/80 [02:48<05:19,  6.03s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.08e-6, train/loss_step=0.00026, global_step=1866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  34%|███▍      | 27/80 [02:48<05:19,  6.03s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=3.37e-5, train/loss_step=0.00144, global_step=1866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  35%|███▌      | 28/80 [02:49<05:04,  5.85s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=3.37e-5, train/loss_step=0.00144, global_step=1866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  35%|███▌      | 28/80 [02:49<05:04,  5.85s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000617, train/loss_vlb_step=3.29e-5, train/loss_step=0.000617, global_step=1866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  36%|███▋      | 29/80 [02:50<04:49,  5.67s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000617, train/loss_vlb_step=3.29e-5, train/loss_step=0.000617, global_step=1866.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  36%|███▋      | 29/80 [02:50<04:49,  5.67s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=8.73e-7, train/loss_step=0.000237, global_step=1867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  38%|███▊      | 30/80 [02:50<04:35,  5.51s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=8.73e-7, train/loss_step=0.000237, global_step=1867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  38%|███▊      | 30/80 [02:50<04:35,  5.51s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=3.11e-5, train/loss_step=0.00057, global_step=1867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  39%|███▉      | 31/80 [02:51<04:22,  5.35s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=3.11e-5, train/loss_step=0.00057, global_step=1867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  39%|███▉      | 31/80 [02:51<04:22,  5.35s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.54e-5, train/loss_step=0.00473, global_step=1867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  40%|████      | 32/80 [03:27<05:01,  6.28s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=2.54e-5, train/loss_step=0.00473, global_step=1867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  40%|████      | 32/80 [03:27<05:01,  6.28s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.01e-5, train/loss_step=0.0108, global_step=1867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  41%|████▏     | 33/80 [03:27<04:47,  6.11s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.01e-5, train/loss_step=0.0108, global_step=1867.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  41%|████▏     | 33/80 [03:27<04:47,  6.11s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000572, train/loss_vlb_step=2.94e-6, train/loss_step=0.000572, global_step=1868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  42%|████▎     | 34/80 [03:28<04:33,  5.95s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000572, train/loss_vlb_step=2.94e-6, train/loss_step=0.000572, global_step=1868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  42%|████▎     | 34/80 [03:28<04:33,  5.95s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=1.64e-5, train/loss_step=0.000787, global_step=1868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  44%|████▍     | 35/80 [03:28<04:20,  5.80s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=1.64e-5, train/loss_step=0.000787, global_step=1868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  44%|████▍     | 35/80 [03:28<04:20,  5.80s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000311, train/loss_step=0.016, global_step=1868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]     Epoch 93:  45%|████▌     | 36/80 [03:29<04:08,  5.66s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000311, train/loss_step=0.016, global_step=1868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  45%|████▌     | 36/80 [03:29<04:08,  5.66s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=0.000101, train/loss_step=0.000778, global_step=1868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  46%|████▋     | 37/80 [03:30<03:58,  5.55s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=0.000101, train/loss_step=0.000778, global_step=1868.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  46%|████▋     | 37/80 [03:30<03:58,  5.55s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000532, train/loss_vlb_step=2.59e-6, train/loss_step=0.000532, global_step=1869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427] Epoch 93:  48%|████▊     | 38/80 [03:31<03:47,  5.42s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.000532, train/loss_vlb_step=2.59e-6, train/loss_step=0.000532, global_step=1869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  48%|████▊     | 38/80 [03:31<03:47,  5.42s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=6.94e-5, train/loss_step=0.0098, global_step=1869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]    Epoch 93:  49%|████▉     | 39/80 [03:31<03:37,  5.30s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=6.94e-5, train/loss_step=0.0098, global_step=1869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  49%|████▉     | 39/80 [03:31<03:37,  5.30s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000656, train/loss_vlb_step=1.93e-5, train/loss_step=0.000656, global_step=1869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  50%|█████     | 40/80 [04:09<04:03,  6.08s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000656, train/loss_vlb_step=1.93e-5, train/loss_step=0.000656, global_step=1869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  50%|█████     | 40/80 [04:09<04:03,  6.08s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=7.49e-6, train/loss_step=0.00042, global_step=1869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  51%|█████▏    | 41/80 [04:09<03:51,  5.95s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=7.49e-6, train/loss_step=0.00042, global_step=1869.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  51%|█████▏    | 41/80 [04:09<03:51,  5.95s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=6.71e-6, train/loss_step=0.00106, global_step=1870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  52%|█████▎    | 42/80 [04:10<03:41,  5.82s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=6.71e-6, train/loss_step=0.00106, global_step=1870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  52%|█████▎    | 42/80 [04:10<03:41,  5.82s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=2e-5, train/loss_step=0.00118, global_step=1870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]   Epoch 93:  54%|█████▍    | 43/80 [04:10<03:30,  5.70s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=2e-5, train/loss_step=0.00118, global_step=1870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  54%|█████▍    | 43/80 [04:10<03:30,  5.70s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.16e-5, train/loss_step=0.00338, global_step=1870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  55%|█████▌    | 44/80 [04:16<03:25,  5.70s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00338, train/loss_vlb_step=1.16e-5, train/loss_step=0.00338, global_step=1870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  55%|█████▌    | 44/80 [04:16<03:25,  5.70s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=1.05e-5, train/loss_step=0.000599, global_step=1870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  56%|█████▋    | 45/80 [04:17<03:15,  5.59s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=1.05e-5, train/loss_step=0.000599, global_step=1870.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  56%|█████▋    | 45/80 [04:17<03:15,  5.59s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=1.54e-6, train/loss_step=0.000398, global_step=1871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  57%|█████▊    | 46/80 [04:18<03:07,  5.50s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=1.54e-6, train/loss_step=0.000398, global_step=1871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  57%|█████▊    | 46/80 [04:18<03:07,  5.50s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=1.92e-5, train/loss_step=0.00554, global_step=1871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]    Epoch 93:  59%|█████▉    | 47/80 [04:19<02:58,  5.40s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=1.92e-5, train/loss_step=0.00554, global_step=1871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  59%|█████▉    | 47/80 [04:19<02:58,  5.40s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.05e-5, train/loss_step=0.00282, global_step=1871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  60%|██████    | 48/80 [04:59<03:15,  6.12s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=1.05e-5, train/loss_step=0.00282, global_step=1871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  60%|██████    | 48/80 [04:59<03:15,  6.12s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.71e-6, train/loss_step=0.000285, global_step=1871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  61%|██████▏   | 49/80 [05:00<03:06,  6.00s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=1.71e-6, train/loss_step=0.000285, global_step=1871.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  61%|██████▏   | 49/80 [05:00<03:06,  6.00s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=3.02e-6, train/loss_step=0.00082, global_step=1872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  62%|██████▎   | 50/80 [05:00<02:56,  5.90s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=3.02e-6, train/loss_step=0.00082, global_step=1872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  62%|██████▎   | 50/80 [05:00<02:56,  5.90s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.0009, train/loss_vlb_step=4.18e-6, train/loss_step=0.0009, global_step=1872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]   Epoch 93:  64%|██████▍   | 51/80 [05:01<02:47,  5.79s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.0009, train/loss_vlb_step=4.18e-6, train/loss_step=0.0009, global_step=1872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  64%|██████▍   | 51/80 [05:01<02:47,  5.79s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=3.9e-5, train/loss_step=0.00926, global_step=1872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  65%|██████▌   | 52/80 [05:01<02:39,  5.70s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00926, train/loss_vlb_step=3.9e-5, train/loss_step=0.00926, global_step=1872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  65%|██████▌   | 52/80 [05:01<02:39,  5.70s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=7.77e-7, train/loss_step=0.000192, global_step=1872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  66%|██████▋   | 53/80 [05:02<02:31,  5.60s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=7.77e-7, train/loss_step=0.000192, global_step=1872.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  66%|██████▋   | 53/80 [05:02<02:31,  5.60s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=4.96e-6, train/loss_step=0.00126, global_step=1873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427] Epoch 93:  68%|██████▊   | 54/80 [05:02<02:23,  5.51s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=4.96e-6, train/loss_step=0.00126, global_step=1873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  68%|██████▊   | 54/80 [05:02<02:23,  5.51s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=3.81e-5, train/loss_step=0.00934, global_step=1873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  69%|██████▉   | 55/80 [05:03<02:15,  5.42s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00934, train/loss_vlb_step=3.81e-5, train/loss_step=0.00934, global_step=1873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  69%|██████▉   | 55/80 [05:03<02:15,  5.42s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=1.9e-5, train/loss_step=0.00567, global_step=1873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427] Epoch 93:  70%|███████   | 56/80 [05:50<02:27,  6.16s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=1.9e-5, train/loss_step=0.00567, global_step=1873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  70%|███████   | 56/80 [05:50<02:27,  6.16s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.26e-5, train/loss_step=0.0105, global_step=1873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427] Epoch 93:  71%|███████▏  | 57/80 [05:51<02:19,  6.06s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=5.26e-5, train/loss_step=0.0105, global_step=1873.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  71%|███████▏  | 57/80 [05:51<02:19,  6.06s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=7e-7, train/loss_step=0.00017, global_step=1874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427] Epoch 93:  72%|███████▎  | 58/80 [05:51<02:11,  5.97s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=7e-7, train/loss_step=0.00017, global_step=1874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  72%|███████▎  | 58/80 [05:51<02:11,  5.97s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.000193, train/loss_step=0.0217, global_step=1874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  74%|███████▍  | 59/80 [05:52<02:03,  5.87s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.0217, train/loss_vlb_step=0.000193, train/loss_step=0.0217, global_step=1874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  74%|███████▍  | 59/80 [05:52<02:03,  5.87s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.35e-6, train/loss_step=0.000237, global_step=1874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  75%|███████▌  | 60/80 [05:53<01:55,  5.79s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.35e-6, train/loss_step=0.000237, global_step=1874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  75%|███████▌  | 60/80 [05:53<01:55,  5.79s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000967, train/loss_vlb_step=4.21e-6, train/loss_step=0.000967, global_step=1874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000967, train/loss_vlb_step=4.21e-6, train/loss_step=0.000967, global_step=1874.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  76%|███████▋  | 61/80 [05:53<01:48,  5.70s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.09e-5, train/loss_step=0.00726, global_step=1875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  78%|███████▊  | 62/80 [05:54<01:41,  5.62s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=3.09e-5, train/loss_step=0.00726, global_step=1875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  78%|███████▊  | 62/80 [05:54<01:41,  5.62s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=2.04e-6, train/loss_step=0.000448, global_step=1875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  79%|███████▉  | 63/80 [05:54<01:34,  5.54s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000448, train/loss_vlb_step=2.04e-6, train/loss_step=0.000448, global_step=1875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  79%|███████▉  | 63/80 [05:54<01:34,  5.54s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=6.42e-6, train/loss_step=0.000423, global_step=1875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  80%|████████  | 64/80 [06:27<01:35,  5.96s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=6.42e-6, train/loss_step=0.000423, global_step=1875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  80%|█████���██  | 64/80 [06:27<01:35,  5.96s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=6.14e-6, train/loss_step=0.00141, global_step=1875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  81%|████████▏ | 65/80 [06:28<01:28,  5.88s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=6.14e-6, train/loss_step=0.00141, global_step=1875.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  81%|████████▏ | 65/80 [06:28<01:28,  5.88s/it, loss=0.00396, v_num=0, train/loss_simple_step=7.7e-5, train/loss_vlb_step=3.66e-7, train/loss_step=7.7e-5, global_step=1876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  82%|████████▎ | 66/80 [06:28<01:21,  5.80s/it, loss=0.00396, v_num=0, train/loss_simple_step=7.7e-5, train/loss_vlb_step=3.66e-7, train/loss_step=7.7e-5, global_step=1876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  82%|████████▎ | 66/80 [06:28<01:21,  5.80s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.17e-5, train/loss_step=0.00579, global_step=1876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  84%|████████▍ | 67/80 [06:29<01:14,  5.72s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.17e-5, train/loss_step=0.00579, global_step=1876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  84%|████████▍ | 67/80 [06:29<01:14,  5.72s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=1.92e-5, train/loss_step=0.00482, global_step=1876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  85%|████████▌ | 68/80 [06:29<01:07,  5.65s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00482, train/loss_vlb_step=1.92e-5, train/loss_step=0.00482, global_step=1876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  85%|████████▌ | 68/80 [06:29<01:07,  5.65s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=3.54e-6, train/loss_step=0.000342, global_step=1876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  86%|████████▋ | 69/80 [06:30<01:01,  5.57s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=3.54e-6, train/loss_step=0.000342, global_step=1876.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  86%|████████▋ | 69/80 [06:30<01:01,  5.57s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=7.61e-5, train/loss_step=0.0124, global_step=1877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]    Epoch 93:  88%|████████▊ | 70/80 [06:30<00:55,  5.50s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=7.61e-5, train/loss_step=0.0124, global_step=1877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  88%|████████▊ | 70/80 [06:30<00:55,  5.50s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=4.3e-5, train/loss_step=0.00431, global_step=1877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  89%|████████▉ | 71/80 [06:31<00:48,  5.43s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00431, train/loss_vlb_step=4.3e-5, train/loss_step=0.00431, global_step=1877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  89%|████████▉ | 71/80 [06:31<00:48,  5.43s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=1.12e-5, train/loss_step=0.000635, global_step=1877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  90%|█████████ | 72/80 [07:03<00:46,  5.80s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=1.12e-5, train/loss_step=0.000635, global_step=1877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  90%|█████████ | 72/80 [07:03<00:46,  5.80s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=1.82e-5, train/loss_step=0.000732, global_step=1877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  91%|█████████▏| 73/80 [07:03<00:40,  5.73s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=1.82e-5, train/loss_step=0.000732, global_step=1877.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  91%|█████████▏| 73/80 [07:03<00:40,  5.73s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=8.18e-6, train/loss_step=0.00201, global_step=1878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  92%|█████████▎| 74/80 [07:04<00:33,  5.66s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=8.18e-6, train/loss_step=0.00201, global_step=1878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  92%|█████████▎| 74/80 [07:04<00:33,  5.66s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=6.35e-5, train/loss_step=0.012, global_step=1878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]     Epoch 93:  94%|█████████▍| 75/80 [07:04<00:27,  5.59s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=6.35e-5, train/loss_step=0.012, global_step=1878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  94%|█████████▍| 75/80 [07:04<00:27,  5.59s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.63e-6, train/loss_step=0.000264, global_step=1878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  95%|█████████▌| 76/80 [07:05<00:22,  5.52s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.63e-6, train/loss_step=0.000264, global_step=1878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  95%|█████████▌| 76/80 [07:05<00:22,  5.52s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.42e-5, train/loss_step=0.00349, global_step=1878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 93:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.42e-5, train/loss_step=0.00349, global_step=1878.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.42e-5, train/loss_step=0.00374, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.42e-5, train/loss_step=0.00374, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=6e-6, train/loss_step=0.00109, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]   Epoch 93:  99%|█████████▉| 79/80 [07:06<00:05,  5.34s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=6e-6, train/loss_step=0.00109, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93:  99%|█████████▉| 79/80 [07:06<00:05,  5.34s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=5.83e-6, train/loss_step=0.00109, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=5.83e-6, train/loss_step=0.00109, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 93: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000497, train/loss_step=0.0361, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427] Average Epoch time: 427.39 seconds
+Average Peak memory 29561.99MiB
+Epoch 93:   0%|          | 0/80 [00:00<00:00, 4951.95it/s, loss=0.00492, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000497, train/loss_step=0.0361, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 94:   0%|          | 0/80 [00:00<00:00, 2187.95it/s, loss=0.00492, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000497, train/loss_step=0.0361, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]Epoch 94:   1%|▏         | 1/80 [00:39<26:18, 19.98s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.0361, train/loss_vlb_step=0.000497, train/loss_step=0.0361, global_step=1879.0, lr_abs=0.0001, train/loss_simple_epoch=0.00427, train/loss_vlb_epoch=9.08e-5, train/loss_epoch=0.00427]  Epoch 94:   1%|▏         | 1/80 [00:39<26:18, 19.98s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=3.17e-6, train/loss_step=0.000833, global_step=1880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   2%|▎         | 2/80 [00:40<17:31, 13.48s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=3.17e-6, train/loss_step=0.000833, global_step=1880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   2%|▎         | 2/80 [00:40<17:31, 13.48s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.54e-5, train/loss_step=0.00703, global_step=1880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379] Epoch 94:   4%|▍         | 3/80 [00:40<13:07, 10.23s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.54e-5, train/loss_step=0.00703, global_step=1880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   4%|▍         | 3/80 [00:40<13:07, 10.23s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=1.62e-6, train/loss_step=0.000406, global_step=1880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   5%|▌         | 4/80 [00:41<10:30,  8.29s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=1.62e-6, train/loss_step=0.000406, global_step=1880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   5%|▌         | 4/80 [00:41<10:30,  8.29s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=9.28e-6, train/loss_step=0.0027, global_step=1880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]    Epoch 94:   6%|▋         | 5/80 [00:47<09:51,  7.88s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=9.28e-6, train/loss_step=0.0027, global_step=1880.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   6%|▋         | 5/80 [00:47<09:51,  7.88s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.45e-5, train/loss_step=0.00341, global_step=1881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   8%|▊         | 6/80 [00:47<08:25,  6.83s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00341, train/loss_vlb_step=1.45e-5, train/loss_step=0.00341, global_step=1881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   8%|▊         | 6/80 [00:47<08:25,  6.83s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=3.17e-5, train/loss_step=0.00848, global_step=1881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   9%|▉         | 7/80 [00:48<07:20,  6.03s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00848, train/loss_vlb_step=3.17e-5, train/loss_step=0.00848, global_step=1881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:   9%|▉         | 7/80 [00:48<07:20,  6.03s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=4.24e-5, train/loss_step=0.00794, global_step=1881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  10%|█         | 8/80 [01:09<09:15,  7.72s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00794, train/loss_vlb_step=4.24e-5, train/loss_step=0.00794, global_step=1881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  10%|█         | 8/80 [01:09<09:15,  7.72s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000272, train/loss_step=0.0127, global_step=1881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379] Epoch 94:  11%|█▏        | 9/80 [01:21<09:37,  8.14s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000272, train/loss_step=0.0127, global_step=1881.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  11%|█▏        | 9/80 [01:21<09:37,  8.14s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=2.56e-6, train/loss_step=0.00044, global_step=1882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  12%|█▎        | 10/80 [01:21<08:41,  7.44s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00044, train/loss_vlb_step=2.56e-6, train/loss_step=0.00044, global_step=1882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  12%|█▎        | 10/80 [01:21<08:41,  7.44s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=3.26e-5, train/loss_step=0.00457, global_step=1882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  14%|█▍        | 11/80 [01:26<08:16,  7.20s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.00457, train/loss_vlb_step=3.26e-5, train/loss_step=0.00457, global_step=1882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  14%|█▍        | 11/80 [01:26<08:16,  7.20s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.64e-6, train/loss_step=0.00041, global_step=1882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  15%|█▌        | 12/80 [01:26<07:34,  6.69s/it, loss=0.00547, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.64e-6, train/loss_step=0.00041, global_step=1882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  15%|█▌        | 12/80 [01:26<07:34,  6.69s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=6.38e-6, train/loss_step=0.00146, global_step=1882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  16%|█▋        | 13/80 [01:27<06:58,  6.25s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=6.38e-6, train/loss_step=0.00146, global_step=1882.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  16%|█▋        | 13/80 [01:27<06:58,  6.25s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=3.64e-5, train/loss_step=0.00211, global_step=1883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  18%|█▊        | 14/80 [01:27<06:26,  5.86s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=3.64e-5, train/loss_step=0.00211, global_step=1883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  18%|█▊        | 14/80 [01:27<06:26,  5.86s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000457, train/loss_vlb_step=1.97e-6, train/loss_step=0.000457, global_step=1883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  19%|█▉        | 15/80 [01:28<05:59,  5.53s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000457, train/loss_vlb_step=1.97e-6, train/loss_step=0.000457, global_step=1883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  19%|█▉        | 15/80 [01:28<05:59,  5.53s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=2.29e-6, train/loss_step=0.000477, global_step=1883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  20%|██        | 16/80 [01:53<07:08,  6.70s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=2.29e-6, train/loss_step=0.000477, global_step=1883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  20%|██        | 16/80 [01:53<07:08,  6.70s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.00019, train/loss_step=0.0134, global_step=1883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]    Epoch 94:  21%|██▏       | 17/80 [02:00<07:00,  6.67s/it, loss=0.00544, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.00019, train/loss_step=0.0134, global_step=1883.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  21%|██▏       | 17/80 [02:00<07:00,  6.67s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.46e-6, train/loss_step=0.00035, global_step=1884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  22%|██▎       | 18/80 [02:00<06:33,  6.35s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.46e-6, train/loss_step=0.00035, global_step=1884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  22%|██▎       | 18/80 [02:00<06:33,  6.35s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=5.68e-5, train/loss_step=0.0161, global_step=1884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  24%|██▍       | 19/80 [02:18<07:03,  6.95s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=5.68e-5, train/loss_step=0.0161, global_step=1884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  24%|██▍       | 19/80 [02:18<07:03,  6.95s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=2.82e-5, train/loss_step=0.0076, global_step=1884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  25%|██▌       | 20/80 [02:19<06:38,  6.64s/it, loss=0.00635, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=2.82e-5, train/loss_step=0.0076, global_step=1884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  25%|██▌       | 20/80 [02:19<06:38,  6.64s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=2.47e-5, train/loss_step=0.00631, global_step=1884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  26%|██▋       | 21/80 [02:19<06:15,  6.36s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00631, train/loss_vlb_step=2.47e-5, train/loss_step=0.00631, global_step=1884.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  26%|██▋       | 21/80 [02:19<06:15,  6.36s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=1.53e-5, train/loss_step=0.00459, global_step=1885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  28%|██▊       | 22/80 [02:20<05:54,  6.11s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00459, train/loss_vlb_step=1.53e-5, train/loss_step=0.00459, global_step=1885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  28%|██▊       | 22/80 [02:20<05:54,  6.11s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.53e-5, train/loss_step=0.00882, global_step=1885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  29%|██▉       | 23/80 [02:20<05:34,  5.87s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00882, train/loss_vlb_step=4.53e-5, train/loss_step=0.00882, global_step=1885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  29%|██▉       | 23/80 [02:20<05:34,  5.87s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=1.64e-6, train/loss_step=0.000376, global_step=1885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  30%|███       | 24/80 [02:32<05:40,  6.09s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=1.64e-6, train/loss_step=0.000376, global_step=1885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  30%|███       | 24/80 [02:32<05:40,  6.09s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.12e-6, train/loss_step=0.000554, global_step=1885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  31%|███▏      | 25/80 [02:57<06:16,  6.84s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.12e-6, train/loss_step=0.000554, global_step=1885.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  31%|███▏      | 25/80 [02:57<06:16,  6.84s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=2.72e-5, train/loss_step=0.00659, global_step=1886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  32%|███▎      | 26/80 [02:58<05:56,  6.61s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00659, train/loss_vlb_step=2.72e-5, train/loss_step=0.00659, global_step=1886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  32%|███▎      | 26/80 [02:58<05:56,  6.61s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=1.92e-6, train/loss_step=0.000474, global_step=1886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  34%|███▍      | 27/80 [02:58<05:38,  6.39s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=1.92e-6, train/loss_step=0.000474, global_step=1886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  34%|███▍      | 27/80 [02:58<05:38,  6.39s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=1.59e-6, train/loss_step=0.000466, global_step=1886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  35%|███▌      | 28/80 [02:59<05:21,  6.19s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000466, train/loss_vlb_step=1.59e-6, train/loss_step=0.000466, global_step=1886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  35%|███▌      | 28/80 [02:59<05:21,  6.19s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=8.66e-7, train/loss_step=0.000227, global_step=1886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  36%|███▋      | 29/80 [02:59<05:05,  6.00s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=8.66e-7, train/loss_step=0.000227, global_step=1886.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  36%|███▋      | 29/80 [02:59<05:05,  6.00s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=3.03e-5, train/loss_step=0.00588, global_step=1887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  38%|███▊      | 30/80 [03:00<04:51,  5.82s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=3.03e-5, train/loss_step=0.00588, global_step=1887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  38%|███▊      | 30/80 [03:00<04:51,  5.82s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=4.46e-6, train/loss_step=0.000635, global_step=1887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  39%|███▉      | 31/80 [03:00<04:37,  5.65s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=4.46e-6, train/loss_step=0.000635, global_step=1887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  39%|███▉      | 31/80 [03:00<04:37,  5.65s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.57e-5, train/loss_step=0.0115, global_step=1887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]    Epoch 94:  40%|████      | 32/80 [03:23<04:55,  6.17s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.57e-5, train/loss_step=0.0115, global_step=1887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  40%|████      | 32/80 [03:23<04:55,  6.17s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.78e-5, train/loss_step=0.00578, global_step=1887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  41%|████▏     | 33/80 [03:41<05:06,  6.53s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00578, train/loss_vlb_step=2.78e-5, train/loss_step=0.00578, global_step=1887.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  41%|████▏     | 33/80 [03:41<05:06,  6.53s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.04e-5, train/loss_step=0.0124, global_step=1888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.00515, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.04e-5, train/loss_step=0.0124, global_step=1888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000111, train/loss_step=0.0255, global_step=1888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000111, train/loss_step=0.0255, global_step=1888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=2.94e-6, train/loss_step=0.000467, global_step=1888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.0064, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=2.94e-6, train/loss_step=0.000467, global_step=1888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=1.49e-5, train/loss_step=0.00444, global_step=1888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379] Epoch 94:  46%|████▋     | 37/80 [03:44<04:13,  5.90s/it, loss=0.00595, v_num=0, train/loss_simple_step=0.00444, train/loss_vlb_step=1.49e-5, train/loss_step=0.00444, global_step=1888.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  46%|████▋     | 37/80 [03:44<04:13,  5.90s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=9.4e-6, train/loss_step=0.00133, global_step=1889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]   Epoch 94:  48%|████▊     | 38/80 [03:44<04:01,  5.76s/it, loss=0.006, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=9.4e-6, train/loss_step=0.00133, global_step=1889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  48%|████▊     | 38/80 [03:44<04:01,  5.76s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=3.23e-6, train/loss_step=0.000805, global_step=1889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  49%|████▉     | 39/80 [03:45<03:50,  5.63s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=3.23e-6, train/loss_step=0.000805, global_step=1889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  49%|████▉     | 39/80 [03:45<03:50,  5.63s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=3.02e-6, train/loss_step=0.000574, global_step=1889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  50%|█████     | 40/80 [04:06<04:00,  6.00s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000574, train/loss_vlb_step=3.02e-6, train/loss_step=0.000574, global_step=1889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  50%|█████     | 40/80 [04:06<04:00,  6.00s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=5.63e-6, train/loss_step=0.00138, global_step=1889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  51%|█████▏    | 41/80 [04:26<04:07,  6.36s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=5.63e-6, train/loss_step=0.00138, global_step=1889.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  51%|█████▏    | 41/80 [04:26<04:07,  6.36s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000929, train/loss_vlb_step=4.32e-6, train/loss_step=0.000929, global_step=1890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  52%|█████▎    | 42/80 [04:27<03:56,  6.22s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000929, train/loss_vlb_step=4.32e-6, train/loss_step=0.000929, global_step=1890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  52%|█████▎    | 42/80 [04:27<03:56,  6.22s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=6.24e-6, train/loss_step=0.00102, global_step=1890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  54%|█████▍    | 43/80 [04:27<03:45,  6.09s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=6.24e-6, train/loss_step=0.00102, global_step=1890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  54%|█████▍    | 43/80 [04:27<03:45,  6.09s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=2.59e-5, train/loss_step=0.00198, global_step=1890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  55%|█████▌    | 44/80 [04:29<03:35,  5.98s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=2.59e-5, train/loss_step=0.00198, global_step=1890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  55%|█████▌    | 44/80 [04:29<03:35,  5.98s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.02e-5, train/loss_step=0.012, global_step=1890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]    Epoch 94:  56%|█████▋    | 45/80 [04:29<03:25,  5.86s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.02e-5, train/loss_step=0.012, global_step=1890.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  56%|█████▋    | 45/80 [04:29<03:25,  5.86s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.03e-5, train/loss_step=0.0173, global_step=1891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  57%|█████▊    | 46/80 [04:30<03:15,  5.75s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.0173, train/loss_vlb_step=7.03e-5, train/loss_step=0.0173, global_step=1891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  57%|█████▊    | 46/80 [04:30<03:15,  5.75s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000674, train/loss_vlb_step=3.45e-6, train/loss_step=0.000674, global_step=1891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  59%|█████▉    | 47/80 [04:30<03:06,  5.64s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000674, train/loss_vlb_step=3.45e-6, train/loss_step=0.000674, global_step=1891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  59%|█████▉    | 47/80 [04:30<03:06,  5.64s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=2.48e-6, train/loss_step=0.000474, global_step=1891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  60%|██████    | 48/80 [04:51<03:10,  5.95s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=2.48e-6, train/loss_step=0.000474, global_step=1891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  60%|██████    | 48/80 [04:51<03:10,  5.95s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.11e-6, train/loss_step=0.000291, global_step=1891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  61%|██████▏   | 49/80 [05:07<03:10,  6.14s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.11e-6, train/loss_step=0.000291, global_step=1891.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  61%|██████▏   | 49/80 [05:07<03:10,  6.14s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=2.67e-5, train/loss_step=0.00719, global_step=1892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  62%|██████▎   | 50/80 [05:07<03:00,  6.03s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=2.67e-5, train/loss_step=0.00719, global_step=1892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  62%|██████▎   | 50/80 [05:07<03:00,  6.03s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=1.14e-5, train/loss_step=0.0016, global_step=1892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  64%|██████▍   | 51/80 [05:08<02:51,  5.92s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=1.14e-5, train/loss_step=0.0016, global_step=1892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  64%|██████▍   | 51/80 [05:08<02:51,  5.92s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=8.07e-7, train/loss_step=0.000171, global_step=1892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  65%|██████▌   | 52/80 [05:09<02:43,  5.83s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=8.07e-7, train/loss_step=0.000171, global_step=1892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  65%|██████▌   | 52/80 [05:09<02:43,  5.83s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=7.98e-6, train/loss_step=0.00208, global_step=1892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=7.98e-6, train/loss_step=0.00208, global_step=1892.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000111, train/loss_step=0.0146, global_step=1893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379] Epoch 94:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000111, train/loss_step=0.0146, global_step=1893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=8.1e-6, train/loss_step=0.0023, global_step=1893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=8.1e-6, train/loss_step=0.0023, global_step=1893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.02e-6, train/loss_step=0.000252, global_step=1893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.02e-6, train/loss_step=0.000252, global_step=1893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=0.000106, train/loss_step=0.00995, global_step=1893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379] Epoch 94:  71%|███████▏  | 57/80 [05:42<02:15,  5.90s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00995, train/loss_vlb_step=0.000106, train/loss_step=0.00995, global_step=1893.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  71%|███████▏  | 57/80 [05:42<02:15,  5.90s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000656, train/loss_vlb_step=3.82e-6, train/loss_step=0.000656, global_step=1894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  72%|███████▎  | 58/80 [05:42<02:07,  5.81s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000656, train/loss_vlb_step=3.82e-6, train/loss_step=0.000656, global_step=1894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  72%|███████▎  | 58/80 [05:42<02:07,  5.81s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.48e-6, train/loss_step=0.00123, global_step=1894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  74%|███████▍  | 59/80 [05:43<02:00,  5.72s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.48e-6, train/loss_step=0.00123, global_step=1894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  74%|███████▍  | 59/80 [05:43<02:00,  5.72s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=5.13e-6, train/loss_step=0.000563, global_step=1894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  75%|███████▌  | 60/80 [05:44<01:52,  5.64s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.000563, train/loss_vlb_step=5.13e-6, train/loss_step=0.000563, global_step=1894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  75%|███████▌  | 60/80 [05:44<01:52,  5.64s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.31e-7, train/loss_step=0.00018, global_step=1894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  76%|███████▋  | 61/80 [05:44<01:45,  5.56s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.31e-7, train/loss_step=0.00018, global_step=1894.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  76%|███████▋  | 61/80 [05:44<01:45,  5.56s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.07e-5, train/loss_step=0.0122, global_step=1895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  78%|███████▊  | 62/80 [05:45<01:38,  5.48s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=7.07e-5, train/loss_step=0.0122, global_step=1895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  78%|███████▊  | 62/80 [05:45<01:38,  5.48s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=1.37e-5, train/loss_step=0.00415, global_step=1895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  79%|███████▉  | 63/80 [05:45<01:31,  5.40s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=1.37e-5, train/loss_step=0.00415, global_step=1895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  79%|███████▉  | 63/80 [05:45<01:31,  5.40s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=6.53e-6, train/loss_step=0.00137, global_step=1895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  80%|████████  | 64/80 [06:19<01:33,  5.83s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=6.53e-6, train/loss_step=0.00137, global_step=1895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  80%|████████  | 64/80 [06:19<01:33,  5.83s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000738, train/loss_step=0.0242, global_step=1895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379] Epoch 94:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000738, train/loss_step=0.0242, global_step=1895.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.21e-5, train/loss_step=0.00177, global_step=1896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  82%|████████▎ | 66/80 [06:20<01:19,  5.68s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=1.21e-5, train/loss_step=0.00177, global_step=1896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  82%|████████▎ | 66/80 [06:20<01:19,  5.68s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.17e-5, train/loss_step=0.00305, global_step=1896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  84%|████████▍ | 67/80 [06:20<01:12,  5.60s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00305, train/loss_vlb_step=1.17e-5, train/loss_step=0.00305, global_step=1896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  84%|████████▍ | 67/80 [06:20<01:12,  5.60s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=8.49e-6, train/loss_step=0.00219, global_step=1896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379] Epoch 94:  85%|████████�� | 68/80 [06:21<01:06,  5.53s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.00219, train/loss_vlb_step=8.49e-6, train/loss_step=0.00219, global_step=1896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  85%|████████▌ | 68/80 [06:21<01:06,  5.53s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000815, train/loss_vlb_step=3.63e-6, train/loss_step=0.000815, global_step=1896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  86%|████████▋ | 69/80 [06:22<01:00,  5.46s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000815, train/loss_vlb_step=3.63e-6, train/loss_step=0.000815, global_step=1896.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  86%|████████▋ | 69/80 [06:22<01:00,  5.46s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=9.96e-6, train/loss_step=0.00212, global_step=1897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  88%|████████▊ | 70/80 [06:22<00:53,  5.39s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00212, train/loss_vlb_step=9.96e-6, train/loss_step=0.00212, global_step=1897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  88%|████████▊ | 70/80 [06:22<00:53,  5.39s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=0.000702, train/loss_step=0.00579, global_step=1897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  89%|████████▉ | 71/80 [06:23<00:47,  5.32s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=0.000702, train/loss_step=0.00579, global_step=1897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  89%|████████▉ | 71/80 [06:23<00:47,  5.32s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000975, train/loss_vlb_step=4e-6, train/loss_step=0.000975, global_step=1897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  90%|█████████ | 72/80 [06:59<00:45,  5.74s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000975, train/loss_vlb_step=4e-6, train/loss_step=0.000975, global_step=1897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  90%|█████████ | 72/80 [06:59<00:45,  5.74s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=9.61e-6, train/loss_step=0.00287, global_step=1897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  91%|█████████▏| 73/80 [07:05<00:40,  5.75s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=9.61e-6, train/loss_step=0.00287, global_step=1897.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  91%|█████████▏| 73/80 [07:05<00:40,  5.75s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=0.000415, train/loss_step=0.00505, global_step=1898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  92%|█████████▎| 74/80 [07:05<00:34,  5.68s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=0.000415, train/loss_step=0.00505, global_step=1898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  92%|█████████▎| 74/80 [07:05<00:34,  5.68s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=1.42e-5, train/loss_step=0.004, global_step=1898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]     Epoch 94:  94%|█████████▍| 75/80 [07:06<00:28,  5.61s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=1.42e-5, train/loss_step=0.004, global_step=1898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  94%|█████████▍| 75/80 [07:06<00:28,  5.61s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=5.05e-5, train/loss_step=0.00903, global_step=1898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  95%|█████████▌| 76/80 [07:06<00:22,  5.55s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00903, train/loss_vlb_step=5.05e-5, train/loss_step=0.00903, global_step=1898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  95%|█████████▌| 76/80 [07:06<00:22,  5.55s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.03e-5, train/loss_step=0.0139, global_step=1898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94:  96%|█████████▋| 77/80 [07:07<00:16,  5.48s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=5.03e-5, train/loss_step=0.0139, global_step=1898.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  96%|█████████▋| 77/80 [07:07<00:16,  5.48s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=2.18e-5, train/loss_step=0.00587, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00587, train/loss_vlb_step=2.18e-5, train/loss_step=0.00587, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.16e-6, train/loss_step=0.000256, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  99%|█████████▉| 79/80 [07:11<00:05,  5.39s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.16e-6, train/loss_step=0.000256, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94:  99%|█████████▉| 79/80 [07:11<00:05,  5.39s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.25e-5, train/loss_step=0.00609, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 94: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00609, train/loss_vlb_step=2.25e-5, train/loss_step=0.00609, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 94: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=4.35e-5, train/loss_step=0.00354, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Average Epoch time: 431.63 seconds
+Average Peak memory 29565.45MiB
+Epoch 94:   0%|          | 0/80 [00:00<00:00, 4490.69it/s, loss=0.00546, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=4.35e-5, train/loss_step=0.00354, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 95:   0%|          | 0/80 [00:00<00:00, 1914.33it/s, loss=0.00546, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=4.35e-5, train/loss_step=0.00354, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]Epoch 95:   1%|▏         | 1/80 [00:43<28:56, 21.98s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00354, train/loss_vlb_step=4.35e-5, train/loss_step=0.00354, global_step=1899.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=8.42e-5, train/loss_epoch=0.00379]  Epoch 95:   1%|▏         | 1/80 [00:43<28:56, 21.98s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=1.17e-6, train/loss_step=0.000222, global_step=1900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   2%|▎         | 2/80 [00:44<19:15, 14.81s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=1.17e-6, train/loss_step=0.000222, global_step=1900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   2%|▎         | 2/80 [00:44<19:15, 14.81s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000122, train/loss_vlb_step=5.04e-7, train/loss_step=0.000122, global_step=1900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   4%|▍         | 3/80 [00:45<14:40, 11.44s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000122, train/loss_vlb_step=5.04e-7, train/loss_step=0.000122, global_step=1900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   4%|▍         | 3/80 [00:45<14:40, 11.44s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.57e-5, train/loss_step=0.00469, global_step=1900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:   5%|▌         | 4/80 [00:46<11:43,  9.25s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.57e-5, train/loss_step=0.00469, global_step=1900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   5%|▌         | 4/80 [00:46<11:43,  9.25s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=6.26e-6, train/loss_step=0.00122, global_step=1900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   6%|▋         | 5/80 [00:46<09:44,  7.79s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=6.26e-6, train/loss_step=0.00122, global_step=1900.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   6%|▋         | 5/80 [00:46<09:44,  7.79s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=2.74e-5, train/loss_step=0.00719, global_step=1901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   8%|▊         | 6/80 [00:47<08:19,  6.75s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=2.74e-5, train/loss_step=0.00719, global_step=1901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   8%|▊         | 6/80 [00:47<08:19,  6.75s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=8.96e-6, train/loss_step=0.00198, global_step=1901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   9%|▉         | 7/80 [00:47<07:15,  5.97s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=8.96e-6, train/loss_step=0.00198, global_step=1901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:   9%|▉         | 7/80 [00:47<07:15,  5.97s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=4.65e-5, train/loss_step=0.00606, global_step=1901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  10%|█         | 8/80 [01:14<09:52,  8.23s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=4.65e-5, train/loss_step=0.00606, global_step=1901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  10%|█         | 8/80 [01:14<09:52,  8.23s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.2e-6, train/loss_step=0.000252, global_step=1901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  11%|█▏        | 9/80 [01:21<09:36,  8.12s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000252, train/loss_vlb_step=1.2e-6, train/loss_step=0.000252, global_step=1901.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  11%|█▏        | 9/80 [01:21<09:36,  8.12s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=9.6e-6, train/loss_step=0.00282, global_step=1902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  12%|█▎        | 10/80 [01:21<08:39,  7.43s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=9.6e-6, train/loss_step=0.00282, global_step=1902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  12%|█▎        | 10/80 [01:21<08:39,  7.43s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=2.37e-5, train/loss_step=0.00657, global_step=1902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  14%|█▍        | 11/80 [01:29<08:35,  7.47s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00657, train/loss_vlb_step=2.37e-5, train/loss_step=0.00657, global_step=1902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  14%|█▍        | 11/80 [01:29<08:35,  7.47s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=3.79e-5, train/loss_step=0.0108, global_step=1902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  15%|█▌        | 12/80 [01:30<07:51,  6.93s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=3.79e-5, train/loss_step=0.0108, global_step=1902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  15%|█▌        | 12/80 [01:30<07:51,  6.93s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000984, train/loss_vlb_step=8.27e-6, train/loss_step=0.000984, global_step=1902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  16%|█▋        | 13/80 [01:30<07:13,  6.47s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000984, train/loss_vlb_step=8.27e-6, train/loss_step=0.000984, global_step=1902.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  16%|█▋        | 13/80 [01:30<07:13,  6.47s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000646, train/loss_vlb_step=1.84e-5, train/loss_step=0.000646, global_step=1903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  18%|█▊        | 14/80 [01:31<06:40,  6.07s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000646, train/loss_vlb_step=1.84e-5, train/loss_step=0.000646, global_step=1903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  18%|█▊        | 14/80 [01:31<06:40,  6.07s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=7.13e-5, train/loss_step=0.00106, global_step=1903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  19%|█▉        | 15/80 [01:31<06:12,  5.73s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=7.13e-5, train/loss_step=0.00106, global_step=1903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  19%|█▉        | 15/80 [01:31<06:12,  5.73s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.03e-5, train/loss_step=0.0021, global_step=1903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  20%|██        | 16/80 [01:52<07:03,  6.62s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=1.03e-5, train/loss_step=0.0021, global_step=1903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  20%|██        | 16/80 [01:52<07:03,  6.62s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000859, train/loss_vlb_step=6.88e-6, train/loss_step=0.000859, global_step=1903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  21%|██▏       | 17/80 [02:07<07:27,  7.11s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000859, train/loss_vlb_step=6.88e-6, train/loss_step=0.000859, global_step=1903.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  21%|██▏       | 17/80 [02:07<07:27,  7.11s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000197, train/loss_vlb_step=8.76e-7, train/loss_step=0.000197, global_step=1904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  22%|██▎       | 18/80 [02:08<06:59,  6.76s/it, loss=0.00288, v_num=0, train/loss_simple_step=0.000197, train/loss_vlb_step=8.76e-7, train/loss_step=0.000197, global_step=1904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  22%|██▎       | 18/80 [02:08<06:59,  6.76s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.05e-5, train/loss_step=0.00221, global_step=1904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  24%|██▍       | 19/80 [02:08<06:33,  6.45s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.05e-5, train/loss_step=0.00221, global_step=1904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  24%|██▍       | 19/80 [02:08<06:33,  6.45s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=2.06e-6, train/loss_step=0.00024, global_step=1904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  25%|██▌       | 20/80 [02:09<06:10,  6.18s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=2.06e-6, train/loss_step=0.00024, global_step=1904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  25%|██▌       | 20/80 [02:09<06:10,  6.18s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=6.79e-6, train/loss_step=0.0016, global_step=1904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  26%|██▋       | 21/80 [02:10<05:49,  5.93s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=6.79e-6, train/loss_step=0.0016, global_step=1904.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  26%|██▋       | 21/80 [02:10<05:49,  5.93s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.01e-5, train/loss_step=0.0026, global_step=1905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  28%|██▊       | 22/80 [02:10<05:30,  5.69s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.01e-5, train/loss_step=0.0026, global_step=1905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  28%|██▊       | 22/80 [02:10<05:30,  5.69s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000746, train/loss_vlb_step=2.44e-5, train/loss_step=0.000746, global_step=1905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  29%|██▉       | 23/80 [02:11<05:12,  5.48s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000746, train/loss_vlb_step=2.44e-5, train/loss_step=0.000746, global_step=1905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  29%|██▉       | 23/80 [02:11<05:12,  5.48s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=7.05e-6, train/loss_step=0.00185, global_step=1905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]   Epoch 95:  30%|███       | 24/80 [02:24<05:22,  5.77s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=7.05e-6, train/loss_step=0.00185, global_step=1905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  30%|███       | 24/80 [02:24<05:22,  5.77s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=2.16e-6, train/loss_step=0.000456, global_step=1905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  31%|███▏      | 25/80 [02:45<05:50,  6.38s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=2.16e-6, train/loss_step=0.000456, global_step=1905.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  31%|███▏      | 25/80 [02:45<05:50,  6.38s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.0001, train/loss_step=0.0149, global_step=1906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]     Epoch 95:  32%|███▎      | 26/80 [02:46<05:32,  6.16s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.0001, train/loss_step=0.0149, global_step=1906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  32%|███▎      | 26/80 [02:46<05:32,  6.16s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00013, train/loss_vlb_step=5.29e-7, train/loss_step=0.00013, global_step=1906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  34%|███▍      | 27/80 [02:47<05:17,  5.99s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00013, train/loss_vlb_step=5.29e-7, train/loss_step=0.00013, global_step=1906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  34%|███▍      | 27/80 [02:47<05:17,  5.99s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000901, train/loss_vlb_step=2.57e-5, train/loss_step=0.000901, global_step=1906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  35%|███▌      | 28/80 [02:48<05:01,  5.80s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000901, train/loss_vlb_step=2.57e-5, train/loss_step=0.000901, global_step=1906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  35%|███▌      | 28/80 [02:48<05:01,  5.80s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000306, train/loss_vlb_step=1.51e-6, train/loss_step=0.000306, global_step=1906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  36%|███▋      | 29/80 [02:48<04:46,  5.62s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000306, train/loss_vlb_step=1.51e-6, train/loss_step=0.000306, global_step=1906.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  36%|███▋      | 29/80 [02:48<04:46,  5.62s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.63e-6, train/loss_step=0.000355, global_step=1907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  38%|███▊      | 30/80 [02:49<04:32,  5.46s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.63e-6, train/loss_step=0.000355, global_step=1907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  38%|███▊      | 30/80 [02:49<04:32,  5.46s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000554, train/loss_step=0.0308, global_step=1907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]   Epoch 95:  39%|███▉      | 31/80 [02:49<04:19,  5.30s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0308, train/loss_vlb_step=0.000554, train/loss_step=0.0308, global_step=1907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  39%|███▉      | 31/80 [02:49<04:19,  5.30s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=0.000111, train/loss_step=0.00554, global_step=1907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  40%|████      | 32/80 [03:06<04:31,  5.66s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00554, train/loss_vlb_step=0.000111, train/loss_step=0.00554, global_step=1907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  40%|████      | 32/80 [03:06<04:31,  5.66s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.87e-6, train/loss_step=0.00038, global_step=1907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429] Epoch 95:  41%|████▏     | 33/80 [03:31<04:52,  6.22s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.87e-6, train/loss_step=0.00038, global_step=1907.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  41%|████▏     | 33/80 [03:31<04:52,  6.22s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=2.37e-6, train/loss_step=0.000355, global_step=1908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  42%|████▎     | 34/80 [03:32<04:38,  6.06s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=2.37e-6, train/loss_step=0.000355, global_step=1908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  42%|████▎     | 34/80 [03:32<04:38,  6.06s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=3.58e-5, train/loss_step=0.00155, global_step=1908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]   Epoch 95:  44%|████▍     | 35/80 [03:32<04:26,  5.91s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=3.58e-5, train/loss_step=0.00155, global_step=1908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  44%|████▍     | 35/80 [03:32<04:26,  5.91s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=2.56e-5, train/loss_step=0.0022, global_step=1908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429] Epoch 95:  45%|████▌     | 36/80 [03:33<04:13,  5.77s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=2.56e-5, train/loss_step=0.0022, global_step=1908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  45%|████▌     | 36/80 [03:33<04:13,  5.77s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=5.68e-6, train/loss_step=0.00126, global_step=1908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  46%|████▋     | 37/80 [03:33<04:02,  5.63s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=5.68e-6, train/loss_step=0.00126, global_step=1908.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  46%|████▋     | 37/80 [03:33<04:02,  5.63s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=6.41e-6, train/loss_step=0.00123, global_step=1909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  48%|████▊     | 38/80 [03:34<03:50,  5.50s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=6.41e-6, train/loss_step=0.00123, global_step=1909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  48%|████▊     | 38/80 [03:34<03:50,  5.50s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000792, train/loss_vlb_step=3.36e-6, train/loss_step=0.000792, global_step=1909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  49%|████▉     | 39/80 [03:34<03:40,  5.37s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000792, train/loss_vlb_step=3.36e-6, train/loss_step=0.000792, global_step=1909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  49%|████▉     | 39/80 [03:34<03:40,  5.37s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=5.97e-6, train/loss_step=0.00151, global_step=1909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  50%|█████     | 40/80 [03:44<03:38,  5.47s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=5.97e-6, train/loss_step=0.00151, global_step=1909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  50%|█████     | 40/80 [03:44<03:38,  5.47s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=2.73e-6, train/loss_step=0.00043, global_step=1909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  51%|█████▏    | 41/80 [04:05<03:47,  5.85s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=2.73e-6, train/loss_step=0.00043, global_step=1909.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  51%|█████▏    | 41/80 [04:05<03:47,  5.85s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=1.64e-6, train/loss_step=0.000366, global_step=1910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  52%|█████▎    | 42/80 [04:06<03:37,  5.72s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000366, train/loss_vlb_step=1.64e-6, train/loss_step=0.000366, global_step=1910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  52%|█████▎    | 42/80 [04:06<03:37,  5.72s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.05e-5, train/loss_step=0.00205, global_step=1910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429] Epoch 95:  54%|█████▍    | 43/80 [04:08<03:29,  5.65s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=1.05e-5, train/loss_step=0.00205, global_step=1910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  54%|█████▍    | 43/80 [04:08<03:29,  5.65s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=5e-6, train/loss_step=0.000434, global_step=1910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429] Epoch 95:  55%|█████▌    | 44/80 [04:09<03:19,  5.54s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=5e-6, train/loss_step=0.000434, global_step=1910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  55%|█████▌    | 44/80 [04:09<03:19,  5.54s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=0.000118, train/loss_step=0.0181, global_step=1910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  56%|█████▋    | 45/80 [04:14<03:13,  5.53s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0181, train/loss_vlb_step=0.000118, train/loss_step=0.0181, global_step=1910.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  56%|█████▋    | 45/80 [04:14<03:13,  5.53s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=8.71e-7, train/loss_step=0.000229, global_step=1911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  57%|█████▊    | 46/80 [04:14<03:04,  5.42s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=8.71e-7, train/loss_step=0.000229, global_step=1911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  57%|█████▊    | 46/80 [04:14<03:04,  5.42s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000668, train/loss_vlb_step=1.09e-5, train/loss_step=0.000668, global_step=1911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  59%|█████▉    | 47/80 [04:15<02:55,  5.32s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000668, train/loss_vlb_step=1.09e-5, train/loss_step=0.000668, global_step=1911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  59%|█████▉    | 47/80 [04:15<02:55,  5.32s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.33e-7, train/loss_step=0.000167, global_step=1911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  60%|██████    | 48/80 [04:32<02:57,  5.56s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.33e-7, train/loss_step=0.000167, global_step=1911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  60%|██████    | 48/80 [04:32<02:57,  5.56s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000596, train/loss_vlb_step=2.14e-6, train/loss_step=0.000596, global_step=1911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  61%|██████▏   | 49/80 [04:54<03:02,  5.89s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000596, train/loss_vlb_step=2.14e-6, train/loss_step=0.000596, global_step=1911.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  61%|██████▏   | 49/80 [04:54<03:02,  5.89s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000309, train/loss_vlb_step=1.77e-6, train/loss_step=0.000309, global_step=1912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  62%|██████▎   | 50/80 [04:55<02:53,  5.79s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000309, train/loss_vlb_step=1.77e-6, train/loss_step=0.000309, global_step=1912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  62%|██████▎   | 50/80 [04:55<02:53,  5.79s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=1.59e-6, train/loss_step=0.00025, global_step=1912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  64%|██████▍   | 51/80 [04:57<02:46,  5.73s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=1.59e-6, train/loss_step=0.00025, global_step=1912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  64%|██████▍   | 51/80 [04:57<02:46,  5.73s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=3.93e-6, train/loss_step=0.000456, global_step=1912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  65%|██████▌   | 52/80 [04:58<02:37,  5.63s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=3.93e-6, train/loss_step=0.000456, global_step=1912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  65%|██████▌   | 52/80 [04:58<02:37,  5.63s/it, loss=0.00165, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=7.52e-7, train/loss_step=0.000157, global_step=1912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  66%|██████▋   | 53/80 [04:59<02:29,  5.54s/it, loss=0.00165, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=7.52e-7, train/loss_step=0.000157, global_step=1912.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  66%|██████▋   | 53/80 [04:59<02:29,  5.54s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=1.37e-5, train/loss_step=0.000647, global_step=1913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  68%|██████▊   | 54/80 [04:59<02:21,  5.45s/it, loss=0.00167, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=1.37e-5, train/loss_step=0.000647, global_step=1913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  68%|██████▊   | 54/80 [04:59<02:21,  5.45s/it, loss=0.00161, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=6.27e-6, train/loss_step=0.000292, global_step=1913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  69%|██████▉   | 55/80 [05:00<02:14,  5.36s/it, loss=0.00161, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=6.27e-6, train/loss_step=0.000292, global_step=1913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  69%|██████▉   | 55/80 [05:00<02:14,  5.36s/it, loss=0.00156, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.43e-6, train/loss_step=0.00135, global_step=1913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  70%|███████   | 56/80 [05:19<02:14,  5.60s/it, loss=0.00156, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.43e-6, train/loss_step=0.00135, global_step=1913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  70%|███████   | 56/80 [05:19<02:14,  5.60s/it, loss=0.00162, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.44e-5, train/loss_step=0.00245, global_step=1913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  71%|███████▏  | 57/80 [05:33<02:12,  5.75s/it, loss=0.00162, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.44e-5, train/loss_step=0.00245, global_step=1913.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  71%|███████▏  | 57/80 [05:33<02:12,  5.75s/it, loss=0.00157, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=8.44e-7, train/loss_step=0.000215, global_step=1914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  72%|███████▎  | 58/80 [05:33<02:04,  5.66s/it, loss=0.00157, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=8.44e-7, train/loss_step=0.000215, global_step=1914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  72%|███████▎  | 58/80 [05:33<02:04,  5.66s/it, loss=0.00164, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=7.49e-6, train/loss_step=0.00204, global_step=1914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  74%|███████▍  | 59/80 [05:34<01:56,  5.57s/it, loss=0.00164, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=7.49e-6, train/loss_step=0.00204, global_step=1914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  74%|███████▍  | 59/80 [05:34<01:56,  5.57s/it, loss=0.00186, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=2.21e-5, train/loss_step=0.00601, global_step=1914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  75%|███████▌  | 60/80 [05:41<01:51,  5.60s/it, loss=0.00186, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=2.21e-5, train/loss_step=0.00601, global_step=1914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  75%|███████▌  | 60/80 [05:41<01:51,  5.60s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.12e-5, train/loss_step=0.00583, global_step=1914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  76%|███████▋  | 61/80 [05:44<01:45,  5.56s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.12e-5, train/loss_step=0.00583, global_step=1914.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  76%|███████▋  | 61/80 [05:44<01:45,  5.56s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=6.84e-7, train/loss_step=0.000168, global_step=1915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  78%|███████▊  | 62/80 [05:45<01:38,  5.48s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=6.84e-7, train/loss_step=0.000168, global_step=1915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  78%|███████▊  | 62/80 [05:45<01:38,  5.48s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.56e-5, train/loss_step=0.00448, global_step=1915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  79%|███████▉  | 63/80 [05:45<01:31,  5.40s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.00448, train/loss_vlb_step=1.56e-5, train/loss_step=0.00448, global_step=1915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  79%|███████▉  | 63/80 [05:45<01:31,  5.40s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.94e-5, train/loss_step=0.00503, global_step=1915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  80%|████████  | 64/80 [06:05<01:30,  5.63s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.94e-5, train/loss_step=0.00503, global_step=1915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  80%|████████  | 64/80 [06:05<01:30,  5.63s/it, loss=0.00159, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=1.14e-5, train/loss_step=0.000437, global_step=1915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  81%|████████▏ | 65/80 [06:15<01:25,  5.69s/it, loss=0.00159, v_num=0, train/loss_simple_step=0.000437, train/loss_vlb_step=1.14e-5, train/loss_step=0.000437, global_step=1915.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  81%|████████▏ | 65/80 [06:15<01:25,  5.69s/it, loss=0.0016, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=5.34e-6, train/loss_step=0.000533, global_step=1916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429] Epoch 95:  82%|████████▎ | 66/80 [06:16<01:18,  5.61s/it, loss=0.0016, v_num=0, train/loss_simple_step=0.000533, train/loss_vlb_step=5.34e-6, train/loss_step=0.000533, global_step=1916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  82%|████████▎ | 66/80 [06:16<01:18,  5.61s/it, loss=0.00159, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.27e-6, train/loss_step=0.000305, global_step=1916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  84%|████████▍ | 67/80 [06:17<01:12,  5.56s/it, loss=0.00159, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.27e-6, train/loss_step=0.000305, global_step=1916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  84%|████████▍ | 67/80 [06:17<01:12,  5.56s/it, loss=0.00159, v_num=0, train/loss_simple_step=0.000153, train/loss_vlb_step=6.1e-7, train/loss_step=0.000153, global_step=1916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429] Epoch 95:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.00159, v_num=0, train/loss_simple_step=0.000153, train/loss_vlb_step=6.1e-7, train/loss_step=0.000153, global_step=1916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=2.44e-5, train/loss_step=0.00563, global_step=1916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429] Epoch 95:  86%|████████▋ | 69/80 [06:32<01:01,  5.61s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=2.44e-5, train/loss_step=0.00563, global_step=1916.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  86%|████████▋ | 69/80 [06:32<01:01,  5.61s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.59e-6, train/loss_step=0.00132, global_step=1917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00189, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=5.59e-6, train/loss_step=0.00132, global_step=1917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=2.56e-5, train/loss_step=0.00145, global_step=1917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  89%|████████▉ | 71/80 [06:33<00:49,  5.47s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=2.56e-5, train/loss_step=0.00145, global_step=1917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  89%|████████▉ | 71/80 [06:33<00:49,  5.47s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.7e-6, train/loss_step=0.00101, global_step=1917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429] Epoch 95:  90%|█████████ | 72/80 [06:44<00:44,  5.54s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=4.7e-6, train/loss_step=0.00101, global_step=1917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  90%|█████████ | 72/80 [06:44<00:44,  5.54s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=1.42e-6, train/loss_step=0.000297, global_step=1917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  91%|█████████▏| 73/80 [06:54<00:39,  5.61s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=1.42e-6, train/loss_step=0.000297, global_step=1917.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  91%|█████████▏| 73/80 [06:54<00:39,  5.61s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=3.64e-5, train/loss_step=0.00392, global_step=1918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95:  92%|█████████▎| 74/80 [06:55<00:33,  5.54s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=3.64e-5, train/loss_step=0.00392, global_step=1918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  92%|█████████▎| 74/80 [06:55<00:33,  5.54s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=6.15e-6, train/loss_step=0.0014, global_step=1918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]   Epoch 95:  94%|█████████▍| 75/80 [06:56<00:27,  5.48s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=6.15e-6, train/loss_step=0.0014, global_step=1918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  94%|█████████▍| 75/80 [06:56<00:27,  5.48s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=0.00036, train/loss_step=0.0196, global_step=1918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=0.00036, train/loss_step=0.0196, global_step=1918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  95%|█████████▌| 76/80 [07:08<00:22,  5.57s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000588, train/loss_vlb_step=2.83e-6, train/loss_step=0.000588, global_step=1918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000588, train/loss_vlb_step=2.83e-6, train/loss_step=0.000588, global_step=1918.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=8.25e-6, train/loss_step=0.00184, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]   Epoch 95:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00184, train/loss_vlb_step=8.25e-6, train/loss_step=0.00184, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=2.19e-5, train/loss_step=0.000945, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=2.19e-5, train/loss_step=0.000945, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=4.92e-6, train/loss_step=0.00134, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 95: 100%|██████████| 80/80 [07:11<00:00,  5.32s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=4.92e-6, train/loss_step=0.00134, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 95: 100%|██████████| 80/80 [07:11<00:00,  5.32s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=4.39e-6, train/loss_step=0.000601, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Average Epoch time: 431.04 seconds
+Average Peak memory 29563.50MiB
+Epoch 95:   0%|          | 0/80 [00:00<00:00, 5035.18it/s, loss=0.00255, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=4.39e-6, train/loss_step=0.000601, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 96:   0%|          | 0/80 [00:00<00:00, 1875.81it/s, loss=0.00255, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=4.39e-6, train/loss_step=0.000601, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]Epoch 96:   1%|▏         | 1/80 [00:46<30:28, 23.14s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=4.39e-6, train/loss_step=0.000601, global_step=1919.0, lr_abs=0.0001, train/loss_simple_epoch=0.00429, train/loss_vlb_epoch=8.27e-5, train/loss_epoch=0.00429]  Epoch 96:   1%|▏         | 1/80 [00:46<30:28, 23.14s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.43e-6, train/loss_step=0.000387, global_step=1920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:   2%|▎         | 2/80 [00:46<20:15, 15.59s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.43e-6, train/loss_step=0.000387, global_step=1920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:   2%|▎         | 2/80 [00:46<20:15, 15.59s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=0.000134, train/loss_step=0.00997, global_step=1920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386] Epoch 96:   4%|▍         | 3/80 [00:47<15:09, 11.81s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00997, train/loss_vlb_step=0.000134, train/loss_step=0.00997, global_step=1920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:   4%|▍         | 3/80 [00:47<15:09, 11.81s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=5e-6, train/loss_step=0.00034, global_step=1920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]     Epoch 96:   5%|▌         | 4/80 [00:47<12:06,  9.56s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=5e-6, train/loss_step=0.00034, global_step=1920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:   5%|▌         | 4/80 [00:47<12:06,  9.56s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000371, train/loss_vlb_step=1.76e-6, train/loss_step=0.000371, global_step=1920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:   6%|▋         | 5/80 [00:48<10:03,  8.05s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000371, train/loss_vlb_step=1.76e-6, train/loss_step=0.000371, global_step=1920.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:   6%|▋         | 5/80 [00:48<10:03,  8.05s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=3.73e-6, train/loss_step=0.000833, global_step=1921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:   8%|▊         | 6/80 [00:48<08:35,  6.97s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000833, train/loss_vlb_step=3.73e-6, train/loss_step=0.000833, global_step=1921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:   8%|▊         | 6/80 [00:48<08:35,  6.97s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.18e-5, train/loss_step=0.00703, global_step=1921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:   9%|▉         | 7/80 [00:49<07:29,  6.16s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.18e-5, train/loss_step=0.00703, global_step=1921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:   9%|▉         | 7/80 [00:49<07:29,  6.16s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000515, train/loss_step=0.016, global_step=1921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]   Epoch 96:  10%|█         | 8/80 [01:17<10:20,  8.62s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000515, train/loss_step=0.016, global_step=1921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  10%|█         | 8/80 [01:17<10:20,  8.62s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.37e-6, train/loss_step=0.00155, global_step=1921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  11%|█▏        | 9/80 [01:28<10:26,  8.83s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00155, train/loss_vlb_step=6.37e-6, train/loss_step=0.00155, global_step=1921.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  11%|█▏        | 9/80 [01:28<10:26,  8.83s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000736, train/loss_vlb_step=3.86e-5, train/loss_step=0.000736, global_step=1922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  12%|█▎        | 10/80 [01:28<09:24,  8.07s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000736, train/loss_vlb_step=3.86e-5, train/loss_step=0.000736, global_step=1922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  12%|█▎        | 10/80 [01:28<09:24,  8.07s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.63e-5, train/loss_step=0.00591, global_step=1922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  14%|█▍        | 11/80 [01:29<08:33,  7.44s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00591, train/loss_vlb_step=2.63e-5, train/loss_step=0.00591, global_step=1922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  14%|█▍        | 11/80 [01:29<08:33,  7.44s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.02e-5, train/loss_step=0.0121, global_step=1922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  15%|█▌        | 12/80 [01:29<07:49,  6.91s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=4.02e-5, train/loss_step=0.0121, global_step=1922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  15%|█▌        | 12/80 [01:29<07:49,  6.91s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.38e-6, train/loss_step=0.000278, global_step=1922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  16%|█▋        | 13/80 [01:30<07:12,  6.45s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=1.38e-6, train/loss_step=0.000278, global_step=1922.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  16%|█▋        | 13/80 [01:30<07:12,  6.45s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.1e-5, train/loss_step=0.0033, global_step=1923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]     Epoch 96:  18%|█▊        | 14/80 [01:30<06:39,  6.05s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.1e-5, train/loss_step=0.0033, global_step=1923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  18%|█▊        | 14/80 [01:30<06:39,  6.05s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.15e-5, train/loss_step=0.0197, global_step=1923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  19%|█▉        | 15/80 [01:31<06:10,  5.71s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.0197, train/loss_vlb_step=8.15e-5, train/loss_step=0.0197, global_step=1923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  19%|█▉        | 15/80 [01:31<06:10,  5.71s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=7.02e-6, train/loss_step=0.00121, global_step=1923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  20%|██        | 16/80 [02:07<08:00,  7.50s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00121, train/loss_vlb_step=7.02e-6, train/loss_step=0.00121, global_step=1923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  20%|██        | 16/80 [02:07<08:00,  7.50s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000814, train/loss_vlb_step=3.01e-6, train/loss_step=0.000814, global_step=1923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  21%|██▏       | 17/80 [02:08<07:28,  7.12s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000814, train/loss_vlb_step=3.01e-6, train/loss_step=0.000814, global_step=1923.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  21%|██▏       | 17/80 [02:08<07:28,  7.12s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=2.2e-6, train/loss_step=0.000367, global_step=1924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386] Epoch 96:  22%|██▎       | 18/80 [02:08<06:59,  6.77s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=2.2e-6, train/loss_step=0.000367, global_step=1924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  22%|██▎       | 18/80 [02:08<06:59,  6.77s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.43e-5, train/loss_step=0.0023, global_step=1924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]   Epoch 96:  24%|██▍       | 19/80 [02:10<06:38,  6.53s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.43e-5, train/loss_step=0.0023, global_step=1924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  24%|██▍       | 19/80 [02:10<06:38,  6.53s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000319, train/loss_step=0.0247, global_step=1924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  25%|██▌       | 20/80 [02:11<06:14,  6.24s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.0247, train/loss_vlb_step=0.000319, train/loss_step=0.0247, global_step=1924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  25%|██▌       | 20/80 [02:11<06:14,  6.24s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=5.41e-6, train/loss_step=0.000344, global_step=1924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  26%|██▋       | 21/80 [02:23<06:25,  6.54s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=5.41e-6, train/loss_step=0.000344, global_step=1924.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  26%|██▋       | 21/80 [02:23<06:25,  6.54s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.86e-5, train/loss_step=0.0024, global_step=1925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]    Epoch 96:  28%|██▊       | 22/80 [02:24<06:04,  6.28s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.86e-5, train/loss_step=0.0024, global_step=1925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  28%|██▊       | 22/80 [02:24<06:04,  6.28s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000379, train/loss_vlb_step=2.2e-6, train/loss_step=0.000379, global_step=1925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  29%|██▉       | 23/80 [02:24<05:44,  6.04s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000379, train/loss_vlb_step=2.2e-6, train/loss_step=0.000379, global_step=1925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  29%|██▉       | 23/80 [02:24<05:44,  6.04s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.14e-5, train/loss_step=0.00873, global_step=1925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386] Epoch 96:  30%|███       | 24/80 [02:47<06:15,  6.70s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=3.14e-5, train/loss_step=0.00873, global_step=1925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  30%|███       | 24/80 [02:47<06:15,  6.70s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=2.51e-6, train/loss_step=0.000378, global_step=1925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  31%|███▏      | 25/80 [02:48<05:55,  6.47s/it, loss=0.00545, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=2.51e-6, train/loss_step=0.000378, global_step=1925.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  31%|███▏      | 25/80 [02:48<05:55,  6.47s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=1.65e-5, train/loss_step=0.00472, global_step=1926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  32%|███▎      | 26/80 [02:48<05:37,  6.25s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=1.65e-5, train/loss_step=0.00472, global_step=1926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  32%|███▎      | 26/80 [02:48<05:37,  6.25s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=1.88e-5, train/loss_step=0.00522, global_step=1926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  34%|███▍      | 27/80 [02:50<05:22,  6.09s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=1.88e-5, train/loss_step=0.00522, global_step=1926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  34%|███▍      | 27/80 [02:50<05:22,  6.09s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=5.21e-5, train/loss_step=0.00916, global_step=1926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  35%|███▌      | 28/80 [02:50<05:06,  5.90s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00916, train/loss_vlb_step=5.21e-5, train/loss_step=0.00916, global_step=1926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  35%|███▌      | 28/80 [02:50<05:06,  5.90s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000127, train/loss_vlb_step=5.24e-7, train/loss_step=0.000127, global_step=1926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  36%|███▋      | 29/80 [03:10<05:24,  6.36s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000127, train/loss_vlb_step=5.24e-7, train/loss_step=0.000127, global_step=1926.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  36%|███▋      | 29/80 [03:10<05:24,  6.36s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=1.56e-5, train/loss_step=0.00454, global_step=1927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  38%|███▊      | 30/80 [03:11<05:08,  6.17s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=1.56e-5, train/loss_step=0.00454, global_step=1927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  38%|███▊      | 30/80 [03:11<05:08,  6.17s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000986, train/loss_vlb_step=4.51e-6, train/loss_step=0.000986, global_step=1927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  39%|███▉      | 31/80 [03:11<04:53,  5.99s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000986, train/loss_vlb_step=4.51e-6, train/loss_step=0.000986, global_step=1927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  39%|███▉      | 31/80 [03:11<04:53,  5.99s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.1e-5, train/loss_step=0.00566, global_step=1927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]   Epoch 96:  40%|████      | 32/80 [03:30<05:06,  6.38s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00566, train/loss_vlb_step=2.1e-5, train/loss_step=0.00566, global_step=1927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  40%|████      | 32/80 [03:30<05:06,  6.38s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=2.21e-6, train/loss_step=0.00057, global_step=1927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  41%|████▏     | 33/80 [03:30<04:51,  6.20s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00057, train/loss_vlb_step=2.21e-6, train/loss_step=0.00057, global_step=1927.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  41%|████▏     | 33/80 [03:30<04:51,  6.20s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.52e-6, train/loss_step=0.00142, global_step=1928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  42%|████▎     | 34/80 [03:31<04:37,  6.04s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=5.52e-6, train/loss_step=0.00142, global_step=1928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  42%|████▎     | 34/80 [03:31<04:37,  6.04s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=1.47e-5, train/loss_step=0.00424, global_step=1928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  44%|████▍     | 35/80 [03:31<04:24,  5.89s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00424, train/loss_vlb_step=1.47e-5, train/loss_step=0.00424, global_step=1928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  44%|████▍     | 35/80 [03:31<04:24,  5.89s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.56e-5, train/loss_step=0.0114, global_step=1928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  45%|████▌     | 36/80 [03:32<04:12,  5.74s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=5.56e-5, train/loss_step=0.0114, global_step=1928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  45%|████▌     | 36/80 [03:32<04:12,  5.74s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.66e-6, train/loss_step=0.00174, global_step=1928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  46%|████▋     | 37/80 [03:52<04:23,  6.12s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=6.66e-6, train/loss_step=0.00174, global_step=1928.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  46%|████▋     | 37/80 [03:52<04:23,  6.12s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.4e-5, train/loss_step=0.0101, global_step=1929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]   Epoch 96:  48%|████▊     | 38/80 [03:52<04:10,  5.97s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.4e-5, train/loss_step=0.0101, global_step=1929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  48%|████▊     | 38/80 [03:52<04:10,  5.97s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000903, train/loss_vlb_step=1.37e-5, train/loss_step=0.000903, global_step=1929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  49%|████▉     | 39/80 [03:53<03:59,  5.84s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000903, train/loss_vlb_step=1.37e-5, train/loss_step=0.000903, global_step=1929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  49%|████▉     | 39/80 [03:53<03:59,  5.84s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.79e-6, train/loss_step=0.000387, global_step=1929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  50%|█████     | 40/80 [04:14<04:07,  6.20s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=1.79e-6, train/loss_step=0.000387, global_step=1929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  50%|█████     | 40/80 [04:14<04:07,  6.20s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1e-6, train/loss_step=0.000261, global_step=1929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]   Epoch 96:  51%|█████▏    | 41/80 [04:14<03:56,  6.06s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1e-6, train/loss_step=0.000261, global_step=1929.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  51%|█████▏    | 41/80 [04:14<03:56,  6.06s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=3.56e-5, train/loss_step=0.00183, global_step=1930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  52%|█████▎    | 42/80 [04:15<03:45,  5.93s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=3.56e-5, train/loss_step=0.00183, global_step=1930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  52%|█████▎    | 42/80 [04:15<03:45,  5.93s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.97e-5, train/loss_step=0.00156, global_step=1930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386] Epoch 96:  54%|█████▍    | 43/80 [04:15<03:34,  5.81s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.97e-5, train/loss_step=0.00156, global_step=1930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  54%|█████▍    | 43/80 [04:15<03:34,  5.81s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=5.43e-6, train/loss_step=0.000373, global_step=1930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  55%|█████▌    | 44/80 [04:16<03:24,  5.69s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000373, train/loss_vlb_step=5.43e-6, train/loss_step=0.000373, global_step=1930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  55%|█████▌    | 44/80 [04:16<03:24,  5.69s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.71e-5, train/loss_step=0.00172, global_step=1930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  56%|█████▋    | 45/80 [04:28<03:24,  5.84s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=1.71e-5, train/loss_step=0.00172, global_step=1930.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  56%|█████▋    | 45/80 [04:28<03:24,  5.84s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000932, train/loss_vlb_step=3.42e-6, train/loss_step=0.000932, global_step=1931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  57%|█████▊    | 46/80 [04:29<03:14,  5.72s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000932, train/loss_vlb_step=3.42e-6, train/loss_step=0.000932, global_step=1931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  57%|█████▊    | 46/80 [04:29<03:14,  5.72s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=8.8e-6, train/loss_step=0.00228, global_step=1931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]   Epoch 96:  59%|█████▉    | 47/80 [04:39<03:11,  5.82s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=8.8e-6, train/loss_step=0.00228, global_step=1931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  59%|█████▉    | 47/80 [04:39<03:11,  5.82s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=7.94e-5, train/loss_step=0.0205, global_step=1931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386] Epoch 96:  60%|██████    | 48/80 [04:57<03:13,  6.06s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=7.94e-5, train/loss_step=0.0205, global_step=1931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  60%|██████    | 48/80 [04:57<03:13,  6.06s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.45e-6, train/loss_step=0.000256, global_step=1931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  61%|██████▏   | 49/80 [04:57<03:04,  5.95s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.45e-6, train/loss_step=0.000256, global_step=1931.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  61%|██████▏   | 49/80 [04:57<03:04,  5.95s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.19e-5, train/loss_step=0.00328, global_step=1932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  62%|██████▎   | 50/80 [04:58<02:55,  5.84s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.00328, train/loss_vlb_step=1.19e-5, train/loss_step=0.00328, global_step=1932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  62%|██████▎   | 50/80 [04:58<02:55,  5.84s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.1e-6, train/loss_step=0.00126, global_step=1932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386] Epoch 96:  64%|██████▍   | 51/80 [04:58<02:46,  5.74s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=6.1e-6, train/loss_step=0.00126, global_step=1932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  64%|██████▍   | 51/80 [04:58<02:46,  5.74s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=1.63e-5, train/loss_step=0.00376, global_step=1932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  65%|██████▌   | 52/80 [04:59<02:38,  5.65s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.00376, train/loss_vlb_step=1.63e-5, train/loss_step=0.00376, global_step=1932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  65%|██████▌   | 52/80 [04:59<02:38,  5.65s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=4.4e-5, train/loss_step=0.0035, global_step=1932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]   Epoch 96:  66%|██████▋   | 53/80 [05:12<02:36,  5.79s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.0035, train/loss_vlb_step=4.4e-5, train/loss_step=0.0035, global_step=1932.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  66%|██████▋   | 53/80 [05:12<02:36,  5.79s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000461, train/loss_vlb_step=1.89e-6, train/loss_step=0.000461, global_step=1933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  68%|██████▊   | 54/80 [05:13<02:28,  5.70s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000461, train/loss_vlb_step=1.89e-6, train/loss_step=0.000461, global_step=1933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  68%|██████▊   | 54/80 [05:13<02:28,  5.70s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000668, train/loss_vlb_step=2.84e-6, train/loss_step=0.000668, global_step=1933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  69%|██████▉   | 55/80 [05:19<02:22,  5.70s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000668, train/loss_vlb_step=2.84e-6, train/loss_step=0.000668, global_step=1933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  69%|██████▉   | 55/80 [05:19<02:22,  5.70s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=9.96e-7, train/loss_step=0.000218, global_step=1933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386] Epoch 96:  70%|███████   | 56/80 [05:35<02:21,  5.88s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=9.96e-7, train/loss_step=0.000218, global_step=1933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  70%|███████   | 56/80 [05:35<02:21,  5.88s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000112, train/loss_vlb_step=4.93e-7, train/loss_step=0.000112, global_step=1933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  71%|███████▏  | 57/80 [05:35<02:13,  5.79s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000112, train/loss_vlb_step=4.93e-7, train/loss_step=0.000112, global_step=1933.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  71%|███████▏  | 57/80 [05:35<02:13,  5.79s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.000992, train/loss_vlb_step=0.000428, train/loss_step=0.000992, global_step=1934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  72%|███████▎  | 58/80 [05:38<02:06,  5.74s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.000992, train/loss_vlb_step=0.000428, train/loss_step=0.000992, global_step=1934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  72%|███████▎  | 58/80 [05:38<02:06,  5.74s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.67e-5, train/loss_step=0.00858, global_step=1934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]   Epoch 96:  74%|███████▍  | 59/80 [05:39<01:58,  5.65s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00858, train/loss_vlb_step=4.67e-5, train/loss_step=0.00858, global_step=1934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  74%|███████▍  | 59/80 [05:39<01:58,  5.65s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.16e-5, train/loss_step=0.00316, global_step=1934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  75%|███████▌  | 60/80 [05:39<01:51,  5.57s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00316, train/loss_vlb_step=1.16e-5, train/loss_step=0.00316, global_step=1934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  75%|███████▌  | 60/80 [05:39<01:51,  5.57s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=1.04e-6, train/loss_step=0.00024, global_step=1934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  76%|███████▋  | 61/80 [06:00<01:50,  5.81s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=1.04e-6, train/loss_step=0.00024, global_step=1934.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  76%|███████▋  | 61/80 [06:00<01:50,  5.81s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000655, train/loss_vlb_step=4.47e-5, train/loss_step=0.000655, global_step=1935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  78%|███████▊  | 62/80 [06:00<01:43,  5.73s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000655, train/loss_vlb_step=4.47e-5, train/loss_step=0.000655, global_step=1935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  78%|███████▊  | 62/80 [06:00<01:43,  5.73s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=4.17e-5, train/loss_step=0.00752, global_step=1935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  79%|███████▉  | 63/80 [06:01<01:35,  5.65s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00752, train/loss_vlb_step=4.17e-5, train/loss_step=0.00752, global_step=1935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  79%|███████▉  | 63/80 [06:01<01:35,  5.65s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=8.58e-7, train/loss_step=0.000199, global_step=1935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  80%|████████  | 64/80 [06:21<01:33,  5.87s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=8.58e-7, train/loss_step=0.000199, global_step=1935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  80%|████████  | 64/80 [06:21<01:33,  5.87s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.78e-6, train/loss_step=0.000314, global_step=1935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  81%|████████▏ | 65/80 [06:22<01:26,  5.79s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.78e-6, train/loss_step=0.000314, global_step=1935.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  81%|████████▏ | 65/80 [06:22<01:26,  5.79s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=8.04e-7, train/loss_step=0.000164, global_step=1936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=8.04e-7, train/loss_step=0.000164, global_step=1936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000123, train/loss_vlb_step=4.94e-7, train/loss_step=0.000123, global_step=1936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386] Epoch 96:  84%|████████▍ | 67/80 [06:23<01:13,  5.63s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000123, train/loss_vlb_step=4.94e-7, train/loss_step=0.000123, global_step=1936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  84%|████████▍ | 67/80 [06:23<01:13,  5.63s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.94e-6, train/loss_step=0.000304, global_step=1936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  85%|████████▌ | 68/80 [06:23<01:06,  5.56s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.94e-6, train/loss_step=0.000304, global_step=1936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  85%|████████▌ | 68/80 [06:23<01:06,  5.56s/it, loss=0.00188, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.67e-6, train/loss_step=0.00211, global_step=1936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  86%|████████▋ | 69/80 [06:30<01:01,  5.57s/it, loss=0.00188, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=8.67e-6, train/loss_step=0.00211, global_step=1936.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  86%|████████▋ | 69/80 [06:30<01:01,  5.57s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=1.84e-5, train/loss_step=0.00462, global_step=1937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  88%|████████▊ | 70/80 [06:30<00:55,  5.50s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=1.84e-5, train/loss_step=0.00462, global_step=1937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  88%|████████▊ | 70/80 [06:30<00:55,  5.50s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.08e-5, train/loss_step=0.00312, global_step=1937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  89%|████████▉ | 71/80 [06:31<00:48,  5.43s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.08e-5, train/loss_step=0.00312, global_step=1937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  89%|████████▉ | 71/80 [06:31<00:48,  5.43s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=6.78e-5, train/loss_step=0.00967, global_step=1937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  90%|█████████ | 72/80 [06:56<00:45,  5.71s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=6.78e-5, train/loss_step=0.00967, global_step=1937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  90%|█████████ | 72/80 [06:56<00:45,  5.71s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.58e-5, train/loss_step=0.00428, global_step=1937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.58e-5, train/loss_step=0.00428, global_step=1937.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000687, train/loss_vlb_step=2.43e-6, train/loss_step=0.000687, global_step=1938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000687, train/loss_vlb_step=2.43e-6, train/loss_step=0.000687, global_step=1938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=3.2e-6, train/loss_step=0.000589, global_step=1938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386] Epoch 96:  94%|█████████▍| 75/80 [06:58<00:27,  5.50s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000589, train/loss_vlb_step=3.2e-6, train/loss_step=0.000589, global_step=1938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  94%|█████████▍| 75/80 [06:58<00:27,  5.50s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=5.71e-7, train/loss_step=0.000154, global_step=1938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  95%|█████████▌| 76/80 [06:58<00:21,  5.44s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=5.71e-7, train/loss_step=0.000154, global_step=1938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  95%|█████████▌| 76/80 [06:58<00:21,  5.44s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=7.84e-7, train/loss_step=0.000221, global_step=1938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  96%|█████████▋| 77/80 [07:10<00:16,  5.51s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=7.84e-7, train/loss_step=0.000221, global_step=1938.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  96%|█████████▋| 77/80 [07:10<00:16,  5.51s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=7.62e-5, train/loss_step=0.00827, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 96:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=7.62e-5, train/loss_step=0.00827, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.000556, train/loss_vlb_step=5.53e-6, train/loss_step=0.000556, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  99%|█████████▉| 79/80 [07:10<00:05,  5.39s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.000556, train/loss_vlb_step=5.53e-6, train/loss_step=0.000556, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96:  99%|█████████▉| 79/80 [07:10<00:05,  5.39s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=2.64e-6, train/loss_step=0.000374, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=2.64e-6, train/loss_step=0.000374, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 96: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.91e-6, train/loss_step=0.000551, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Average Epoch time: 431.50 seconds
+Average Peak memory 29566.11MiB
+Epoch 96:   0%|          | 0/80 [00:00<00:00, 4609.13it/s, loss=0.00222, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.91e-6, train/loss_step=0.000551, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 97:   0%|          | 0/80 [00:00<00:00, 1763.05it/s, loss=0.00222, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.91e-6, train/loss_step=0.000551, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]Epoch 97:   1%|▏         | 1/80 [00:41<27:07, 20.60s/it, loss=0.00222, v_num=0, train/loss_simple_step=0.000551, train/loss_vlb_step=2.91e-6, train/loss_step=0.000551, global_step=1939.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=8.05e-5, train/loss_epoch=0.00386]  Epoch 97:   1%|▏         | 1/80 [00:41<27:07, 20.60s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=9.98e-7, train/loss_step=0.000199, global_step=1940.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]   Epoch 97:   2%|▎         | 2/80 [00:41<18:03, 13.89s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=9.98e-7, train/loss_step=0.000199, global_step=1940.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   2%|▎         | 2/80 [00:41<18:03, 13.89s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.000174, train/loss_vlb_step=6.86e-7, train/loss_step=0.000174, global_step=1940.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   4%|▍         | 3/80 [00:42<13:31, 10.54s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.000174, train/loss_vlb_step=6.86e-7, train/loss_step=0.000174, global_step=1940.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   4%|▍         | 3/80 [00:42<13:31, 10.54s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=6.02e-6, train/loss_step=0.000313, global_step=1940.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   5%|▌         | 4/80 [00:42<10:48,  8.54s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000313, train/loss_vlb_step=6.02e-6, train/loss_step=0.000313, global_step=1940.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   5%|▌         | 4/80 [00:42<10:48,  8.54s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.000214, train/loss_vlb_step=8.32e-7, train/loss_step=0.000214, global_step=1940.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   6%|▋         | 5/80 [00:43<08:59,  7.20s/it, loss=0.00183, v_num=0, train/loss_simple_step=0.000214, train/loss_vlb_step=8.32e-7, train/loss_step=0.000214, global_step=1940.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   6%|▋         | 5/80 [00:43<08:59,  7.20s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=1.07e-6, train/loss_step=0.000165, global_step=1941.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   8%|▊         | 6/80 [00:44<07:53,  6.40s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=1.07e-6, train/loss_step=0.000165, global_step=1941.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   8%|▊         | 6/80 [00:44<07:53,  6.40s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.47e-5, train/loss_step=0.013, global_step=1941.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]      Epoch 97:   9%|▉         | 7/80 [00:45<06:53,  5.67s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=4.47e-5, train/loss_step=0.013, global_step=1941.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:   9%|▉         | 7/80 [00:45<06:53,  5.67s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.94e-5, train/loss_step=0.00201, global_step=1941.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  10%|█         | 8/80 [01:20<10:45,  8.97s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.94e-5, train/loss_step=0.00201, global_step=1941.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  10%|█         | 8/80 [01:20<10:45,  8.97s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=3.78e-5, train/loss_step=0.00908, global_step=1941.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  11%|█▏        | 9/80 [01:22<09:48,  8.29s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00908, train/loss_vlb_step=3.78e-5, train/loss_step=0.00908, global_step=1941.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  11%|█▏        | 9/80 [01:22<09:48,  8.29s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.13e-5, train/loss_step=0.0023, global_step=1942.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]   Epoch 97:  12%|█▎        | 10/80 [01:23<08:50,  7.58s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.0023, train/loss_vlb_step=1.13e-5, train/loss_step=0.0023, global_step=1942.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  12%|█▎        | 10/80 [01:23<08:50,  7.58s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=2.47e-6, train/loss_step=0.000268, global_step=1942.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  14%|█▍        | 11/80 [01:26<08:18,  7.23s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=2.47e-6, train/loss_step=0.000268, global_step=1942.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  14%|█▍        | 11/80 [01:26<08:18,  7.23s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=0.000452, train/loss_step=0.00274, global_step=1942.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039] Epoch 97:  15%|█▌        | 12/80 [01:27<07:36,  6.71s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=0.000452, train/loss_step=0.00274, global_step=1942.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  15%|█▌        | 12/80 [01:27<07:36,  6.71s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=2.13e-5, train/loss_step=0.0061, global_step=1942.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]    Epoch 97:  16%|█▋        | 13/80 [01:27<06:59,  6.27s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.0061, train/loss_vlb_step=2.13e-5, train/loss_step=0.0061, global_step=1942.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  16%|█▋        | 13/80 [01:27<06:59,  6.27s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=6.73e-5, train/loss_step=0.0123, global_step=1943.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  18%|█▊        | 14/80 [01:28<06:28,  5.88s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=6.73e-5, train/loss_step=0.0123, global_step=1943.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  18%|█▊        | 14/80 [01:28<06:28,  5.88s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=2.83e-5, train/loss_step=0.00664, global_step=1943.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  19%|█▉        | 15/80 [01:29<06:03,  5.59s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00664, train/loss_vlb_step=2.83e-5, train/loss_step=0.00664, global_step=1943.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  19%|█▉        | 15/80 [01:29<06:03,  5.59s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.22e-5, train/loss_step=0.00637, global_step=1943.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  20%|██        | 16/80 [01:55<07:15,  6.80s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.22e-5, train/loss_step=0.00637, global_step=1943.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  20%|██        | 16/80 [01:55<07:15,  6.80s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=5.56e-5, train/loss_step=0.000798, global_step=1943.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  21%|██▏       | 17/80 [02:06<07:23,  7.04s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=5.56e-5, train/loss_step=0.000798, global_step=1943.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  21%|██▏       | 17/80 [02:06<07:23,  7.04s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=4.11e-6, train/loss_step=0.00088, global_step=1944.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  22%|██▎       | 18/80 [02:07<06:55,  6.69s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=4.11e-6, train/loss_step=0.00088, global_step=1944.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  22%|██▎       | 18/80 [02:07<06:55,  6.69s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=5.08e-6, train/loss_step=0.000555, global_step=1944.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  24%|██▍       | 19/80 [02:10<06:39,  6.55s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=5.08e-6, train/loss_step=0.000555, global_step=1944.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  24%|██▍       | 19/80 [02:10<06:39,  6.55s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=1.46e-6, train/loss_step=0.000235, global_step=1944.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  25%|██▌       | 20/80 [02:11<06:15,  6.26s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=1.46e-6, train/loss_step=0.000235, global_step=1944.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  25%|██▌       | 20/80 [02:11<06:15,  6.26s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=1.4e-5, train/loss_step=0.00422, global_step=1944.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]   Epoch 97:  26%|██▋       | 21/80 [02:12<05:54,  6.00s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=1.4e-5, train/loss_step=0.00422, global_step=1944.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  26%|██▋       | 21/80 [02:12<05:54,  6.00s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000948, train/loss_vlb_step=4.19e-6, train/loss_step=0.000948, global_step=1945.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  28%|██▊       | 22/80 [02:12<05:34,  5.76s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000948, train/loss_vlb_step=4.19e-6, train/loss_step=0.000948, global_step=1945.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  28%|██▊       | 22/80 [02:12<05:34,  5.76s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.52e-5, train/loss_step=0.00539, global_step=1945.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  29%|██▉       | 23/80 [02:13<05:15,  5.54s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=2.52e-5, train/loss_step=0.00539, global_step=1945.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  29%|██▉       | 23/80 [02:13<05:15,  5.54s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.52e-5, train/loss_step=0.0045, global_step=1945.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  30%|███       | 24/80 [02:39<05:58,  6.39s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.52e-5, train/loss_step=0.0045, global_step=1945.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  30%|███       | 24/80 [02:39<05:58,  6.39s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000173, train/loss_vlb_step=7.62e-7, train/loss_step=0.000173, global_step=1945.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  31%|███▏      | 25/80 [02:41<05:42,  6.22s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000173, train/loss_vlb_step=7.62e-7, train/loss_step=0.000173, global_step=1945.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  31%|███▏      | 25/80 [02:41<05:42,  6.22s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.37e-6, train/loss_step=0.000275, global_step=1946.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  32%|███▎      | 26/80 [02:42<05:24,  6.01s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.37e-6, train/loss_step=0.000275, global_step=1946.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  32%|███▎      | 26/80 [02:42<05:24,  6.01s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=8.52e-6, train/loss_step=0.00222, global_step=1946.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]   Epoch 97:  34%|███▍      | 27/80 [02:48<05:19,  6.02s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=8.52e-6, train/loss_step=0.00222, global_step=1946.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  34%|███▍      | 27/80 [02:48<05:19,  6.02s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.94e-5, train/loss_step=0.00408, global_step=1946.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  35%|███▌      | 28/80 [03:01<05:25,  6.25s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.94e-5, train/loss_step=0.00408, global_step=1946.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  35%|███▌      | 28/80 [03:01<05:25,  6.25s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.23e-5, train/loss_step=0.00329, global_step=1946.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  36%|███▋      | 29/80 [03:01<05:09,  6.06s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.23e-5, train/loss_step=0.00329, global_step=1946.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  36%|███▋      | 29/80 [03:01<05:09,  6.06s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=3.04e-6, train/loss_step=0.000631, global_step=1947.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  38%|███▊      | 30/80 [03:02<04:54,  5.88s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000631, train/loss_vlb_step=3.04e-6, train/loss_step=0.000631, global_step=1947.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  38%|███▊      | 30/80 [03:02<04:54,  5.88s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.000178, train/loss_step=0.0211, global_step=1947.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]   Epoch 97:  39%|███▉      | 31/80 [03:02<04:39,  5.71s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.000178, train/loss_step=0.0211, global_step=1947.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  39%|███▉      | 31/80 [03:02<04:39,  5.71s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000493, train/loss_vlb_step=1.89e-6, train/loss_step=0.000493, global_step=1947.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  40%|████      | 32/80 [03:33<05:10,  6.46s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000493, train/loss_vlb_step=1.89e-6, train/loss_step=0.000493, global_step=1947.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  40%|████      | 32/80 [03:33<05:10,  6.46s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=3.78e-5, train/loss_step=0.00251, global_step=1947.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  41%|████▏     | 33/80 [03:33<04:55,  6.28s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00251, train/loss_vlb_step=3.78e-5, train/loss_step=0.00251, global_step=1947.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  41%|████▏     | 33/80 [03:33<04:55,  6.28s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=2.57e-6, train/loss_step=0.000285, global_step=1948.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  42%|████▎     | 34/80 [03:34<04:41,  6.12s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000285, train/loss_vlb_step=2.57e-6, train/loss_step=0.000285, global_step=1948.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  42%|████▎     | 34/80 [03:34<04:41,  6.12s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000664, train/loss_vlb_step=2.87e-6, train/loss_step=0.000664, global_step=1948.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  44%|████▍     | 35/80 [03:34<04:28,  5.96s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.000664, train/loss_vlb_step=2.87e-6, train/loss_step=0.000664, global_step=1948.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  44%|████▍     | 35/80 [03:34<04:28,  5.96s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=7.54e-5, train/loss_step=0.00726, global_step=1948.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  45%|████▌     | 36/80 [03:37<04:19,  5.89s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00726, train/loss_vlb_step=7.54e-5, train/loss_step=0.00726, global_step=1948.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  45%|████▌     | 36/80 [03:37<04:19,  5.89s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=1.06e-5, train/loss_step=0.00157, global_step=1948.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  46%|████▋     | 37/80 [03:38<04:07,  5.75s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00157, train/loss_vlb_step=1.06e-5, train/loss_step=0.00157, global_step=1948.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  46%|████▋     | 37/80 [03:38<04:07,  5.75s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=5.29e-5, train/loss_step=0.000887, global_step=1949.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  48%|████▊     | 38/80 [03:40<03:56,  5.64s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=5.29e-5, train/loss_step=0.000887, global_step=1949.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  48%|████▊     | 38/80 [03:40<03:56,  5.64s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.8e-6, train/loss_step=0.00038, global_step=1949.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]   Epoch 97:  49%|████▉     | 39/80 [03:42<03:47,  5.56s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.00038, train/loss_vlb_step=1.8e-6, train/loss_step=0.00038, global_step=1949.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  49%|████▉     | 39/80 [03:42<03:47,  5.56s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=8.12e-6, train/loss_step=0.00227, global_step=1949.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  50%|█████     | 40/80 [04:15<04:09,  6.23s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00227, train/loss_vlb_step=8.12e-6, train/loss_step=0.00227, global_step=1949.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  50%|█████     | 40/80 [04:15<04:09,  6.23s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.11e-5, train/loss_step=0.00615, global_step=1949.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  51%|█████▏    | 41/80 [04:16<03:57,  6.10s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00615, train/loss_vlb_step=2.11e-5, train/loss_step=0.00615, global_step=1949.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  51%|█████▏    | 41/80 [04:16<03:57,  6.10s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=3.38e-6, train/loss_step=0.000777, global_step=1950.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  52%|█████▎    | 42/80 [04:16<03:46,  5.97s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=3.38e-6, train/loss_step=0.000777, global_step=1950.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  52%|█████▎    | 42/80 [04:16<03:46,  5.97s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=1.87e-5, train/loss_step=0.00522, global_step=1950.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  54%|█████▍    | 43/80 [04:24<03:42,  6.02s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=1.87e-5, train/loss_step=0.00522, global_step=1950.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  54%|█████▍    | 43/80 [04:24<03:42,  6.02s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.13e-5, train/loss_step=0.00534, global_step=1950.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  55%|█████▌    | 44/80 [04:25<03:32,  5.90s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00534, train/loss_vlb_step=2.13e-5, train/loss_step=0.00534, global_step=1950.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  55%|█████▌    | 44/80 [04:25<03:32,  5.90s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.78e-6, train/loss_step=0.00136, global_step=1950.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  56%|█████▋    | 45/80 [04:25<03:22,  5.78s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.78e-6, train/loss_step=0.00136, global_step=1950.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  56%|█████▋    | 45/80 [04:25<03:22,  5.78s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.77e-5, train/loss_step=0.00243, global_step=1951.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  57%|█████▊    | 46/80 [04:26<03:12,  5.67s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00243, train/loss_vlb_step=1.77e-5, train/loss_step=0.00243, global_step=1951.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  57%|█████▊    | 46/80 [04:26<03:12,  5.67s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=0.000193, train/loss_step=0.006, global_step=1951.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]   Epoch 97:  59%|█████▉    | 47/80 [04:26<03:03,  5.56s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=0.000193, train/loss_step=0.006, global_step=1951.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  59%|█████▉    | 47/80 [04:26<03:03,  5.56s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=7.99e-5, train/loss_step=0.00562, global_step=1951.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  60%|██████    | 48/80 [05:02<03:17,  6.18s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00562, train/loss_vlb_step=7.99e-5, train/loss_step=0.00562, global_step=1951.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  60%|██████    | 48/80 [05:02<03:17,  6.18s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=4.11e-5, train/loss_step=0.00666, global_step=1951.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  61%|██████▏   | 49/80 [05:03<03:08,  6.07s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00666, train/loss_vlb_step=4.11e-5, train/loss_step=0.00666, global_step=1951.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  61%|██████▏   | 49/80 [05:03<03:08,  6.07s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00081, train/loss_vlb_step=5.07e-6, train/loss_step=0.00081, global_step=1952.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  62%|██████▎   | 50/80 [05:03<02:58,  5.96s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00081, train/loss_vlb_step=5.07e-6, train/loss_step=0.00081, global_step=1952.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  62%|██████▎   | 50/80 [05:03<02:58,  5.96s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.89e-6, train/loss_step=0.00135, global_step=1952.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039] Epoch 97:  64%|██████▍   | 51/80 [05:04<02:49,  5.86s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.89e-6, train/loss_step=0.00135, global_step=1952.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  64%|██████▍   | 51/80 [05:04<02:49,  5.86s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.33e-5, train/loss_step=0.00395, global_step=1952.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00395, train/loss_vlb_step=1.33e-5, train/loss_step=0.00395, global_step=1952.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=7.44e-5, train/loss_step=0.0126, global_step=1952.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0126, train/loss_vlb_step=7.44e-5, train/loss_step=0.0126, global_step=1952.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=2.12e-5, train/loss_step=0.00233, global_step=1953.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=2.12e-5, train/loss_step=0.00233, global_step=1953.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.22e-6, train/loss_step=0.00026, global_step=1953.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  69%|██████▉   | 55/80 [05:12<02:19,  5.57s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.22e-6, train/loss_step=0.00026, global_step=1953.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  69%|██████▉   | 55/80 [05:12<02:19,  5.57s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=3.28e-6, train/loss_step=0.000375, global_step=1953.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  70%|███████   | 56/80 [05:44<02:25,  6.05s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000375, train/loss_vlb_step=3.28e-6, train/loss_step=0.000375, global_step=1953.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  70%|███████   | 56/80 [05:44<02:25,  6.05s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=7.44e-5, train/loss_step=0.0129, global_step=1953.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]    Epoch 97:  71%|███████▏  | 57/80 [05:45<02:17,  5.96s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=7.44e-5, train/loss_step=0.0129, global_step=1953.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  71%|███████▏  | 57/80 [05:45<02:17,  5.96s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=1.82e-6, train/loss_step=0.000381, global_step=1954.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  72%|███████▎  | 58/80 [05:45<02:09,  5.86s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=1.82e-6, train/loss_step=0.000381, global_step=1954.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  72%|███████▎  | 58/80 [05:45<02:09,  5.86s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=2.74e-5, train/loss_step=0.00728, global_step=1954.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]   Epoch 97:  74%|███████▍  | 59/80 [05:46<02:01,  5.77s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00728, train/loss_vlb_step=2.74e-5, train/loss_step=0.00728, global_step=1954.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  74%|███████▍  | 59/80 [05:46<02:01,  5.77s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=6.23e-6, train/loss_step=0.00133, global_step=1954.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  75%|███████▌  | 60/80 [06:04<01:59,  5.97s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=6.23e-6, train/loss_step=0.00133, global_step=1954.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  75%|███████▌  | 60/80 [06:04<01:59,  5.97s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=3.9e-5, train/loss_step=0.00909, global_step=1954.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  76%|███████▋  | 61/80 [06:04<01:51,  5.89s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00909, train/loss_vlb_step=3.9e-5, train/loss_step=0.00909, global_step=1954.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  76%|███████▋  | 61/80 [06:04<01:51,  5.89s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=8.03e-6, train/loss_step=0.00216, global_step=1955.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  78%|███████▊  | 62/80 [06:05<01:44,  5.80s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=8.03e-6, train/loss_step=0.00216, global_step=1955.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  78%|███████▊  | 62/80 [06:05<01:44,  5.80s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000383, train/loss_vlb_step=1.58e-6, train/loss_step=0.000383, global_step=1955.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  79%|███████▉  | 63/80 [06:05<01:37,  5.72s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000383, train/loss_vlb_step=1.58e-6, train/loss_step=0.000383, global_step=1955.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  79%|███████▉  | 63/80 [06:05<01:37,  5.72s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=7.59e-5, train/loss_step=0.0135, global_step=1955.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]    Epoch 97:  80%|████████  | 64/80 [06:23<01:34,  5.90s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=7.59e-5, train/loss_step=0.0135, global_step=1955.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  80%|████████  | 64/80 [06:23<01:34,  5.90s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=1.81e-6, train/loss_step=0.000455, global_step=1955.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  81%|████████▏ | 65/80 [06:24<01:27,  5.82s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=1.81e-6, train/loss_step=0.000455, global_step=1955.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  81%|████████▏ | 65/80 [06:24<01:27,  5.82s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.56e-5, train/loss_step=0.00604, global_step=1956.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  82%|████████▎ | 66/80 [06:24<01:20,  5.74s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00604, train/loss_vlb_step=2.56e-5, train/loss_step=0.00604, global_step=1956.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  82%|████████▎ | 66/80 [06:24<01:20,  5.74s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=8.27e-5, train/loss_step=0.00735, global_step=1956.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  84%|████████▍ | 67/80 [06:32<01:15,  5.77s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=8.27e-5, train/loss_step=0.00735, global_step=1956.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  84%|████████▍ | 67/80 [06:32<01:15,  5.77s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=9.23e-6, train/loss_step=0.00179, global_step=1956.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  85%|████████▌ | 68/80 [06:36<01:09,  5.75s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=9.23e-6, train/loss_step=0.00179, global_step=1956.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  85%|████████▌ | 68/80 [06:36<01:09,  5.75s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.97e-5, train/loss_step=0.00149, global_step=1956.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.97e-5, train/loss_step=0.00149, global_step=1956.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.35e-6, train/loss_step=0.000471, global_step=1957.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  88%|████████▊ | 70/80 [06:37<00:56,  5.61s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.35e-6, train/loss_step=0.000471, global_step=1957.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  88%|████████▊ | 70/80 [06:37<00:56,  5.61s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=6.48e-6, train/loss_step=0.000673, global_step=1957.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  89%|████████▉ | 71/80 [06:38<00:49,  5.53s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=6.48e-6, train/loss_step=0.000673, global_step=1957.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  89%|████████▉ | 71/80 [06:38<00:49,  5.53s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000707, train/loss_vlb_step=2.31e-5, train/loss_step=0.000707, global_step=1957.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.000707, train/loss_vlb_step=2.31e-5, train/loss_step=0.000707, global_step=1957.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=4.12e-5, train/loss_step=0.0079, global_step=1957.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]    Epoch 97:  91%|█████████▏| 73/80 [07:01<00:39,  5.69s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=4.12e-5, train/loss_step=0.0079, global_step=1957.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  91%|█████████▏| 73/80 [07:01<00:39,  5.69s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=9.89e-7, train/loss_step=0.000242, global_step=1958.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=9.89e-7, train/loss_step=0.000242, global_step=1958.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  92%|█████████▎| 74/80 [07:01<00:33,  5.62s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.19e-5, train/loss_step=0.00343, global_step=1958.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]   Epoch 97:  94%|█████████▍| 75/80 [07:15<00:28,  5.73s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00343, train/loss_vlb_step=1.19e-5, train/loss_step=0.00343, global_step=1958.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  94%|█████████▍| 75/80 [07:15<00:28,  5.73s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=1.92e-5, train/loss_step=0.00491, global_step=1958.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00491, train/loss_vlb_step=1.92e-5, train/loss_step=0.00491, global_step=1958.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  95%|█████████▌| 76/80 [07:16<00:22,  5.66s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=0.000574, train/loss_step=0.00141, global_step=1958.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=0.000574, train/loss_step=0.00141, global_step=1958.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  96%|█████████▋| 77/80 [07:16<00:16,  5.60s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=1.2e-6, train/loss_step=0.000288, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=1.2e-6, train/loss_step=0.000288, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  98%|█████████▊| 78/80 [07:17<00:11,  5.53s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=4.2e-6, train/loss_step=0.00052, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 97:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=4.2e-6, train/loss_step=0.00052, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97:  99%|█████████▉| 79/80 [07:17<00:05,  5.47s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.35e-6, train/loss_step=0.000355, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.35e-6, train/loss_step=0.000355, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 97: 100%|██████████| 80/80 [07:18<00:00,  5.41s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=3.37e-6, train/loss_step=0.000438, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Average Epoch time: 438.09 seconds
+Average Peak memory 29560.35MiB
+Epoch 97:   0%|          | 0/80 [00:00<00:00, 5793.24it/s, loss=0.00272, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=3.37e-6, train/loss_step=0.000438, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 98:   0%|          | 0/80 [00:00<00:00, 2318.58it/s, loss=0.00272, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=3.37e-6, train/loss_step=0.000438, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]Epoch 98:   1%|▏         | 1/80 [00:38<25:12, 19.15s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=3.37e-6, train/loss_step=0.000438, global_step=1959.0, lr_abs=0.0001, train/loss_simple_epoch=0.0039, train/loss_vlb_epoch=5.84e-5, train/loss_epoch=0.0039]  Epoch 98:   1%|▏         | 1/80 [00:38<25:12, 19.15s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=3.55e-5, train/loss_step=0.00937, global_step=1960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365] Epoch 98:   2%|▎         | 2/80 [00:38<16:48, 12.92s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=3.55e-5, train/loss_step=0.00937, global_step=1960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   2%|▎         | 2/80 [00:38<16:48, 12.92s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000654, train/loss_vlb_step=4.63e-6, train/loss_step=0.000654, global_step=1960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   4%|▍         | 3/80 [00:53<17:18, 13.49s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000654, train/loss_vlb_step=4.63e-6, train/loss_step=0.000654, global_step=1960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   4%|▍         | 3/80 [00:53<17:18, 13.49s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000193, train/loss_vlb_step=1.08e-6, train/loss_step=0.000193, global_step=1960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   5%|▌         | 4/80 [00:54<13:48, 10.90s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000193, train/loss_vlb_step=1.08e-6, train/loss_step=0.000193, global_step=1960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   5%|▌         | 4/80 [00:54<13:48, 10.90s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=9.34e-7, train/loss_step=0.000254, global_step=1960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   6%|▋         | 5/80 [00:55<11:27,  9.17s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=9.34e-7, train/loss_step=0.000254, global_step=1960.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   6%|▋         | 5/80 [00:55<11:27,  9.17s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.03e-5, train/loss_step=0.0027, global_step=1961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]    Epoch 98:   8%|▊         | 6/80 [00:55<09:46,  7.93s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.0027, train/loss_vlb_step=1.03e-5, train/loss_step=0.0027, global_step=1961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   8%|▊         | 6/80 [00:55<09:46,  7.93s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000134, train/loss_vlb_step=7.15e-7, train/loss_step=0.000134, global_step=1961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   9%|▉         | 7/80 [00:55<08:30,  7.00s/it, loss=0.0019, v_num=0, train/loss_simple_step=0.000134, train/loss_vlb_step=7.15e-7, train/loss_step=0.000134, global_step=1961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:   9%|▉         | 7/80 [00:55<08:30,  7.00s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000742, train/loss_vlb_step=4.16e-5, train/loss_step=0.000742, global_step=1961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  10%|█         | 8/80 [01:08<09:07,  7.60s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000742, train/loss_vlb_step=4.16e-5, train/loss_step=0.000742, global_step=1961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  10%|█         | 8/80 [01:08<09:07,  7.60s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000635, train/loss_step=0.017, global_step=1961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]     Epoch 98:  11%|█▏        | 9/80 [01:08<08:09,  6.89s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=0.000635, train/loss_step=0.017, global_step=1961.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  11%|█▏        | 9/80 [01:08<08:09,  6.89s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.31e-5, train/loss_step=0.0218, global_step=1962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  12%|█▎        | 10/80 [01:17<08:12,  7.04s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.0218, train/loss_vlb_step=9.31e-5, train/loss_step=0.0218, global_step=1962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  12%|█▎        | 10/80 [01:17<08:12,  7.04s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=3.13e-5, train/loss_step=0.00868, global_step=1962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  14%|█▍        | 11/80 [01:37<09:20,  8.13s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00868, train/loss_vlb_step=3.13e-5, train/loss_step=0.00868, global_step=1962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  14%|█▍        | 11/80 [01:37<09:20,  8.13s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=9.36e-6, train/loss_step=0.00183, global_step=1962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  15%|█▌        | 12/80 [01:38<08:32,  7.54s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=9.36e-6, train/loss_step=0.00183, global_step=1962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  15%|█▌        | 12/80 [01:38<08:32,  7.54s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=2.14e-6, train/loss_step=0.000324, global_step=1962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  16%|█▋        | 13/80 [01:38<07:51,  7.04s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=2.14e-6, train/loss_step=0.000324, global_step=1962.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  16%|█▋        | 13/80 [01:38<07:51,  7.04s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=6.15e-6, train/loss_step=0.0014, global_step=1963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]    Epoch 98:  18%|█▊        | 14/80 [01:39<07:15,  6.60s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=6.15e-6, train/loss_step=0.0014, global_step=1963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  18%|█▊        | 14/80 [01:39<07:15,  6.60s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.63e-5, train/loss_step=0.00106, global_step=1963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  19%|█▉        | 15/80 [01:39<06:44,  6.22s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00106, train/loss_vlb_step=1.63e-5, train/loss_step=0.00106, global_step=1963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  19%|█▉        | 15/80 [01:39<06:44,  6.22s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=1.84e-5, train/loss_step=0.00521, global_step=1963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  20%|██        | 16/80 [01:49<06:50,  6.42s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00521, train/loss_vlb_step=1.84e-5, train/loss_step=0.00521, global_step=1963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  20%|██        | 16/80 [01:49<06:50,  6.42s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000689, train/loss_vlb_step=8.86e-6, train/loss_step=0.000689, global_step=1963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  21%|██▏       | 17/80 [01:57<06:51,  6.53s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000689, train/loss_vlb_step=8.86e-6, train/loss_step=0.000689, global_step=1963.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  21%|██▏       | 17/80 [01:57<06:51,  6.53s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=7.88e-5, train/loss_step=0.0096, global_step=1964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]    Epoch 98:  22%|██▎       | 18/80 [02:02<06:40,  6.46s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0096, train/loss_vlb_step=7.88e-5, train/loss_step=0.0096, global_step=1964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  22%|██▎       | 18/80 [02:02<06:40,  6.46s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=6.46e-6, train/loss_step=0.0013, global_step=1964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  24%|██▍       | 19/80 [02:09<06:35,  6.48s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=6.46e-6, train/loss_step=0.0013, global_step=1964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  24%|██▍       | 19/80 [02:09<06:35,  6.48s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000202, train/loss_vlb_step=7.28e-7, train/loss_step=0.000202, global_step=1964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  25%|██▌       | 20/80 [02:10<06:11,  6.20s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000202, train/loss_vlb_step=7.28e-7, train/loss_step=0.000202, global_step=1964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  25%|██▌       | 20/80 [02:10<06:11,  6.20s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=8.05e-5, train/loss_step=0.0104, global_step=1964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]    Epoch 98:  26%|██▋       | 21/80 [02:12<05:55,  6.03s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=8.05e-5, train/loss_step=0.0104, global_step=1964.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  26%|██▋       | 21/80 [02:12<05:55,  6.03s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000713, train/loss_vlb_step=6.5e-6, train/loss_step=0.000713, global_step=1965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  28%|██▊       | 22/80 [02:13<05:35,  5.79s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000713, train/loss_vlb_step=6.5e-6, train/loss_step=0.000713, global_step=1965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  28%|██▊       | 22/80 [02:13<05:35,  5.79s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=7.86e-6, train/loss_step=0.0021, global_step=1965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]   Epoch 98:  29%|██▉       | 23/80 [02:28<05:53,  6.21s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0021, train/loss_vlb_step=7.86e-6, train/loss_step=0.0021, global_step=1965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  29%|██▉       | 23/80 [02:28<05:53,  6.21s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000958, train/loss_vlb_step=4.64e-6, train/loss_step=0.000958, global_step=1965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  30%|███       | 24/80 [02:29<05:34,  5.98s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000958, train/loss_vlb_step=4.64e-6, train/loss_step=0.000958, global_step=1965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  30%|███       | 24/80 [02:29<05:34,  5.98s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.97e-6, train/loss_step=0.0012, global_step=1965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]     Epoch 98:  31%|███▏      | 25/80 [02:49<05:57,  6.50s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.97e-6, train/loss_step=0.0012, global_step=1965.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  31%|███▏      | 25/80 [02:49<05:57,  6.50s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=6.38e-6, train/loss_step=0.000763, global_step=1966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  32%|███▎      | 26/80 [02:49<05:38,  6.28s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000763, train/loss_vlb_step=6.38e-6, train/loss_step=0.000763, global_step=1966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  32%|███▎      | 26/80 [02:49<05:38,  6.28s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=7.63e-6, train/loss_step=0.00201, global_step=1966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  34%|███▍      | 27/80 [02:49<05:21,  6.07s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=7.63e-6, train/loss_step=0.00201, global_step=1966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  34%|███▍      | 27/80 [02:49<05:21,  6.07s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.66e-5, train/loss_step=0.00408, global_step=1966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  35%|███▌      | 28/80 [02:50<05:05,  5.88s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=2.66e-5, train/loss_step=0.00408, global_step=1966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  35%|███▌      | 28/80 [02:50<05:05,  5.88s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000588, train/loss_vlb_step=2.65e-6, train/loss_step=0.000588, global_step=1966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  36%|███▋      | 29/80 [02:57<05:02,  5.93s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000588, train/loss_vlb_step=2.65e-6, train/loss_step=0.000588, global_step=1966.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  36%|███▋      | 29/80 [02:57<05:02,  5.93s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.04e-5, train/loss_step=0.00561, global_step=1967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  38%|███▊      | 30/80 [02:58<04:47,  5.75s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=2.04e-5, train/loss_step=0.00561, global_step=1967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  38%|███▊      | 30/80 [02:58<04:47,  5.75s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=3.83e-6, train/loss_step=0.000566, global_step=1967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  39%|███▉      | 31/80 [03:13<04:56,  6.04s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000566, train/loss_vlb_step=3.83e-6, train/loss_step=0.000566, global_step=1967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  39%|███▉      | 31/80 [03:13<04:56,  6.04s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.78e-5, train/loss_step=0.00624, global_step=1967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  40%|████      | 32/80 [03:13<04:42,  5.88s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.78e-5, train/loss_step=0.00624, global_step=1967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  40%|████      | 32/80 [03:13<04:42,  5.88s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000123, train/loss_step=0.0109, global_step=1967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365] Epoch 98:  41%|████▏     | 33/80 [03:29<04:49,  6.17s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000123, train/loss_step=0.0109, global_step=1967.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  41%|████▏     | 33/80 [03:29<04:49,  6.17s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=4.83e-6, train/loss_step=0.00112, global_step=1968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  42%|████▎     | 34/80 [03:30<04:36,  6.01s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=4.83e-6, train/loss_step=0.00112, global_step=1968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  42%|████▎     | 34/80 [03:30<04:36,  6.01s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.36e-6, train/loss_step=0.000248, global_step=1968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  44%|████▍     | 35/80 [03:30<04:23,  5.85s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.36e-6, train/loss_step=0.000248, global_step=1968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  44%|████▍     | 35/80 [03:30<04:23,  5.85s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.000217, train/loss_vlb_step=8.54e-7, train/loss_step=0.000217, global_step=1968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  45%|████▌     | 36/80 [03:34<04:14,  5.79s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.000217, train/loss_vlb_step=8.54e-7, train/loss_step=0.000217, global_step=1968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  45%|████▌     | 36/80 [03:34<04:14,  5.79s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=1.42e-5, train/loss_step=0.00405, global_step=1968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  46%|████▋     | 37/80 [03:43<04:12,  5.88s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=1.42e-5, train/loss_step=0.00405, global_step=1968.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  46%|████▋     | 37/80 [03:43<04:12,  5.88s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000522, train/loss_vlb_step=2.67e-6, train/loss_step=0.000522, global_step=1969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  48%|████▊     | 38/80 [03:43<04:01,  5.74s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000522, train/loss_vlb_step=2.67e-6, train/loss_step=0.000522, global_step=1969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  48%|████▊     | 38/80 [03:43<04:01,  5.74s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=1.87e-6, train/loss_step=0.000398, global_step=1969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  49%|████▉     | 39/80 [03:57<04:03,  5.94s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=1.87e-6, train/loss_step=0.000398, global_step=1969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  49%|████▉     | 39/80 [03:57<04:03,  5.94s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000515, train/loss_vlb_step=1.75e-5, train/loss_step=0.000515, global_step=1969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  50%|█████     | 40/80 [03:58<03:52,  5.81s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000515, train/loss_vlb_step=1.75e-5, train/loss_step=0.000515, global_step=1969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  50%|█████     | 40/80 [03:58<03:52,  5.81s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.89e-5, train/loss_step=0.00512, global_step=1969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  51%|█████▏    | 41/80 [04:19<04:00,  6.17s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.89e-5, train/loss_step=0.00512, global_step=1969.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  51%|█████▏    | 41/80 [04:19<04:00,  6.17s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.01e-5, train/loss_step=0.0101, global_step=1970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  52%|█████▎    | 42/80 [04:19<03:49,  6.04s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=4.01e-5, train/loss_step=0.0101, global_step=1970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  52%|█████▎    | 42/80 [04:19<03:49,  6.04s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.16e-5, train/loss_step=0.00299, global_step=1970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  54%|█████▍    | 43/80 [04:20<03:38,  5.91s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.16e-5, train/loss_step=0.00299, global_step=1970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  54%|█████▍    | 43/80 [04:20<03:38,  5.91s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=4.37e-5, train/loss_step=0.00644, global_step=1970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  55%|█████▌    | 44/80 [04:26<03:32,  5.91s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=4.37e-5, train/loss_step=0.00644, global_step=1970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  55%|█████▌    | 44/80 [04:26<03:32,  5.91s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=1.38e-5, train/loss_step=0.0014, global_step=1970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  56%|█████▋    | 45/80 [04:26<03:22,  5.80s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=1.38e-5, train/loss_step=0.0014, global_step=1970.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  56%|█████▋    | 45/80 [04:26<03:22,  5.80s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=7.58e-5, train/loss_step=0.00134, global_step=1971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  57%|█████▊    | 46/80 [04:27<03:13,  5.68s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=7.58e-5, train/loss_step=0.00134, global_step=1971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  57%|█████▊    | 46/80 [04:27<03:13,  5.68s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=0.000129, train/loss_step=0.0168, global_step=1971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365] Epoch 98:  59%|█████▉    | 47/80 [04:30<03:06,  5.64s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0168, train/loss_vlb_step=0.000129, train/loss_step=0.0168, global_step=1971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  59%|█████▉    | 47/80 [04:30<03:06,  5.64s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=2.96e-5, train/loss_step=0.00842, global_step=1971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  60%|██████    | 48/80 [04:32<02:57,  5.56s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00842, train/loss_vlb_step=2.96e-5, train/loss_step=0.00842, global_step=1971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  60%|██████    | 48/80 [04:32<02:57,  5.56s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=1.23e-6, train/loss_step=0.00029, global_step=1971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  61%|██████▏   | 49/80 [05:01<03:07,  6.04s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00029, train/loss_vlb_step=1.23e-6, train/loss_step=0.00029, global_step=1971.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  61%|██████▏   | 49/80 [05:01<03:07,  6.04s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.98e-6, train/loss_step=0.000389, global_step=1972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  62%|██████▎   | 50/80 [05:02<02:57,  5.93s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=1.98e-6, train/loss_step=0.000389, global_step=1972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  62%|██████▎   | 50/80 [05:02<02:57,  5.93s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000994, train/loss_vlb_step=4.78e-6, train/loss_step=0.000994, global_step=1972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  64%|██████▍   | 51/80 [05:02<02:48,  5.82s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000994, train/loss_vlb_step=4.78e-6, train/loss_step=0.000994, global_step=1972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  64%|██████▍   | 51/80 [05:02<02:48,  5.82s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=3.1e-6, train/loss_step=0.000632, global_step=1972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365] Epoch 98:  65%|██████▌   | 52/80 [05:03<02:40,  5.73s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000632, train/loss_vlb_step=3.1e-6, train/loss_step=0.000632, global_step=1972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  65%|██████▌   | 52/80 [05:03<02:40,  5.73s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=0.000151, train/loss_step=0.0135, global_step=1972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=0.000151, train/loss_step=0.0135, global_step=1972.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  66%|██████▋   | 53/80 [05:09<02:34,  5.73s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=1.92e-5, train/loss_step=0.00511, global_step=1973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  68%|██████▊   | 54/80 [05:09<02:26,  5.63s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=1.92e-5, train/loss_step=0.00511, global_step=1973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  68%|██████▊   | 54/80 [05:09<02:26,  5.63s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.47e-6, train/loss_step=0.00187, global_step=1973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  69%|██████▉   | 55/80 [05:13<02:20,  5.60s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.00187, train/loss_vlb_step=7.47e-6, train/loss_step=0.00187, global_step=1973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  69%|██████▉   | 55/80 [05:13<02:20,  5.60s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=1.56e-6, train/loss_step=0.000209, global_step=1973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  70%|███████   | 56/80 [05:14<02:12,  5.52s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=1.56e-6, train/loss_step=0.000209, global_step=1973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  70%|███████   | 56/80 [05:14<02:12,  5.52s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000322, train/loss_step=0.014, global_step=1973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]     Epoch 98:  71%|███████▏  | 57/80 [05:44<02:16,  5.94s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=0.000322, train/loss_step=0.014, global_step=1973.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  71%|███████▏  | 57/80 [05:44<02:16,  5.94s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=9.57e-6, train/loss_step=0.00277, global_step=1974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  72%|███████▎  | 58/80 [05:45<02:08,  5.85s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=9.57e-6, train/loss_step=0.00277, global_step=1974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  72%|███████▎  | 58/80 [05:45<02:08,  5.85s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=2.67e-5, train/loss_step=0.00603, global_step=1974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  74%|███████▍  | 59/80 [05:45<02:00,  5.76s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00603, train/loss_vlb_step=2.67e-5, train/loss_step=0.00603, global_step=1974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  74%|███████▍  | 59/80 [05:45<02:00,  5.76s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000169, train/loss_vlb_step=6.61e-7, train/loss_step=0.000169, global_step=1974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  75%|███████▌  | 60/80 [05:46<01:53,  5.67s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.000169, train/loss_vlb_step=6.61e-7, train/loss_step=0.000169, global_step=1974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  75%|███████▌  | 60/80 [05:46<01:53,  5.67s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=1.71e-5, train/loss_step=0.0047, global_step=1974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]    Epoch 98:  76%|███████▋  | 61/80 [05:58<01:49,  5.78s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=1.71e-5, train/loss_step=0.0047, global_step=1974.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  76%|███████▋  | 61/80 [05:58<01:49,  5.78s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=2.72e-5, train/loss_step=0.000579, global_step=1975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  78%|███████▊  | 62/80 [05:58<01:42,  5.69s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000579, train/loss_vlb_step=2.72e-5, train/loss_step=0.000579, global_step=1975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  78%|███████▊  | 62/80 [05:58<01:42,  5.69s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=3.87e-5, train/loss_step=0.000615, global_step=1975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  79%|███████▉  | 63/80 [05:59<01:35,  5.61s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=3.87e-5, train/loss_step=0.000615, global_step=1975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  79%|███████▉  | 63/80 [05:59<01:35,  5.61s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=1.63e-5, train/loss_step=0.00483, global_step=1975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  80%|████████  | 64/80 [06:00<01:28,  5.54s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=1.63e-5, train/loss_step=0.00483, global_step=1975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  80%|████████  | 64/80 [06:00<01:28,  5.54s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000172, train/loss_vlb_step=6.64e-7, train/loss_step=0.000172, global_step=1975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  81%|████████▏ | 65/80 [06:27<01:28,  5.88s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000172, train/loss_vlb_step=6.64e-7, train/loss_step=0.000172, global_step=1975.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  81%|████████▏ | 65/80 [06:27<01:28,  5.88s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.75e-5, train/loss_step=0.0103, global_step=1976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]    Epoch 98:  82%|████████▎ | 66/80 [06:28<01:21,  5.80s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.75e-5, train/loss_step=0.0103, global_step=1976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  82%|████████▎ | 66/80 [06:28<01:21,  5.80s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=1.41e-5, train/loss_step=0.000584, global_step=1976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  84%|████████▍ | 67/80 [06:28<01:14,  5.72s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000584, train/loss_vlb_step=1.41e-5, train/loss_step=0.000584, global_step=1976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  84%|████████▍ | 67/80 [06:28<01:14,  5.72s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.3e-5, train/loss_step=0.00348, global_step=1976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]   Epoch 98:  85%|████████▌ | 68/80 [06:29<01:07,  5.64s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=1.3e-5, train/loss_step=0.00348, global_step=1976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  85%|████████▌ | 68/80 [06:29<01:07,  5.64s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.04e-5, train/loss_step=0.00257, global_step=1976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  86%|████████▋ | 69/80 [06:40<01:02,  5.72s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00257, train/loss_vlb_step=1.04e-5, train/loss_step=0.00257, global_step=1976.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  86%|████████▋ | 69/80 [06:40<01:02,  5.72s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=9.55e-6, train/loss_step=0.00273, global_step=1977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  88%|████████▊ | 70/80 [06:40<00:56,  5.64s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=9.55e-6, train/loss_step=0.00273, global_step=1977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  88%|████████▊ | 70/80 [06:40<00:56,  5.64s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000169, train/loss_vlb_step=7.05e-7, train/loss_step=0.000169, global_step=1977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  89%|████████▉ | 71/80 [06:41<00:50,  5.57s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000169, train/loss_vlb_step=7.05e-7, train/loss_step=0.000169, global_step=1977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  89%|████████▉ | 71/80 [06:41<00:50,  5.57s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00016, train/loss_vlb_step=6.42e-7, train/loss_step=0.00016, global_step=1977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  90%|█████████ | 72/80 [06:41<00:44,  5.50s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00016, train/loss_vlb_step=6.42e-7, train/loss_step=0.00016, global_step=1977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  90%|█████████ | 72/80 [06:41<00:44,  5.50s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=2.25e-6, train/loss_step=0.000325, global_step=1977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  91%|█████████▏| 73/80 [06:58<00:39,  5.65s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=2.25e-6, train/loss_step=0.000325, global_step=1977.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  91%|█████████▏| 73/80 [06:58<00:39,  5.65s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000724, train/loss_vlb_step=2.46e-5, train/loss_step=0.000724, global_step=1978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  92%|█████████▎| 74/80 [06:58<00:33,  5.59s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000724, train/loss_vlb_step=2.46e-5, train/loss_step=0.000724, global_step=1978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  92%|█████████▎| 74/80 [06:58<00:33,  5.59s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000534, train/loss_vlb_step=2.71e-6, train/loss_step=0.000534, global_step=1978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  94%|█████████▍| 75/80 [06:59<00:27,  5.52s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000534, train/loss_vlb_step=2.71e-6, train/loss_step=0.000534, global_step=1978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  94%|█████████▍| 75/80 [06:59<00:27,  5.52s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=5.55e-6, train/loss_step=0.00141, global_step=1978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 98:  95%|█████████▌| 76/80 [06:59<00:21,  5.45s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.00141, train/loss_vlb_step=5.55e-6, train/loss_step=0.00141, global_step=1978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  95%|█████████▌| 76/80 [06:59<00:21,  5.45s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=0.000482, train/loss_step=0.0213, global_step=1978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365] Epoch 98:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0213, train/loss_vlb_step=0.000482, train/loss_step=0.0213, global_step=1978.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  96%|█████████▋| 77/80 [07:09<00:16,  5.50s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=1.67e-5, train/loss_step=0.00476, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=1.67e-5, train/loss_step=0.00476, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=6.45e-6, train/loss_step=0.00177, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365] Epoch 98:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=6.45e-6, train/loss_step=0.00177, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=1.32e-6, train/loss_step=0.000365, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=1.32e-6, train/loss_step=0.000365, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 98: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=6.43e-6, train/loss_step=0.00125, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Average Epoch time: 430.80 seconds
+Average Peak memory 29561.74MiB
+Epoch 98:   0%|          | 0/80 [00:00<00:00, 7025.63it/s, loss=0.00293, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=6.43e-6, train/loss_step=0.00125, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 99:   0%|          | 0/80 [00:00<00:00, 2252.58it/s, loss=0.00293, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=6.43e-6, train/loss_step=0.00125, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]Epoch 99:   1%|▏         | 1/80 [00:40<26:44, 20.32s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00125, train/loss_vlb_step=6.43e-6, train/loss_step=0.00125, global_step=1979.0, lr_abs=0.0001, train/loss_simple_epoch=0.00365, train/loss_vlb_epoch=9.4e-5, train/loss_epoch=0.00365]  Epoch 99:   1%|▏         | 1/80 [00:40<26:44, 20.32s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=0.000134, train/loss_step=0.00357, global_step=1980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   2%|▎         | 2/80 [00:41<17:48, 13.70s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00357, train/loss_vlb_step=0.000134, train/loss_step=0.00357, global_step=1980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   2%|▎         | 2/80 [00:41<17:48, 13.70s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000176, train/loss_vlb_step=8.32e-7, train/loss_step=0.000176, global_step=1980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   4%|▍         | 3/80 [00:41<13:20, 10.40s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000176, train/loss_vlb_step=8.32e-7, train/loss_step=0.000176, global_step=1980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   4%|▍         | 3/80 [00:41<13:20, 10.40s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.24e-5, train/loss_step=0.00221, global_step=1980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:   5%|▌         | 4/80 [00:42<10:40,  8.43s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00221, train/loss_vlb_step=1.24e-5, train/loss_step=0.00221, global_step=1980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   5%|▌         | 4/80 [00:42<10:40,  8.43s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=1.36e-5, train/loss_step=0.00411, global_step=1980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   6%|▋         | 5/80 [00:42<08:53,  7.11s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=1.36e-5, train/loss_step=0.00411, global_step=1980.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   6%|▋         | 5/80 [00:42<08:53,  7.11s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=4.87e-5, train/loss_step=0.0018, global_step=1981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]   Epoch 99:   8%|▊         | 6/80 [00:43<07:38,  6.19s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=4.87e-5, train/loss_step=0.0018, global_step=1981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   8%|▊         | 6/80 [00:43<07:38,  6.19s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.29e-6, train/loss_step=0.000279, global_step=1981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   9%|▉         | 7/80 [00:45<06:57,  5.72s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.29e-6, train/loss_step=0.000279, global_step=1981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:   9%|▉         | 7/80 [00:45<06:57,  5.72s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=8.33e-6, train/loss_step=0.00204, global_step=1981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  10%|█         | 8/80 [01:27<11:39,  9.71s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=8.33e-6, train/loss_step=0.00204, global_step=1981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  10%|█         | 8/80 [01:27<11:39,  9.71s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=1.41e-5, train/loss_step=0.00423, global_step=1981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436] Epoch 99:  11%|█▏        | 9/80 [01:27<10:24,  8.79s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=1.41e-5, train/loss_step=0.00423, global_step=1981.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  11%|█▏        | 9/80 [01:27<10:24,  8.79s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=0.000179, train/loss_step=0.000928, global_step=1982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  12%|█▎        | 10/80 [01:28<09:22,  8.04s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=0.000179, train/loss_step=0.000928, global_step=1982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  12%|█▎        | 10/80 [01:28<09:22,  8.04s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.09e-6, train/loss_step=0.000303, global_step=1982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436] Epoch 99:  14%|█▍        | 11/80 [01:28<08:31,  7.41s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.09e-6, train/loss_step=0.000303, global_step=1982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  14%|█▍        | 11/80 [01:28<08:31,  7.41s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=2.32e-6, train/loss_step=0.000524, global_step=1982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  15%|█▌        | 12/80 [01:29<07:47,  6.88s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=2.32e-6, train/loss_step=0.000524, global_step=1982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  15%|█▌        | 12/80 [01:29<07:47,  6.88s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=6.45e-5, train/loss_step=0.00939, global_step=1982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  16%|█▋        | 13/80 [01:29<07:10,  6.43s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=6.45e-5, train/loss_step=0.00939, global_step=1982.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  16%|█▋        | 13/80 [01:29<07:10,  6.43s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=0.000528, train/loss_step=0.0201, global_step=1983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436] Epoch 99:  18%|█▊        | 14/80 [01:30<06:37,  6.03s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=0.000528, train/loss_step=0.0201, global_step=1983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  18%|█▊        | 14/80 [01:30<06:37,  6.03s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=0.00154, train/loss_step=0.00497, global_step=1983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  19%|█▉        | 15/80 [01:30<06:09,  5.68s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00497, train/loss_vlb_step=0.00154, train/loss_step=0.00497, global_step=1983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  19%|█▉        | 15/80 [01:30<06:09,  5.68s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.16e-5, train/loss_step=0.0046, global_step=1983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  20%|██        | 16/80 [02:23<08:58,  8.42s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0046, train/loss_vlb_step=2.16e-5, train/loss_step=0.0046, global_step=1983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  20%|██        | 16/80 [02:23<08:58,  8.42s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=3.14e-5, train/loss_step=0.00588, global_step=1983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  21%|██▏       | 17/80 [02:23<08:22,  7.98s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00588, train/loss_vlb_step=3.14e-5, train/loss_step=0.00588, global_step=1983.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  21%|██▏       | 17/80 [02:23<08:22,  7.98s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=5.04e-6, train/loss_step=0.000438, global_step=1984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  22%|██▎       | 18/80 [02:24<07:50,  7.58s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000438, train/loss_vlb_step=5.04e-6, train/loss_step=0.000438, global_step=1984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  22%|██▎       | 18/80 [02:24<07:50,  7.58s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=0.000106, train/loss_step=0.00821, global_step=1984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436] Epoch 99:  24%|██▍       | 19/80 [02:24<07:21,  7.23s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=0.000106, train/loss_step=0.00821, global_step=1984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  24%|██▍       | 19/80 [02:24<07:21,  7.23s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=1.66e-5, train/loss_step=0.000523, global_step=1984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  25%|██▌       | 20/80 [02:25<06:54,  6.91s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000523, train/loss_vlb_step=1.66e-5, train/loss_step=0.000523, global_step=1984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  25%|██▌       | 20/80 [02:25<06:54,  6.91s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000223, train/loss_vlb_step=9.24e-7, train/loss_step=0.000223, global_step=1984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  26%|██▋       | 21/80 [02:25<06:30,  6.62s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000223, train/loss_vlb_step=9.24e-7, train/loss_step=0.000223, global_step=1984.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  26%|██▋       | 21/80 [02:25<06:30,  6.62s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=8.15e-6, train/loss_step=0.00178, global_step=1985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  28%|██▊       | 22/80 [02:26<06:08,  6.35s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=8.15e-6, train/loss_step=0.00178, global_step=1985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  28%|██▊       | 22/80 [02:26<06:08,  6.35s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=1.89e-6, train/loss_step=0.000359, global_step=1985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  29%|██▉       | 23/80 [02:26<05:48,  6.11s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000359, train/loss_vlb_step=1.89e-6, train/loss_step=0.000359, global_step=1985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  29%|██▉       | 23/80 [02:26<05:48,  6.11s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=0.000411, train/loss_step=0.00169, global_step=1985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436] Epoch 99:  30%|███       | 24/80 [03:07<06:59,  7.49s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=0.000411, train/loss_step=0.00169, global_step=1985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  30%|███       | 24/80 [03:07<06:59,  7.49s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=1.92e-5, train/loss_step=0.00568, global_step=1985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  31%|███▏      | 25/80 [03:07<06:37,  7.22s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=1.92e-5, train/loss_step=0.00568, global_step=1985.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  31%|███▏      | 25/80 [03:07<06:37,  7.22s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=4.33e-6, train/loss_step=0.000511, global_step=1986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  32%|███▎      | 26/80 [03:08<06:16,  6.97s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=4.33e-6, train/loss_step=0.000511, global_step=1986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  32%|███▎      | 26/80 [03:08<06:16,  6.97s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=7.05e-7, train/loss_step=0.000181, global_step=1986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  34%|███▍      | 27/80 [03:08<05:57,  6.74s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000181, train/loss_vlb_step=7.05e-7, train/loss_step=0.000181, global_step=1986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  34%|███▍      | 27/80 [03:08<05:57,  6.74s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=7.91e-6, train/loss_step=0.00214, global_step=1986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  35%|███▌      | 28/80 [03:09<05:39,  6.53s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=7.91e-6, train/loss_step=0.00214, global_step=1986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  35%|███▌      | 28/80 [03:09<05:39,  6.53s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=7.32e-7, train/loss_step=0.000166, global_step=1986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  36%|███▋      | 29/80 [03:09<05:22,  6.33s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=7.32e-7, train/loss_step=0.000166, global_step=1986.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  36%|███▋      | 29/80 [03:09<05:22,  6.33s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=4.68e-5, train/loss_step=0.00307, global_step=1987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  38%|███▊      | 30/80 [03:10<05:06,  6.14s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00307, train/loss_vlb_step=4.68e-5, train/loss_step=0.00307, global_step=1987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  38%|███▊      | 30/80 [03:10<05:06,  6.14s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000138, train/loss_vlb_step=5.22e-7, train/loss_step=0.000138, global_step=1987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  39%|███▉      | 31/80 [03:10<04:52,  5.96s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000138, train/loss_vlb_step=5.22e-7, train/loss_step=0.000138, global_step=1987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  39%|███▉      | 31/80 [03:10<04:52,  5.96s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000783, train/loss_vlb_step=3.44e-6, train/loss_step=0.000783, global_step=1987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  40%|████      | 32/80 [03:52<05:37,  7.03s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.000783, train/loss_vlb_step=3.44e-6, train/loss_step=0.000783, global_step=1987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  40%|████      | 32/80 [03:52<05:37,  7.03s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=1.35e-5, train/loss_step=0.000489, global_step=1987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436] Epoch 99:  41%|████▏     | 33/80 [03:52<05:21,  6.84s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=1.35e-5, train/loss_step=0.000489, global_step=1987.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  41%|████▏     | 33/80 [03:52<05:21,  6.84s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000625, train/loss_vlb_step=3.19e-6, train/loss_step=0.000625, global_step=1988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  42%|████▎     | 34/80 [03:53<05:06,  6.66s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000625, train/loss_vlb_step=3.19e-6, train/loss_step=0.000625, global_step=1988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  42%|████▎     | 34/80 [03:53<05:06,  6.66s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000659, train/loss_vlb_step=4.89e-6, train/loss_step=0.000659, global_step=1988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  44%|████▍     | 35/80 [03:53<04:52,  6.49s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000659, train/loss_vlb_step=4.89e-6, train/loss_step=0.000659, global_step=1988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  44%|████▍     | 35/80 [03:53<04:52,  6.49s/it, loss=0.0017, v_num=0, train/loss_simple_step=0.000463, train/loss_vlb_step=1.85e-6, train/loss_step=0.000463, global_step=1988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436] Epoch 99:  45%|████▌     | 36/80 [03:54<04:38,  6.33s/it, loss=0.0017, v_num=0, train/loss_simple_step=0.000463, train/loss_vlb_step=1.85e-6, train/loss_step=0.000463, global_step=1988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  45%|████▌     | 36/80 [03:54<04:38,  6.33s/it, loss=0.00143, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=1.62e-5, train/loss_step=0.000555, global_step=1988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  46%|████▋     | 37/80 [03:54<04:25,  6.18s/it, loss=0.00143, v_num=0, train/loss_simple_step=0.000555, train/loss_vlb_step=1.62e-5, train/loss_step=0.000555, global_step=1988.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  46%|████▋     | 37/80 [03:54<04:25,  6.18s/it, loss=0.00143, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.64e-6, train/loss_step=0.000329, global_step=1989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  48%|████▊     | 38/80 [03:55<04:13,  6.03s/it, loss=0.00143, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.64e-6, train/loss_step=0.000329, global_step=1989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  48%|████▊     | 38/80 [03:55<04:13,  6.03s/it, loss=0.0011, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=1.04e-5, train/loss_step=0.00163, global_step=1989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]   Epoch 99:  49%|████▉     | 39/80 [03:55<04:01,  5.90s/it, loss=0.0011, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=1.04e-5, train/loss_step=0.00163, global_step=1989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  49%|████▉     | 39/80 [03:55<04:01,  5.90s/it, loss=0.00113, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=3.76e-6, train/loss_step=0.00102, global_step=1989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  50%|█████     | 40/80 [04:40<04:33,  6.84s/it, loss=0.00113, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=3.76e-6, train/loss_step=0.00102, global_step=1989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  50%|█████     | 40/80 [04:40<04:33,  6.84s/it, loss=0.00125, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.08e-5, train/loss_step=0.00268, global_step=1989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  51%|█████▏    | 41/80 [04:40<04:20,  6.69s/it, loss=0.00125, v_num=0, train/loss_simple_step=0.00268, train/loss_vlb_step=1.08e-5, train/loss_step=0.00268, global_step=1989.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  51%|█████▏    | 41/80 [04:40<04:20,  6.69s/it, loss=0.00131, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.04e-5, train/loss_step=0.00299, global_step=1990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  52%|█████▎    | 42/80 [04:41<04:08,  6.55s/it, loss=0.00131, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.04e-5, train/loss_step=0.00299, global_step=1990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  52%|█████▎    | 42/80 [04:41<04:08,  6.55s/it, loss=0.00137, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=6.48e-6, train/loss_step=0.00163, global_step=1990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  54%|█████▍    | 43/80 [04:41<03:57,  6.41s/it, loss=0.00137, v_num=0, train/loss_simple_step=0.00163, train/loss_vlb_step=6.48e-6, train/loss_step=0.00163, global_step=1990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  54%|█████▍    | 43/80 [04:41<03:57,  6.41s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.21e-5, train/loss_step=0.0117, global_step=1990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  55%|█████▌    | 44/80 [04:42<03:46,  6.28s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.21e-5, train/loss_step=0.0117, global_step=1990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  55%|█████▌    | 44/80 [04:42<03:46,  6.28s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.3e-5, train/loss_step=0.00361, global_step=1990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  56%|█████▋    | 45/80 [04:43<03:35,  6.15s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.00361, train/loss_vlb_step=1.3e-5, train/loss_step=0.00361, global_step=1990.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  56%|█████▋    | 45/80 [04:43<03:35,  6.15s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.000571, train/loss_vlb_step=1.34e-5, train/loss_step=0.000571, global_step=1991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  57%|█████▊    | 46/80 [04:43<03:25,  6.03s/it, loss=0.00177, v_num=0, train/loss_simple_step=0.000571, train/loss_vlb_step=1.34e-5, train/loss_step=0.000571, global_step=1991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  57%|█████▊    | 46/80 [04:43<03:25,  6.03s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.36e-5, train/loss_step=0.00637, global_step=1991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  59%|█████▉    | 47/80 [04:43<03:15,  5.92s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.36e-5, train/loss_step=0.00637, global_step=1991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  59%|█████▉    | 47/80 [04:43<03:15,  5.92s/it, loss=0.002, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=5.61e-6, train/loss_step=0.000477, global_step=1991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  60%|██████    | 48/80 [05:29<03:35,  6.73s/it, loss=0.002, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=5.61e-6, train/loss_step=0.000477, global_step=1991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  60%|██████    | 48/80 [05:29<03:35,  6.73s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=1.42e-5, train/loss_step=0.00411, global_step=1991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436] Epoch 99:  61%|██████▏   | 49/80 [05:30<03:24,  6.61s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=1.42e-5, train/loss_step=0.00411, global_step=1991.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  61%|██████▏   | 49/80 [05:30<03:24,  6.61s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=0.000371, train/loss_step=0.012, global_step=1992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  62%|██████▎   | 50/80 [05:30<03:14,  6.49s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=0.000371, train/loss_step=0.012, global_step=1992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  62%|██████▎   | 50/80 [05:30<03:14,  6.49s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000965, train/loss_vlb_step=4.65e-6, train/loss_step=0.000965, global_step=1992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  64%|██████▍   | 51/80 [05:31<03:04,  6.37s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000965, train/loss_vlb_step=4.65e-6, train/loss_step=0.000965, global_step=1992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  64%|██████▍   | 51/80 [05:31<03:04,  6.37s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000618, train/loss_vlb_step=2.61e-6, train/loss_step=0.000618, global_step=1992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  65%|██████▌   | 52/80 [05:31<02:55,  6.26s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000618, train/loss_vlb_step=2.61e-6, train/loss_step=0.000618, global_step=1992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  65%|██████▌   | 52/80 [05:31<02:55,  6.26s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=2.38e-6, train/loss_step=0.000431, global_step=1992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  66%|██████▋   | 53/80 [05:32<02:46,  6.16s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=2.38e-6, train/loss_step=0.000431, global_step=1992.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  66%|██████▋   | 53/80 [05:32<02:46,  6.16s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=5.37e-5, train/loss_step=0.00948, global_step=1993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  68%|██████▊   | 54/80 [05:32<02:37,  6.05s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=5.37e-5, train/loss_step=0.00948, global_step=1993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  68%|██████▊   | 54/80 [05:32<02:37,  6.05s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=3.74e-6, train/loss_step=0.000321, global_step=1993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  69%|██████▉   | 55/80 [05:33<02:28,  5.95s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=3.74e-6, train/loss_step=0.000321, global_step=1993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  69%|██████▉   | 55/80 [05:33<02:28,  5.95s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=3.03e-6, train/loss_step=0.000339, global_step=1993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  70%|███████   | 56/80 [06:14<02:37,  6.58s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=3.03e-6, train/loss_step=0.000339, global_step=1993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  70%|███████   | 56/80 [06:14<02:37,  6.58s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.38e-6, train/loss_step=0.000499, global_step=1993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  71%|███████▏  | 57/80 [06:15<02:28,  6.47s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.38e-6, train/loss_step=0.000499, global_step=1993.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  71%|███████▏  | 57/80 [06:15<02:28,  6.47s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=7.86e-5, train/loss_step=0.0133, global_step=1994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]    Epoch 99:  72%|███████▎  | 58/80 [06:15<02:20,  6.37s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0133, train/loss_vlb_step=7.86e-5, train/loss_step=0.0133, global_step=1994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  72%|███████▎  | 58/80 [06:15<02:20,  6.37s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.75e-5, train/loss_step=0.00555, global_step=1994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  74%|███████▍  | 59/80 [06:16<02:11,  6.27s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00555, train/loss_vlb_step=2.75e-5, train/loss_step=0.00555, global_step=1994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  74%|███████▍  | 59/80 [06:16<02:11,  6.27s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=0.000195, train/loss_step=0.00143, global_step=1994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  75%|███████▌  | 60/80 [06:16<02:03,  6.18s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=0.000195, train/loss_step=0.00143, global_step=1994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  75%|███████▌  | 60/80 [06:16<02:03,  6.18s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=4.21e-6, train/loss_step=0.000969, global_step=1994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  76%|███████▋  | 61/80 [06:17<01:55,  6.09s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000969, train/loss_vlb_step=4.21e-6, train/loss_step=0.000969, global_step=1994.0, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  76%|███████▋  | 61/80 [06:17<01:55,  6.09s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=3.7e-5, train/loss_step=0.0106, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]       Epoch 99:  78%|███████▊  | 62/80 [06:17<01:47,  6.00s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=3.7e-5, train/loss_step=0.0106, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  78%|███████▊  | 62/80 [06:17<01:47,  6.00s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.23e-5, train/loss_step=0.0164, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  79%|███████▉  | 63/80 [06:18<01:40,  5.91s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0164, train/loss_vlb_step=6.23e-5, train/loss_step=0.0164, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  79%|███████▉  | 63/80 [06:18<01:40,  5.91s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=3.95e-6, train/loss_step=0.000945, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  80%|████████  | 64/80 [06:54<01:42,  6.38s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000945, train/loss_vlb_step=3.95e-6, train/loss_step=0.000945, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  80%|████████  | 64/80 [06:54<01:42,  6.38s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.32e-5, train/loss_step=0.00331, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  81%|████████▏ | 65/80 [06:55<01:34,  6.29s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=1.32e-5, train/loss_step=0.00331, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  81%|████████▏ | 65/80 [06:55<01:34,  6.29s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=9.09e-5, train/loss_step=0.019, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]    Epoch 99:  82%|████████▎ | 66/80 [06:55<01:26,  6.21s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.019, train/loss_vlb_step=9.09e-5, train/loss_step=0.019, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  82%|████████▎ | 66/80 [06:55<01:26,  6.21s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=5.89e-6, train/loss_step=0.00152, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  84%|████████▍ | 67/80 [06:56<01:19,  6.12s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=5.89e-6, train/loss_step=0.00152, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  84%|████████▍ | 67/80 [06:56<01:19,  6.12s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00092, train/loss_vlb_step=5.69e-6, train/loss_step=0.00092, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  85%|████████▌ | 68/80 [06:56<01:12,  6.04s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00092, train/loss_vlb_step=5.69e-6, train/loss_step=0.00092, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  85%|████████▌ | 68/80 [06:56<01:12,  6.04s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.03e-6, train/loss_step=0.000286, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  86%|████████▋ | 69/80 [06:57<01:05,  5.96s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.03e-6, train/loss_step=0.000286, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  86%|████████▋ | 69/80 [06:57<01:05,  5.96s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=2.38e-6, train/loss_step=0.000316, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  88%|████████▊ | 70/80 [06:57<00:58,  5.88s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=2.38e-6, train/loss_step=0.000316, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  88%|████████▊ | 70/80 [06:57<00:58,  5.88s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=2.69e-6, train/loss_step=0.000213, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  89%|████████▉ | 71/80 [06:58<00:52,  5.81s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=2.69e-6, train/loss_step=0.000213, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  89%|████████▉ | 71/80 [06:58<00:52,  5.81s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=6.86e-5, train/loss_step=0.00105, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 99:  90%|█████████ | 72/80 [07:19<00:48,  6.02s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=6.86e-5, train/loss_step=0.00105, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  90%|█████████ | 72/80 [07:19<00:48,  6.02s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.3e-5, train/loss_step=0.0125, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]   Epoch 99:  91%|█████████▏| 73/80 [07:20<00:41,  5.95s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.3e-5, train/loss_step=0.0125, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  91%|█████████▏| 73/80 [07:20<00:41,  5.95s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=4.19e-5, train/loss_step=0.00593, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  92%|█████████▎| 74/80 [07:20<00:35,  5.87s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=4.19e-5, train/loss_step=0.00593, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  92%|█████████▎| 74/80 [07:20<00:35,  5.87s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=0.00076, train/loss_step=0.00172, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  94%|█████████▍| 75/80 [07:20<00:29,  5.80s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.00172, train/loss_vlb_step=0.00076, train/loss_step=0.00172, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  94%|█████████▍| 75/80 [07:20<00:29,  5.80s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=3e-6, train/loss_step=0.000621, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436] Epoch 99:  95%|█████████▌| 76/80 [07:21<00:22,  5.73s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.000621, train/loss_vlb_step=3e-6, train/loss_step=0.000621, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  95%|█████████▌| 76/80 [07:21<00:22,  5.73s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000153, train/loss_step=0.0248, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  96%|█████████▋| 77/80 [07:22<00:17,  5.67s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.0248, train/loss_vlb_step=0.000153, train/loss_step=0.0248, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  96%|█████████▋| 77/80 [07:22<00:17,  5.67s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.63e-5, train/loss_step=0.00509, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  98%|█████████▊| 78/80 [07:36<00:11,  5.78s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.63e-5, train/loss_step=0.00509, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  98%|█████████▊| 78/80 [07:36<00:11,  5.78s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=6.05e-5, train/loss_step=0.00943, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  99%|█████████▉| 79/80 [07:37<00:05,  5.72s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=6.05e-5, train/loss_step=0.00943, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99:  99%|█████████▉| 79/80 [07:37<00:05,  5.72s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=1.91e-5, train/loss_step=0.00545, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99: 100%|██████████| 80/80 [07:37<00:00,  5.65s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00545, train/loss_vlb_step=1.91e-5, train/loss_step=0.00545, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 99: 100%|██████████| 80/80 [07:37<00:00,  5.65s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=7.2e-7, train/loss_step=0.000148, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Average Epoch time: 457.79 seconds
+Average Peak memory 29565.49MiB
+Epoch 99:   0%|          | 0/80 [00:00<00:00, 5890.88it/s, loss=0.00602, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=7.2e-7, train/loss_step=0.000148, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 100:   0%|          | 0/80 [00:00<00:00, 2379.07it/s, loss=0.00602, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=7.2e-7, train/loss_step=0.000148, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]Epoch 100:   1%|▏         | 1/80 [00:45<30:02, 22.82s/it, loss=0.00602, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=7.2e-7, train/loss_step=0.000148, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00436, train/loss_vlb_epoch=9.88e-5, train/loss_epoch=0.00436]  Epoch 100:   1%|▏         | 1/80 [00:45<30:02, 22.82s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=3.43e-6, train/loss_step=0.000357, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   2%|▎         | 2/80 [00:46<19:58, 15.37s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=3.43e-6, train/loss_step=0.000357, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   2%|▎         | 2/80 [00:46<19:58, 15.37s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=6.64e-7, train/loss_step=0.000164, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   4%|▍         | 3/80 [00:46<14:57, 11.65s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=6.64e-7, train/loss_step=0.000164, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   4%|▍         | 3/80 [00:46<14:57, 11.65s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000369, train/loss_vlb_step=1.15e-5, train/loss_step=0.000369, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   5%|▌         | 4/80 [00:47<11:56,  9.43s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000369, train/loss_vlb_step=1.15e-5, train/loss_step=0.000369, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   5%|▌         | 4/80 [00:47<11:56,  9.43s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.52e-5, train/loss_step=0.0068, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]    Epoch 100:   6%|▋         | 5/80 [00:47<09:55,  7.94s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.52e-5, train/loss_step=0.0068, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   6%|▋         | 5/80 [00:47<09:55,  7.94s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=9.16e-5, train/loss_step=0.0123, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385] Epoch 100:   8%|▊         | 6/80 [00:48<08:28,  6.88s/it, loss=0.0045, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=9.16e-5, train/loss_step=0.0123, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   8%|▊         | 6/80 [00:48<08:28,  6.88s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000361, train/loss_vlb_step=1.95e-6, train/loss_step=0.000361, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   9%|▉         | 7/80 [00:48<07:23,  6.08s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000361, train/loss_vlb_step=1.95e-6, train/loss_step=0.000361, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:   9%|▉         | 7/80 [00:48<07:23,  6.08s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.69e-6, train/loss_step=0.00103, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  10%|█         | 8/80 [01:17<10:21,  8.63s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=4.69e-6, train/loss_step=0.00103, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  10%|█         | 8/80 [01:17<10:21,  8.63s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=4.55e-6, train/loss_step=0.000409, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  11%|█▏        | 9/80 [01:25<10:06,  8.55s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=4.55e-6, train/loss_step=0.000409, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  11%|█▏        | 9/80 [01:25<10:06,  8.55s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.47e-5, train/loss_step=0.00428, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  12%|█▎        | 10/80 [01:25<09:07,  7.82s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00428, train/loss_vlb_step=1.47e-5, train/loss_step=0.00428, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  12%|█▎        | 10/80 [01:25<09:07,  7.82s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000843, train/loss_vlb_step=4.39e-6, train/loss_step=0.000843, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  14%|█▍        | 11/80 [01:26<08:17,  7.21s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000843, train/loss_vlb_step=4.39e-6, train/loss_step=0.000843, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  14%|█▍        | 11/80 [01:26<08:17,  7.21s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00054, train/loss_vlb_step=2.13e-5, train/loss_step=0.00054, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  15%|█▌        | 12/80 [01:27<07:35,  6.70s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00054, train/loss_vlb_step=2.13e-5, train/loss_step=0.00054, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  15%|█▌        | 12/80 [01:27<07:35,  6.70s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=3.07e-6, train/loss_step=0.000337, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  16%|█▋        | 13/80 [01:27<06:59,  6.26s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=3.07e-6, train/loss_step=0.000337, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  16%|█▋        | 13/80 [01:27<06:59,  6.26s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=2.99e-5, train/loss_step=0.00813, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  18%|█▊        | 14/80 [01:37<07:06,  6.47s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00813, train/loss_vlb_step=2.99e-5, train/loss_step=0.00813, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  18%|█▊        | 14/80 [01:37<07:06,  6.47s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.08e-5, train/loss_step=0.0024, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]   Epoch 100:  19%|█▉        | 15/80 [01:37<06:36,  6.10s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.08e-5, train/loss_step=0.0024, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  19%|█▉        | 15/80 [01:37<06:36,  6.10s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000495, train/loss_vlb_step=1.93e-6, train/loss_step=0.000495, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  20%|██        | 16/80 [02:00<07:32,  7.07s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000495, train/loss_vlb_step=1.93e-6, train/loss_step=0.000495, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  20%|██        | 16/80 [02:00<07:32,  7.07s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000189, train/loss_step=0.0255, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]   Epoch 100:  21%|██▏       | 17/80 [02:16<07:58,  7.59s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.0255, train/loss_vlb_step=0.000189, train/loss_step=0.0255, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  21%|██▏       | 17/80 [02:16<07:58,  7.59s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000941, train/loss_vlb_step=3.36e-6, train/loss_step=0.000941, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  22%|██▎       | 18/80 [02:17<07:27,  7.21s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.000941, train/loss_vlb_step=3.36e-6, train/loss_step=0.000941, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  22%|██▎       | 18/80 [02:17<07:27,  7.21s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=3.28e-6, train/loss_step=0.000761, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  24%|██▍       | 19/80 [02:17<06:59,  6.88s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000761, train/loss_vlb_step=3.28e-6, train/loss_step=0.000761, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  24%|██▍       | 19/80 [02:17<06:59,  6.88s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.41e-5, train/loss_step=0.00149, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  25%|██▌       | 20/80 [02:18<06:35,  6.59s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=1.41e-5, train/loss_step=0.00149, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  25%|██▌       | 20/80 [02:18<06:35,  6.59s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.1e-5, train/loss_step=0.00606, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385] Epoch 100:  26%|██▋       | 21/80 [02:18<06:12,  6.31s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.1e-5, train/loss_step=0.00606, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  26%|██▋       | 21/80 [02:18<06:12,  6.31s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.28e-6, train/loss_step=0.000241, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  28%|██▊       | 22/80 [02:19<05:51,  6.06s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.28e-6, train/loss_step=0.000241, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  28%|██▊       | 22/80 [02:19<05:51,  6.06s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.78e-6, train/loss_step=0.000287, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  29%|██▉       | 23/80 [02:19<05:32,  5.83s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.78e-6, train/loss_step=0.000287, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  29%|██▉       | 23/80 [02:19<05:32,  5.83s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=3.82e-6, train/loss_step=0.000312, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  30%|███       | 24/80 [02:41<06:02,  6.47s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=3.82e-6, train/loss_step=0.000312, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  30%|███       | 24/80 [02:41<06:02,  6.47s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.57e-5, train/loss_step=0.0098, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]    Epoch 100:  31%|███▏      | 25/80 [03:02<06:26,  7.03s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0098, train/loss_vlb_step=4.57e-5, train/loss_step=0.0098, global_step=2e+3, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  31%|███▏      | 25/80 [03:02<06:26,  7.03s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00037, train/loss_vlb_step=6.24e-6, train/loss_step=0.00037, global_step=2006.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  32%|███▎      | 26/80 [03:03<06:06,  6.78s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00037, train/loss_vlb_step=6.24e-6, train/loss_step=0.00037, global_step=2006.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  32%|███▎      | 26/80 [03:03<06:06,  6.78s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=0.000351, train/loss_step=0.0163, global_step=2006.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385] Epoch 100:  34%|███▍      | 27/80 [03:03<05:47,  6.56s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.0163, train/loss_vlb_step=0.000351, train/loss_step=0.0163, global_step=2006.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  34%|███▍      | 27/80 [03:03<05:47,  6.56s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.25e-6, train/loss_step=0.00236, global_step=2006.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  35%|███▌      | 28/80 [03:04<05:30,  6.35s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.25e-6, train/loss_step=0.00236, global_step=2006.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  35%|███▌      | 28/80 [03:04<05:30,  6.35s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=6.88e-6, train/loss_step=0.00201, global_step=2006.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  36%|███▋      | 29/80 [03:04<05:14,  6.16s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=6.88e-6, train/loss_step=0.00201, global_step=2006.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  36%|███▋      | 29/80 [03:04<05:14,  6.16s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000153, train/loss_vlb_step=5.89e-7, train/loss_step=0.000153, global_step=2007.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  38%|███▊      | 30/80 [03:05<04:58,  5.98s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000153, train/loss_vlb_step=5.89e-7, train/loss_step=0.000153, global_step=2007.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  38%|███▊      | 30/80 [03:05<04:58,  5.98s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.08e-6, train/loss_step=0.000418, global_step=2007.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  39%|███▉      | 31/80 [03:05<04:44,  5.80s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.08e-6, train/loss_step=0.000418, global_step=2007.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  39%|███▉      | 31/80 [03:05<04:44,  5.80s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.00466, train/loss_step=0.0346, global_step=2007.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]    Epoch 100:  40%|████      | 32/80 [03:25<04:59,  6.23s/it, loss=0.00565, v_num=0, train/loss_simple_step=0.0346, train/loss_vlb_step=0.00466, train/loss_step=0.0346, global_step=2007.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  40%|████      | 32/80 [03:25<04:59,  6.23s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.000102, train/loss_step=0.0169, global_step=2007.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  41%|████▏     | 33/80 [03:43<05:09,  6.58s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=0.000102, train/loss_step=0.0169, global_step=2007.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  41%|████▏     | 33/80 [03:43<05:09,  6.58s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.00741, train/loss_vlb_step=0.00123, train/loss_step=0.00741, global_step=2008.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  42%|████▎     | 34/80 [03:44<04:54,  6.41s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.00741, train/loss_vlb_step=0.00123, train/loss_step=0.00741, global_step=2008.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  42%|████▎     | 34/80 [03:44<04:54,  6.41s/it, loss=0.00676, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.82e-5, train/loss_step=0.00869, global_step=2008.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  44%|████▍     | 35/80 [03:44<04:40,  6.24s/it, loss=0.00676, v_num=0, train/loss_simple_step=0.00869, train/loss_vlb_step=4.82e-5, train/loss_step=0.00869, global_step=2008.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  44%|████▍     | 35/80 [03:44<04:40,  6.24s/it, loss=0.00732, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=0.000104, train/loss_step=0.0118, global_step=2008.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385] Epoch 100:  45%|████▌     | 36/80 [03:45<04:28,  6.09s/it, loss=0.00732, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=0.000104, train/loss_step=0.0118, global_step=2008.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  45%|████▌     | 36/80 [03:45<04:28,  6.09s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=1.55e-5, train/loss_step=0.00438, global_step=2008.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  46%|████▋     | 37/80 [03:45<04:15,  5.94s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=1.55e-5, train/loss_step=0.00438, global_step=2008.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  46%|████▋     | 37/80 [03:45<04:15,  5.94s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.000723, train/loss_vlb_step=3.58e-6, train/loss_step=0.000723, global_step=2009.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  48%|████▊     | 38/80 [03:46<04:03,  5.80s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.000723, train/loss_vlb_step=3.58e-6, train/loss_step=0.000723, global_step=2009.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  48%|████▊     | 38/80 [03:46<04:03,  5.80s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.000801, train/loss_vlb_step=3.6e-6, train/loss_step=0.000801, global_step=2009.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385] Epoch 100:  49%|████▉     | 39/80 [03:46<03:52,  5.67s/it, loss=0.00626, v_num=0, train/loss_simple_step=0.000801, train/loss_vlb_step=3.6e-6, train/loss_step=0.000801, global_step=2009.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  49%|████▉     | 39/80 [03:46<03:52,  5.67s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=1.78e-5, train/loss_step=0.00498, global_step=2009.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385] Epoch 100:  50%|█████     | 40/80 [04:08<04:02,  6.06s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=1.78e-5, train/loss_step=0.00498, global_step=2009.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  50%|█████     | 40/80 [04:08<04:02,  6.06s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.01e-5, train/loss_step=0.012, global_step=2009.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]    Epoch 100:  51%|█████▏    | 41/80 [04:22<04:03,  6.25s/it, loss=0.00673, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=5.01e-5, train/loss_step=0.012, global_step=2009.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  51%|█████▏    | 41/80 [04:22<04:03,  6.25s/it, loss=0.00726, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.53e-5, train/loss_step=0.0109, global_step=2010.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  52%|█████▎    | 42/80 [04:23<03:52,  6.12s/it, loss=0.00726, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=4.53e-5, train/loss_step=0.0109, global_step=2010.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  52%|█████▎    | 42/80 [04:23<03:52,  6.12s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.24e-5, train/loss_step=0.00644, global_step=2010.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  54%|█████▍    | 43/80 [04:23<03:41,  5.99s/it, loss=0.00757, v_num=0, train/loss_simple_step=0.00644, train/loss_vlb_step=3.24e-5, train/loss_step=0.00644, global_step=2010.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  54%|█████▍    | 43/80 [04:23<03:41,  5.99s/it, loss=0.00773, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=3.82e-5, train/loss_step=0.00339, global_step=2010.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  55%|█████▌    | 44/80 [04:24<03:31,  5.87s/it, loss=0.00773, v_num=0, train/loss_simple_step=0.00339, train/loss_vlb_step=3.82e-5, train/loss_step=0.00339, global_step=2010.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  55%|█████▌    | 44/80 [04:24<03:31,  5.87s/it, loss=0.00734, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=7.3e-6, train/loss_step=0.00216, global_step=2010.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385] Epoch 100:  56%|█████▋    | 45/80 [04:25<03:21,  5.76s/it, loss=0.00734, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=7.3e-6, train/loss_step=0.00216, global_step=2010.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  56%|█████▋    | 45/80 [04:25<03:21,  5.76s/it, loss=0.00741, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.09e-5, train/loss_step=0.00179, global_step=2011.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  57%|█████▊    | 46/80 [04:25<03:12,  5.65s/it, loss=0.00741, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=1.09e-5, train/loss_step=0.00179, global_step=2011.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  57%|█████▊    | 46/80 [04:25<03:12,  5.65s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000242, train/loss_step=0.0141, global_step=2011.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  59%|█████▉    | 47/80 [04:26<03:02,  5.54s/it, loss=0.0073, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=0.000242, train/loss_step=0.0141, global_step=2011.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  59%|█████▉    | 47/80 [04:26<03:02,  5.54s/it, loss=0.00719, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=8.66e-7, train/loss_step=0.00019, global_step=2011.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  60%|██████    | 48/80 [04:52<03:10,  5.96s/it, loss=0.00719, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=8.66e-7, train/loss_step=0.00019, global_step=2011.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  60%|██████    | 48/80 [04:52<03:10,  5.96s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.7e-5, train/loss_step=0.0109, global_step=2011.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]   Epoch 100:  61%|██████▏   | 49/80 [05:12<03:13,  6.25s/it, loss=0.00764, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=5.7e-5, train/loss_step=0.0109, global_step=2011.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  61%|██████▏   | 49/80 [05:12<03:13,  6.25s/it, loss=0.00768, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=3.88e-6, train/loss_step=0.000928, global_step=2012.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  62%|██████▎   | 50/80 [05:12<03:04,  6.14s/it, loss=0.00768, v_num=0, train/loss_simple_step=0.000928, train/loss_vlb_step=3.88e-6, train/loss_step=0.000928, global_step=2012.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  62%|██████▎   | 50/80 [05:12<03:04,  6.14s/it, loss=0.00767, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=2.07e-5, train/loss_step=0.000347, global_step=2012.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  64%|██████▍   | 51/80 [05:13<02:54,  6.03s/it, loss=0.00767, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=2.07e-5, train/loss_step=0.000347, global_step=2012.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  64%|██████▍   | 51/80 [05:13<02:54,  6.03s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=2.99e-5, train/loss_step=0.0028, global_step=2012.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]    Epoch 100:  65%|██████▌   | 52/80 [05:13<02:45,  5.92s/it, loss=0.00608, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=2.99e-5, train/loss_step=0.0028, global_step=2012.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  65%|██████▌   | 52/80 [05:13<02:45,  5.92s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=4.25e-6, train/loss_step=0.0002, global_step=2012.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  66%|██████▋   | 53/80 [05:14<02:37,  5.82s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=4.25e-6, train/loss_step=0.0002, global_step=2012.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  66%|██████▋   | 53/80 [05:14<02:37,  5.82s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=2.73e-6, train/loss_step=0.000647, global_step=2013.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  68%|██████▊   | 54/80 [05:14<02:28,  5.73s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=2.73e-6, train/loss_step=0.000647, global_step=2013.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  68%|██████▊   | 54/80 [05:14<02:28,  5.73s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=1.01e-6, train/loss_step=0.000171, global_step=2013.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  69%|██████▉   | 55/80 [05:15<02:20,  5.63s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=1.01e-6, train/loss_step=0.000171, global_step=2013.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  69%|██████▉   | 55/80 [05:15<02:20,  5.63s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00099, train/loss_vlb_step=3.83e-6, train/loss_step=0.00099, global_step=2013.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  70%|███████   | 56/80 [05:35<02:21,  5.89s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00099, train/loss_vlb_step=3.83e-6, train/loss_step=0.00099, global_step=2013.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  70%|███████   | 56/80 [05:35<02:21,  5.89s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=0.000111, train/loss_step=0.012, global_step=2013.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]   Epoch 100:  71%|███████▏  | 57/80 [05:58<02:22,  6.19s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=0.000111, train/loss_step=0.012, global_step=2013.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  71%|███████▏  | 57/80 [05:58<02:22,  6.19s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.28e-6, train/loss_step=0.000264, global_step=2014.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  72%|███████▎  | 58/80 [05:59<02:13,  6.09s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.28e-6, train/loss_step=0.000264, global_step=2014.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  72%|███████▎  | 58/80 [05:59<02:13,  6.09s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000116, train/loss_step=0.0146, global_step=2014.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  74%|███████▍  | 59/80 [05:59<02:05,  6.00s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.0146, train/loss_vlb_step=0.000116, train/loss_step=0.0146, global_step=2014.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  74%|███████▍  | 59/80 [05:59<02:05,  6.00s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.02e-5, train/loss_step=0.00606, global_step=2014.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  75%|███████▌  | 60/80 [06:01<01:58,  5.92s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.02e-5, train/loss_step=0.00606, global_step=2014.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  75%|███████▌  | 60/80 [06:01<01:58,  5.92s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=3.62e-6, train/loss_step=0.000623, global_step=2014.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  76%|███████▋  | 61/80 [06:01<01:50,  5.83s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000623, train/loss_vlb_step=3.62e-6, train/loss_step=0.000623, global_step=2014.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  76%|███████▋  | 61/80 [06:01<01:50,  5.83s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000772, train/loss_vlb_step=0.000291, train/loss_step=0.000772, global_step=2015.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  78%|███████▊  | 62/80 [06:02<01:43,  5.75s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.000772, train/loss_vlb_step=0.000291, train/loss_step=0.000772, global_step=2015.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  78%|███████▊  | 62/80 [06:02<01:43,  5.75s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000346, train/loss_vlb_step=1.4e-6, train/loss_step=0.000346, global_step=2015.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  79%|███████▉  | 63/80 [06:02<01:36,  5.66s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000346, train/loss_vlb_step=1.4e-6, train/loss_step=0.000346, global_step=2015.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  79%|███████▉  | 63/80 [06:02<01:36,  5.66s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=3.33e-6, train/loss_step=0.000635, global_step=2015.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  80%|████████  | 64/80 [06:14<01:32,  5.77s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=3.33e-6, train/loss_step=0.000635, global_step=2015.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  80%|████████  | 64/80 [06:14<01:32,  5.77s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=2.43e-5, train/loss_step=0.00625, global_step=2015.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  81%|████████▏ | 65/80 [06:45<01:32,  6.14s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00625, train/loss_vlb_step=2.43e-5, train/loss_step=0.00625, global_step=2015.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  81%|████████▏ | 65/80 [06:45<01:32,  6.14s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.29e-6, train/loss_step=0.000324, global_step=2016.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  82%|████████▎ | 66/80 [06:45<01:24,  6.05s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.29e-6, train/loss_step=0.000324, global_step=2016.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  82%|████████▎ | 66/80 [06:45<01:24,  6.05s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.59e-6, train/loss_step=0.000409, global_step=2016.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  84%|████████▍ | 67/80 [06:46<01:17,  5.97s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.59e-6, train/loss_step=0.000409, global_step=2016.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  84%|████████▍ | 67/80 [06:46<01:17,  5.97s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.35e-5, train/loss_step=0.00624, global_step=2016.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  85%|████████▌ | 68/80 [06:46<01:10,  5.89s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.00624, train/loss_vlb_step=2.35e-5, train/loss_step=0.00624, global_step=2016.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  85%|████████▌ | 68/80 [06:46<01:10,  5.89s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.05e-6, train/loss_step=0.000409, global_step=2016.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  86%|████████▋ | 69/80 [06:47<01:03,  5.82s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.05e-6, train/loss_step=0.000409, global_step=2016.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  86%|████████▋ | 69/80 [06:47<01:03,  5.82s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.09e-5, train/loss_step=0.000305, global_step=2017.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  88%|████████▊ | 70/80 [06:47<00:57,  5.74s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.000305, train/loss_vlb_step=1.09e-5, train/loss_step=0.000305, global_step=2017.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  88%|████████▊ | 70/80 [06:47<00:57,  5.74s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=3.47e-5, train/loss_step=0.00594, global_step=2017.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]    Epoch 100:  89%|████████▉ | 71/80 [06:48<00:51,  5.67s/it, loss=0.003, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=3.47e-5, train/loss_step=0.00594, global_step=2017.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  89%|████████▉ | 71/80 [06:48<00:51,  5.67s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=3.19e-5, train/loss_step=0.00837, global_step=2017.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  90%|█████████ | 72/80 [06:51<00:45,  5.64s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=3.19e-5, train/loss_step=0.00837, global_step=2017.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  90%|█████████ | 72/80 [06:51<00:45,  5.64s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000913, train/loss_vlb_step=4.32e-6, train/loss_step=0.000913, global_step=2017.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  91%|█████████▏| 73/80 [07:12<00:40,  5.84s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000913, train/loss_vlb_step=4.32e-6, train/loss_step=0.000913, global_step=2017.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  91%|█████████▏| 73/80 [07:12<00:40,  5.84s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=2.02e-6, train/loss_step=0.000268, global_step=2018.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  92%|█████████▎| 74/80 [07:12<00:34,  5.77s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=2.02e-6, train/loss_step=0.000268, global_step=2018.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  92%|█████████▎| 74/80 [07:12<00:34,  5.77s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000961, train/loss_vlb_step=5.76e-6, train/loss_step=0.000961, global_step=2018.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  94%|█████████▍| 75/80 [07:13<00:28,  5.70s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000961, train/loss_vlb_step=5.76e-6, train/loss_step=0.000961, global_step=2018.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  94%|█████████▍| 75/80 [07:13<00:28,  5.70s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.18e-5, train/loss_step=0.006, global_step=2018.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]      Epoch 100:  95%|█████████▌| 76/80 [07:13<00:22,  5.63s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.006, train/loss_vlb_step=2.18e-5, train/loss_step=0.006, global_step=2018.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  95%|█████████▌| 76/80 [07:13<00:22,  5.63s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=9.1e-5, train/loss_step=0.0118, global_step=2018.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  96%|█████████▋| 77/80 [07:14<00:16,  5.57s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=9.1e-5, train/loss_step=0.0118, global_step=2018.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  96%|█████████▋| 77/80 [07:14<00:16,  5.57s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=3.07e-6, train/loss_step=0.000258, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  98%|█████████▊| 78/80 [07:14<00:11,  5.50s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=3.07e-6, train/loss_step=0.000258, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  98%|█████████▊| 78/80 [07:14<00:11,  5.50s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.44e-5, train/loss_step=0.00493, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 100:  99%|█████████▉| 79/80 [07:15<00:05,  5.44s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=2.44e-5, train/loss_step=0.00493, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100:  99%|█████████▉| 79/80 [07:15<00:05,  5.44s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.11e-6, train/loss_step=0.000275, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100: 100%|██████████| 80/80 [07:15<00:00,  5.38s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.11e-6, train/loss_step=0.000275, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 100: 100%|██████████| 80/80 [07:15<00:00,  5.38s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=9.85e-6, train/loss_step=0.0024, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]   Average Epoch time: 435.65 seconds
+Average Peak memory 29566.51MiB
+Epoch 100:   0%|          | 0/80 [00:00<00:00, 7423.55it/s, loss=0.00289, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=9.85e-6, train/loss_step=0.0024, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 101:   0%|          | 0/80 [00:00<00:00, 2955.82it/s, loss=0.00289, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=9.85e-6, train/loss_step=0.0024, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]Epoch 101:   1%|▏         | 1/80 [00:42<28:10, 21.40s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=9.85e-6, train/loss_step=0.0024, global_step=2019.0, lr_abs=0.0001, train/loss_simple_epoch=0.00385, train/loss_vlb_epoch=0.000118, train/loss_epoch=0.00385]  Epoch 101:   1%|▏         | 1/80 [00:42<28:10, 21.40s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000875, train/loss_vlb_step=3.11e-6, train/loss_step=0.000875, global_step=2020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   2%|▎         | 2/80 [00:43<18:45, 14.43s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000875, train/loss_vlb_step=3.11e-6, train/loss_step=0.000875, global_step=2020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   2%|▎         | 2/80 [00:43<18:45, 14.43s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=8.75e-6, train/loss_step=0.00224, global_step=2020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:   4%|▍         | 3/80 [00:47<15:05, 11.76s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00224, train/loss_vlb_step=8.75e-6, train/loss_step=0.00224, global_step=2020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   4%|▍         | 3/80 [00:47<15:05, 11.76s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=1.82e-5, train/loss_step=0.00126, global_step=2020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   5%|▌         | 4/80 [00:47<12:03,  9.51s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00126, train/loss_vlb_step=1.82e-5, train/loss_step=0.00126, global_step=2020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   5%|▌         | 4/80 [00:47<12:03,  9.51s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=1.62e-6, train/loss_step=0.00024, global_step=2020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   6%|▋         | 5/80 [00:48<10:00,  8.01s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=1.62e-6, train/loss_step=0.00024, global_step=2020.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   6%|▋         | 5/80 [00:48<10:00,  8.01s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=2.69e-5, train/loss_step=0.00746, global_step=2021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   8%|▊         | 6/80 [00:48<08:33,  6.94s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=2.69e-5, train/loss_step=0.00746, global_step=2021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   8%|▊         | 6/80 [00:48<08:33,  6.94s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000136, train/loss_vlb_step=5.45e-7, train/loss_step=0.000136, global_step=2021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   9%|▉         | 7/80 [00:53<08:06,  6.66s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.000136, train/loss_vlb_step=5.45e-7, train/loss_step=0.000136, global_step=2021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:   9%|▉         | 7/80 [00:53<08:06,  6.66s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=2.88e-6, train/loss_step=0.000624, global_step=2021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  10%|█         | 8/80 [01:18<10:28,  8.72s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=2.88e-6, train/loss_step=0.000624, global_step=2021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  10%|█         | 8/80 [01:18<10:28,  8.72s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.15e-5, train/loss_step=0.0105, global_step=2021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]    Epoch 101:  11%|█▏        | 9/80 [01:20<09:29,  8.02s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.15e-5, train/loss_step=0.0105, global_step=2021.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  11%|█▏        | 9/80 [01:20<09:29,  8.02s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000918, train/loss_vlb_step=4.94e-6, train/loss_step=0.000918, global_step=2022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  12%|█▎        | 10/80 [01:20<08:33,  7.33s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000918, train/loss_vlb_step=4.94e-6, train/loss_step=0.000918, global_step=2022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  12%|█▎        | 10/80 [01:20<08:33,  7.33s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.71e-5, train/loss_step=0.00649, global_step=2022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  14%|█▍        | 11/80 [01:24<08:07,  7.06s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.71e-5, train/loss_step=0.00649, global_step=2022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  14%|█▍        | 11/80 [01:24<08:07,  7.06s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.17e-5, train/loss_step=0.00736, global_step=2022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  15%|█▌        | 12/80 [01:26<07:32,  6.65s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00736, train/loss_vlb_step=3.17e-5, train/loss_step=0.00736, global_step=2022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  15%|█▌        | 12/80 [01:26<07:32,  6.65s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=0.000109, train/loss_step=0.00949, global_step=2022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  16%|█▋        | 13/80 [01:26<06:56,  6.21s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00949, train/loss_vlb_step=0.000109, train/loss_step=0.00949, global_step=2022.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  16%|█▋        | 13/80 [01:26<06:56,  6.21s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0001, train/loss_vlb_step=4.12e-7, train/loss_step=0.0001, global_step=2023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]   Epoch 101:  18%|█▊        | 14/80 [01:27<06:24,  5.83s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.0001, train/loss_vlb_step=4.12e-7, train/loss_step=0.0001, global_step=2023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  18%|█▊        | 14/80 [01:27<06:24,  5.83s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=2.88e-6, train/loss_step=0.000315, global_step=2023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  19%|█▉        | 15/80 [01:33<06:19,  5.84s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=2.88e-6, train/loss_step=0.000315, global_step=2023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  19%|█▉        | 15/80 [01:33<06:19,  5.84s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000693, train/loss_vlb_step=3.19e-6, train/loss_step=0.000693, global_step=2023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  20%|██        | 16/80 [02:12<08:17,  7.77s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000693, train/loss_vlb_step=3.19e-6, train/loss_step=0.000693, global_step=2023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  20%|██        | 16/80 [02:12<08:17,  7.77s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=7.33e-6, train/loss_step=0.00181, global_step=2023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  21%|██▏       | 17/80 [02:12<07:44,  7.37s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.00181, train/loss_vlb_step=7.33e-6, train/loss_step=0.00181, global_step=2023.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  21%|██▏       | 17/80 [02:12<07:44,  7.37s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=3.44e-5, train/loss_step=0.000778, global_step=2024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  22%|██▎       | 18/80 [02:13<07:14,  7.00s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000778, train/loss_vlb_step=3.44e-5, train/loss_step=0.000778, global_step=2024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  22%|██▎       | 18/80 [02:13<07:14,  7.00s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=1.07e-5, train/loss_step=0.000624, global_step=2024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  24%|██▍       | 19/80 [02:13<06:47,  6.68s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000624, train/loss_vlb_step=1.07e-5, train/loss_step=0.000624, global_step=2024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  24%|██▍       | 19/80 [02:13<06:47,  6.68s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.79e-6, train/loss_step=0.000298, global_step=2024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  25%|██▌       | 20/80 [02:14<06:23,  6.39s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.79e-6, train/loss_step=0.000298, global_step=2024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  25%|██▌       | 20/80 [02:14<06:23,  6.39s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2.22e-6, train/loss_step=0.000398, global_step=2024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  26%|██▋       | 21/80 [02:14<06:00,  6.12s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2.22e-6, train/loss_step=0.000398, global_step=2024.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  26%|██▋       | 21/80 [02:14<06:00,  6.12s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=8.19e-6, train/loss_step=0.00171, global_step=2025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00171, train/loss_vlb_step=8.19e-6, train/loss_step=0.00171, global_step=2025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=8.54e-6, train/loss_step=0.00152, global_step=2025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=8.54e-6, train/loss_step=0.00152, global_step=2025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=3.73e-6, train/loss_step=0.00103, global_step=2025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  30%|███       | 24/80 [02:41<06:01,  6.45s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=3.73e-6, train/loss_step=0.00103, global_step=2025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  30%|███       | 24/80 [02:41<06:01,  6.45s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=4.06e-5, train/loss_step=0.00129, global_step=2025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  31%|███▏      | 25/80 [02:42<05:43,  6.24s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00129, train/loss_vlb_step=4.06e-5, train/loss_step=0.00129, global_step=2025.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  31%|��██▏      | 25/80 [02:42<05:43,  6.24s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=7.38e-6, train/loss_step=0.00178, global_step=2026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  32%|███▎      | 26/80 [02:43<05:26,  6.04s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=7.38e-6, train/loss_step=0.00178, global_step=2026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  32%|███▎      | 26/80 [02:43<05:26,  6.04s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=0.000325, train/loss_step=0.00368, global_step=2026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  34%|███▍      | 27/80 [02:49<05:21,  6.06s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=0.000325, train/loss_step=0.00368, global_step=2026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  34%|███▍      | 27/80 [02:49<05:21,  6.06s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=6.42e-6, train/loss_step=0.00107, global_step=2026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397] Epoch 101:  35%|███▌      | 28/80 [02:50<05:05,  5.87s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=6.42e-6, train/loss_step=0.00107, global_step=2026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  35%|███▌      | 28/80 [02:50<05:05,  5.87s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000214, train/loss_step=0.0246, global_step=2026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  36%|███▋      | 29/80 [02:50<04:50,  5.69s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.0246, train/loss_vlb_step=0.000214, train/loss_step=0.0246, global_step=2026.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  36%|███▋      | 29/80 [02:50<04:50,  5.69s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=0.000261, train/loss_step=0.0208, global_step=2027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=0.000261, train/loss_step=0.0208, global_step=2027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  38%|███▊      | 30/80 [03:02<04:54,  5.89s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=4.06e-5, train/loss_step=0.00823, global_step=2027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  39%|███▉      | 31/80 [03:03<04:40,  5.72s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00823, train/loss_vlb_step=4.06e-5, train/loss_step=0.00823, global_step=2027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  39%|███▉      | 31/80 [03:03<04:40,  5.72s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=0.000421, train/loss_step=0.00188, global_step=2027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  40%|████      | 32/80 [03:18<04:49,  6.02s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=0.000421, train/loss_step=0.00188, global_step=2027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  40%|████      | 32/80 [03:18<04:49,  6.02s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=2.91e-6, train/loss_step=0.00082, global_step=2027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397] Epoch 101:  41%|████▏     | 33/80 [03:23<04:41,  6.00s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=2.91e-6, train/loss_step=0.00082, global_step=2027.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  41%|████▏     | 33/80 [03:23<04:41,  6.00s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=1.88e-6, train/loss_step=0.000428, global_step=2028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  42%|████▎     | 34/80 [03:24<04:28,  5.84s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=1.88e-6, train/loss_step=0.000428, global_step=2028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  42%|████▎     | 34/80 [03:24<04:28,  5.84s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.9e-6, train/loss_step=0.000499, global_step=2028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  44%|████▍     | 35/80 [03:31<04:23,  5.86s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=2.9e-6, train/loss_step=0.000499, global_step=2028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  44%|████▍     | 35/80 [03:31<04:23,  5.86s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000263, train/loss_step=0.0263, global_step=2028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397] Epoch 101:  45%|████▌     | 36/80 [03:31<04:11,  5.72s/it, loss=0.00498, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.000263, train/loss_step=0.0263, global_step=2028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  45%|████▌     | 36/80 [03:31<04:11,  5.72s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.000592, train/loss_vlb_step=3.5e-6, train/loss_step=0.000592, global_step=2028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  46%|████▋     | 37/80 [03:32<04:00,  5.58s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.000592, train/loss_vlb_step=3.5e-6, train/loss_step=0.000592, global_step=2028.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  46%|████▋     | 37/80 [03:32<04:00,  5.58s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.13e-5, train/loss_step=0.0104, global_step=2029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]    Epoch 101:  48%|████▊     | 38/80 [03:47<04:05,  5.83s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.13e-5, train/loss_step=0.0104, global_step=2029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  48%|████▊     | 38/80 [03:47<04:05,  5.83s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000384, train/loss_vlb_step=1.74e-6, train/loss_step=0.000384, global_step=2029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  49%|████▉     | 39/80 [03:48<03:53,  5.70s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000384, train/loss_vlb_step=1.74e-6, train/loss_step=0.000384, global_step=2029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  49%|████▉     | 39/80 [03:48<03:53,  5.70s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.66e-6, train/loss_step=0.000433, global_step=2029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  50%|█████     | 40/80 [04:00<03:55,  5.88s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000433, train/loss_vlb_step=1.66e-6, train/loss_step=0.000433, global_step=2029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  50%|█████     | 40/80 [04:00<03:55,  5.88s/it, loss=0.00697, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00289, train/loss_step=0.032, global_step=2029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]      Epoch 101:  51%|█████▏    | 41/80 [04:03<03:45,  5.79s/it, loss=0.00697, v_num=0, train/loss_simple_step=0.032, train/loss_vlb_step=0.00289, train/loss_step=0.032, global_step=2029.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  51%|█████▏    | 41/80 [04:03<03:45,  5.79s/it, loss=0.00726, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.46e-5, train/loss_step=0.00746, global_step=2030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  52%|█████▎    | 42/80 [04:11<03:42,  5.86s/it, loss=0.00726, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.46e-5, train/loss_step=0.00746, global_step=2030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  52%|█████▎    | 42/80 [04:11<03:42,  5.86s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.000884, train/loss_vlb_step=2.64e-5, train/loss_step=0.000884, global_step=2030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  54%|█████▍    | 43/80 [04:32<03:48,  6.19s/it, loss=0.00723, v_num=0, train/loss_simple_step=0.000884, train/loss_vlb_step=2.64e-5, train/loss_step=0.000884, global_step=2030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  54%|█████▍    | 43/80 [04:32<03:48,  6.19s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.00053, train/loss_vlb_step=4.63e-6, train/loss_step=0.00053, global_step=2030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  55%|█████▌    | 44/80 [04:32<03:38,  6.06s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.00053, train/loss_vlb_step=4.63e-6, train/loss_step=0.00053, global_step=2030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  55%|█████▌    | 44/80 [04:32<03:38,  6.06s/it, loss=0.00772, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=6.46e-5, train/loss_step=0.0116, global_step=2030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  56%|█████▋    | 45/80 [04:33<03:27,  5.94s/it, loss=0.00772, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=6.46e-5, train/loss_step=0.0116, global_step=2030.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  56%|█████▋    | 45/80 [04:33<03:27,  5.94s/it, loss=0.0082, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.9e-5, train/loss_step=0.0112, global_step=2031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  57%|█████▊    | 46/80 [04:34<03:18,  5.83s/it, loss=0.0082, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.9e-5, train/loss_step=0.0112, global_step=2031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  57%|█████▊    | 46/80 [04:34<03:18,  5.83s/it, loss=0.00815, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=3.13e-5, train/loss_step=0.00275, global_step=2031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  59%|█████▉    | 47/80 [04:34<03:08,  5.72s/it, loss=0.00815, v_num=0, train/loss_simple_step=0.00275, train/loss_vlb_step=3.13e-5, train/loss_step=0.00275, global_step=2031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  59%|█████▉    | 47/80 [04:34<03:08,  5.72s/it, loss=0.00826, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.23e-5, train/loss_step=0.00329, global_step=2031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  60%|██████    | 48/80 [04:48<03:08,  5.89s/it, loss=0.00826, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.23e-5, train/loss_step=0.00329, global_step=2031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  60%|██████    | 48/80 [04:48<03:08,  5.89s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.14e-6, train/loss_step=0.000286, global_step=2031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  61%|██████▏   | 49/80 [04:49<02:59,  5.78s/it, loss=0.00705, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.14e-6, train/loss_step=0.000286, global_step=2031.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  61%|██████▏   | 49/80 [04:49<02:59,  5.78s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=1.72e-5, train/loss_step=0.00481, global_step=2032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  62%|██████▎   | 50/80 [04:52<02:51,  5.73s/it, loss=0.00624, v_num=0, train/loss_simple_step=0.00481, train/loss_vlb_step=1.72e-5, train/loss_step=0.00481, global_step=2032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  62%|██████▎   | 50/80 [04:52<02:51,  5.73s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.69e-6, train/loss_step=0.000345, global_step=2032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  64%|██████▍   | 51/80 [05:20<02:58,  6.16s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.69e-6, train/loss_step=0.000345, global_step=2032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  64%|██████▍   | 51/80 [05:20<02:58,  6.16s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.13e-5, train/loss_step=0.00308, global_step=2032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 101:  65%|██████▌   | 52/80 [05:21<02:49,  6.06s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.13e-5, train/loss_step=0.00308, global_step=2032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  65%|██████▌   | 52/80 [05:21<02:49,  6.06s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4e-5, train/loss_step=0.0102, global_step=2032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]     Epoch 101:  66%|██████▋   | 53/80 [05:21<02:40,  5.96s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=4e-5, train/loss_step=0.0102, global_step=2032.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  66%|██████▋   | 53/80 [05:21<02:40,  5.96s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=2.23e-6, train/loss_step=0.000341, global_step=2033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  68%|██████▊   | 54/80 [05:22<02:32,  5.86s/it, loss=0.00637, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=2.23e-6, train/loss_step=0.000341, global_step=2033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  68%|██████▊   | 54/80 [05:22<02:32,  5.86s/it, loss=0.00713, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.000114, train/loss_step=0.0157, global_step=2033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]   Epoch 101:  69%|██████▉   | 55/80 [05:22<02:24,  5.76s/it, loss=0.00713, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.000114, train/loss_step=0.0157, global_step=2033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  69%|██████▉   | 55/80 [05:22<02:24,  5.76s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=0.000431, train/loss_step=0.0024, global_step=2033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  70%|███████   | 56/80 [05:30<02:19,  5.80s/it, loss=0.00594, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=0.000431, train/loss_step=0.0024, global_step=2033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  70%|███████   | 56/80 [05:30<02:19,  5.80s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000134, train/loss_step=0.0158, global_step=2033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397] Epoch 101:  71%|███████▏  | 57/80 [05:31<02:11,  5.71s/it, loss=0.0067, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000134, train/loss_step=0.0158, global_step=2033.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  71%|███████▏  | 57/80 [05:31<02:11,  5.71s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=8.18e-5, train/loss_step=0.0102, global_step=2034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  72%|███████▎  | 58/80 [05:34<02:04,  5.66s/it, loss=0.00669, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=8.18e-5, train/loss_step=0.0102, global_step=2034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  72%|███████▎  | 58/80 [05:34<02:04,  5.66s/it, loss=0.00681, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.64e-5, train/loss_step=0.00272, global_step=2034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  74%|███████▍  | 59/80 [06:04<02:07,  6.07s/it, loss=0.00681, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.64e-5, train/loss_step=0.00272, global_step=2034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  74%|███████▍  | 59/80 [06:04<02:07,  6.07s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.000961, train/loss_vlb_step=2.8e-5, train/loss_step=0.000961, global_step=2034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  75%|███████▌  | 60/80 [06:04<01:59,  5.98s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.000961, train/loss_vlb_step=2.8e-5, train/loss_step=0.000961, global_step=2034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  75%|███████▌  | 60/80 [06:04<01:59,  5.98s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=3.2e-6, train/loss_step=0.000712, global_step=2034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  76%|███████▋  | 61/80 [06:05<01:51,  5.89s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=3.2e-6, train/loss_step=0.000712, global_step=2034.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  76%|███████▋  | 61/80 [06:05<01:51,  5.89s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=6.41e-5, train/loss_step=0.012, global_step=2035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]     Epoch 101:  78%|███████▊  | 62/80 [06:05<01:44,  5.81s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=6.41e-5, train/loss_step=0.012, global_step=2035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  78%|███████▊  | 62/80 [06:05<01:44,  5.81s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=1.02e-6, train/loss_step=0.00021, global_step=2035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  79%|███████▉  | 63/80 [06:06<01:37,  5.72s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00021, train/loss_vlb_step=1.02e-6, train/loss_step=0.00021, global_step=2035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  79%|███████▉  | 63/80 [06:06<01:37,  5.72s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=3.77e-5, train/loss_step=0.00865, global_step=2035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  80%|████████  | 64/80 [06:07<01:30,  5.65s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00865, train/loss_vlb_step=3.77e-5, train/loss_step=0.00865, global_step=2035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  80%|████████  | 64/80 [06:07<01:30,  5.65s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=6.95e-7, train/loss_step=0.000157, global_step=2035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  81%|████████▏ | 65/80 [06:11<01:24,  5.62s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=6.95e-7, train/loss_step=0.000157, global_step=2035.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  81%|████████▏ | 65/80 [06:11<01:24,  5.62s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.52e-6, train/loss_step=0.00149, global_step=2036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]   Epoch 101:  82%|████████▎ | 66/80 [06:11<01:17,  5.55s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.52e-6, train/loss_step=0.00149, global_step=2036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  82%|████████▎ | 66/80 [06:11<01:17,  5.55s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=9.94e-7, train/loss_step=0.000251, global_step=2036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  84%|████████▍ | 67/80 [06:40<01:16,  5.90s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=9.94e-7, train/loss_step=0.000251, global_step=2036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  84%|████████▍ | 67/80 [06:40<01:16,  5.90s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=9.61e-5, train/loss_step=0.0139, global_step=2036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]    Epoch 101:  85%|████████▌ | 68/80 [06:41<01:09,  5.82s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=9.61e-5, train/loss_step=0.0139, global_step=2036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  85%|████████▌ | 68/80 [06:41<01:09,  5.82s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.8e-5, train/loss_step=0.00758, global_step=2036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  86%|████████▋ | 69/80 [06:42<01:03,  5.74s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=3.8e-5, train/loss_step=0.00758, global_step=2036.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  86%|████████▋ | 69/80 [06:42<01:03,  5.74s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=8.68e-6, train/loss_step=0.00247, global_step=2037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=8.68e-6, train/loss_step=0.00247, global_step=2037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=0.000509, train/loss_step=0.00492, global_step=2037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  89%|████████▉ | 71/80 [06:42<00:50,  5.60s/it, loss=0.00569, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=0.000509, train/loss_step=0.00492, global_step=2037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  89%|████████▉ | 71/80 [06:42<00:50,  5.60s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=7.27e-6, train/loss_step=0.00193, global_step=2037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397] Epoch 101:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00193, train/loss_vlb_step=7.27e-6, train/loss_step=0.00193, global_step=2037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  90%|█████████ | 72/80 [06:48<00:44,  5.59s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=4.85e-6, train/loss_step=0.00109, global_step=2037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  91%|█████████▏| 73/80 [06:48<00:38,  5.53s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=4.85e-6, train/loss_step=0.00109, global_step=2037.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  91%|█████████▏| 73/80 [06:48<00:38,  5.53s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000516, train/loss_vlb_step=4.96e-6, train/loss_step=0.000516, global_step=2038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  92%|█████████▎| 74/80 [06:49<00:32,  5.46s/it, loss=0.00518, v_num=0, train/loss_simple_step=0.000516, train/loss_vlb_step=4.96e-6, train/loss_step=0.000516, global_step=2038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  92%|█████████▎| 74/80 [06:49<00:32,  5.46s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000181, train/loss_step=0.0124, global_step=2038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]   Epoch 101:  94%|█████████▍| 75/80 [07:11<00:28,  5.67s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.000181, train/loss_step=0.0124, global_step=2038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  94%|█████████▍| 75/80 [07:11<00:28,  5.67s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=4.69e-6, train/loss_step=0.000987, global_step=2038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  95%|█████████▌| 76/80 [07:11<00:22,  5.61s/it, loss=0.00495, v_num=0, train/loss_simple_step=0.000987, train/loss_vlb_step=4.69e-6, train/loss_step=0.000987, global_step=2038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  95%|█████████▌| 76/80 [07:11<00:22,  5.61s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=1e-6, train/loss_step=0.000239, global_step=2038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]   Epoch 101:  96%|█████████▋| 77/80 [07:12<00:16,  5.54s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000239, train/loss_vlb_step=1e-6, train/loss_step=0.000239, global_step=2038.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  96%|█████████▋| 77/80 [07:12<00:16,  5.54s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.7e-6, train/loss_step=0.000471, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  98%|█████████▊| 78/80 [07:15<00:11,  5.52s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.7e-6, train/loss_step=0.000471, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  98%|█████████▊| 78/80 [07:15<00:11,  5.52s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=1.97e-5, train/loss_step=0.00539, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397] Epoch 101:  99%|█████████▉| 79/80 [07:16<00:05,  5.45s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00539, train/loss_vlb_step=1.97e-5, train/loss_step=0.00539, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101:  99%|█████████▉| 79/80 [07:16<00:05,  5.45s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=6.1e-5, train/loss_step=0.0101, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]   Epoch 101: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=6.1e-5, train/loss_step=0.0101, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 101: 100%|██████████| 80/80 [07:16<00:00,  5.39s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000963, train/loss_vlb_step=6.9e-6, train/loss_step=0.000963, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Average Epoch time: 436.75 seconds
+Average Peak memory 29565.16MiB
+Epoch 101:   0%|          | 0/80 [00:00<00:00, 5949.37it/s, loss=0.00429, v_num=0, train/loss_simple_step=0.000963, train/loss_vlb_step=6.9e-6, train/loss_step=0.000963, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 102:   0%|          | 0/80 [00:00<00:00, 2430.07it/s, loss=0.00429, v_num=0, train/loss_simple_step=0.000963, train/loss_vlb_step=6.9e-6, train/loss_step=0.000963, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]Epoch 102:   1%|▏         | 1/80 [00:44<29:27, 22.37s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000963, train/loss_vlb_step=6.9e-6, train/loss_step=0.000963, global_step=2039.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000112, train/loss_epoch=0.00397]  Epoch 102:   1%|▏         | 1/80 [00:44<29:27, 22.38s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=2.1e-5, train/loss_step=0.00623, global_step=2040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]     Epoch 102:   2%|▎         | 2/80 [00:45<19:35, 15.08s/it, loss=0.004, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=2.1e-5, train/loss_step=0.00623, global_step=2040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:   2%|▎         | 2/80 [00:45<19:36, 15.08s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.11e-5, train/loss_step=0.00281, global_step=2040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:   4%|▍         | 3/80 [00:45<14:40, 11.43s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00281, train/loss_vlb_step=1.11e-5, train/loss_step=0.00281, global_step=2040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:   4%|▍         | 3/80 [00:45<14:40, 11.43s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.46e-6, train/loss_step=0.001, global_step=2040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]    Epoch 102:   5%|▌         | 4/80 [00:46<11:45,  9.28s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.001, train/loss_vlb_step=4.46e-6, train/loss_step=0.001, global_step=2040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:   5%|▌         | 4/80 [00:46<11:45,  9.28s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.56e-6, train/loss_step=0.000325, global_step=2040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:   6%|▋         | 5/80 [00:46<09:46,  7.82s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000325, train/loss_vlb_step=1.56e-6, train/loss_step=0.000325, global_step=2040.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:   6%|▋         | 5/80 [00:46<09:46,  7.82s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=9.09e-6, train/loss_step=0.00235, global_step=2041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]   Epoch 102:   8%|▊         | 6/80 [00:47<08:20,  6.77s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=9.09e-6, train/loss_step=0.00235, global_step=2041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:   8%|▊         | 6/80 [00:47<08:20,  6.77s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.69e-5, train/loss_step=0.0148, global_step=2041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:   9%|▉         | 7/80 [00:47<07:16,  5.99s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=5.69e-5, train/loss_step=0.0148, global_step=2041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:   9%|▉         | 7/80 [00:47<07:16,  5.99s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.97e-6, train/loss_step=0.00135, global_step=2041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  10%|█         | 8/80 [01:13<09:49,  8.19s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.97e-6, train/loss_step=0.00135, global_step=2041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  10%|█         | 8/80 [01:13<09:49,  8.19s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=1.05e-5, train/loss_step=0.00158, global_step=2041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  11%|█▏        | 9/80 [01:26<10:13,  8.64s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=1.05e-5, train/loss_step=0.00158, global_step=2041.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  11%|█▏        | 9/80 [01:26<10:13,  8.64s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.4e-5, train/loss_step=0.00637, global_step=2042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:  12%|█▎        | 10/80 [01:26<09:13,  7.90s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00637, train/loss_vlb_step=2.4e-5, train/loss_step=0.00637, global_step=2042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  12%|█▎        | 10/80 [01:26<09:13,  7.90s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.16e-6, train/loss_step=0.00026, global_step=2042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  14%|█▍        | 11/80 [01:27<08:22,  7.28s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.16e-6, train/loss_step=0.00026, global_step=2042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  14%|█▍        | 11/80 [01:27<08:22,  7.28s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=1.94e-6, train/loss_step=0.000412, global_step=2042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  15%|█▌        | 12/80 [01:33<08:08,  7.18s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=1.94e-6, train/loss_step=0.000412, global_step=2042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  15%|█▌        | 12/80 [01:33<08:08,  7.18s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.24e-5, train/loss_step=0.00374, global_step=2042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  16%|█▋        | 13/80 [01:33<07:29,  6.70s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.24e-5, train/loss_step=0.00374, global_step=2042.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  16%|█▋        | 13/80 [01:33<07:29,  6.70s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.19e-5, train/loss_step=0.00344, global_step=2043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  18%|█▊        | 14/80 [01:34<06:55,  6.29s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00344, train/loss_vlb_step=1.19e-5, train/loss_step=0.00344, global_step=2043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  18%|█▊        | 14/80 [01:34<06:55,  6.29s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=3.39e-6, train/loss_step=0.00082, global_step=2043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  19%|█▉        | 15/80 [01:34<06:25,  5.93s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00082, train/loss_vlb_step=3.39e-6, train/loss_step=0.00082, global_step=2043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  19%|█▉        | 15/80 [01:34<06:25,  5.93s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000513, train/loss_vlb_step=9.84e-6, train/loss_step=0.000513, global_step=2043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  20%|██        | 16/80 [01:47<06:44,  6.33s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000513, train/loss_vlb_step=9.84e-6, train/loss_step=0.000513, global_step=2043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  20%|██        | 16/80 [01:47<06:44,  6.33s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=7.88e-6, train/loss_step=0.00131, global_step=2043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  21%|██▏       | 17/80 [01:57<06:51,  6.53s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=7.88e-6, train/loss_step=0.00131, global_step=2043.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  21%|██▏       | 17/80 [01:57<06:51,  6.53s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.64e-5, train/loss_step=0.0198, global_step=2044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  22%|██▎       | 18/80 [02:07<06:57,  6.73s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=8.64e-5, train/loss_step=0.0198, global_step=2044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  22%|██▎       | 18/80 [02:07<06:57,  6.73s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=7.35e-5, train/loss_step=0.013, global_step=2044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  24%|██▍       | 19/80 [02:08<06:31,  6.42s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=7.35e-5, train/loss_step=0.013, global_step=2044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  24%|██▍       | 19/80 [02:08<06:31,  6.42s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=3.28e-6, train/loss_step=0.000297, global_step=2044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  25%|██▌       | 20/80 [02:11<06:15,  6.25s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=3.28e-6, train/loss_step=0.000297, global_step=2044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  25%|██▌       | 20/80 [02:11<06:15,  6.25s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.36e-6, train/loss_step=0.00136, global_step=2044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  26%|██▋       | 21/80 [02:11<05:53,  5.99s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.36e-6, train/loss_step=0.00136, global_step=2044.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  26%|██▋       | 21/80 [02:11<05:53,  5.99s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000797, train/loss_vlb_step=4.03e-6, train/loss_step=0.000797, global_step=2045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  28%|██▊       | 22/80 [02:12<05:33,  5.75s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000797, train/loss_vlb_step=4.03e-6, train/loss_step=0.000797, global_step=2045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  28%|██▊       | 22/80 [02:12<05:33,  5.75s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=3.88e-5, train/loss_step=0.0108, global_step=2045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]    Epoch 102:  29%|██▉       | 23/80 [02:12<05:15,  5.53s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=3.88e-5, train/loss_step=0.0108, global_step=2045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  29%|██▉       | 23/80 [02:12<05:15,  5.53s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.1e-6, train/loss_step=0.000264, global_step=2045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  30%|███       | 24/80 [02:46<06:12,  6.64s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.1e-6, train/loss_step=0.000264, global_step=2045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  30%|███       | 24/80 [02:46<06:12,  6.64s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=1.44e-5, train/loss_step=0.000434, global_step=2045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  31%|███▏      | 25/80 [02:46<05:52,  6.41s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=1.44e-5, train/loss_step=0.000434, global_step=2045.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  31%|███▏      | 25/80 [02:46<05:52,  6.41s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=7.76e-7, train/loss_step=0.000166, global_step=2046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  32%|███▎      | 26/80 [02:53<05:47,  6.43s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=7.76e-7, train/loss_step=0.000166, global_step=2046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  32%|███▎      | 26/80 [02:53<05:47,  6.43s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000179, train/loss_vlb_step=7.19e-7, train/loss_step=0.000179, global_step=2046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  34%|███▍      | 27/80 [02:54<05:29,  6.22s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000179, train/loss_vlb_step=7.19e-7, train/loss_step=0.000179, global_step=2046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  34%|███▍      | 27/80 [02:54<05:29,  6.22s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.44e-5, train/loss_step=0.0052, global_step=2046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]    Epoch 102:  35%|███▌      | 28/80 [02:59<05:21,  6.18s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0052, train/loss_vlb_step=2.44e-5, train/loss_step=0.0052, global_step=2046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  35%|███▌      | 28/80 [02:59<05:21,  6.18s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=9.93e-6, train/loss_step=0.00282, global_step=2046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  36%|███▋      | 29/80 [02:59<05:05,  5.99s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00282, train/loss_vlb_step=9.93e-6, train/loss_step=0.00282, global_step=2046.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  36%|███▋      | 29/80 [02:59<05:05,  5.99s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.8e-6, train/loss_step=0.00102, global_step=2047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  38%|███▊      | 30/80 [03:00<04:50,  5.81s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.8e-6, train/loss_step=0.00102, global_step=2047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  38%|███▊      | 30/80 [03:00<04:50,  5.81s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.83e-6, train/loss_step=0.0012, global_step=2047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:  39%|███▉      | 31/80 [03:00<04:36,  5.65s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=4.83e-6, train/loss_step=0.0012, global_step=2047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  39%|███▉      | 31/80 [03:00<04:36,  5.65s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000211, train/loss_vlb_step=1.29e-6, train/loss_step=0.000211, global_step=2047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  40%|████      | 32/80 [03:23<04:55,  6.15s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000211, train/loss_vlb_step=1.29e-6, train/loss_step=0.000211, global_step=2047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  40%|████      | 32/80 [03:23<04:55,  6.15s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=9.77e-7, train/loss_step=0.000268, global_step=2047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  41%|████▏     | 33/80 [03:24<04:42,  6.01s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000268, train/loss_vlb_step=9.77e-7, train/loss_step=0.000268, global_step=2047.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  41%|████▏     | 33/80 [03:24<04:42,  6.01s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=5.4e-5, train/loss_step=0.00188, global_step=2048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]   Epoch 102:  42%|████▎     | 34/80 [03:34<04:42,  6.14s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00188, train/loss_vlb_step=5.4e-5, train/loss_step=0.00188, global_step=2048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  42%|████▎     | 34/80 [03:34<04:42,  6.14s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=7.1e-5, train/loss_step=0.0101, global_step=2048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  44%|████▍     | 35/80 [03:35<04:29,  5.98s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=7.1e-5, train/loss_step=0.0101, global_step=2048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  44%|████▍     | 35/80 [03:35<04:29,  5.98s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=6.19e-6, train/loss_step=0.00153, global_step=2048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  45%|████▌     | 36/80 [03:45<04:27,  6.09s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=6.19e-6, train/loss_step=0.00153, global_step=2048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  45%|████▌     | 36/80 [03:45<04:27,  6.09s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.04e-6, train/loss_step=0.000259, global_step=2048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  46%|████▋     | 37/80 [03:45<04:15,  5.94s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=1.04e-6, train/loss_step=0.000259, global_step=2048.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  46%|████▋     | 37/80 [03:45<04:15,  5.94s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=4.48e-6, train/loss_step=0.000308, global_step=2049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:  48%|████▊     | 38/80 [03:46<04:03,  5.80s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=4.48e-6, train/loss_step=0.000308, global_step=2049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  48%|████▊     | 38/80 [03:46<04:03,  5.80s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=2.83e-6, train/loss_step=0.000314, global_step=2049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  49%|████▉     | 39/80 [03:46<03:52,  5.67s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=2.83e-6, train/loss_step=0.000314, global_step=2049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  49%|████▉     | 39/80 [03:46<03:52,  5.67s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=3.49e-6, train/loss_step=0.000387, global_step=2049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  50%|█████     | 40/80 [03:56<03:51,  5.78s/it, loss=0.00198, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=3.49e-6, train/loss_step=0.000387, global_step=2049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  50%|█████     | 40/80 [03:56<03:51,  5.78s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=2.84e-5, train/loss_step=0.00712, global_step=2049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  51%|█████▏    | 41/80 [04:14<03:56,  6.07s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00712, train/loss_vlb_step=2.84e-5, train/loss_step=0.00712, global_step=2049.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  51%|█████▏    | 41/80 [04:14<03:56,  6.07s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.16e-5, train/loss_step=0.0128, global_step=2050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  52%|█████▎    | 42/80 [04:23<03:52,  6.13s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0128, train/loss_vlb_step=5.16e-5, train/loss_step=0.0128, global_step=2050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  52%|█████▎    | 42/80 [04:23<03:52,  6.13s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.000671, train/loss_vlb_step=2.68e-6, train/loss_step=0.000671, global_step=2050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  54%|█████▍    | 43/80 [04:23<03:41,  6.00s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.000671, train/loss_vlb_step=2.68e-6, train/loss_step=0.000671, global_step=2050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  54%|█████▍    | 43/80 [04:23<03:41,  6.00s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.000595, train/loss_vlb_step=2.16e-6, train/loss_step=0.000595, global_step=2050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  55%|█████▌    | 44/80 [04:43<03:46,  6.30s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.000595, train/loss_vlb_step=2.16e-6, train/loss_step=0.000595, global_step=2050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  55%|█████▌    | 44/80 [04:43<03:46,  6.30s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=4.25e-6, train/loss_step=0.000788, global_step=2050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  56%|█████▋    | 45/80 [04:44<03:36,  6.18s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=4.25e-6, train/loss_step=0.000788, global_step=2050.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  56%|█████▋    | 45/80 [04:44<03:36,  6.18s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000104, train/loss_vlb_step=5.1e-7, train/loss_step=0.000104, global_step=2051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:  57%|█████▊    | 46/80 [04:44<03:25,  6.05s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000104, train/loss_vlb_step=5.1e-7, train/loss_step=0.000104, global_step=2051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  57%|█████▊    | 46/80 [04:44<03:25,  6.05s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000205, train/loss_vlb_step=1.46e-6, train/loss_step=0.000205, global_step=2051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  59%|█████▉    | 47/80 [04:45<03:15,  5.94s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000205, train/loss_vlb_step=1.46e-6, train/loss_step=0.000205, global_step=2051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  59%|█████▉    | 47/80 [04:45<03:15,  5.94s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000771, train/loss_vlb_step=3.29e-6, train/loss_step=0.000771, global_step=2051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  60%|██████    | 48/80 [04:45<03:06,  5.83s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000771, train/loss_vlb_step=3.29e-6, train/loss_step=0.000771, global_step=2051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  60%|██████    | 48/80 [04:45<03:06,  5.83s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=1.14e-6, train/loss_step=0.00022, global_step=2051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  61%|██████▏   | 49/80 [05:03<03:08,  6.07s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=1.14e-6, train/loss_step=0.00022, global_step=2051.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  61%|██████▏   | 49/80 [05:03<03:08,  6.07s/it, loss=0.002, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.31e-6, train/loss_step=0.000279, global_step=2052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  62%|██████▎   | 50/80 [05:04<02:58,  5.96s/it, loss=0.002, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.31e-6, train/loss_step=0.000279, global_step=2052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  62%|██████▎   | 50/80 [05:04<02:58,  5.96s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=8.48e-6, train/loss_step=0.00239, global_step=2052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  64%|██████▍   | 51/80 [05:04<02:49,  5.86s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=8.48e-6, train/loss_step=0.00239, global_step=2052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  64%|██████▍   | 51/80 [05:04<02:49,  5.86s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.21e-5, train/loss_step=0.0036, global_step=2052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  65%|██████▌   | 52/80 [05:25<02:51,  6.13s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.21e-5, train/loss_step=0.0036, global_step=2052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  65%|██████▌   | 52/80 [05:25<02:51,  6.13s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=4.69e-5, train/loss_step=0.0124, global_step=2052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  66%|██████▋   | 53/80 [05:25<02:42,  6.03s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=4.69e-5, train/loss_step=0.0124, global_step=2052.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  66%|██████▋   | 53/80 [05:25<02:42,  6.03s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000145, train/loss_vlb_step=7.22e-7, train/loss_step=0.000145, global_step=2053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  68%|██████▊   | 54/80 [05:26<02:34,  5.93s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000145, train/loss_vlb_step=7.22e-7, train/loss_step=0.000145, global_step=2053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  68%|██████▊   | 54/80 [05:26<02:34,  5.93s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.08e-5, train/loss_step=0.00263, global_step=2053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  69%|██████▉   | 55/80 [05:26<02:25,  5.83s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.08e-5, train/loss_step=0.00263, global_step=2053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  69%|██████▉   | 55/80 [05:26<02:25,  5.83s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000905, train/loss_vlb_step=4.7e-6, train/loss_step=0.000905, global_step=2053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  70%|███████   | 56/80 [05:27<02:17,  5.74s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000905, train/loss_vlb_step=4.7e-6, train/loss_step=0.000905, global_step=2053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  70%|███████   | 56/80 [05:27<02:17,  5.74s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=6.31e-6, train/loss_step=0.00123, global_step=2053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:  71%|███████▏  | 57/80 [05:53<02:20,  6.09s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=6.31e-6, train/loss_step=0.00123, global_step=2053.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  71%|███████▏  | 57/80 [05:53<02:20,  6.09s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.65e-6, train/loss_step=0.00035, global_step=2054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  72%|███████▎  | 58/80 [05:53<02:11,  5.99s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.65e-6, train/loss_step=0.00035, global_step=2054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  72%|███████▎  | 58/80 [05:53<02:11,  5.99s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=6.67e-5, train/loss_step=0.0115, global_step=2054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  74%|███████▍  | 59/80 [05:54<02:03,  5.90s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=6.67e-5, train/loss_step=0.0115, global_step=2054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  74%|███████▍  | 59/80 [05:54<02:03,  5.90s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=6.34e-6, train/loss_step=0.000464, global_step=2054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  75%|███████▌  | 60/80 [06:03<01:59,  5.96s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=6.34e-6, train/loss_step=0.000464, global_step=2054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  75%|███████▌  | 60/80 [06:03<01:59,  5.96s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=3.59e-5, train/loss_step=0.0097, global_step=2054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]    Epoch 102:  76%|███████▋  | 61/80 [06:04<01:51,  5.87s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.0097, train/loss_vlb_step=3.59e-5, train/loss_step=0.0097, global_step=2054.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  76%|███████▋  | 61/80 [06:04<01:51,  5.87s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=2.72e-6, train/loss_step=0.000735, global_step=2055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  78%|███████▊  | 62/80 [06:04<01:44,  5.79s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=2.72e-6, train/loss_step=0.000735, global_step=2055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  78%|███████▊  | 62/80 [06:04<01:44,  5.79s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=4.81e-6, train/loss_step=0.00115, global_step=2055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  79%|███████▉  | 63/80 [06:05<01:36,  5.70s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=4.81e-6, train/loss_step=0.00115, global_step=2055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  79%|███████▉  | 63/80 [06:05<01:36,  5.70s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=9.43e-6, train/loss_step=0.00263, global_step=2055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  80%|████████  | 64/80 [06:05<01:29,  5.62s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=9.43e-6, train/loss_step=0.00263, global_step=2055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  80%|████████  | 64/80 [06:05<01:29,  5.62s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=3.07e-5, train/loss_step=0.00519, global_step=2055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  81%|████████▏ | 65/80 [06:40<01:30,  6.07s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=3.07e-5, train/loss_step=0.00519, global_step=2055.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  81%|████████▏ | 65/80 [06:40<01:30,  6.07s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.19e-5, train/loss_step=0.00498, global_step=2056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  82%|████████▎ | 66/80 [06:40<01:23,  5.98s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00498, train/loss_vlb_step=2.19e-5, train/loss_step=0.00498, global_step=2056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  82%|████████▎ | 66/80 [06:40<01:23,  5.98s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.5e-6, train/loss_step=0.000299, global_step=2056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  84%|████████▍ | 67/80 [06:41<01:16,  5.90s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.5e-6, train/loss_step=0.000299, global_step=2056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  84%|████████▍ | 67/80 [06:41<01:16,  5.90s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=4.14e-5, train/loss_step=0.00574, global_step=2056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:  85%|████████▌ | 68/80 [06:41<01:09,  5.82s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=4.14e-5, train/loss_step=0.00574, global_step=2056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  85%|████████▌ | 68/80 [06:41<01:09,  5.82s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=3.47e-6, train/loss_step=0.000288, global_step=2056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000288, train/loss_vlb_step=3.47e-6, train/loss_step=0.000288, global_step=2056.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=1.69e-5, train/loss_step=0.00476, global_step=2057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 102:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00476, train/loss_vlb_step=1.69e-5, train/loss_step=0.00476, global_step=2057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000741, train/loss_vlb_step=9.22e-6, train/loss_step=0.000741, global_step=2057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  89%|████████▉ | 71/80 [06:43<00:50,  5.60s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000741, train/loss_vlb_step=9.22e-6, train/loss_step=0.000741, global_step=2057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  89%|████████▉ | 71/80 [06:43<00:50,  5.60s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.99e-5, train/loss_step=0.0112, global_step=2057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]    Epoch 102:  90%|█████████ | 72/80 [06:43<00:44,  5.53s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=6.99e-5, train/loss_step=0.0112, global_step=2057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  90%|█████████ | 72/80 [06:43<00:44,  5.53s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000389, train/loss_step=0.0153, global_step=2057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:  91%|█████████▏| 73/80 [07:16<00:41,  5.89s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0153, train/loss_vlb_step=0.000389, train/loss_step=0.0153, global_step=2057.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  91%|█████████▏| 73/80 [07:16<00:41,  5.89s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=7.33e-6, train/loss_step=0.00211, global_step=2058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  92%|█████████▎| 74/80 [07:16<00:34,  5.82s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00211, train/loss_vlb_step=7.33e-6, train/loss_step=0.00211, global_step=2058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  92%|█████████▎| 74/80 [07:16<00:34,  5.82s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=0.000428, train/loss_step=0.00304, global_step=2058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  94%|█████████▍| 75/80 [07:17<00:28,  5.75s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=0.000428, train/loss_step=0.00304, global_step=2058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  94%|█████████▍| 75/80 [07:17<00:28,  5.75s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=3.57e-5, train/loss_step=0.00309, global_step=2058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:  95%|█████████▌| 76/80 [07:17<00:22,  5.68s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=3.57e-5, train/loss_step=0.00309, global_step=2058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  95%|█████████▌| 76/80 [07:17<00:22,  5.68s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=1.5e-5, train/loss_step=0.00119, global_step=2058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408] Epoch 102:  96%|█████████▋| 77/80 [07:18<00:16,  5.62s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=1.5e-5, train/loss_step=0.00119, global_step=2058.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  96%|█████████▋| 77/80 [07:18<00:16,  5.62s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000173, train/loss_vlb_step=8.16e-7, train/loss_step=0.000173, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000173, train/loss_vlb_step=8.16e-7, train/loss_step=0.000173, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000161, train/loss_vlb_step=8.49e-7, train/loss_step=0.000161, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  99%|█████████▉| 79/80 [07:19<00:05,  5.49s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000161, train/loss_vlb_step=8.49e-7, train/loss_step=0.000161, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102:  99%|█████████▉| 79/80 [07:19<00:05,  5.49s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=3.09e-6, train/loss_step=0.000591, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102: 100%|██████████| 80/80 [07:19<00:00,  5.43s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000591, train/loss_vlb_step=3.09e-6, train/loss_step=0.000591, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 102: 100%|██████████| 80/80 [07:19<00:00,  5.43s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=4.46e-6, train/loss_step=0.000467, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Average Epoch time: 439.58 seconds
+Average Peak memory 29566.37MiB
+Epoch 102:   0%|          | 0/80 [00:00<00:00, 7449.92it/s, loss=0.00319, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=4.46e-6, train/loss_step=0.000467, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 103:   0%|          | 0/80 [00:00<00:00, 2774.01it/s, loss=0.00319, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=4.46e-6, train/loss_step=0.000467, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]Epoch 103:   1%|▏         | 1/80 [00:46<30:29, 23.15s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=4.46e-6, train/loss_step=0.000467, global_step=2059.0, lr_abs=0.0001, train/loss_simple_epoch=0.00408, train/loss_vlb_epoch=7.15e-5, train/loss_epoch=0.00408]  Epoch 103:   1%|▏         | 1/80 [00:46<30:29, 23.15s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=4.33e-5, train/loss_step=0.00697, global_step=2060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]   Epoch 103:   2%|▎         | 2/80 [00:49<21:29, 16.53s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00697, train/loss_vlb_step=4.33e-5, train/loss_step=0.00697, global_step=2060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:   2%|▎         | 2/80 [00:49<21:29, 16.53s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.06e-6, train/loss_step=0.000411, global_step=2060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:   4%|▍         | 3/80 [00:50<16:04, 12.52s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000411, train/loss_vlb_step=2.06e-6, train/loss_step=0.000411, global_step=2060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:   4%|▍         | 3/80 [00:50<16:04, 12.52s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.66e-5, train/loss_step=0.00452, global_step=2060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:   5%|▌         | 4/80 [00:50<12:49, 10.12s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00452, train/loss_vlb_step=1.66e-5, train/loss_step=0.00452, global_step=2060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:   5%|▌         | 4/80 [00:50<12:49, 10.12s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.54e-6, train/loss_step=0.000308, global_step=2060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:   6%|▋         | 5/80 [00:51<10:46,  8.62s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.54e-6, train/loss_step=0.000308, global_step=2060.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:   6%|▋         | 5/80 [00:51<10:46,  8.62s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=8.23e-6, train/loss_step=0.00226, global_step=2061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:   8%|▊         | 6/80 [00:52<09:12,  7.46s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=8.23e-6, train/loss_step=0.00226, global_step=2061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:   8%|▊         | 6/80 [00:52<09:12,  7.46s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.3e-6, train/loss_step=0.000324, global_step=2061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:   9%|▉         | 7/80 [00:52<08:01,  6.59s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.3e-6, train/loss_step=0.000324, global_step=2061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:   9%|▉         | 7/80 [00:52<08:01,  6.59s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=6.44e-6, train/loss_step=0.00178, global_step=2061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367] Epoch 103:  10%|█         | 8/80 [01:25<11:22,  9.47s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00178, train/loss_vlb_step=6.44e-6, train/loss_step=0.00178, global_step=2061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  10%|█         | 8/80 [01:25<11:22,  9.47s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=6.63e-6, train/loss_step=0.00185, global_step=2061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  11%|█▏        | 9/80 [01:26<10:16,  8.69s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=6.63e-6, train/loss_step=0.00185, global_step=2061.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  11%|█▏        | 9/80 [01:26<10:16,  8.69s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=5.18e-6, train/loss_step=0.00146, global_step=2062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367] Epoch 103:  12%|█▎        | 10/80 [01:27<09:15,  7.94s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=5.18e-6, train/loss_step=0.00146, global_step=2062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  12%|█▎        | 10/80 [01:27<09:15,  7.94s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=9.12e-6, train/loss_step=0.00246, global_step=2062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  14%|█▍        | 11/80 [01:27<08:25,  7.33s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00246, train/loss_vlb_step=9.12e-6, train/loss_step=0.00246, global_step=2062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  14%|█▍        | 11/80 [01:27<08:25,  7.33s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=1.85e-5, train/loss_step=0.00467, global_step=2062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  15%|█▌        | 12/80 [01:28<07:42,  6.80s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=1.85e-5, train/loss_step=0.00467, global_step=2062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  15%|█▌        | 12/80 [01:28<07:42,  6.80s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=3.07e-6, train/loss_step=0.000349, global_step=2062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  16%|█▋        | 13/80 [01:35<07:35,  6.80s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=3.07e-6, train/loss_step=0.000349, global_step=2062.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  16%|█▋        | 13/80 [01:35<07:35,  6.80s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.000285, train/loss_step=0.024, global_step=2063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]     Epoch 103:  18%|█▊        | 14/80 [01:35<07:00,  6.38s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.024, train/loss_vlb_step=0.000285, train/loss_step=0.024, global_step=2063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  18%|█▊        | 14/80 [01:35<07:00,  6.38s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=0.000145, train/loss_step=0.0209, global_step=2063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  19%|█▉        | 15/80 [01:36<06:30,  6.01s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.0209, train/loss_vlb_step=0.000145, train/loss_step=0.0209, global_step=2063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  19%|█▉        | 15/80 [01:36<06:30,  6.01s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.92e-6, train/loss_step=0.000355, global_step=2063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  20%|██        | 16/80 [02:04<07:49,  7.34s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.92e-6, train/loss_step=0.000355, global_step=2063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  20%|██        | 16/80 [02:04<07:49,  7.34s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=1.24e-5, train/loss_step=0.00131, global_step=2063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  21%|██▏       | 17/80 [02:21<08:14,  7.86s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=1.24e-5, train/loss_step=0.00131, global_step=2063.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  21%|██▏       | 17/80 [02:21<08:14,  7.86s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=3.92e-5, train/loss_step=0.00944, global_step=2064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  22%|██▎       | 18/80 [02:21<07:42,  7.47s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00944, train/loss_vlb_step=3.92e-5, train/loss_step=0.00944, global_step=2064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  22%|██▎       | 18/80 [02:21<07:42,  7.47s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=2.76e-6, train/loss_step=0.000365, global_step=2064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  24%|██▍       | 19/80 [02:22<07:14,  7.12s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=2.76e-6, train/loss_step=0.000365, global_step=2064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  24%|██▍       | 19/80 [02:22<07:14,  7.12s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=2e-5, train/loss_step=0.00331, global_step=2064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]     Epoch 103:  25%|██▌       | 20/80 [02:22<06:48,  6.81s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.00331, train/loss_vlb_step=2e-5, train/loss_step=0.00331, global_step=2064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  25%|██▌       | 20/80 [02:22<06:48,  6.81s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.47e-6, train/loss_step=0.000336, global_step=2064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  26%|██▋       | 21/80 [02:23<06:24,  6.52s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.47e-6, train/loss_step=0.000336, global_step=2064.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  26%|██▋       | 21/80 [02:23<06:24,  6.52s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=5.14e-6, train/loss_step=0.00109, global_step=2065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  28%|██▊       | 22/80 [02:23<06:02,  6.26s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=5.14e-6, train/loss_step=0.00109, global_step=2065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  28%|██▊       | 22/80 [02:23<06:02,  6.26s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=7.11e-6, train/loss_step=0.00174, global_step=2065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  29%|██▉       | 23/80 [02:24<05:43,  6.02s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.00174, train/loss_vlb_step=7.11e-6, train/loss_step=0.00174, global_step=2065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  29%|██▉       | 23/80 [02:24<05:43,  6.02s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=3.12e-5, train/loss_step=0.00846, global_step=2065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  30%|███       | 24/80 [02:36<05:49,  6.24s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00846, train/loss_vlb_step=3.12e-5, train/loss_step=0.00846, global_step=2065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  30%|███       | 24/80 [02:36<05:49,  6.24s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=4.19e-5, train/loss_step=0.00577, global_step=2065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  31%|███▏      | 25/80 [03:14<06:52,  7.50s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00577, train/loss_vlb_step=4.19e-5, train/loss_step=0.00577, global_step=2065.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  31%|███▏      | 25/80 [03:14<06:52,  7.50s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=8.56e-6, train/loss_step=0.0024, global_step=2066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  32%|███▎      | 26/80 [03:15<06:30,  7.24s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=8.56e-6, train/loss_step=0.0024, global_step=2066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  32%|███▎      | 26/80 [03:15<06:30,  7.24s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=1.73e-5, train/loss_step=0.00507, global_step=2066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  34%|███▍      | 27/80 [03:15<06:10,  6.99s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00507, train/loss_vlb_step=1.73e-5, train/loss_step=0.00507, global_step=2066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  34%|███▍      | 27/80 [03:15<06:10,  6.99s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=5.86e-6, train/loss_step=0.000296, global_step=2066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  35%|███▌      | 28/80 [03:16<05:52,  6.77s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000296, train/loss_vlb_step=5.86e-6, train/loss_step=0.000296, global_step=2066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  35%|███▌      | 28/80 [03:16<05:52,  6.77s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=2.84e-6, train/loss_step=0.000338, global_step=2066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  36%|███▋      | 29/80 [03:16<05:34,  6.56s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000338, train/loss_vlb_step=2.84e-6, train/loss_step=0.000338, global_step=2066.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  36%|███▋      | 29/80 [03:16<05:34,  6.56s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=3.01e-6, train/loss_step=0.000387, global_step=2067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  38%|███▊      | 30/80 [03:17<05:18,  6.37s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000387, train/loss_vlb_step=3.01e-6, train/loss_step=0.000387, global_step=2067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  38%|███▊      | 30/80 [03:17<05:18,  6.37s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.66e-6, train/loss_step=0.000329, global_step=2067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  39%|███▉      | 31/80 [03:17<05:03,  6.18s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=1.66e-6, train/loss_step=0.000329, global_step=2067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  39%|███▉      | 31/80 [03:17<05:03,  6.18s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=4.99e-6, train/loss_step=0.00119, global_step=2067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  40%|████      | 32/80 [03:30<05:05,  6.37s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=4.99e-6, train/loss_step=0.00119, global_step=2067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  40%|████      | 32/80 [03:30<05:05,  6.37s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=0.000236, train/loss_step=0.0137, global_step=2067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367] Epoch 103:  41%|████▏     | 33/80 [03:57<05:28,  6.99s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=0.000236, train/loss_step=0.0137, global_step=2067.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  41%|████▏     | 33/80 [03:57<05:28,  6.99s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=8.55e-6, train/loss_step=0.00255, global_step=2068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  42%|████▎     | 34/80 [03:58<05:13,  6.81s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.00255, train/loss_vlb_step=8.55e-6, train/loss_step=0.00255, global_step=2068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  42%|████▎     | 34/80 [03:58<05:13,  6.81s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=2.45e-6, train/loss_step=0.000497, global_step=2068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  44%|████▍     | 35/80 [03:58<04:58,  6.63s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000497, train/loss_vlb_step=2.45e-6, train/loss_step=0.000497, global_step=2068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  44%|████▍     | 35/80 [03:58<04:58,  6.63s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.78e-5, train/loss_step=0.00352, global_step=2068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  45%|████▌     | 36/80 [03:59<04:44,  6.47s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.00352, train/loss_vlb_step=1.78e-5, train/loss_step=0.00352, global_step=2068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  45%|████▌     | 36/80 [03:59<04:44,  6.47s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000854, train/loss_vlb_step=3.74e-6, train/loss_step=0.000854, global_step=2068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  46%|████▋     | 37/80 [03:59<04:31,  6.31s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000854, train/loss_vlb_step=3.74e-6, train/loss_step=0.000854, global_step=2068.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  46%|████▋     | 37/80 [03:59<04:31,  6.31s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000729, train/loss_vlb_step=4.61e-6, train/loss_step=0.000729, global_step=2069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  48%|████▊     | 38/80 [04:00<04:18,  6.16s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000729, train/loss_vlb_step=4.61e-6, train/loss_step=0.000729, global_step=2069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  48%|████▊     | 38/80 [04:00<04:18,  6.16s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000594, train/loss_vlb_step=2.57e-6, train/loss_step=0.000594, global_step=2069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  49%|████▉     | 39/80 [04:00<04:06,  6.02s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000594, train/loss_vlb_step=2.57e-6, train/loss_step=0.000594, global_step=2069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  49%|████▉     | 39/80 [04:00<04:06,  6.02s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=3.29e-6, train/loss_step=0.000506, global_step=2069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  50%|█████     | 40/80 [04:23<04:17,  6.43s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000506, train/loss_vlb_step=3.29e-6, train/loss_step=0.000506, global_step=2069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  50%|█████     | 40/80 [04:23<04:17,  6.43s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=0.000403, train/loss_step=0.0166, global_step=2069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]   Epoch 103:  51%|█████▏    | 41/80 [04:37<04:18,  6.62s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=0.000403, train/loss_step=0.0166, global_step=2069.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  51%|█████▏    | 41/80 [04:37<04:18,  6.62s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000319, train/loss_vlb_step=1.36e-6, train/loss_step=0.000319, global_step=2070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  52%|█████▎    | 42/80 [04:38<04:05,  6.47s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000319, train/loss_vlb_step=1.36e-6, train/loss_step=0.000319, global_step=2070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  52%|█████▎    | 42/80 [04:38<04:05,  6.47s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=6.56e-7, train/loss_step=0.000164, global_step=2070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  54%|█████▍    | 43/80 [04:38<03:54,  6.34s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=6.56e-7, train/loss_step=0.000164, global_step=2070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  54%|█████▍    | 43/80 [04:38<03:54,  6.34s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=1.62e-5, train/loss_step=0.00455, global_step=2070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=1.62e-5, train/loss_step=0.00455, global_step=2070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  55%|█████▌    | 44/80 [04:39<03:43,  6.21s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=0.000847, train/loss_step=0.00238, global_step=2070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=0.000847, train/loss_step=0.00238, global_step=2070.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  56%|█████▋    | 45/80 [04:40<03:33,  6.09s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=9.83e-7, train/loss_step=0.000258, global_step=2071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  57%|█████▊    | 46/80 [04:40<03:22,  5.97s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=9.83e-7, train/loss_step=0.000258, global_step=2071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  57%|█████▊    | 46/80 [04:40<03:22,  5.97s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.03e-5, train/loss_step=0.00225, global_step=2071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]   Epoch 103:  59%|█████▉    | 47/80 [04:40<03:13,  5.85s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00225, train/loss_vlb_step=1.03e-5, train/loss_step=0.00225, global_step=2071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  59%|█████▉    | 47/80 [04:40<03:13,  5.85s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=3.37e-6, train/loss_step=0.000861, global_step=2071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  60%|██████    | 48/80 [05:08<03:21,  6.30s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000861, train/loss_vlb_step=3.37e-6, train/loss_step=0.000861, global_step=2071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  60%|██████    | 48/80 [05:08<03:21,  6.30s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000361, train/loss_vlb_step=1.89e-6, train/loss_step=0.000361, global_step=2071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  61%|██████▏   | 49/80 [05:17<03:16,  6.35s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000361, train/loss_vlb_step=1.89e-6, train/loss_step=0.000361, global_step=2071.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  61%|██████▏   | 49/80 [05:17<03:16,  6.35s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=6.04e-6, train/loss_step=0.000301, global_step=2072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  62%|██████▎   | 50/80 [05:17<03:06,  6.23s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=6.04e-6, train/loss_step=0.000301, global_step=2072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  62%|██████▎   | 50/80 [05:17<03:06,  6.23s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=4.71e-6, train/loss_step=0.00122, global_step=2072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  64%|██████▍   | 51/80 [05:18<02:57,  6.12s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=4.71e-6, train/loss_step=0.00122, global_step=2072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  64%|██████▍   | 51/80 [05:18<02:57,  6.12s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=5.47e-7, train/loss_step=0.000113, global_step=2072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  65%|██████▌   | 52/80 [05:18<02:48,  6.02s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=5.47e-7, train/loss_step=0.000113, global_step=2072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  65%|██████▌   | 52/80 [05:18<02:48,  6.02s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.1e-5, train/loss_step=0.00326, global_step=2072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]   Epoch 103:  66%|██████▋   | 53/80 [05:19<02:39,  5.91s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.00326, train/loss_vlb_step=1.1e-5, train/loss_step=0.00326, global_step=2072.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  66%|██████▋   | 53/80 [05:19<02:39,  5.91s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.000103, train/loss_vlb_step=4.82e-7, train/loss_step=0.000103, global_step=2073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  68%|██████▊   | 54/80 [05:19<02:31,  5.82s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.000103, train/loss_vlb_step=4.82e-7, train/loss_step=0.000103, global_step=2073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  68%|██████▊   | 54/80 [05:19<02:31,  5.82s/it, loss=0.00207, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.38e-5, train/loss_step=0.00248, global_step=2073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  69%|██████▉   | 55/80 [05:20<02:23,  5.72s/it, loss=0.00207, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=1.38e-5, train/loss_step=0.00248, global_step=2073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  69%|██████▉   | 55/80 [05:20<02:23,  5.72s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000354, train/loss_vlb_step=1.24e-6, train/loss_step=0.000354, global_step=2073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  70%|███████   | 56/80 [05:43<02:24,  6.03s/it, loss=0.00191, v_num=0, train/loss_simple_step=0.000354, train/loss_vlb_step=1.24e-6, train/loss_step=0.000354, global_step=2073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  70%|███████   | 56/80 [05:43<02:24,  6.03s/it, loss=0.002, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=9.37e-6, train/loss_step=0.00271, global_step=2073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]    Epoch 103:  71%|███████▏  | 57/80 [05:59<02:22,  6.20s/it, loss=0.002, v_num=0, train/loss_simple_step=0.00271, train/loss_vlb_step=9.37e-6, train/loss_step=0.00271, global_step=2073.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  71%|███████▏  | 57/80 [05:59<02:22,  6.20s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.78e-5, train/loss_step=0.0108, global_step=2074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  72%|███████▎  | 58/80 [06:00<02:14,  6.11s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=4.78e-5, train/loss_step=0.0108, global_step=2074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  72%|███████▎  | 58/80 [06:00<02:14,  6.11s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.76e-5, train/loss_step=0.00173, global_step=2074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.00173, train/loss_vlb_step=1.76e-5, train/loss_step=0.00173, global_step=2074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  74%|███████▍  | 59/80 [06:00<02:06,  6.01s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=8.53e-6, train/loss_step=0.00228, global_step=2074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  75%|███████▌  | 60/80 [06:01<01:58,  5.92s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=8.53e-6, train/loss_step=0.00228, global_step=2074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  75%|███████▌  | 60/80 [06:01<01:58,  5.92s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.56e-6, train/loss_step=0.000274, global_step=2074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  76%|███████▋  | 61/80 [06:01<01:50,  5.84s/it, loss=0.00184, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.56e-6, train/loss_step=0.000274, global_step=2074.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  76%|███████▋  | 61/80 [06:01<01:50,  5.84s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.26e-5, train/loss_step=0.00755, global_step=2075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]   Epoch 103:  78%|███████▊  | 62/80 [06:02<01:43,  5.75s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.00755, train/loss_vlb_step=3.26e-5, train/loss_step=0.00755, global_step=2075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  78%|███████▊  | 62/80 [06:02<01:43,  5.75s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.82e-6, train/loss_step=0.000367, global_step=2075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  79%|███████▉  | 63/80 [06:02<01:36,  5.67s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.82e-6, train/loss_step=0.000367, global_step=2075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  79%|███████▉  | 63/80 [06:02<01:36,  5.67s/it, loss=0.00201, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=1.26e-5, train/loss_step=0.00045, global_step=2075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  80%|████████  | 64/80 [06:32<01:36,  6.04s/it, loss=0.00201, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=1.26e-5, train/loss_step=0.00045, global_step=2075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  80%|████████  | 64/80 [06:32<01:36,  6.04s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=1.92e-5, train/loss_step=0.00547, global_step=2075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  81%|████████▏ | 65/80 [06:51<01:33,  6.24s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=1.92e-5, train/loss_step=0.00547, global_step=2075.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  81%|████████▏ | 65/80 [06:51<01:33,  6.24s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=2.09e-6, train/loss_step=0.00025, global_step=2076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  82%|████████▎ | 66/80 [06:52<01:26,  6.16s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=2.09e-6, train/loss_step=0.00025, global_step=2076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  82%|████████▎ | 66/80 [06:52<01:26,  6.16s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=7.29e-6, train/loss_step=0.00158, global_step=2076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  84%|████████▍ | 67/80 [06:52<01:18,  6.07s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=7.29e-6, train/loss_step=0.00158, global_step=2076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  84%|████████▍ | 67/80 [06:52<01:18,  6.07s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=4.22e-5, train/loss_step=0.00362, global_step=2076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  85%|████████▌ | 68/80 [06:53<01:11,  5.99s/it, loss=0.00226, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=4.22e-5, train/loss_step=0.00362, global_step=2076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  85%|████████▌ | 68/80 [06:53<01:11,  5.99s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.000156, train/loss_vlb_step=6.46e-7, train/loss_step=0.000156, global_step=2076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  86%|████████▋ | 69/80 [06:53<01:05,  5.91s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.000156, train/loss_vlb_step=6.46e-7, train/loss_step=0.000156, global_step=2076.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  86%|████████▋ | 69/80 [06:53<01:05,  5.91s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=1.72e-5, train/loss_step=0.00473, global_step=2077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  88%|████████▊ | 70/80 [06:54<00:58,  5.84s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.00473, train/loss_vlb_step=1.72e-5, train/loss_step=0.00473, global_step=2077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  88%|████████▊ | 70/80 [06:54<00:58,  5.84s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00991, train/loss_vlb_step=4.76e-5, train/loss_step=0.00991, global_step=2077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  89%|████████▉ | 71/80 [06:54<00:51,  5.76s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00991, train/loss_vlb_step=4.76e-5, train/loss_step=0.00991, global_step=2077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  89%|████████▉ | 71/80 [06:54<00:51,  5.76s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=2.39e-6, train/loss_step=0.000567, global_step=2077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  90%|█████████ | 72/80 [07:07<00:46,  5.85s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000567, train/loss_vlb_step=2.39e-6, train/loss_step=0.000567, global_step=2077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  90%|█████████ | 72/80 [07:07<00:46,  5.85s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=2.4e-5, train/loss_step=0.0068, global_step=2077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]     Epoch 103:  91%|█████████▏| 73/80 [07:30<00:42,  6.09s/it, loss=0.00311, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=2.4e-5, train/loss_step=0.0068, global_step=2077.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  91%|█████████▏| 73/80 [07:30<00:42,  6.09s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=9.55e-6, train/loss_step=0.00232, global_step=2078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  92%|█████████▎| 74/80 [07:31<00:36,  6.02s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00232, train/loss_vlb_step=9.55e-6, train/loss_step=0.00232, global_step=2078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  92%|█████████▎| 74/80 [07:31<00:36,  6.02s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.33e-5, train/loss_step=0.00196, global_step=2078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  94%|█████████▍| 75/80 [07:31<00:29,  5.95s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=1.33e-5, train/loss_step=0.00196, global_step=2078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  94%|█████████▍| 75/80 [07:31<00:29,  5.95s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.51e-5, train/loss_step=0.0022, global_step=2078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 103:  95%|█████████▌| 76/80 [07:32<00:23,  5.87s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.0022, train/loss_vlb_step=1.51e-5, train/loss_step=0.0022, global_step=2078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  95%|█████████▌| 76/80 [07:32<00:23,  5.87s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=3.26e-5, train/loss_step=0.00342, global_step=2078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  96%|█████████▋| 77/80 [07:32<00:17,  5.81s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00342, train/loss_vlb_step=3.26e-5, train/loss_step=0.00342, global_step=2078.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  96%|█████████▋| 77/80 [07:32<00:17,  5.81s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=2.49e-6, train/loss_step=0.000525, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  98%|█████████▊| 78/80 [07:33<00:11,  5.74s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000525, train/loss_vlb_step=2.49e-6, train/loss_step=0.000525, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  98%|█████████▊| 78/80 [07:33<00:11,  5.74s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000193, train/loss_vlb_step=7.77e-7, train/loss_step=0.000193, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  99%|█████████▉| 79/80 [07:33<00:05,  5.67s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000193, train/loss_vlb_step=7.77e-7, train/loss_step=0.000193, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103:  99%|█████████▉| 79/80 [07:33<00:05,  5.67s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.79e-5, train/loss_step=0.0049, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]    Epoch 103: 100%|██████████| 80/80 [07:34<00:00,  5.61s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.0049, train/loss_vlb_step=2.79e-5, train/loss_step=0.0049, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 103: 100%|██████████| 80/80 [07:34<00:00,  5.61s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000115, train/loss_vlb_step=4.1e-7, train/loss_step=0.000115, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Average Epoch time: 454.33 seconds
+Average Peak memory 29565.73MiB
+Epoch 103:   0%|          | 0/80 [00:00<00:00, 6034.97it/s, loss=0.00285, v_num=0, train/loss_simple_step=0.000115, train/loss_vlb_step=4.1e-7, train/loss_step=0.000115, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 104:   0%|          | 0/80 [00:00<00:00, 2284.48it/s, loss=0.00285, v_num=0, train/loss_simple_step=0.000115, train/loss_vlb_step=4.1e-7, train/loss_step=0.000115, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]Epoch 104:   1%|▏         | 1/80 [00:38<25:04, 19.04s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.000115, train/loss_vlb_step=4.1e-7, train/loss_step=0.000115, global_step=2079.0, lr_abs=0.0001, train/loss_simple_epoch=0.00367, train/loss_vlb_epoch=6.52e-5, train/loss_epoch=0.00367]  Epoch 104:   1%|▏         | 1/80 [00:38<25:04, 19.05s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=2.24e-6, train/loss_step=0.000487, global_step=2080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   2%|▎         | 2/80 [00:38<16:42, 12.86s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=2.24e-6, train/loss_step=0.000487, global_step=2080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   2%|▎         | 2/80 [00:38<16:42, 12.86s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=2.46e-5, train/loss_step=0.0067, global_step=2080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]   Epoch 104:   4%|▍         | 3/80 [00:57<18:21, 14.31s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.0067, train/loss_vlb_step=2.46e-5, train/loss_step=0.0067, global_step=2080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   4%|▍         | 3/80 [00:57<18:21, 14.31s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=3.17e-6, train/loss_step=0.000626, global_step=2080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   5%|▌         | 4/80 [00:57<14:38, 11.55s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=3.17e-6, train/loss_step=0.000626, global_step=2080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   5%|▌         | 4/80 [00:57<14:38, 11.55s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=8.66e-6, train/loss_step=0.0025, global_step=2080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]    Epoch 104:   6%|▋         | 5/80 [00:58<12:08,  9.71s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.0025, train/loss_vlb_step=8.66e-6, train/loss_step=0.0025, global_step=2080.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   6%|▋         | 5/80 [00:58<12:08,  9.71s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=1.8e-5, train/loss_step=0.00478, global_step=2081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   8%|▊         | 6/80 [00:58<10:21,  8.39s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=1.8e-5, train/loss_step=0.00478, global_step=2081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   8%|▊         | 6/80 [00:58<10:21,  8.39s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.08e-5, train/loss_step=0.00322, global_step=2081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   9%|▉         | 7/80 [00:59<09:00,  7.41s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=1.08e-5, train/loss_step=0.00322, global_step=2081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:   9%|▉         | 7/80 [00:59<09:00,  7.41s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=2.59e-6, train/loss_step=0.000365, global_step=2081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  10%|█         | 8/80 [01:15<10:01,  8.35s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000365, train/loss_vlb_step=2.59e-6, train/loss_step=0.000365, global_step=2081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  10%|█         | 8/80 [01:15<10:01,  8.35s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=1.9e-5, train/loss_step=0.00572, global_step=2081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]    Epoch 104:  11%|█▏        | 9/80 [01:16<09:00,  7.62s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=1.9e-5, train/loss_step=0.00572, global_step=2081.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  11%|█▏        | 9/80 [01:16<09:00,  7.62s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=2.82e-5, train/loss_step=0.00733, global_step=2082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  12%|█▎        | 10/80 [01:16<08:07,  6.97s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00733, train/loss_vlb_step=2.82e-5, train/loss_step=0.00733, global_step=2082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  12%|█▎        | 10/80 [01:16<08:07,  6.97s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=0.000147, train/loss_step=0.0112, global_step=2082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  14%|█▍        | 11/80 [01:35<09:10,  7.98s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=0.000147, train/loss_step=0.0112, global_step=2082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  14%|█▍        | 11/80 [01:35<09:10,  7.98s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.23e-5, train/loss_step=0.00553, global_step=2082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  15%|█▌        | 12/80 [01:36<08:23,  7.41s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.23e-5, train/loss_step=0.00553, global_step=2082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  15%|█▌        | 12/80 [01:36<08:23,  7.41s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=2.71e-6, train/loss_step=0.000425, global_step=2082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  16%|█▋        | 13/80 [01:36<07:43,  6.92s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=2.71e-6, train/loss_step=0.000425, global_step=2082.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  16%|█▋        | 13/80 [01:36<07:43,  6.92s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.29e-5, train/loss_step=0.00437, global_step=2083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  18%|█▊        | 14/80 [01:37<07:08,  6.49s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00437, train/loss_vlb_step=2.29e-5, train/loss_step=0.00437, global_step=2083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  18%|█▊        | 14/80 [01:37<07:08,  6.49s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000744, train/loss_vlb_step=2.9e-6, train/loss_step=0.000744, global_step=2083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  19%|█▉        | 15/80 [01:37<06:37,  6.11s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.000744, train/loss_vlb_step=2.9e-6, train/loss_step=0.000744, global_step=2083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  19%|█▉        | 15/80 [01:37<06:37,  6.11s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=2.32e-6, train/loss_step=0.000488, global_step=2083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  20%|██        | 16/80 [01:56<07:17,  6.83s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=2.32e-6, train/loss_step=0.000488, global_step=2083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  20%|██        | 16/80 [01:56<07:17,  6.83s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=7.7e-7, train/loss_step=0.000175, global_step=2083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397] Epoch 104:  21%|██▏       | 17/80 [02:02<07:09,  6.82s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=7.7e-7, train/loss_step=0.000175, global_step=2083.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  21%|██▏       | 17/80 [02:02<07:09,  6.82s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00099, train/loss_vlb_step=4.28e-6, train/loss_step=0.00099, global_step=2084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397] Epoch 104:  22%|██▎       | 18/80 [02:03<06:42,  6.49s/it, loss=0.00304, v_num=0, train/loss_simple_step=0.00099, train/loss_vlb_step=4.28e-6, train/loss_step=0.00099, global_step=2084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  22%|██▎       | 18/80 [02:03<06:42,  6.49s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=4.53e-5, train/loss_step=0.0118, global_step=2084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  24%|██▍       | 19/80 [02:19<07:04,  6.96s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=4.53e-5, train/loss_step=0.0118, global_step=2084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  24%|██▍       | 19/80 [02:19<07:04,  6.96s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000922, train/loss_vlb_step=7.61e-6, train/loss_step=0.000922, global_step=2084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  25%|██▌       | 20/80 [02:19<06:39,  6.65s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000922, train/loss_vlb_step=7.61e-6, train/loss_step=0.000922, global_step=2084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  25%|██▌       | 20/80 [02:19<06:39,  6.65s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.9e-5, train/loss_step=0.00469, global_step=2084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]   Epoch 104:  26%|██▋       | 21/80 [02:20<06:16,  6.37s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.9e-5, train/loss_step=0.00469, global_step=2084.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  26%|██▋       | 21/80 [02:20<06:16,  6.37s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=1.02e-6, train/loss_step=0.000224, global_step=2085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  28%|██▊       | 22/80 [02:20<05:54,  6.12s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=1.02e-6, train/loss_step=0.000224, global_step=2085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  28%|██▊       | 22/80 [02:20<05:54,  6.12s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=0.00013, train/loss_step=0.00827, global_step=2085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  29%|██▉       | 23/80 [02:21<05:35,  5.88s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00827, train/loss_vlb_step=0.00013, train/loss_step=0.00827, global_step=2085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  29%|██▉       | 23/80 [02:21<05:35,  5.88s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=2.42e-6, train/loss_step=0.00042, global_step=2085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  30%|███       | 24/80 [02:40<05:58,  6.40s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=2.42e-6, train/loss_step=0.00042, global_step=2085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  30%|███       | 24/80 [02:40<05:58,  6.40s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.09e-5, train/loss_step=0.00678, global_step=2085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  31%|███▏      | 25/80 [02:40<05:40,  6.19s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00678, train/loss_vlb_step=3.09e-5, train/loss_step=0.00678, global_step=2085.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  31%|███▏      | 25/80 [02:40<05:40,  6.19s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=9.02e-7, train/loss_step=0.000218, global_step=2086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  32%|███▎      | 26/80 [02:41<05:22,  5.98s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=9.02e-7, train/loss_step=0.000218, global_step=2086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  32%|███▎      | 26/80 [02:41<05:22,  5.98s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.49e-5, train/loss_step=0.00746, global_step=2086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397] Epoch 104:  34%|███▍      | 27/80 [02:52<05:26,  6.15s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00746, train/loss_vlb_step=3.49e-5, train/loss_step=0.00746, global_step=2086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  34%|███▍      | 27/80 [02:52<05:26,  6.15s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000122, train/loss_step=0.0249, global_step=2086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397] Epoch 104:  35%|███▌      | 28/80 [02:52<05:09,  5.96s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.0249, train/loss_vlb_step=0.000122, train/loss_step=0.0249, global_step=2086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  35%|███▌      | 28/80 [02:52<05:09,  5.96s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.74e-6, train/loss_step=0.000351, global_step=2086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  36%|███▋      | 29/80 [03:15<05:32,  6.52s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.74e-6, train/loss_step=0.000351, global_step=2086.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  36%|███▋      | 29/80 [03:15<05:32,  6.52s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.3e-5, train/loss_step=0.00483, global_step=2087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]   Epoch 104:  38%|███▊      | 30/80 [03:16<05:16,  6.33s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.3e-5, train/loss_step=0.00483, global_step=2087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  38%|███▊      | 30/80 [03:16<05:16,  6.33s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=1.06e-6, train/loss_step=0.000199, global_step=2087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  39%|███▉      | 31/80 [03:16<05:01,  6.14s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=1.06e-6, train/loss_step=0.000199, global_step=2087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  39%|███▉      | 31/80 [03:16<05:01,  6.14s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=7.25e-6, train/loss_step=0.00149, global_step=2087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  40%|████      | 32/80 [03:18<04:48,  6.01s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=7.25e-6, train/loss_step=0.00149, global_step=2087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  40%|████      | 32/80 [03:18<04:48,  6.01s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=0.000191, train/loss_step=0.00102, global_step=2087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  41%|████▏     | 33/80 [03:21<04:39,  5.94s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=0.000191, train/loss_step=0.00102, global_step=2087.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  41%|████▏     | 33/80 [03:21<04:39,  5.94s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000116, train/loss_vlb_step=5.6e-7, train/loss_step=0.000116, global_step=2088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  42%|████▎     | 34/80 [03:22<04:26,  5.78s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000116, train/loss_vlb_step=5.6e-7, train/loss_step=0.000116, global_step=2088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  42%|████▎     | 34/80 [03:22<04:26,  5.78s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=2.76e-6, train/loss_step=0.000248, global_step=2088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  44%|████▍     | 35/80 [03:34<04:27,  5.95s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=2.76e-6, train/loss_step=0.000248, global_step=2088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  44%|████▍     | 35/80 [03:34<04:27,  5.95s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.04e-5, train/loss_step=0.0056, global_step=2088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]    Epoch 104:  45%|████▌     | 36/80 [03:34<04:15,  5.81s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0056, train/loss_vlb_step=2.04e-5, train/loss_step=0.0056, global_step=2088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  45%|████▌     | 36/80 [03:34<04:15,  5.81s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.13e-6, train/loss_step=0.0003, global_step=2088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  46%|████▋     | 37/80 [04:02<04:33,  6.37s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0003, train/loss_vlb_step=1.13e-6, train/loss_step=0.0003, global_step=2088.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  46%|████▋     | 37/80 [04:02<04:33,  6.37s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=4.17e-6, train/loss_step=0.00094, global_step=2089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  48%|████▊     | 38/80 [04:02<04:21,  6.22s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00094, train/loss_vlb_step=4.17e-6, train/loss_step=0.00094, global_step=2089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  48%|████▊     | 38/80 [04:02<04:21,  6.22s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=4.95e-6, train/loss_step=0.00112, global_step=2089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  49%|████▉     | 39/80 [04:02<04:09,  6.07s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=4.95e-6, train/loss_step=0.00112, global_step=2089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  49%|████▉     | 39/80 [04:02<04:09,  6.07s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=7.14e-7, train/loss_step=0.000165, global_step=2089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  50%|█████     | 40/80 [04:03<03:57,  5.94s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=7.14e-7, train/loss_step=0.000165, global_step=2089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  50%|█████     | 40/80 [04:03<03:57,  5.94s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.19e-5, train/loss_step=0.00165, global_step=2089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  51%|█████▏    | 41/80 [04:05<03:48,  5.85s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.19e-5, train/loss_step=0.00165, global_step=2089.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  51%|█████▏    | 41/80 [04:05<03:48,  5.85s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=9.32e-5, train/loss_step=0.0195, global_step=2090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  52%|█████▎    | 42/80 [04:06<03:37,  5.73s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0195, train/loss_vlb_step=9.32e-5, train/loss_step=0.0195, global_step=2090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  52%|█████▎    | 42/80 [04:06<03:37,  5.73s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.18e-6, train/loss_step=0.000241, global_step=2090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  54%|█████▍    | 43/80 [04:14<03:33,  5.78s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.18e-6, train/loss_step=0.000241, global_step=2090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  54%|█████▍    | 43/80 [04:14<03:33,  5.78s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000694, train/loss_vlb_step=5.09e-6, train/loss_step=0.000694, global_step=2090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  55%|█████▌    | 44/80 [04:14<03:23,  5.66s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000694, train/loss_vlb_step=5.09e-6, train/loss_step=0.000694, global_step=2090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  55%|█████▌    | 44/80 [04:14<03:23,  5.66s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000603, train/loss_vlb_step=8.95e-6, train/loss_step=0.000603, global_step=2090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  56%|█████▋    | 45/80 [04:51<03:41,  6.34s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000603, train/loss_vlb_step=8.95e-6, train/loss_step=0.000603, global_step=2090.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  56%|█████▋    | 45/80 [04:51<03:41,  6.34s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.18e-5, train/loss_step=0.00332, global_step=2091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  57%|█████▊    | 46/80 [04:51<03:31,  6.21s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.18e-5, train/loss_step=0.00332, global_step=2091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  57%|█████▊    | 46/80 [04:51<03:31,  6.21s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=5.09e-6, train/loss_step=0.000641, global_step=2091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  59%|█████▉    | 47/80 [04:52<03:21,  6.09s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000641, train/loss_vlb_step=5.09e-6, train/loss_step=0.000641, global_step=2091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  59%|█████▉    | 47/80 [04:52<03:21,  6.09s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=5.93e-6, train/loss_step=0.000389, global_step=2091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  60%|██████    | 48/80 [04:52<03:11,  5.98s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=5.93e-6, train/loss_step=0.000389, global_step=2091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  60%|██████    | 48/80 [04:52<03:11,  5.98s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=3.42e-5, train/loss_step=0.0089, global_step=2091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]     Epoch 104:  61%|██████▏   | 49/80 [04:55<03:03,  5.91s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.0089, train/loss_vlb_step=3.42e-5, train/loss_step=0.0089, global_step=2091.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  61%|██████▏   | 49/80 [04:55<03:03,  5.91s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=2.46e-6, train/loss_step=0.000647, global_step=2092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  62%|██████▎   | 50/80 [04:55<02:54,  5.80s/it, loss=0.00239, v_num=0, train/loss_simple_step=0.000647, train/loss_vlb_step=2.46e-6, train/loss_step=0.000647, global_step=2092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  62%|██████▎   | 50/80 [04:55<02:54,  5.80s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=7.92e-5, train/loss_step=0.00527, global_step=2092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  64%|██████▍   | 51/80 [04:57<02:45,  5.72s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=7.92e-5, train/loss_step=0.00527, global_step=2092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  64%|██████▍   | 51/80 [04:57<02:45,  5.72s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.08e-5, train/loss_step=0.00762, global_step=2092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  65%|██████▌   | 52/80 [04:57<02:37,  5.62s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00762, train/loss_vlb_step=3.08e-5, train/loss_step=0.00762, global_step=2092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  65%|██████▌   | 52/80 [04:57<02:37,  5.62s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.05e-5, train/loss_step=0.00242, global_step=2092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  66%|██████▋   | 53/80 [05:46<02:53,  6.42s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=1.05e-5, train/loss_step=0.00242, global_step=2092.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  66%|██████▋   | 53/80 [05:46<02:53,  6.42s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=9.56e-7, train/loss_step=0.000207, global_step=2093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  68%|██████▊   | 54/80 [05:47<02:44,  6.31s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=9.56e-7, train/loss_step=0.000207, global_step=2093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  68%|██████▊   | 54/80 [05:47<02:44,  6.31s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.18e-7, train/loss_step=0.000165, global_step=2093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  69%|██████▉   | 55/80 [05:47<02:35,  6.21s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.18e-7, train/loss_step=0.000165, global_step=2093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  69%|██████▉   | 55/80 [05:47<02:35,  6.21s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.55e-6, train/loss_step=0.000246, global_step=2093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  70%|███████   | 56/80 [05:48<02:26,  6.11s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=1.55e-6, train/loss_step=0.000246, global_step=2093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  70%|███████   | 56/80 [05:48<02:26,  6.11s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=0.000119, train/loss_step=0.00183, global_step=2093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397] Epoch 104:  71%|███████▏  | 57/80 [05:48<02:18,  6.01s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=0.000119, train/loss_step=0.00183, global_step=2093.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  71%|███████▏  | 57/80 [05:48<02:18,  6.01s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=9.88e-7, train/loss_step=0.000236, global_step=2094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  72%|███████▎  | 58/80 [05:49<02:10,  5.92s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=9.88e-7, train/loss_step=0.000236, global_step=2094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  72%|███████▎  | 58/80 [05:49<02:10,  5.92s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=3.37e-6, train/loss_step=0.000278, global_step=2094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  74%|███████▍  | 59/80 [05:49<02:02,  5.83s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.000278, train/loss_vlb_step=3.37e-6, train/loss_step=0.000278, global_step=2094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  74%|███████▍  | 59/80 [05:49<02:02,  5.83s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=5.34e-6, train/loss_step=0.000561, global_step=2094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=5.34e-6, train/loss_step=0.000561, global_step=2094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.71e-5, train/loss_step=0.0086, global_step=2094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]    Epoch 104:  76%|███████▋  | 61/80 [06:27<01:58,  6.25s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.0086, train/loss_vlb_step=4.71e-5, train/loss_step=0.0086, global_step=2094.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  76%|███████▋  | 61/80 [06:27<01:58,  6.25s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.000277, train/loss_vlb_step=2.23e-6, train/loss_step=0.000277, global_step=2095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  78%|███████▊  | 62/80 [06:27<01:50,  6.16s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.000277, train/loss_vlb_step=2.23e-6, train/loss_step=0.000277, global_step=2095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  78%|███████▊  | 62/80 [06:27<01:50,  6.16s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=1.55e-5, train/loss_step=0.000842, global_step=2095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  79%|███████▉  | 63/80 [06:28<01:43,  6.07s/it, loss=0.00219, v_num=0, train/loss_simple_step=0.000842, train/loss_vlb_step=1.55e-5, train/loss_step=0.000842, global_step=2095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  79%|███████▉  | 63/80 [06:28<01:43,  6.07s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=1.11e-6, train/loss_step=0.000245, global_step=2095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  80%|████████  | 64/80 [06:29<01:35,  5.98s/it, loss=0.00217, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=1.11e-6, train/loss_step=0.000245, global_step=2095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  80%|████████  | 64/80 [06:29<01:35,  5.98s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.62e-6, train/loss_step=0.000261, global_step=2095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  81%|████████▏ | 65/80 [06:29<01:28,  5.90s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000261, train/loss_vlb_step=1.62e-6, train/loss_step=0.000261, global_step=2095.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  81%|████████▏ | 65/80 [06:29<01:28,  5.90s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.2e-5, train/loss_step=0.00619, global_step=2096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]   Epoch 104:  82%|████████▎ | 66/80 [06:30<01:21,  5.82s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=2.2e-5, train/loss_step=0.00619, global_step=2096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  82%|████████▎ | 66/80 [06:30<01:21,  5.82s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=7.62e-7, train/loss_step=0.000204, global_step=2096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000204, train/loss_vlb_step=7.62e-7, train/loss_step=0.000204, global_step=2096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  84%|████████▍ | 67/80 [06:30<01:14,  5.74s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=6.72e-5, train/loss_step=0.0101, global_step=2096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]    Epoch 104:  85%|████████▌ | 68/80 [06:31<01:08,  5.67s/it, loss=0.00276, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=6.72e-5, train/loss_step=0.0101, global_step=2096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  85%|████████▌ | 68/80 [06:31<01:08,  5.67s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=9.69e-6, train/loss_step=0.00138, global_step=2096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  86%|████████▋ | 69/80 [07:04<01:06,  6.06s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=9.69e-6, train/loss_step=0.00138, global_step=2096.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  86%|████████▋ | 69/80 [07:04<01:06,  6.06s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.55e-5, train/loss_step=0.00925, global_step=2097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  88%|████████▊ | 70/80 [07:04<00:59,  5.99s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00925, train/loss_vlb_step=4.55e-5, train/loss_step=0.00925, global_step=2097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  88%|████████▊ | 70/80 [07:04<00:59,  5.99s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=4.45e-5, train/loss_step=0.00791, global_step=2097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  89%|████████▉ | 71/80 [07:05<00:53,  5.91s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=4.45e-5, train/loss_step=0.00791, global_step=2097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  89%|████████▉ | 71/80 [07:05<00:53,  5.91s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000104, train/loss_step=0.0183, global_step=2097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397] Epoch 104:  90%|█████████ | 72/80 [07:06<00:46,  5.84s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0183, train/loss_vlb_step=0.000104, train/loss_step=0.0183, global_step=2097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  90%|█████████ | 72/80 [07:06<00:46,  5.84s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=3.06e-6, train/loss_step=0.000332, global_step=2097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  91%|█████████▏| 73/80 [07:06<00:40,  5.76s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=3.06e-6, train/loss_step=0.000332, global_step=2097.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  91%|█████████▏| 73/80 [07:06<00:40,  5.76s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=7.45e-6, train/loss_step=0.00142, global_step=2098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 104:  92%|█████████▎| 74/80 [07:06<00:34,  5.69s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=7.45e-6, train/loss_step=0.00142, global_step=2098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  92%|█████████▎| 74/80 [07:06<00:34,  5.69s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.43e-6, train/loss_step=0.00105, global_step=2098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  94%|█████████▍| 75/80 [07:07<00:28,  5.62s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.43e-6, train/loss_step=0.00105, global_step=2098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  94%|█████████▍| 75/80 [07:07<00:28,  5.62s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=2.67e-5, train/loss_step=0.00674, global_step=2098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397] Epoch 104:  95%|█████████▌| 76/80 [07:07<00:22,  5.56s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=2.67e-5, train/loss_step=0.00674, global_step=2098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  95%|█████████▌| 76/80 [07:07<00:22,  5.56s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=3.76e-5, train/loss_step=0.00943, global_step=2098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  96%|█████████▋| 77/80 [07:30<00:17,  5.77s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=3.76e-5, train/loss_step=0.00943, global_step=2098.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  96%|█████████▋| 77/80 [07:30<00:17,  5.77s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=8.18e-7, train/loss_step=0.00015, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  98%|█████████▊| 78/80 [07:30<00:11,  5.70s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=8.18e-7, train/loss_step=0.00015, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  98%|█████████▊| 78/80 [07:30<00:11,  5.70s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.44e-6, train/loss_step=0.00036, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  99%|█████████▉| 79/80 [07:31<00:05,  5.64s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00036, train/loss_vlb_step=1.44e-6, train/loss_step=0.00036, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104:  99%|█████████▉| 79/80 [07:31<00:05,  5.64s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=3.63e-5, train/loss_step=0.00914, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104: 100%|██████████| 80/80 [07:31<00:00,  5.58s/it, loss=0.00461, v_num=0, train/loss_simple_step=0.00914, train/loss_vlb_step=3.63e-5, train/loss_step=0.00914, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 104: 100%|██████████| 80/80 [07:31<00:00,  5.58s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=0.000167, train/loss_step=0.00105, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Average Epoch time: 451.75 seconds
+Average Peak memory 29563.53MiB
+Epoch 104:   0%|          | 0/80 [00:00<00:00, 4539.29it/s, loss=0.00423, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=0.000167, train/loss_step=0.00105, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 105:   0%|          | 0/80 [00:00<00:00, 2039.04it/s, loss=0.00423, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=0.000167, train/loss_step=0.00105, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]Epoch 105:   1%|▏         | 1/80 [00:37<24:52, 18.90s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=0.000167, train/loss_step=0.00105, global_step=2099.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=8.51e-5, train/loss_epoch=0.00397]  Epoch 105:   1%|▏         | 1/80 [00:37<24:52, 18.90s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000985, train/loss_vlb_step=4e-6, train/loss_step=0.000985, global_step=2100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:   2%|▎         | 2/80 [00:41<18:06, 13.93s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000985, train/loss_vlb_step=4e-6, train/loss_step=0.000985, global_step=2100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:   2%|▎         | 2/80 [00:41<18:06, 13.93s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000146, train/loss_vlb_step=7.33e-7, train/loss_step=0.000146, global_step=2100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:   4%|▍         | 3/80 [00:42<13:33, 10.57s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000146, train/loss_vlb_step=7.33e-7, train/loss_step=0.000146, global_step=2100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:   4%|▍         | 3/80 [00:42<13:33, 10.57s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=3.77e-6, train/loss_step=0.000828, global_step=2100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:   5%|▌         | 4/80 [00:46<11:42,  9.24s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.000828, train/loss_vlb_step=3.77e-6, train/loss_step=0.000828, global_step=2100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:   5%|▌         | 4/80 [00:46<11:42,  9.24s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=7.6e-6, train/loss_step=0.00199, global_step=2100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]   Epoch 105:   6%|▋         | 5/80 [00:46<09:44,  7.79s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=7.6e-6, train/loss_step=0.00199, global_step=2100.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:   6%|▋         | 5/80 [00:46<09:44,  7.79s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.59e-5, train/loss_step=0.0103, global_step=2101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:   8%|▊         | 6/80 [00:47<08:19,  6.75s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=3.59e-5, train/loss_step=0.0103, global_step=2101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:   8%|▊         | 6/80 [00:47<08:19,  6.75s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.46e-5, train/loss_step=0.0113, global_step=2101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:   9%|▉         | 7/80 [00:47<07:15,  5.97s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=5.46e-5, train/loss_step=0.0113, global_step=2101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:   9%|▉         | 7/80 [00:47<07:15,  5.97s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000675, train/loss_vlb_step=3.33e-6, train/loss_step=0.000675, global_step=2101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  10%|█         | 8/80 [01:18<10:29,  8.74s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000675, train/loss_vlb_step=3.33e-6, train/loss_step=0.000675, global_step=2101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  10%|█         | 8/80 [01:18<10:29,  8.74s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000352, train/loss_vlb_step=1.42e-6, train/loss_step=0.000352, global_step=2101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  11%|█▏        | 9/80 [01:19<09:22,  7.92s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.000352, train/loss_vlb_step=1.42e-6, train/loss_step=0.000352, global_step=2101.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  11%|█▏        | 9/80 [01:19<09:22,  7.92s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=4.37e-6, train/loss_step=0.00109, global_step=2102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  12%|█▎        | 10/80 [01:31<09:43,  8.33s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=4.37e-6, train/loss_step=0.00109, global_step=2102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  12%|█▎        | 10/80 [01:31<09:43,  8.33s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000211, train/loss_step=0.0188, global_step=2102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  14%|█▍        | 11/80 [01:32<08:49,  7.68s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000211, train/loss_step=0.0188, global_step=2102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  14%|█▍        | 11/80 [01:32<08:49,  7.68s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.71e-5, train/loss_step=0.0137, global_step=2102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  15%|█▌        | 12/80 [01:32<08:04,  7.13s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.71e-5, train/loss_step=0.0137, global_step=2102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  15%|█▌        | 12/80 [01:32<08:04,  7.13s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.23e-5, train/loss_step=0.00323, global_step=2102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  16%|█▋        | 13/80 [01:33<07:25,  6.65s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.23e-5, train/loss_step=0.00323, global_step=2102.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  16%|█▋        | 13/80 [01:33<07:25,  6.65s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000139, train/loss_step=0.0134, global_step=2103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  18%|█▊        | 14/80 [01:33<06:52,  6.24s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=0.000139, train/loss_step=0.0134, global_step=2103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  18%|█▊        | 14/80 [01:33<06:52,  6.24s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.000194, train/loss_vlb_step=8.12e-7, train/loss_step=0.000194, global_step=2103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  19%|█▉        | 15/80 [01:34<06:22,  5.88s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.000194, train/loss_vlb_step=8.12e-7, train/loss_step=0.000194, global_step=2103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  19%|█▉        | 15/80 [01:34<06:22,  5.88s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.42e-6, train/loss_step=0.00166, global_step=2103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  20%|██        | 16/80 [01:57<07:20,  6.89s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.42e-6, train/loss_step=0.00166, global_step=2103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  20%|██        | 16/80 [01:57<07:20,  6.89s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=9.81e-7, train/loss_step=0.000245, global_step=2103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  21%|██▏       | 17/80 [01:57<06:51,  6.53s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=9.81e-7, train/loss_step=0.000245, global_step=2103.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  21%|██▏       | 17/80 [01:57<06:51,  6.53s/it, loss=0.00447, v_num=0, train/loss_simple_step=9.39e-5, train/loss_vlb_step=4.06e-7, train/loss_step=9.39e-5, global_step=2104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  22%|██▎       | 18/80 [02:15<07:20,  7.11s/it, loss=0.00447, v_num=0, train/loss_simple_step=9.39e-5, train/loss_vlb_step=4.06e-7, train/loss_step=9.39e-5, global_step=2104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  22%|██▎       | 18/80 [02:15<07:20,  7.11s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=7.56e-5, train/loss_step=0.0127, global_step=2104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  24%|██▍       | 19/80 [02:15<06:53,  6.78s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=7.56e-5, train/loss_step=0.0127, global_step=2104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  24%|██▍       | 19/80 [02:15<06:53,  6.78s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=5.68e-5, train/loss_step=0.00937, global_step=2104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  25%|██▌       | 20/80 [02:18<06:36,  6.61s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=5.68e-5, train/loss_step=0.00937, global_step=2104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  25%|██▌       | 20/80 [02:18<06:36,  6.61s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=2.37e-6, train/loss_step=0.000643, global_step=2104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  26%|██▋       | 21/80 [02:19<06:13,  6.34s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=2.37e-6, train/loss_step=0.000643, global_step=2104.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  26%|██▋       | 21/80 [02:19<06:13,  6.34s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.000414, train/loss_vlb_step=1.34e-5, train/loss_step=0.000414, global_step=2105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.000414, train/loss_vlb_step=1.34e-5, train/loss_step=0.000414, global_step=2105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=4.23e-5, train/loss_step=0.00405, global_step=2105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=4.23e-5, train/loss_step=0.00405, global_step=2105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000648, train/loss_vlb_step=2.91e-6, train/loss_step=0.000648, global_step=2105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  30%|███       | 24/80 [02:37<05:51,  6.28s/it, loss=0.00524, v_num=0, train/loss_simple_step=0.000648, train/loss_vlb_step=2.91e-6, train/loss_step=0.000648, global_step=2105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  30%|███       | 24/80 [02:37<05:51,  6.28s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=9.11e-6, train/loss_step=0.00238, global_step=2105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  31%|███▏      | 25/80 [02:37<05:33,  6.06s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=9.11e-6, train/loss_step=0.00238, global_step=2105.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  31%|███▏      | 25/80 [02:37<05:33,  6.06s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=0.00014, train/loss_step=0.0103, global_step=2106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  32%|███▎      | 26/80 [02:58<05:57,  6.62s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=0.00014, train/loss_step=0.0103, global_step=2106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  32%|███▎      | 26/80 [02:58<05:57,  6.62s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000145, train/loss_vlb_step=6.04e-7, train/loss_step=0.000145, global_step=2106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  34%|███▍      | 27/80 [02:59<05:39,  6.40s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000145, train/loss_vlb_step=6.04e-7, train/loss_step=0.000145, global_step=2106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  34%|███▍      | 27/80 [02:59<05:39,  6.40s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=1.11e-5, train/loss_step=0.00142, global_step=2106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  35%|███▌      | 28/80 [02:59<05:22,  6.20s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=1.11e-5, train/loss_step=0.00142, global_step=2106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  35%|███▌      | 28/80 [02:59<05:22,  6.20s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.46e-6, train/loss_step=0.000471, global_step=2106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  36%|███▋      | 29/80 [03:00<05:06,  6.02s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.46e-6, train/loss_step=0.000471, global_step=2106.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  36%|███▋      | 29/80 [03:00<05:06,  6.02s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.01e-6, train/loss_step=0.000409, global_step=2107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  38%|███▊      | 30/80 [03:00<04:51,  5.84s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000409, train/loss_vlb_step=2.01e-6, train/loss_step=0.000409, global_step=2107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  38%|███▊      | 30/80 [03:00<04:51,  5.84s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=6.9e-7, train/loss_step=0.000171, global_step=2107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  39%|███▉      | 31/80 [03:01<04:37,  5.67s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=6.9e-7, train/loss_step=0.000171, global_step=2107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  39%|███▉      | 31/80 [03:01<04:37,  5.67s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.69e-5, train/loss_step=0.00245, global_step=2107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  40%|████      | 32/80 [03:15<04:43,  5.92s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00245, train/loss_vlb_step=1.69e-5, train/loss_step=0.00245, global_step=2107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  40%|████      | 32/80 [03:15<04:43,  5.92s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.57e-7, train/loss_step=0.000167, global_step=2107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  41%|████▏     | 33/80 [03:15<04:30,  5.76s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000167, train/loss_vlb_step=6.57e-7, train/loss_step=0.000167, global_step=2107.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  41%|████▏     | 33/80 [03:15<04:30,  5.76s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=3.92e-6, train/loss_step=0.000374, global_step=2108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000374, train/loss_vlb_step=3.92e-6, train/loss_step=0.000374, global_step=2108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  42%|████▎     | 34/80 [03:42<04:52,  6.36s/it, loss=0.00241, v_num=0, train/loss_simple_step=9.49e-5, train/loss_vlb_step=3.9e-7, train/loss_step=9.49e-5, global_step=2108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]   Epoch 105:  44%|████▍     | 35/80 [03:43<04:38,  6.20s/it, loss=0.00241, v_num=0, train/loss_simple_step=9.49e-5, train/loss_vlb_step=3.9e-7, train/loss_step=9.49e-5, global_step=2108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  44%|████▍     | 35/80 [03:43<04:38,  6.20s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.36e-7, train/loss_step=0.000207, global_step=2108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  45%|████▌     | 36/80 [03:45<04:27,  6.08s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.36e-7, train/loss_step=0.000207, global_step=2108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  45%|████▌     | 36/80 [03:45<04:27,  6.08s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.92e-6, train/loss_step=0.000344, global_step=2108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  46%|████▋     | 37/80 [03:45<04:15,  5.94s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.92e-6, train/loss_step=0.000344, global_step=2108.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  46%|████▋     | 37/80 [03:45<04:15,  5.94s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=6.09e-6, train/loss_step=0.000777, global_step=2109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  48%|████▊     | 38/80 [03:46<04:03,  5.80s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=6.09e-6, train/loss_step=0.000777, global_step=2109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  48%|████▊     | 38/80 [03:46<04:03,  5.80s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000922, train/loss_vlb_step=3.5e-6, train/loss_step=0.000922, global_step=2109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  49%|████▉     | 39/80 [03:46<03:52,  5.67s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000922, train/loss_vlb_step=3.5e-6, train/loss_step=0.000922, global_step=2109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  49%|████▉     | 39/80 [03:46<03:52,  5.67s/it, loss=0.0014, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6.13e-6, train/loss_step=0.00151, global_step=2109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  50%|█████     | 40/80 [03:59<03:53,  5.85s/it, loss=0.0014, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=6.13e-6, train/loss_step=0.00151, global_step=2109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  50%|█████     | 40/80 [03:59<03:53,  5.85s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=0.000127, train/loss_step=0.00309, global_step=2109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  51%|█████▏    | 41/80 [04:00<03:43,  5.72s/it, loss=0.00152, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=0.000127, train/loss_step=0.00309, global_step=2109.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  51%|█████▏    | 41/80 [04:00<03:43,  5.72s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=2.54e-5, train/loss_step=0.00638, global_step=2110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  52%|█████▎    | 42/80 [04:25<03:54,  6.16s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.00638, train/loss_vlb_step=2.54e-5, train/loss_step=0.00638, global_step=2110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  52%|█████▎    | 42/80 [04:25<03:54,  6.16s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.29e-5, train/loss_step=0.00374, global_step=2110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  54%|█████▍    | 43/80 [04:25<03:43,  6.04s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.00374, train/loss_vlb_step=1.29e-5, train/loss_step=0.00374, global_step=2110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  54%|█████▍    | 43/80 [04:25<03:43,  6.04s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=0.000603, train/loss_step=0.0187, global_step=2110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  55%|█████▌    | 44/80 [04:30<03:36,  6.01s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0187, train/loss_vlb_step=0.000603, train/loss_step=0.0187, global_step=2110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  55%|█████▌    | 44/80 [04:30<03:36,  6.01s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000806, train/loss_vlb_step=0.000346, train/loss_step=0.000806, global_step=2110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  56%|█████▋    | 45/80 [04:30<03:26,  5.89s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000806, train/loss_vlb_step=0.000346, train/loss_step=0.000806, global_step=2110.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  56%|█████▋    | 45/80 [04:30<03:26,  5.89s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.6e-6, train/loss_step=0.00148, global_step=2111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]    Epoch 105:  57%|█████▊    | 46/80 [04:31<03:16,  5.77s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.6e-6, train/loss_step=0.00148, global_step=2111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  57%|█████▊    | 46/80 [04:31<03:16,  5.77s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=0.000766, train/loss_step=0.0227, global_step=2111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  59%|█████▉    | 47/80 [04:31<03:06,  5.66s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.0227, train/loss_vlb_step=0.000766, train/loss_step=0.0227, global_step=2111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  59%|█████▉    | 47/80 [04:31<03:06,  5.66s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=3.63e-6, train/loss_step=0.000524, global_step=2111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  60%|██████    | 48/80 [04:43<03:04,  5.78s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=3.63e-6, train/loss_step=0.000524, global_step=2111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  60%|██████    | 48/80 [04:43<03:04,  5.78s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.24e-5, train/loss_step=0.00583, global_step=2111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  61%|██████▏   | 49/80 [04:43<02:55,  5.67s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.24e-5, train/loss_step=0.00583, global_step=2111.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  61%|██████▏   | 49/80 [04:43<02:55,  5.67s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000745, train/loss_vlb_step=3.64e-6, train/loss_step=0.000745, global_step=2112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  62%|██████▎   | 50/80 [05:08<03:01,  6.04s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000745, train/loss_vlb_step=3.64e-6, train/loss_step=0.000745, global_step=2112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  62%|██████▎   | 50/80 [05:08<03:01,  6.04s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.7e-5, train/loss_step=0.0107, global_step=2112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]     Epoch 105:  64%|██████▍   | 51/80 [05:08<02:52,  5.94s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=4.7e-5, train/loss_step=0.0107, global_step=2112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  64%|██████▍   | 51/80 [05:08<02:52,  5.94s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=9.75e-7, train/loss_step=0.000232, global_step=2112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  65%|██████▌   | 52/80 [05:09<02:43,  5.83s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000232, train/loss_vlb_step=9.75e-7, train/loss_step=0.000232, global_step=2112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  65%|██████▌   | 52/80 [05:09<02:43,  5.83s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=2.62e-6, train/loss_step=0.000737, global_step=2112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  66%|██████▋   | 53/80 [05:09<02:34,  5.74s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000737, train/loss_vlb_step=2.62e-6, train/loss_step=0.000737, global_step=2112.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  66%|██████▋   | 53/80 [05:09<02:34,  5.74s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.64e-5, train/loss_step=0.0178, global_step=2113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]    Epoch 105:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=7.64e-5, train/loss_step=0.0178, global_step=2113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  68%|██████▊   | 54/80 [05:10<02:26,  5.64s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=3.18e-5, train/loss_step=0.00402, global_step=2113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=3.18e-5, train/loss_step=0.00402, global_step=2113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  69%|██████▉   | 55/80 [05:10<02:18,  5.55s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=7.91e-7, train/loss_step=0.000195, global_step=2113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  70%|███████   | 56/80 [05:24<02:16,  5.70s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=7.91e-7, train/loss_step=0.000195, global_step=2113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  70%|███████   | 56/80 [05:24<02:16,  5.70s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000998, train/loss_vlb_step=3.61e-5, train/loss_step=0.000998, global_step=2113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  71%|███████▏  | 57/80 [05:25<02:08,  5.61s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000998, train/loss_vlb_step=3.61e-5, train/loss_step=0.000998, global_step=2113.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  71%|███████▏  | 57/80 [05:25<02:08,  5.61s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=7.75e-5, train/loss_step=0.0144, global_step=2114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]    Epoch 105:  72%|███████▎  | 58/80 [06:00<02:14,  6.11s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.0144, train/loss_vlb_step=7.75e-5, train/loss_step=0.0144, global_step=2114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  72%|███████▎  | 58/80 [06:00<02:14,  6.11s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.46e-5, train/loss_step=0.00373, global_step=2114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  74%|███████▍  | 59/80 [06:01<02:06,  6.02s/it, loss=0.00591, v_num=0, train/loss_simple_step=0.00373, train/loss_vlb_step=1.46e-5, train/loss_step=0.00373, global_step=2114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  74%|███████▍  | 59/80 [06:01<02:06,  6.02s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=1.78e-5, train/loss_step=0.00439, global_step=2114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  75%|███████▌  | 60/80 [06:01<01:58,  5.93s/it, loss=0.00606, v_num=0, train/loss_simple_step=0.00439, train/loss_vlb_step=1.78e-5, train/loss_step=0.00439, global_step=2114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  75%|███████▌  | 60/80 [06:01<01:58,  5.93s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=9.28e-6, train/loss_step=0.00137, global_step=2114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  76%|███████▋  | 61/80 [06:02<01:51,  5.84s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.00137, train/loss_vlb_step=9.28e-6, train/loss_step=0.00137, global_step=2114.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  76%|███████▋  | 61/80 [06:02<01:51,  5.84s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=1.19e-6, train/loss_step=0.000236, global_step=2115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  78%|███████▊  | 62/80 [06:02<01:43,  5.76s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=1.19e-6, train/loss_step=0.000236, global_step=2115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  78%|███████▊  | 62/80 [06:02<01:43,  5.76s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.11e-5, train/loss_step=0.00594, global_step=2115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  79%|███████▉  | 63/80 [06:03<01:36,  5.68s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=2.11e-5, train/loss_step=0.00594, global_step=2115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  79%|███████▉  | 63/80 [06:03<01:36,  5.68s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.19e-5, train/loss_step=0.0125, global_step=2115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  80%|████████  | 64/80 [06:10<01:31,  5.70s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=5.19e-5, train/loss_step=0.0125, global_step=2115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  80%|████████  | 64/80 [06:10<01:31,  5.70s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=8.86e-5, train/loss_step=0.00217, global_step=2115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.00553, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=8.86e-5, train/loss_step=0.00217, global_step=2115.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  81%|████████▏ | 65/80 [06:10<01:24,  5.62s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=4.88e-6, train/loss_step=0.000418, global_step=2116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  82%|████████▎ | 66/80 [06:27<01:20,  5.78s/it, loss=0.00548, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=4.88e-6, train/loss_step=0.000418, global_step=2116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  82%|████████▎ | 66/80 [06:27<01:20,  5.78s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000128, train/loss_vlb_step=4.9e-7, train/loss_step=0.000128, global_step=2116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369] Epoch 105:  84%|████████▍ | 67/80 [06:27<01:14,  5.70s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000128, train/loss_vlb_step=4.9e-7, train/loss_step=0.000128, global_step=2116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  84%|████████▍ | 67/80 [06:27<01:14,  5.70s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=9.66e-7, train/loss_step=0.000225, global_step=2116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  85%|████████▌ | 68/80 [06:30<01:07,  5.66s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=9.66e-7, train/loss_step=0.000225, global_step=2116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  85%|████████▌ | 68/80 [06:30<01:07,  5.66s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=1.66e-5, train/loss_step=0.00464, global_step=2116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  86%|████████▋ | 69/80 [06:31<01:01,  5.59s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.00464, train/loss_vlb_step=1.66e-5, train/loss_step=0.00464, global_step=2116.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  86%|████████▋ | 69/80 [06:31<01:01,  5.59s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=5.09e-6, train/loss_step=0.0013, global_step=2117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  88%|████████▊ | 70/80 [06:31<00:55,  5.51s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=5.09e-6, train/loss_step=0.0013, global_step=2117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  88%|████████▊ | 70/80 [06:31<00:55,  5.51s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000188, train/loss_vlb_step=8.15e-7, train/loss_step=0.000188, global_step=2117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  89%|████████▉ | 71/80 [06:31<00:48,  5.44s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000188, train/loss_vlb_step=8.15e-7, train/loss_step=0.000188, global_step=2117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  89%|████████▉ | 71/80 [06:31<00:48,  5.44s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.06e-5, train/loss_step=0.0029, global_step=2117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]    Epoch 105:  90%|█████████ | 72/80 [06:41<00:44,  5.50s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.0029, train/loss_vlb_step=1.06e-5, train/loss_step=0.0029, global_step=2117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  90%|█████████ | 72/80 [06:41<00:44,  5.50s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000125, train/loss_vlb_step=4.83e-7, train/loss_step=0.000125, global_step=2117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  91%|█████████▏| 73/80 [06:42<00:38,  5.43s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000125, train/loss_vlb_step=4.83e-7, train/loss_step=0.000125, global_step=2117.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  91%|█████████▏| 73/80 [06:42<00:38,  5.43s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=1.93e-5, train/loss_step=0.00568, global_step=2118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  92%|█████████▎| 74/80 [07:08<00:34,  5.71s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.00568, train/loss_vlb_step=1.93e-5, train/loss_step=0.00568, global_step=2118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  92%|█████████▎| 74/80 [07:08<00:34,  5.71s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=0.000159, train/loss_step=0.013, global_step=2118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]   Epoch 105:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=0.000159, train/loss_step=0.013, global_step=2118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=1.61e-6, train/loss_step=0.000218, global_step=2118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=1.61e-6, train/loss_step=0.000218, global_step=2118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  95%|█████████▌| 76/80 [07:09<00:22,  5.57s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=8.87e-7, train/loss_step=0.000148, global_step=2118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=8.87e-7, train/loss_step=0.000148, global_step=2118.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000629, train/loss_vlb_step=8.78e-6, train/loss_step=0.000629, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 105:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000629, train/loss_vlb_step=8.78e-6, train/loss_step=0.000629, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  98%|█████████▊| 78/80 [07:09<00:10,  5.44s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=6.08e-7, train/loss_step=0.000144, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=6.08e-7, train/loss_step=0.000144, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=4.75e-5, train/loss_step=0.0122, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]    Epoch 105: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=4.75e-5, train/loss_step=0.0122, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 105: 100%|██████████| 80/80 [07:10<00:00,  5.32s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=2.51e-5, train/loss_step=0.00735, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Average Epoch time: 431.01 seconds
+Average Peak memory 29570.61MiB
+Epoch 105:   0%|          | 0/80 [00:00<00:00, 3975.64it/s, loss=0.00351, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=2.51e-5, train/loss_step=0.00735, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 106:   0%|          | 0/80 [00:00<00:00, 1855.07it/s, loss=0.00351, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=2.51e-5, train/loss_step=0.00735, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]Epoch 106:   1%|▏         | 1/80 [00:40<26:50, 20.39s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00735, train/loss_vlb_step=2.51e-5, train/loss_step=0.00735, global_step=2119.0, lr_abs=0.0001, train/loss_simple_epoch=0.00369, train/loss_vlb_epoch=7.66e-5, train/loss_epoch=0.00369]  Epoch 106:   1%|▏         | 1/80 [00:40<26:50, 20.39s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.04e-5, train/loss_step=0.0117, global_step=2120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:   2%|▎         | 2/80 [00:41<17:52, 13.75s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=4.04e-5, train/loss_step=0.0117, global_step=2120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:   2%|▎         | 2/80 [00:41<17:52, 13.75s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=7.65e-7, train/loss_step=0.00017, global_step=2120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:   4%|▍         | 3/80 [00:41<13:23, 10.44s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00017, train/loss_vlb_step=7.65e-7, train/loss_step=0.00017, global_step=2120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:   4%|▍         | 3/80 [00:41<13:23, 10.44s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=1.47e-6, train/loss_step=0.000186, global_step=2120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:   5%|▌         | 4/80 [00:42<10:42,  8.45s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=1.47e-6, train/loss_step=0.000186, global_step=2120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:   5%|▌         | 4/80 [00:42<10:42,  8.46s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000971, train/loss_vlb_step=3.7e-6, train/loss_step=0.000971, global_step=2120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:   6%|▋         | 5/80 [00:42<08:54,  7.13s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000971, train/loss_vlb_step=3.7e-6, train/loss_step=0.000971, global_step=2120.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:   6%|▋         | 5/80 [00:42<08:54,  7.13s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.46e-5, train/loss_step=0.00394, global_step=2121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:   8%|▊         | 6/80 [00:43<07:37,  6.18s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00394, train/loss_vlb_step=1.46e-5, train/loss_step=0.00394, global_step=2121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:   8%|▊         | 6/80 [00:43<07:37,  6.18s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=9.16e-7, train/loss_step=0.000195, global_step=2121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:   9%|▉         | 7/80 [00:49<07:34,  6.22s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.000195, train/loss_vlb_step=9.16e-7, train/loss_step=0.000195, global_step=2121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:   9%|▉         | 7/80 [00:49<07:34,  6.22s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=1.65e-5, train/loss_step=0.00479, global_step=2121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:  10%|█         | 8/80 [01:32<12:17, 10.24s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00479, train/loss_vlb_step=1.65e-5, train/loss_step=0.00479, global_step=2121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  10%|█         | 8/80 [01:32<12:17, 10.24s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.46e-5, train/loss_step=0.00041, global_step=2121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  11%|█▏        | 9/80 [01:32<10:57,  9.27s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00041, train/loss_vlb_step=1.46e-5, train/loss_step=0.00041, global_step=2121.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  11%|█▏        | 9/80 [01:32<10:57,  9.27s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.31e-6, train/loss_step=0.000242, global_step=2122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  12%|█▎        | 10/80 [01:33<09:52,  8.47s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000242, train/loss_vlb_step=1.31e-6, train/loss_step=0.000242, global_step=2122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  12%|█▎        | 10/80 [01:33<09:52,  8.47s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=2.29e-5, train/loss_step=0.00647, global_step=2122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  14%|█▍        | 11/80 [01:33<08:58,  7.80s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.00647, train/loss_vlb_step=2.29e-5, train/loss_step=0.00647, global_step=2122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  14%|█▍        | 11/80 [01:33<08:58,  7.80s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=5.67e-6, train/loss_step=0.000284, global_step=2122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  15%|█▌        | 12/80 [01:34<08:12,  7.24s/it, loss=0.00344, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=5.67e-6, train/loss_step=0.000284, global_step=2122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  15%|█▌        | 12/80 [01:34<08:12,  7.24s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000577, train/loss_vlb_step=2.7e-6, train/loss_step=0.000577, global_step=2122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:  16%|█▋        | 13/80 [01:34<07:33,  6.76s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000577, train/loss_vlb_step=2.7e-6, train/loss_step=0.000577, global_step=2122.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  16%|█▋        | 13/80 [01:34<07:33,  6.76s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=2.3e-5, train/loss_step=0.00614, global_step=2123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  18%|█▊        | 14/80 [01:35<06:58,  6.35s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=2.3e-5, train/loss_step=0.00614, global_step=2123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  18%|█▊        | 14/80 [01:35<06:58,  6.35s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000952, train/loss_vlb_step=6.02e-6, train/loss_step=0.000952, global_step=2123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  19%|█▉        | 15/80 [01:37<06:34,  6.07s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000952, train/loss_vlb_step=6.02e-6, train/loss_step=0.000952, global_step=2123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  19%|█▉        | 15/80 [01:37<06:34,  6.07s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.42e-5, train/loss_step=0.00565, global_step=2123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  20%|██        | 16/80 [02:11<08:15,  7.74s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00565, train/loss_vlb_step=2.42e-5, train/loss_step=0.00565, global_step=2123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  20%|██        | 16/80 [02:11<08:15,  7.74s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.53e-6, train/loss_step=0.00111, global_step=2123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  21%|██▏       | 17/80 [02:12<07:42,  7.34s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=4.53e-6, train/loss_step=0.00111, global_step=2123.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  21%|██▏       | 17/80 [02:12<07:42,  7.34s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=1.67e-6, train/loss_step=0.000487, global_step=2124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  22%|██▎       | 18/80 [02:12<07:12,  6.98s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000487, train/loss_vlb_step=1.67e-6, train/loss_step=0.000487, global_step=2124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  22%|██▎       | 18/80 [02:12<07:12,  6.98s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=9.88e-7, train/loss_step=0.000267, global_step=2124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  24%|██▍       | 19/80 [02:13<06:45,  6.65s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000267, train/loss_vlb_step=9.88e-7, train/loss_step=0.000267, global_step=2124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  24%|██▍       | 19/80 [02:13<06:45,  6.65s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.72e-5, train/loss_step=0.00382, global_step=2124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  25%|██▌       | 20/80 [02:17<06:31,  6.53s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=2.72e-5, train/loss_step=0.00382, global_step=2124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  25%|██▌       | 20/80 [02:17<06:31,  6.53s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.03e-5, train/loss_step=0.0134, global_step=2124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  26%|██▋       | 21/80 [02:17<06:09,  6.26s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.03e-5, train/loss_step=0.0134, global_step=2124.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  26%|██▋       | 21/80 [02:17<06:09,  6.26s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.81e-5, train/loss_step=0.00859, global_step=2125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  28%|██▊       | 22/80 [02:18<05:48,  6.01s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00859, train/loss_vlb_step=4.81e-5, train/loss_step=0.00859, global_step=2125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  28%|██▊       | 22/80 [02:18<05:48,  6.01s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=3.45e-6, train/loss_step=0.000701, global_step=2125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  29%|██▉       | 23/80 [02:28<05:51,  6.17s/it, loss=0.00296, v_num=0, train/loss_simple_step=0.000701, train/loss_vlb_step=3.45e-6, train/loss_step=0.000701, global_step=2125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  29%|██▉       | 23/80 [02:28<05:51,  6.17s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.000309, train/loss_vlb_step=3.64e-6, train/loss_step=0.000309, global_step=2125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  30%|███       | 24/80 [02:57<06:37,  7.09s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.000309, train/loss_vlb_step=3.64e-6, train/loss_step=0.000309, global_step=2125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  30%|███       | 24/80 [02:57<06:37,  7.09s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.42e-5, train/loss_step=0.00419, global_step=2125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  31%|███▏      | 25/80 [02:57<06:16,  6.84s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.42e-5, train/loss_step=0.00419, global_step=2125.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  31%|███▏      | 25/80 [02:57<06:16,  6.84s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.09e-5, train/loss_step=0.00273, global_step=2126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  32%|███▎      | 26/80 [02:58<05:56,  6.60s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00273, train/loss_vlb_step=1.09e-5, train/loss_step=0.00273, global_step=2126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  32%|███▎      | 26/80 [02:58<05:56,  6.60s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000849, train/loss_vlb_step=3.46e-6, train/loss_step=0.000849, global_step=2126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  34%|███▍      | 27/80 [02:58<05:38,  6.38s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.000849, train/loss_vlb_step=3.46e-6, train/loss_step=0.000849, global_step=2126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  34%|███▍      | 27/80 [02:58<05:38,  6.38s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.000115, train/loss_vlb_step=4.61e-7, train/loss_step=0.000115, global_step=2126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  35%|███▌      | 28/80 [02:59<05:21,  6.18s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.000115, train/loss_vlb_step=4.61e-7, train/loss_step=0.000115, global_step=2126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  35%|███▌      | 28/80 [02:59<05:21,  6.18s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=6.44e-6, train/loss_step=0.00101, global_step=2126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  36%|███▋      | 29/80 [02:59<05:05,  6.00s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=6.44e-6, train/loss_step=0.00101, global_step=2126.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  36%|███▋      | 29/80 [02:59<05:05,  6.00s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=2.76e-6, train/loss_step=0.000732, global_step=2127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  38%|███▊      | 30/80 [03:00<04:50,  5.82s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=2.76e-6, train/loss_step=0.000732, global_step=2127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  38%|███▊      | 30/80 [03:00<04:50,  5.82s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000944, train/loss_vlb_step=3.34e-6, train/loss_step=0.000944, global_step=2127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  39%|███▉      | 31/80 [03:10<04:52,  5.97s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000944, train/loss_vlb_step=3.34e-6, train/loss_step=0.000944, global_step=2127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  39%|███▉      | 31/80 [03:10<04:52,  5.97s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=8.04e-5, train/loss_step=0.0106, global_step=2127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]    Epoch 106:  40%|████      | 32/80 [03:41<05:21,  6.70s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=8.04e-5, train/loss_step=0.0106, global_step=2127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  40%|████      | 32/80 [03:41<05:21,  6.70s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=1.5e-5, train/loss_step=0.00148, global_step=2127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  41%|████▏     | 33/80 [03:41<05:06,  6.52s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=1.5e-5, train/loss_step=0.00148, global_step=2127.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  41%|████▏     | 33/80 [03:41<05:06,  6.52s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=3.71e-5, train/loss_step=0.00881, global_step=2128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  42%|████▎     | 34/80 [03:42<04:52,  6.35s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00881, train/loss_vlb_step=3.71e-5, train/loss_step=0.00881, global_step=2128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  42%|████▎     | 34/80 [03:42<04:52,  6.35s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=0.000502, train/loss_step=0.00112, global_step=2128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=0.000502, train/loss_step=0.00112, global_step=2128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  44%|████▍     | 35/80 [03:42<04:38,  6.19s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=2.39e-6, train/loss_step=0.000246, global_step=2128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000246, train/loss_vlb_step=2.39e-6, train/loss_step=0.000246, global_step=2128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  45%|████▌     | 36/80 [03:43<04:25,  6.04s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=8.3e-7, train/loss_step=0.000175, global_step=2128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=8.3e-7, train/loss_step=0.000175, global_step=2128.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  46%|████▋     | 37/80 [03:43<04:13,  5.89s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=5.03e-6, train/loss_step=0.00124, global_step=2129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:  48%|████▊     | 38/80 [03:44<04:01,  5.76s/it, loss=0.00306, v_num=0, train/loss_simple_step=0.00124, train/loss_vlb_step=5.03e-6, train/loss_step=0.00124, global_step=2129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  48%|████▊     | 38/80 [03:44<04:01,  5.76s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=0.000156, train/loss_step=0.00502, global_step=2129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  49%|████▉     | 39/80 [03:56<04:02,  5.91s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=0.000156, train/loss_step=0.00502, global_step=2129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  49%|████▉     | 39/80 [03:56<04:02,  5.91s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.23e-6, train/loss_step=0.00149, global_step=2129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  50%|█████     | 40/80 [04:25<04:19,  6.49s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.00149, train/loss_vlb_step=9.23e-6, train/loss_step=0.00149, global_step=2129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  50%|█████     | 40/80 [04:25<04:19,  6.49s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=4.33e-6, train/loss_step=0.000323, global_step=2129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  51%|█████▏    | 41/80 [04:26<04:07,  6.34s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000323, train/loss_vlb_step=4.33e-6, train/loss_step=0.000323, global_step=2129.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  51%|█████▏    | 41/80 [04:26<04:07,  6.34s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=2.85e-6, train/loss_step=0.000549, global_step=2130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  52%|█████▎    | 42/80 [04:26<03:55,  6.21s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=2.85e-6, train/loss_step=0.000549, global_step=2130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  52%|█████▎    | 42/80 [04:26<03:55,  6.21s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=6.83e-5, train/loss_step=0.0199, global_step=2130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]    Epoch 106:  54%|█████▍    | 43/80 [04:27<03:44,  6.08s/it, loss=0.00309, v_num=0, train/loss_simple_step=0.0199, train/loss_vlb_step=6.83e-5, train/loss_step=0.0199, global_step=2130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  54%|█████▍    | 43/80 [04:27<03:44,  6.08s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00904, train/loss_vlb_step=4.08e-5, train/loss_step=0.00904, global_step=2130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  55%|█████▌    | 44/80 [04:28<03:34,  5.96s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00904, train/loss_vlb_step=4.08e-5, train/loss_step=0.00904, global_step=2130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  55%|█████▌    | 44/80 [04:28<03:34,  5.96s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=9.55e-6, train/loss_step=0.000329, global_step=2130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  56%|█████▋    | 45/80 [04:28<03:24,  5.84s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000329, train/loss_vlb_step=9.55e-6, train/loss_step=0.000329, global_step=2130.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  56%|█████▋    | 45/80 [04:28<03:24,  5.84s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.08e-6, train/loss_step=0.000254, global_step=2131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  57%|█████▊    | 46/80 [04:29<03:14,  5.73s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.08e-6, train/loss_step=0.000254, global_step=2131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  57%|█████▊    | 46/80 [04:29<03:14,  5.73s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.53e-5, train/loss_step=0.00402, global_step=2131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  59%|█████▉    | 47/80 [04:40<03:12,  5.84s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.53e-5, train/loss_step=0.00402, global_step=2131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  59%|█████▉    | 47/80 [04:40<03:12,  5.84s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.96e-6, train/loss_step=0.000274, global_step=2131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  60%|██████    | 48/80 [04:57<03:14,  6.08s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000274, train/loss_vlb_step=1.96e-6, train/loss_step=0.000274, global_step=2131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  60%|██████    | 48/80 [04:57<03:14,  6.08s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=1.65e-5, train/loss_step=0.00502, global_step=2131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  61%|██████▏   | 49/80 [04:58<03:04,  5.97s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=1.65e-5, train/loss_step=0.00502, global_step=2131.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  61%|██████▏   | 49/80 [04:58<03:04,  5.97s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000185, train/loss_vlb_step=1.36e-6, train/loss_step=0.000185, global_step=2132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000185, train/loss_vlb_step=1.36e-6, train/loss_step=0.000185, global_step=2132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  62%|██████▎   | 50/80 [05:09<03:02,  6.07s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.43e-5, train/loss_step=0.0104, global_step=2132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]    Epoch 106:  64%|██████▍   | 51/80 [05:10<02:52,  5.96s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=4.43e-5, train/loss_step=0.0104, global_step=2132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  64%|██████▍   | 51/80 [05:10<02:52,  5.96s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=8.19e-6, train/loss_step=0.00215, global_step=2132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=8.19e-6, train/loss_step=0.00215, global_step=2132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  65%|██████▌   | 52/80 [05:10<02:44,  5.86s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=5.75e-5, train/loss_step=0.0087, global_step=2132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.0087, train/loss_vlb_step=5.75e-5, train/loss_step=0.0087, global_step=2132.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  66%|██████▋   | 53/80 [05:11<02:35,  5.76s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=1.18e-6, train/loss_step=0.000243, global_step=2133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=1.18e-6, train/loss_step=0.000243, global_step=2133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  68%|██████▊   | 54/80 [05:11<02:27,  5.67s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=1.43e-5, train/loss_step=0.000615, global_step=2133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  69%|██████▉   | 55/80 [05:23<02:24,  5.77s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.000615, train/loss_vlb_step=1.43e-5, train/loss_step=0.000615, global_step=2133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  69%|██████▉   | 55/80 [05:23<02:24,  5.77s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.57e-5, train/loss_step=0.00786, global_step=2133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00786, train/loss_vlb_step=3.57e-5, train/loss_step=0.00786, global_step=2133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=3.19e-6, train/loss_step=0.000561, global_step=2133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  71%|███████▏  | 57/80 [05:42<02:15,  5.90s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=3.19e-6, train/loss_step=0.000561, global_step=2133.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  71%|███████▏  | 57/80 [05:42<02:15,  5.90s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=8.86e-5, train/loss_step=0.0119, global_step=2134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]    Epoch 106:  72%|███████▎  | 58/80 [05:54<02:12,  6.00s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=8.86e-5, train/loss_step=0.0119, global_step=2134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  72%|███████▎  | 58/80 [05:54<02:12,  6.00s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=1.39e-5, train/loss_step=0.00417, global_step=2134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  74%|███████▍  | 59/80 [05:54<02:04,  5.91s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00417, train/loss_vlb_step=1.39e-5, train/loss_step=0.00417, global_step=2134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  74%|███████▍  | 59/80 [05:54<02:04,  5.91s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=9.15e-7, train/loss_step=0.00023, global_step=2134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  75%|███████▌  | 60/80 [05:55<01:56,  5.82s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=9.15e-7, train/loss_step=0.00023, global_step=2134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  75%|███████▌  | 60/80 [05:55<01:56,  5.82s/it, loss=0.005, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.2e-5, train/loss_step=0.0137, global_step=2134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]     Epoch 106:  76%|███████▋  | 61/80 [05:55<01:49,  5.74s/it, loss=0.005, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=6.2e-5, train/loss_step=0.0137, global_step=2134.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  76%|███████▋  | 61/80 [05:55<01:49,  5.74s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=9.4e-6, train/loss_step=0.00252, global_step=2135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  78%|███████▊  | 62/80 [05:56<01:41,  5.66s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.00252, train/loss_vlb_step=9.4e-6, train/loss_step=0.00252, global_step=2135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  78%|███████▊  | 62/80 [05:56<01:41,  5.66s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=2.8e-5, train/loss_step=0.00668, global_step=2135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  79%|███████▉  | 63/80 [06:06<01:37,  5.73s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.00668, train/loss_vlb_step=2.8e-5, train/loss_step=0.00668, global_step=2135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  79%|███████▉  | 63/80 [06:06<01:37,  5.73s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.09e-5, train/loss_step=0.00764, global_step=2135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  80%|████████  | 64/80 [06:17<01:32,  5.80s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=3.09e-5, train/loss_step=0.00764, global_step=2135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  80%|████████  | 64/80 [06:17<01:32,  5.80s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.2e-5, train/loss_step=0.00319, global_step=2135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:  81%|████████▏ | 65/80 [06:17<01:25,  5.72s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=1.2e-5, train/loss_step=0.00319, global_step=2135.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  81%|████████▏ | 65/80 [06:17<01:25,  5.72s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000572, train/loss_vlb_step=0.000112, train/loss_step=0.000572, global_step=2136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  82%|████████▎ | 66/80 [06:37<01:23,  5.93s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000572, train/loss_vlb_step=0.000112, train/loss_step=0.000572, global_step=2136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  82%|████████▎ | 66/80 [06:37<01:23,  5.93s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=9.11e-7, train/loss_step=0.000227, global_step=2136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:  84%|████████▍ | 67/80 [06:38<01:16,  5.85s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=9.11e-7, train/loss_step=0.000227, global_step=2136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  84%|████████▍ | 67/80 [06:38<01:16,  5.85s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.00052, train/loss_step=0.0194, global_step=2136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]     Epoch 106:  85%|████████▌ | 68/80 [06:38<01:09,  5.78s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.00052, train/loss_step=0.0194, global_step=2136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  85%|████████▌ | 68/80 [06:38<01:09,  5.78s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=8.17e-6, train/loss_step=0.00177, global_step=2136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  86%|████████▋ | 69/80 [06:39<01:02,  5.70s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=8.17e-6, train/loss_step=0.00177, global_step=2136.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  86%|████████▋ | 69/80 [06:39<01:02,  5.70s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=8.23e-7, train/loss_step=0.000201, global_step=2137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=8.23e-7, train/loss_step=0.000201, global_step=2137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=8.29e-5, train/loss_step=0.00203, global_step=2137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 106:  89%|████████▉ | 71/80 [06:46<00:50,  5.64s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=8.29e-5, train/loss_step=0.00203, global_step=2137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  89%|████████▉ | 71/80 [06:46<00:50,  5.64s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.39e-5, train/loss_step=0.00351, global_step=2137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  90%|█████████ | 72/80 [06:57<00:45,  5.72s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.39e-5, train/loss_step=0.00351, global_step=2137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  90%|█████████ | 72/80 [06:57<00:45,  5.72s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000255, train/loss_step=0.0182, global_step=2137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:  91%|█████████▏| 73/80 [06:57<00:39,  5.65s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000255, train/loss_step=0.0182, global_step=2137.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  91%|█████████▏| 73/80 [06:57<00:39,  5.65s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=1.09e-6, train/loss_step=0.000221, global_step=2138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  92%|█████████▎| 74/80 [07:10<00:34,  5.74s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=1.09e-6, train/loss_step=0.000221, global_step=2138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  92%|█████████▎| 74/80 [07:10<00:34,  5.74s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=7.5e-6, train/loss_step=0.00206, global_step=2138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]   Epoch 106:  94%|█████████▍| 75/80 [07:11<00:28,  5.68s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.00206, train/loss_vlb_step=7.5e-6, train/loss_step=0.00206, global_step=2138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  94%|█████████▍| 75/80 [07:11<00:28,  5.68s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.00012, train/loss_step=0.0244, global_step=2138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372] Epoch 106:  95%|█████████▌| 76/80 [07:11<00:22,  5.61s/it, loss=0.00616, v_num=0, train/loss_simple_step=0.0244, train/loss_vlb_step=0.00012, train/loss_step=0.0244, global_step=2138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  95%|█████████▌| 76/80 [07:11<00:22,  5.61s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=8.49e-7, train/loss_step=0.000201, global_step=2138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  96%|█████████▋| 77/80 [07:12<00:16,  5.54s/it, loss=0.00614, v_num=0, train/loss_simple_step=0.000201, train/loss_vlb_step=8.49e-7, train/loss_step=0.000201, global_step=2138.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  96%|█████████▋| 77/80 [07:12<00:16,  5.54s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=4.86e-7, train/loss_step=0.000113, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  98%|█████████▊| 78/80 [07:12<00:10,  5.48s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=4.86e-7, train/loss_step=0.000113, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  98%|█████████▊| 78/80 [07:12<00:10,  5.48s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=1.6e-5, train/loss_step=0.00453, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]   Epoch 106:  99%|█████████▉| 79/80 [07:13<00:05,  5.42s/it, loss=0.00557, v_num=0, train/loss_simple_step=0.00453, train/loss_vlb_step=1.6e-5, train/loss_step=0.00453, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106:  99%|█████████▉| 79/80 [07:13<00:05,  5.42s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.74e-6, train/loss_step=0.00113, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106: 100%|██████████| 80/80 [07:13<00:00,  5.36s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=4.74e-6, train/loss_step=0.00113, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 106: 100%|██████████| 80/80 [07:13<00:00,  5.36s/it, loss=0.00493, v_num=0, train/loss_simple_step=8.24e-5, train/loss_vlb_step=4.05e-7, train/loss_step=8.24e-5, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Average Epoch time: 433.80 seconds
+Average Peak memory 29568.34MiB
+Epoch 106:   0%|          | 0/80 [00:00<00:00, 4928.68it/s, loss=0.00493, v_num=0, train/loss_simple_step=8.24e-5, train/loss_vlb_step=4.05e-7, train/loss_step=8.24e-5, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 107:   0%|          | 0/80 [00:00<00:00, 2143.23it/s, loss=0.00493, v_num=0, train/loss_simple_step=8.24e-5, train/loss_vlb_step=4.05e-7, train/loss_step=8.24e-5, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]Epoch 107:   1%|▏         | 1/80 [00:35<23:28, 17.82s/it, loss=0.00493, v_num=0, train/loss_simple_step=8.24e-5, train/loss_vlb_step=4.05e-7, train/loss_step=8.24e-5, global_step=2139.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=4.86e-5, train/loss_epoch=0.00372]  Epoch 107:   1%|▏         | 1/80 [00:35<23:28, 17.82s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000197, train/loss_vlb_step=1.91e-6, train/loss_step=0.000197, global_step=2140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   2%|▎         | 2/80 [00:36<15:39, 12.04s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000197, train/loss_vlb_step=1.91e-6, train/loss_step=0.000197, global_step=2140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   2%|▎         | 2/80 [00:36<15:39, 12.04s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000133, train/loss_vlb_step=4.88e-7, train/loss_step=0.000133, global_step=2140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   4%|▍         | 3/80 [00:44<14:19, 11.17s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.000133, train/loss_vlb_step=4.88e-7, train/loss_step=0.000133, global_step=2140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   4%|▍         | 3/80 [00:44<14:19, 11.17s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.00074, train/loss_step=0.0311, global_step=2140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]    Epoch 107:   5%|▌         | 4/80 [00:45<11:26,  9.04s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.0311, train/loss_vlb_step=0.00074, train/loss_step=0.0311, global_step=2140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   5%|▌         | 4/80 [00:45<11:26,  9.04s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=1.76e-6, train/loss_step=0.000456, global_step=2140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   6%|▋         | 5/80 [00:45<09:31,  7.62s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000456, train/loss_vlb_step=1.76e-6, train/loss_step=0.000456, global_step=2140.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   6%|▋         | 5/80 [00:45<09:31,  7.62s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.1e-5, train/loss_step=0.0115, global_step=2141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]     Epoch 107:   8%|▊         | 6/80 [00:46<08:08,  6.60s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=5.1e-5, train/loss_step=0.0115, global_step=2141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   8%|▊         | 6/80 [00:46<08:08,  6.60s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=3.98e-5, train/loss_step=0.0116, global_step=2141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   9%|▉         | 7/80 [00:46<07:06,  5.84s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=3.98e-5, train/loss_step=0.0116, global_step=2141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:   9%|▉         | 7/80 [00:46<07:06,  5.84s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000112, train/loss_step=0.016, global_step=2141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349] Epoch 107:  10%|█         | 8/80 [01:12<09:38,  8.03s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.016, train/loss_vlb_step=0.000112, train/loss_step=0.016, global_step=2141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  10%|█         | 8/80 [01:12<09:38,  8.03s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.88e-6, train/loss_step=0.00166, global_step=2141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  11%|█▏        | 9/80 [01:12<08:37,  7.28s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.00166, train/loss_vlb_step=6.88e-6, train/loss_step=0.00166, global_step=2141.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  11%|█▏        | 9/80 [01:12<08:37,  7.28s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=1.74e-5, train/loss_step=0.00119, global_step=2142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  12%|█▎        | 10/80 [01:17<08:12,  7.03s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=1.74e-5, train/loss_step=0.00119, global_step=2142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  12%|█▎        | 10/80 [01:17<08:12,  7.03s/it, loss=0.00674, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=2.57e-5, train/loss_step=0.00651, global_step=2142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  14%|█▍        | 11/80 [01:21<07:51,  6.83s/it, loss=0.00674, v_num=0, train/loss_simple_step=0.00651, train/loss_vlb_step=2.57e-5, train/loss_step=0.00651, global_step=2142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  14%|█▍        | 11/80 [01:21<07:51,  6.83s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.74e-5, train/loss_step=0.013, global_step=2142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]    Epoch 107:  15%|█▌        | 12/80 [01:24<07:21,  6.49s/it, loss=0.00721, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=6.74e-5, train/loss_step=0.013, global_step=2142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  15%|█▌        | 12/80 [01:24<07:21,  6.49s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=6.98e-6, train/loss_step=0.00114, global_step=2142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  16%|█▋        | 13/80 [01:24<06:46,  6.06s/it, loss=0.00636, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=6.98e-6, train/loss_step=0.00114, global_step=2142.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  16%|█▋        | 13/80 [01:24<06:46,  6.06s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=9.77e-6, train/loss_step=0.00248, global_step=2143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  18%|█▊        | 14/80 [01:25<06:15,  5.69s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.00248, train/loss_vlb_step=9.77e-6, train/loss_step=0.00248, global_step=2143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  18%|█▊        | 14/80 [01:25<06:15,  5.69s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=8.78e-7, train/loss_step=0.00023, global_step=2143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  19%|█▉        | 15/80 [01:25<05:48,  5.37s/it, loss=0.00638, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=8.78e-7, train/loss_step=0.00023, global_step=2143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  19%|█▉        | 15/80 [01:25<05:48,  5.37s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4e-5, train/loss_step=0.00874, global_step=2143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]    Epoch 107:  20%|██        | 16/80 [01:56<07:18,  6.86s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=4e-5, train/loss_step=0.00874, global_step=2143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  20%|██        | 16/80 [01:56<07:18,  6.86s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=1.81e-5, train/loss_step=0.00544, global_step=2143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  21%|██▏       | 17/80 [01:57<06:49,  6.50s/it, loss=0.00586, v_num=0, train/loss_simple_step=0.00544, train/loss_vlb_step=1.81e-5, train/loss_step=0.00544, global_step=2143.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  21%|██▏       | 17/80 [01:57<06:49,  6.50s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=8.64e-6, train/loss_step=0.00228, global_step=2144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  22%|██▎       | 18/80 [01:57<06:23,  6.19s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=8.64e-6, train/loss_step=0.00228, global_step=2144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  22%|██▎       | 18/80 [01:57<06:23,  6.19s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=1.27e-5, train/loss_step=0.00377, global_step=2144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  24%|██▍       | 19/80 [02:09<06:35,  6.48s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=1.27e-5, train/loss_step=0.00377, global_step=2144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  24%|██▍       | 19/80 [02:09<06:35,  6.48s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=6.36e-7, train/loss_step=0.000175, global_step=2144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  25%|██▌       | 20/80 [02:10<06:11,  6.20s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=6.36e-7, train/loss_step=0.000175, global_step=2144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  25%|██▌       | 20/80 [02:10<06:11,  6.20s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=1.86e-5, train/loss_step=0.00528, global_step=2144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  26%|██▋       | 21/80 [02:10<05:50,  5.94s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.00528, train/loss_vlb_step=1.86e-5, train/loss_step=0.00528, global_step=2144.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  26%|██▋       | 21/80 [02:10<05:50,  5.94s/it, loss=0.0062, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=9.72e-6, train/loss_step=0.00131, global_step=2145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349] Epoch 107:  28%|██▊       | 22/80 [02:11<05:30,  5.70s/it, loss=0.0062, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=9.72e-6, train/loss_step=0.00131, global_step=2145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  28%|██▊       | 22/80 [02:11<05:30,  5.70s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.000513, train/loss_vlb_step=3.47e-6, train/loss_step=0.000513, global_step=2145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  29%|██▉       | 23/80 [02:11<05:12,  5.48s/it, loss=0.00622, v_num=0, train/loss_simple_step=0.000513, train/loss_vlb_step=3.47e-6, train/loss_step=0.000513, global_step=2145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  29%|██▉       | 23/80 [02:11<05:12,  5.48s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=3.46e-6, train/loss_step=0.000295, global_step=2145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  30%|███       | 24/80 [02:37<05:53,  6.30s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=3.46e-6, train/loss_step=0.000295, global_step=2145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  30%|███       | 24/80 [02:37<05:53,  6.30s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.000206, train/loss_vlb_step=8.16e-7, train/loss_step=0.000206, global_step=2145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  31%|███▏      | 25/80 [02:38<05:36,  6.11s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.000206, train/loss_vlb_step=8.16e-7, train/loss_step=0.000206, global_step=2145.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  31%|███▏      | 25/80 [02:38<05:36,  6.11s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.19e-5, train/loss_step=0.00485, global_step=2146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  32%|███▎      | 26/80 [02:39<05:18,  5.90s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=2.19e-5, train/loss_step=0.00485, global_step=2146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  32%|███▎      | 26/80 [02:39<05:18,  5.90s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.22e-6, train/loss_step=0.000279, global_step=2146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  34%|███▍      | 27/80 [02:50<05:23,  6.10s/it, loss=0.00377, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=1.22e-6, train/loss_step=0.000279, global_step=2146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  34%|███▍      | 27/80 [02:50<05:23,  6.10s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=3.15e-5, train/loss_step=0.00558, global_step=2146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  35%|███▌      | 28/80 [02:53<05:10,  5.98s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=3.15e-5, train/loss_step=0.00558, global_step=2146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  35%|███▌      | 28/80 [02:53<05:10,  5.98s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000659, train/loss_vlb_step=8.05e-5, train/loss_step=0.000659, global_step=2146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  36%|███▋      | 29/80 [02:53<04:55,  5.80s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000659, train/loss_vlb_step=8.05e-5, train/loss_step=0.000659, global_step=2146.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  36%|███▋      | 29/80 [02:53<04:55,  5.80s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000403, train/loss_vlb_step=1.43e-6, train/loss_step=0.000403, global_step=2147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  38%|███▊      | 30/80 [02:54<04:41,  5.63s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000403, train/loss_vlb_step=1.43e-6, train/loss_step=0.000403, global_step=2147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  38%|███▊      | 30/80 [02:54<04:41,  5.63s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.67e-5, train/loss_step=0.00116, global_step=2147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  39%|███▉      | 31/80 [02:54<04:27,  5.46s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.00116, train/loss_vlb_step=1.67e-5, train/loss_step=0.00116, global_step=2147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  39%|███▉      | 31/80 [02:54<04:27,  5.46s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=3.42e-5, train/loss_step=0.00524, global_step=2147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349] Epoch 107:  40%|████      | 32/80 [03:17<04:47,  5.98s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00524, train/loss_vlb_step=3.42e-5, train/loss_step=0.00524, global_step=2147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  40%|████      | 32/80 [03:17<04:47,  5.98s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=1.86e-5, train/loss_step=0.00556, global_step=2147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  41%|████▏     | 33/80 [03:18<04:34,  5.84s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00556, train/loss_vlb_step=1.86e-5, train/loss_step=0.00556, global_step=2147.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  41%|████▏     | 33/80 [03:18<04:34,  5.84s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.27e-5, train/loss_step=0.00366, global_step=2148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  42%|████▎     | 34/80 [03:19<04:21,  5.69s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.00366, train/loss_vlb_step=1.27e-5, train/loss_step=0.00366, global_step=2148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  42%|████▎     | 34/80 [03:19<04:21,  5.69s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000741, train/loss_vlb_step=2.6e-6, train/loss_step=0.000741, global_step=2148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  44%|████▍     | 35/80 [03:30<04:22,  5.84s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.000741, train/loss_vlb_step=2.6e-6, train/loss_step=0.000741, global_step=2148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  44%|████▍     | 35/80 [03:30<04:22,  5.84s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.2e-5, train/loss_step=0.0026, global_step=2148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]     Epoch 107:  45%|████▌     | 36/80 [03:30<04:10,  5.70s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.0026, train/loss_vlb_step=1.2e-5, train/loss_step=0.0026, global_step=2148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  45%|████▌     | 36/80 [03:30<04:10,  5.70s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000886, train/loss_vlb_step=3.79e-6, train/loss_step=0.000886, global_step=2148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  46%|████▋     | 37/80 [03:31<03:59,  5.56s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.000886, train/loss_vlb_step=3.79e-6, train/loss_step=0.000886, global_step=2148.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  46%|████▋     | 37/80 [03:31<03:59,  5.56s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=1.8e-5, train/loss_step=0.00449, global_step=2149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]   Epoch 107:  48%|████▊     | 38/80 [03:31<03:48,  5.43s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00449, train/loss_vlb_step=1.8e-5, train/loss_step=0.00449, global_step=2149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  48%|████▊     | 38/80 [03:31<03:48,  5.43s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000205, train/loss_vlb_step=8.49e-7, train/loss_step=0.000205, global_step=2149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  49%|████▉     | 39/80 [03:33<03:38,  5.34s/it, loss=0.0022, v_num=0, train/loss_simple_step=0.000205, train/loss_vlb_step=8.49e-7, train/loss_step=0.000205, global_step=2149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  49%|████▉     | 39/80 [03:33<03:38,  5.34s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=7.34e-5, train/loss_step=0.00993, global_step=2149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349] Epoch 107:  50%|█████     | 40/80 [03:56<03:50,  5.76s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.00993, train/loss_vlb_step=7.34e-5, train/loss_step=0.00993, global_step=2149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  50%|█████     | 40/80 [03:56<03:50,  5.76s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.000498, train/loss_vlb_step=6.26e-6, train/loss_step=0.000498, global_step=2149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  51%|█████▏    | 41/80 [03:57<03:40,  5.66s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.000498, train/loss_vlb_step=6.26e-6, train/loss_step=0.000498, global_step=2149.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  51%|█████▏    | 41/80 [03:57<03:40,  5.66s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=4.74e-6, train/loss_step=0.000777, global_step=2150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  52%|█████▎    | 42/80 [03:58<03:30,  5.54s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=4.74e-6, train/loss_step=0.000777, global_step=2150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  52%|█████▎    | 42/80 [03:58<03:30,  5.54s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.07e-5, train/loss_step=0.0162, global_step=2150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]    Epoch 107:  54%|█████▍    | 43/80 [04:09<03:29,  5.67s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.07e-5, train/loss_step=0.0162, global_step=2150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  54%|█████▍    | 43/80 [04:09<03:29,  5.67s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=9.32e-6, train/loss_step=0.00107, global_step=2150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  55%|█████▌    | 44/80 [04:09<03:19,  5.55s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=9.32e-6, train/loss_step=0.00107, global_step=2150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  55%|█████▌    | 44/80 [04:09<03:19,  5.55s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=1.12e-6, train/loss_step=0.000235, global_step=2150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  56%|█████▋    | 45/80 [04:10<03:10,  5.45s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=1.12e-6, train/loss_step=0.000235, global_step=2150.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  56%|█████▋    | 45/80 [04:10<03:10,  5.45s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.09e-5, train/loss_step=0.003, global_step=2151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]      Epoch 107:  57%|█████▊    | 46/80 [04:11<03:01,  5.34s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.09e-5, train/loss_step=0.003, global_step=2151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  57%|█████▊    | 46/80 [04:11<03:01,  5.34s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.05e-6, train/loss_step=0.000256, global_step=2151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  59%|█████▉    | 47/80 [04:26<03:02,  5.54s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000256, train/loss_vlb_step=1.05e-6, train/loss_step=0.000256, global_step=2151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  59%|█████▉    | 47/80 [04:26<03:02,  5.54s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.44e-6, train/loss_step=0.00154, global_step=2151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  60%|██████    | 48/80 [04:37<03:00,  5.65s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00154, train/loss_vlb_step=6.44e-6, train/loss_step=0.00154, global_step=2151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  60%|██████    | 48/80 [04:37<03:00,  5.65s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00767, train/loss_vlb_step=3.89e-5, train/loss_step=0.00767, global_step=2151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349] Epoch 107:  61%|██████▏   | 49/80 [04:37<02:52,  5.56s/it, loss=0.0033, v_num=0, train/loss_simple_step=0.00767, train/loss_vlb_step=3.89e-5, train/loss_step=0.00767, global_step=2151.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  61%|██████▏   | 49/80 [04:37<02:52,  5.56s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=1.55e-5, train/loss_step=0.00422, global_step=2152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  62%|██████▎   | 50/80 [04:38<02:43,  5.46s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=1.55e-5, train/loss_step=0.00422, global_step=2152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  62%|██████▎   | 50/80 [04:38<02:43,  5.46s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=1.34e-5, train/loss_step=0.00388, global_step=2152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  64%|██████▍   | 51/80 [04:52<02:43,  5.63s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00388, train/loss_vlb_step=1.34e-5, train/loss_step=0.00388, global_step=2152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  64%|██████▍   | 51/80 [04:52<02:43,  5.63s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3.56e-5, train/loss_step=0.00589, global_step=2152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  65%|██████▌   | 52/80 [04:53<02:34,  5.53s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=3.56e-5, train/loss_step=0.00589, global_step=2152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  65%|██████▌   | 52/80 [04:53<02:34,  5.53s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=5.64e-7, train/loss_step=0.000154, global_step=2152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  66%|██████▋   | 53/80 [04:53<02:26,  5.44s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=5.64e-7, train/loss_step=0.000154, global_step=2152.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  66%|██████▋   | 53/80 [04:53<02:26,  5.44s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=4.46e-5, train/loss_step=0.00296, global_step=2153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  68%|██████▊   | 54/80 [04:54<02:19,  5.35s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.00296, train/loss_vlb_step=4.46e-5, train/loss_step=0.00296, global_step=2153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  68%|██████▊   | 54/80 [04:54<02:19,  5.35s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=1.21e-5, train/loss_step=0.000626, global_step=2153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  69%|██████▉   | 55/80 [05:08<02:17,  5.51s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=1.21e-5, train/loss_step=0.000626, global_step=2153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  69%|██████▉   | 55/80 [05:08<02:17,  5.51s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.72e-5, train/loss_step=0.00256, global_step=2153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  70%|███████   | 56/80 [05:21<02:15,  5.64s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=1.72e-5, train/loss_step=0.00256, global_step=2153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  70%|███████   | 56/80 [05:21<02:15,  5.64s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=1.99e-6, train/loss_step=0.00042, global_step=2153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  71%|███████▏  | 57/80 [05:26<02:09,  5.63s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=1.99e-6, train/loss_step=0.00042, global_step=2153.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  71%|███████▏  | 57/80 [05:26<02:09,  5.63s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.99e-6, train/loss_step=0.000599, global_step=2154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  72%|███████▎  | 58/80 [05:27<02:02,  5.55s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000599, train/loss_vlb_step=2.99e-6, train/loss_step=0.000599, global_step=2154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  72%|███████▎  | 58/80 [05:27<02:02,  5.55s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=1.31e-6, train/loss_step=0.000293, global_step=2154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  74%|███████▍  | 59/80 [05:40<01:59,  5.68s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=1.31e-6, train/loss_step=0.000293, global_step=2154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  74%|███████▍  | 59/80 [05:40<01:59,  5.68s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=0.000114, train/loss_step=0.0123, global_step=2154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]   Epoch 107:  75%|███████▌  | 60/80 [05:41<01:51,  5.60s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=0.000114, train/loss_step=0.0123, global_step=2154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  75%|███████▌  | 60/80 [05:41<01:51,  5.60s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=1.99e-6, train/loss_step=0.000428, global_step=2154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  76%|███████▋  | 61/80 [05:41<01:44,  5.51s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000428, train/loss_vlb_step=1.99e-6, train/loss_step=0.000428, global_step=2154.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  76%|█████��█▋  | 61/80 [05:41<01:44,  5.51s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.19e-6, train/loss_step=0.000311, global_step=2155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  78%|███████▊  | 62/80 [05:42<01:37,  5.43s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.19e-6, train/loss_step=0.000311, global_step=2155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  78%|███████▊  | 62/80 [05:42<01:37,  5.43s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000458, train/loss_vlb_step=1.77e-6, train/loss_step=0.000458, global_step=2155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  79%|███████▉  | 63/80 [05:57<01:35,  5.59s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.000458, train/loss_vlb_step=1.77e-6, train/loss_step=0.000458, global_step=2155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  79%|███████▉  | 63/80 [05:57<01:35,  5.59s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.31e-6, train/loss_step=0.00136, global_step=2155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  80%|████████  | 64/80 [06:02<01:29,  5.58s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=5.31e-6, train/loss_step=0.00136, global_step=2155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  80%|████████  | 64/80 [06:02<01:29,  5.58s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.05e-6, train/loss_step=0.000295, global_step=2155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  81%|████████▏ | 65/80 [06:18<01:25,  5.73s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.05e-6, train/loss_step=0.000295, global_step=2155.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  81%|████████▏ | 65/80 [06:18<01:25,  5.73s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.01e-5, train/loss_step=0.0124, global_step=2156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]    Epoch 107:  82%|████████▎ | 66/80 [06:18<01:19,  5.65s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=5.01e-5, train/loss_step=0.0124, global_step=2156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  82%|████████▎ | 66/80 [06:18<01:19,  5.65s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.81e-6, train/loss_step=0.00032, global_step=2156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  84%|████████▍ | 67/80 [06:19<01:12,  5.57s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.81e-6, train/loss_step=0.00032, global_step=2156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  84%|████████▍ | 67/80 [06:19<01:12,  5.57s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=9.46e-5, train/loss_step=0.0108, global_step=2156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]   Epoch 107:  85%|████████▌ | 68/80 [06:19<01:06,  5.50s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=9.46e-5, train/loss_step=0.0108, global_step=2156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  85%|████████▌ | 68/80 [06:19<01:06,  5.50s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=1.58e-5, train/loss_step=0.00467, global_step=2156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  86%|████████▋ | 69/80 [06:31<01:01,  5.60s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00467, train/loss_vlb_step=1.58e-5, train/loss_step=0.00467, global_step=2156.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  86%|████████▋ | 69/80 [06:31<01:01,  5.60s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=6.75e-6, train/loss_step=0.00132, global_step=2157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349] Epoch 107:  88%|████████▊ | 70/80 [06:32<00:55,  5.53s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00132, train/loss_vlb_step=6.75e-6, train/loss_step=0.00132, global_step=2157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  88%|████████▊ | 70/80 [06:32<00:55,  5.53s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000214, train/loss_vlb_step=1e-6, train/loss_step=0.000214, global_step=2157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  89%|████████▉ | 71/80 [06:37<00:49,  5.52s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000214, train/loss_vlb_step=1e-6, train/loss_step=0.000214, global_step=2157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  89%|████████▉ | 71/80 [06:37<00:49,  5.52s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.69e-6, train/loss_step=0.000355, global_step=2157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  90%|█████████ | 72/80 [06:37<00:43,  5.45s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.69e-6, train/loss_step=0.000355, global_step=2157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  90%|█████████ | 72/80 [06:37<00:43,  5.45s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=2.16e-5, train/loss_step=0.00242, global_step=2157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  91%|█████████▏| 73/80 [06:53<00:39,  5.58s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=2.16e-5, train/loss_step=0.00242, global_step=2157.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  91%|█████████▏| 73/80 [06:53<00:39,  5.58s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000811, train/loss_vlb_step=3.61e-6, train/loss_step=0.000811, global_step=2158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.000811, train/loss_vlb_step=3.61e-6, train/loss_step=0.000811, global_step=2158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  92%|█████████▎| 74/80 [06:53<00:33,  5.51s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=2.39e-6, train/loss_step=0.000446, global_step=2158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  94%|█████████▍| 75/80 [06:54<00:27,  5.45s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=2.39e-6, train/loss_step=0.000446, global_step=2158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  94%|█████████▍| 75/80 [06:54<00:27,  5.45s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.000875, train/loss_vlb_step=4.52e-6, train/loss_step=0.000875, global_step=2158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  95%|█████████▌| 76/80 [06:54<00:21,  5.39s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.000875, train/loss_vlb_step=4.52e-6, train/loss_step=0.000875, global_step=2158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  95%|█████████▌| 76/80 [06:54<00:21,  5.39s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000941, train/loss_vlb_step=4.44e-6, train/loss_step=0.000941, global_step=2158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000941, train/loss_vlb_step=4.44e-6, train/loss_step=0.000941, global_step=2158.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.06e-5, train/loss_step=0.00199, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 107:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=1.06e-5, train/loss_step=0.00199, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.41e-6, train/loss_step=0.00148, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  99%|█████████▉| 79/80 [07:10<00:05,  5.39s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.41e-6, train/loss_step=0.00148, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107:  99%|█████████▉| 79/80 [07:10<00:05,  5.39s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=1.88e-5, train/loss_step=0.00523, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00523, train/loss_vlb_step=1.88e-5, train/loss_step=0.00523, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 107: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=2.9e-6, train/loss_step=0.000518, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Average Epoch time: 431.38 seconds
+Average Peak memory 29565.58MiB
+Epoch 107:   0%|          | 0/80 [00:00<00:00, 4894.17it/s, loss=0.00236, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=2.9e-6, train/loss_step=0.000518, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 108:   0%|          | 0/80 [00:00<00:00, 2038.05it/s, loss=0.00236, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=2.9e-6, train/loss_step=0.000518, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]Epoch 108:   1%|▏         | 1/80 [00:38<25:17, 19.21s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.000518, train/loss_vlb_step=2.9e-6, train/loss_step=0.000518, global_step=2159.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=3.87e-5, train/loss_epoch=0.00349]  Epoch 108:   1%|▏         | 1/80 [00:38<25:17, 19.21s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00885, train/loss_vlb_step=3.08e-5, train/loss_step=0.00885, global_step=2160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349] Epoch 108:   2%|▎         | 2/80 [00:38<16:51, 12.96s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.00885, train/loss_vlb_step=3.08e-5, train/loss_step=0.00885, global_step=2160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   2%|▎         | 2/80 [00:38<16:51, 12.96s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=2.47e-6, train/loss_step=0.000312, global_step=2160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   4%|▍         | 3/80 [00:39<12:38,  9.84s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=2.47e-6, train/loss_step=0.000312, global_step=2160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   4%|▍         | 3/80 [00:39<12:38,  9.85s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=7.19e-5, train/loss_step=0.00937, global_step=2160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:   5%|▌         | 4/80 [00:50<12:43, 10.04s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00937, train/loss_vlb_step=7.19e-5, train/loss_step=0.00937, global_step=2160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   5%|▌         | 4/80 [00:50<12:43, 10.04s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=1.69e-5, train/loss_step=0.00416, global_step=2160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   6%|▋         | 5/80 [00:50<10:34,  8.46s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00416, train/loss_vlb_step=1.69e-5, train/loss_step=0.00416, global_step=2160.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   6%|▋         | 5/80 [00:50<10:34,  8.46s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=5.06e-6, train/loss_step=0.00112, global_step=2161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   8%|▊         | 6/80 [00:51<09:01,  7.32s/it, loss=0.00281, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=5.06e-6, train/loss_step=0.00112, global_step=2161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   8%|▊         | 6/80 [00:51<09:01,  7.32s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.11e-5, train/loss_step=0.00303, global_step=2161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   9%|▉         | 7/80 [00:51<07:51,  6.46s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.11e-5, train/loss_step=0.00303, global_step=2161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:   9%|▉         | 7/80 [00:51<07:51,  6.46s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=2.2e-6, train/loss_step=0.000412, global_step=2161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  10%|█         | 8/80 [01:24<11:14,  9.36s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000412, train/loss_vlb_step=2.2e-6, train/loss_step=0.000412, global_step=2161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  10%|█         | 8/80 [01:24<11:14,  9.36s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.55e-5, train/loss_step=0.00375, global_step=2161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349] Epoch 108:  11%|█▏        | 9/80 [01:24<10:02,  8.48s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.55e-5, train/loss_step=0.00375, global_step=2161.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  11%|█▏        | 9/80 [01:24<10:02,  8.48s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000999, train/loss_step=0.0257, global_step=2162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  12%|█▎        | 10/80 [01:25<09:02,  7.75s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.0257, train/loss_vlb_step=0.000999, train/loss_step=0.0257, global_step=2162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  12%|█▎        | 10/80 [01:25<09:02,  7.75s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.0151, train/loss_step=0.0339, global_step=2162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349] Epoch 108:  14%|█▍        | 11/80 [01:25<08:13,  7.15s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.0339, train/loss_vlb_step=0.0151, train/loss_step=0.0339, global_step=2162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  14%|█▍        | 11/80 [01:25<08:13,  7.15s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.000699, train/loss_vlb_step=3.54e-6, train/loss_step=0.000699, global_step=2162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  15%|█▌        | 12/80 [01:26<07:33,  6.66s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.000699, train/loss_vlb_step=3.54e-6, train/loss_step=0.000699, global_step=2162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  15%|█▌        | 12/80 [01:26<07:33,  6.66s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.35e-7, train/loss_step=0.00018, global_step=2162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349] Epoch 108:  16%|█▋        | 13/80 [01:27<06:57,  6.23s/it, loss=0.00519, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.35e-7, train/loss_step=0.00018, global_step=2162.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  16%|█▋        | 13/80 [01:27<06:57,  6.23s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=1.27e-5, train/loss_step=0.00118, global_step=2163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  18%|█▊        | 14/80 [01:27<06:25,  5.84s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=1.27e-5, train/loss_step=0.00118, global_step=2163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  18%|█▊        | 14/80 [01:27<06:25,  5.84s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000102, train/loss_step=0.011, global_step=2163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]   Epoch 108:  19%|█▉        | 15/80 [01:28<05:58,  5.51s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000102, train/loss_step=0.011, global_step=2163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  19%|█▉        | 15/80 [01:28<05:58,  5.51s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.17e-5, train/loss_step=0.00314, global_step=2163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  20%|██        | 16/80 [01:56<07:18,  6.85s/it, loss=0.00585, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.17e-5, train/loss_step=0.00314, global_step=2163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  20%|██        | 16/80 [01:56<07:18,  6.85s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.41e-6, train/loss_step=0.00032, global_step=2163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  21%|██▏       | 17/80 [01:57<06:52,  6.55s/it, loss=0.00582, v_num=0, train/loss_simple_step=0.00032, train/loss_vlb_step=1.41e-6, train/loss_step=0.00032, global_step=2163.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  21%|██▏       | 17/80 [01:57<06:52,  6.55s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.61e-6, train/loss_step=0.000284, global_step=2164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  22%|██▎       | 18/80 [01:58<06:26,  6.24s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=1.61e-6, train/loss_step=0.000284, global_step=2164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  22%|██▎       | 18/80 [01:58<06:26,  6.24s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=4.39e-6, train/loss_step=0.000263, global_step=2164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  24%|██▍       | 19/80 [02:01<06:10,  6.08s/it, loss=0.00567, v_num=0, train/loss_simple_step=0.000263, train/loss_vlb_step=4.39e-6, train/loss_step=0.000263, global_step=2164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  24%|██▍       | 19/80 [02:01<06:10,  6.08s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.17e-6, train/loss_step=0.000299, global_step=2164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  25%|██▌       | 20/80 [02:03<05:53,  5.90s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.17e-6, train/loss_step=0.000299, global_step=2164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  25%|██▌       | 20/80 [02:03<05:53,  5.90s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=4.75e-6, train/loss_step=0.00123, global_step=2164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  26%|██▋       | 21/80 [02:04<05:33,  5.66s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=4.75e-6, train/loss_step=0.00123, global_step=2164.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  26%|██▋       | 21/80 [02:04<05:33,  5.66s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000672, train/loss_vlb_step=3.17e-6, train/loss_step=0.000672, global_step=2165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  28%|██▊       | 22/80 [02:05<05:15,  5.43s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000672, train/loss_vlb_step=3.17e-6, train/loss_step=0.000672, global_step=2165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  28%|██▊       | 22/80 [02:05<05:15,  5.43s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.26e-5, train/loss_step=0.00613, global_step=2165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  29%|██▉       | 23/80 [02:05<04:58,  5.23s/it, loss=0.00535, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.26e-5, train/loss_step=0.00613, global_step=2165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  29%|██▉       | 23/80 [02:05<04:58,  5.23s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=1.67e-5, train/loss_step=0.00496, global_step=2165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  30%|███       | 24/80 [02:39<05:57,  6.38s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00496, train/loss_vlb_step=1.67e-5, train/loss_step=0.00496, global_step=2165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  30%|███       | 24/80 [02:39<05:57,  6.38s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.7e-5, train/loss_step=0.00567, global_step=2165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  31%|███▏      | 25/80 [02:39<05:38,  6.15s/it, loss=0.0052, v_num=0, train/loss_simple_step=0.00567, train/loss_vlb_step=2.7e-5, train/loss_step=0.00567, global_step=2165.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  31%|███▏      | 25/80 [02:39<05:38,  6.15s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=1.27e-6, train/loss_step=0.000222, global_step=2166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  32%|███▎      | 26/80 [02:40<05:20,  5.94s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=1.27e-6, train/loss_step=0.000222, global_step=2166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  32%|███▎      | 26/80 [02:40<05:20,  5.94s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=2.81e-5, train/loss_step=0.00672, global_step=2166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  34%|███▍      | 27/80 [02:45<05:12,  5.90s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00672, train/loss_vlb_step=2.81e-5, train/loss_step=0.00672, global_step=2166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  34%|███▍      | 27/80 [02:45<05:12,  5.90s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.29e-5, train/loss_step=0.00375, global_step=2166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  35%|███▌      | 28/80 [02:45<04:56,  5.71s/it, loss=0.00551, v_num=0, train/loss_simple_step=0.00375, train/loss_vlb_step=1.29e-5, train/loss_step=0.00375, global_step=2166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  35%|███▌      | 28/80 [02:45<04:56,  5.71s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=9.34e-5, train/loss_step=0.0122, global_step=2166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  36%|███▋      | 29/80 [02:46<04:42,  5.54s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.0122, train/loss_vlb_step=9.34e-5, train/loss_step=0.0122, global_step=2166.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  36%|███▋      | 29/80 [02:46<04:42,  5.54s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=5.86e-7, train/loss_step=0.000144, global_step=2167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  38%|███▊      | 30/80 [02:46<04:28,  5.37s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.000144, train/loss_vlb_step=5.86e-7, train/loss_step=0.000144, global_step=2167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  38%|███▊      | 30/80 [02:46<04:28,  5.37s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.1e-5, train/loss_step=0.0145, global_step=2167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]     Epoch 108:  39%|███▉      | 31/80 [02:47<04:15,  5.22s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.0145, train/loss_vlb_step=6.1e-5, train/loss_step=0.0145, global_step=2167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  39%|███▉      | 31/80 [02:47<04:15,  5.22s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000182, train/loss_vlb_step=6.23e-7, train/loss_step=0.000182, global_step=2167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  40%|████      | 32/80 [03:20<04:52,  6.09s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000182, train/loss_vlb_step=6.23e-7, train/loss_step=0.000182, global_step=2167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  40%|████      | 32/80 [03:20<04:52,  6.09s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000685, train/loss_vlb_step=7.08e-6, train/loss_step=0.000685, global_step=2167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  41%|████▏     | 33/80 [03:21<04:38,  5.93s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000685, train/loss_vlb_step=7.08e-6, train/loss_step=0.000685, global_step=2167.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  41%|████▏     | 33/80 [03:21<04:38,  5.93s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000581, train/loss_vlb_step=4.02e-6, train/loss_step=0.000581, global_step=2168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  42%|████▎     | 34/80 [03:22<04:25,  5.77s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000581, train/loss_vlb_step=4.02e-6, train/loss_step=0.000581, global_step=2168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  42%|████▎     | 34/80 [03:22<04:25,  5.77s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=2.38e-6, train/loss_step=0.000406, global_step=2168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  44%|████▍     | 35/80 [03:25<04:16,  5.70s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.000406, train/loss_vlb_step=2.38e-6, train/loss_step=0.000406, global_step=2168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  44%|████▍     | 35/80 [03:25<04:16,  5.70s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.51e-6, train/loss_step=0.0015, global_step=2168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]    Epoch 108:  45%|████▌     | 36/80 [03:27<04:07,  5.62s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.51e-6, train/loss_step=0.0015, global_step=2168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  45%|████▌     | 36/80 [03:27<04:07,  5.62s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.72e-6, train/loss_step=0.000311, global_step=2168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  46%|████▋     | 37/80 [03:28<03:55,  5.49s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000311, train/loss_vlb_step=1.72e-6, train/loss_step=0.000311, global_step=2168.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  46%|████▋     | 37/80 [03:28<03:55,  5.49s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=1.5e-5, train/loss_step=0.00442, global_step=2169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]   Epoch 108:  48%|████▊     | 38/80 [03:29<03:45,  5.36s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00442, train/loss_vlb_step=1.5e-5, train/loss_step=0.00442, global_step=2169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  48%|████▊     | 38/80 [03:29<03:45,  5.36s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=1.83e-5, train/loss_step=0.00505, global_step=2169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  49%|████▉     | 39/80 [03:29<03:34,  5.24s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00505, train/loss_vlb_step=1.83e-5, train/loss_step=0.00505, global_step=2169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  49%|████▉     | 39/80 [03:29<03:34,  5.24s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=4.55e-6, train/loss_step=0.000284, global_step=2169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  50%|█████     | 40/80 [03:58<03:52,  5.81s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000284, train/loss_vlb_step=4.55e-6, train/loss_step=0.000284, global_step=2169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  50%|█████     | 40/80 [03:58<03:52,  5.81s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000608, train/loss_vlb_step=4.26e-6, train/loss_step=0.000608, global_step=2169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  51%|█████▏    | 41/80 [03:58<03:41,  5.69s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000608, train/loss_vlb_step=4.26e-6, train/loss_step=0.000608, global_step=2169.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  51%|█████▏    | 41/80 [03:58<03:41,  5.69s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000123, train/loss_step=0.0149, global_step=2170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]   Epoch 108:  52%|█████▎    | 42/80 [03:59<03:31,  5.57s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=0.000123, train/loss_step=0.0149, global_step=2170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  52%|█████▎    | 42/80 [03:59<03:31,  5.57s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000967, train/loss_vlb_step=4.28e-6, train/loss_step=0.000967, global_step=2170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  54%|█████▍    | 43/80 [04:01<03:23,  5.49s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.000967, train/loss_vlb_step=4.28e-6, train/loss_step=0.000967, global_step=2170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  54%|█████▍    | 43/80 [04:01<03:23,  5.49s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=1.82e-5, train/loss_step=0.00519, global_step=2170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349] Epoch 108:  55%|█████▌    | 44/80 [04:16<03:25,  5.70s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=1.82e-5, train/loss_step=0.00519, global_step=2170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  55%|█████▌    | 44/80 [04:16<03:25,  5.70s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=8.93e-6, train/loss_step=0.000661, global_step=2170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  56%|█████▋    | 45/80 [04:16<03:15,  5.58s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=8.93e-6, train/loss_step=0.000661, global_step=2170.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  56%|█████▋    | 45/80 [04:16<03:15,  5.58s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.07e-6, train/loss_step=0.0016, global_step=2171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]    Epoch 108:  57%|█████▊    | 46/80 [04:17<03:06,  5.47s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=7.07e-6, train/loss_step=0.0016, global_step=2171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  57%|█████▊    | 46/80 [04:17<03:06,  5.47s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=6.07e-6, train/loss_step=0.00162, global_step=2171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  59%|█████▉    | 47/80 [04:17<02:57,  5.37s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=6.07e-6, train/loss_step=0.00162, global_step=2171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  59%|█████▉    | 47/80 [04:17<02:57,  5.37s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.59e-6, train/loss_step=0.000336, global_step=2171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  60%|██████    | 48/80 [04:39<03:02,  5.71s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.59e-6, train/loss_step=0.000336, global_step=2171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  60%|██████    | 48/80 [04:39<03:02,  5.71s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=5.96e-5, train/loss_step=0.000626, global_step=2171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  61%|██████▏   | 49/80 [04:40<02:53,  5.60s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=5.96e-5, train/loss_step=0.000626, global_step=2171.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  61%|██████▏   | 49/80 [04:40<02:53,  5.60s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.75e-5, train/loss_step=0.00301, global_step=2172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  62%|██████▎   | 50/80 [04:40<02:45,  5.50s/it, loss=0.00287, v_num=0, train/loss_simple_step=0.00301, train/loss_vlb_step=1.75e-5, train/loss_step=0.00301, global_step=2172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  62%|██████▎   | 50/80 [04:40<02:45,  5.50s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=0.000147, train/loss_step=0.0114, global_step=2172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349] Epoch 108:  64%|██████▍   | 51/80 [04:42<02:37,  5.43s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=0.000147, train/loss_step=0.0114, global_step=2172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  64%|██████▍   | 51/80 [04:42<02:37,  5.43s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=7.48e-6, train/loss_step=0.00196, global_step=2172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  65%|██████▌   | 52/80 [05:04<02:41,  5.75s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00196, train/loss_vlb_step=7.48e-6, train/loss_step=0.00196, global_step=2172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  65%|██████▌   | 52/80 [05:04<02:41,  5.75s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=3.85e-6, train/loss_step=0.000376, global_step=2172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  66%|██████▋   | 53/80 [05:05<02:32,  5.65s/it, loss=0.00279, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=3.85e-6, train/loss_step=0.000376, global_step=2172.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  66%|██████▋   | 53/80 [05:05<02:32,  5.65s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=2.63e-5, train/loss_step=0.00732, global_step=2173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  68%|██████▊   | 54/80 [05:05<02:24,  5.56s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00732, train/loss_vlb_step=2.63e-5, train/loss_step=0.00732, global_step=2173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  68%|██████▊   | 54/80 [05:05<02:24,  5.56s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=0.000111, train/loss_step=0.000887, global_step=2173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  69%|██████▉   | 55/80 [05:06<02:16,  5.47s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=0.000111, train/loss_step=0.000887, global_step=2173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  69%|██████▉   | 55/80 [05:06<02:16,  5.47s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=3.28e-5, train/loss_step=0.00939, global_step=2173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]   Epoch 108:  70%|███████   | 56/80 [05:17<02:13,  5.57s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=3.28e-5, train/loss_step=0.00939, global_step=2173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  70%|███████   | 56/80 [05:17<02:13,  5.57s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000854, train/loss_vlb_step=4.05e-6, train/loss_step=0.000854, global_step=2173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  71%|███████▏  | 57/80 [05:18<02:06,  5.49s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000854, train/loss_vlb_step=4.05e-6, train/loss_step=0.000854, global_step=2173.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  71%|███████▏  | 57/80 [05:18<02:06,  5.49s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=2.62e-5, train/loss_step=0.00793, global_step=2174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  72%|███████▎  | 58/80 [05:18<01:58,  5.41s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.00793, train/loss_vlb_step=2.62e-5, train/loss_step=0.00793, global_step=2174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  72%|███████▎  | 58/80 [05:18<01:58,  5.41s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=3.35e-5, train/loss_step=0.000446, global_step=2174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  74%|███████▍  | 59/80 [05:28<01:55,  5.48s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=3.35e-5, train/loss_step=0.000446, global_step=2174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  74%|███████▍  | 59/80 [05:28<01:55,  5.48s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.7e-5, train/loss_step=0.0108, global_step=2174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]     Epoch 108:  75%|███████▌  | 60/80 [05:45<01:53,  5.67s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.0108, train/loss_vlb_step=5.7e-5, train/loss_step=0.0108, global_step=2174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  75%|███████▌  | 60/80 [05:45<01:53,  5.67s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=4.95e-6, train/loss_step=0.00118, global_step=2174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  76%|███████▋  | 61/80 [05:46<01:46,  5.59s/it, loss=0.00407, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=4.95e-6, train/loss_step=0.00118, global_step=2174.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  76%|███████▋  | 61/80 [05:46<01:46,  5.59s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.22e-5, train/loss_step=0.0136, global_step=2175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]    Epoch 108:  78%|███████▊  | 62/80 [05:46<01:39,  5.50s/it, loss=0.004, v_num=0, train/loss_simple_step=0.0136, train/loss_vlb_step=6.22e-5, train/loss_step=0.0136, global_step=2175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  78%|███████▊  | 62/80 [05:46<01:39,  5.50s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000131, train/loss_vlb_step=5.14e-7, train/loss_step=0.000131, global_step=2175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  79%|███████▉  | 63/80 [05:47<01:32,  5.43s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000131, train/loss_vlb_step=5.14e-7, train/loss_step=0.000131, global_step=2175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  79%|███████▉  | 63/80 [05:47<01:32,  5.43s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000414, train/loss_vlb_step=3.3e-6, train/loss_step=0.000414, global_step=2175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349] Epoch 108:  80%|████████  | 64/80 [06:01<01:29,  5.57s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000414, train/loss_vlb_step=3.3e-6, train/loss_step=0.000414, global_step=2175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  80%|████████  | 64/80 [06:01<01:29,  5.57s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=2.21e-6, train/loss_step=0.000488, global_step=2175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  81%|████████▏ | 65/80 [06:02<01:22,  5.49s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000488, train/loss_vlb_step=2.21e-6, train/loss_step=0.000488, global_step=2175.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  81%|████████▏ | 65/80 [06:02<01:22,  5.49s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=8.84e-7, train/loss_step=0.00022, global_step=2176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  82%|████████▎ | 66/80 [06:02<01:15,  5.42s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=8.84e-7, train/loss_step=0.00022, global_step=2176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  82%|████████▎ | 66/80 [06:02<01:15,  5.42s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=1.78e-6, train/loss_step=0.000442, global_step=2176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  84%|████████▍ | 67/80 [06:18<01:12,  5.57s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000442, train/loss_vlb_step=1.78e-6, train/loss_step=0.000442, global_step=2176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  84%|████████▍ | 67/80 [06:18<01:12,  5.57s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000128, train/loss_step=0.0165, global_step=2176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]   Epoch 108:  85%|████████▌ | 68/80 [06:19<01:05,  5.50s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=0.000128, train/loss_step=0.0165, global_step=2176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  85%|████████▌ | 68/80 [06:19<01:05,  5.50s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.19e-5, train/loss_step=0.00351, global_step=2176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  86%|████████▋ | 69/80 [06:19<00:59,  5.43s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00351, train/loss_vlb_step=1.19e-5, train/loss_step=0.00351, global_step=2176.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  86%|████████▋ | 69/80 [06:19<00:59,  5.43s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000915, train/loss_vlb_step=5.54e-5, train/loss_step=0.000915, global_step=2177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  88%|████████▊ | 70/80 [06:20<00:53,  5.36s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000915, train/loss_vlb_step=5.54e-5, train/loss_step=0.000915, global_step=2177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  88%|████████▊ | 70/80 [06:20<00:53,  5.36s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.91e-6, train/loss_step=0.000324, global_step=2177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  89%|████████▉ | 71/80 [06:20<00:47,  5.29s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.000324, train/loss_vlb_step=1.91e-6, train/loss_step=0.000324, global_step=2177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  89%|████████▉ | 71/80 [06:20<00:47,  5.29s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=2.06e-6, train/loss_step=0.000241, global_step=2177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  90%|█████████ | 72/80 [06:42<00:44,  5.52s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=2.06e-6, train/loss_step=0.000241, global_step=2177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  90%|█████████ | 72/80 [06:42<00:44,  5.52s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.53e-5, train/loss_step=0.00226, global_step=2177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 108:  91%|█████████▏| 73/80 [06:43<00:38,  5.45s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00226, train/loss_vlb_step=1.53e-5, train/loss_step=0.00226, global_step=2177.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  91%|█████████▏| 73/80 [06:43<00:38,  5.45s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000922, train/loss_vlb_step=4.36e-6, train/loss_step=0.000922, global_step=2178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  92%|█████████▎| 74/80 [06:43<00:32,  5.38s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000922, train/loss_vlb_step=4.36e-6, train/loss_step=0.000922, global_step=2178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  92%|█████████▎| 74/80 [06:43<00:32,  5.38s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=2.4e-6, train/loss_step=0.000545, global_step=2178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349] Epoch 108:  94%|█████████▍| 75/80 [06:52<00:27,  5.43s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000545, train/loss_vlb_step=2.4e-6, train/loss_step=0.000545, global_step=2178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  94%|█████████▍| 75/80 [06:52<00:27,  5.43s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00065, train/loss_vlb_step=2.72e-6, train/loss_step=0.00065, global_step=2178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349] Epoch 108:  95%|█████████▌| 76/80 [06:58<00:21,  5.44s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00065, train/loss_vlb_step=2.72e-6, train/loss_step=0.00065, global_step=2178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  95%|█████████▌| 76/80 [06:58<00:21,  5.44s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000202, train/loss_vlb_step=8.7e-7, train/loss_step=0.000202, global_step=2178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  96%|█████████▋| 77/80 [06:59<00:16,  5.37s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.000202, train/loss_vlb_step=8.7e-7, train/loss_step=0.000202, global_step=2178.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  96%|█████████▋| 77/80 [06:59<00:16,  5.37s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=1.31e-6, train/loss_step=0.000258, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  98%|█████████▊| 78/80 [07:00<00:10,  5.32s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.000258, train/loss_vlb_step=1.31e-6, train/loss_step=0.000258, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  98%|█████████▊| 78/80 [07:00<00:10,  5.32s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=1.03e-6, train/loss_step=0.000215, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  99%|█████████▉| 79/80 [07:01<00:05,  5.26s/it, loss=0.00269, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=1.03e-6, train/loss_step=0.000215, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108:  99%|█████████▉| 79/80 [07:01<00:05,  5.26s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2e-5, train/loss_step=0.00574, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]     Epoch 108: 100%|██████████| 80/80 [07:01<00:00,  5.20s/it, loss=0.00244, v_num=0, train/loss_simple_step=0.00574, train/loss_vlb_step=2e-5, train/loss_step=0.00574, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 108: 100%|██████████| 80/80 [07:01<00:00,  5.20s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000114, train/loss_vlb_step=4.87e-7, train/loss_step=0.000114, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Average Epoch time: 421.60 seconds
+Average Peak memory 29563.29MiB
+Epoch 108:   0%|          | 0/80 [00:00<00:00, 4894.17it/s, loss=0.00238, v_num=0, train/loss_simple_step=0.000114, train/loss_vlb_step=4.87e-7, train/loss_step=0.000114, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 109:   0%|          | 0/80 [00:00<00:00, 2029.17it/s, loss=0.00238, v_num=0, train/loss_simple_step=0.000114, train/loss_vlb_step=4.87e-7, train/loss_step=0.000114, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]Epoch 109:   1%|▏         | 1/80 [00:39<25:41, 19.52s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000114, train/loss_vlb_step=4.87e-7, train/loss_step=0.000114, global_step=2179.0, lr_abs=0.0001, train/loss_simple_epoch=0.00349, train/loss_vlb_epoch=4.19e-5, train/loss_epoch=0.00349]  Epoch 109:   1%|▏         | 1/80 [00:39<25:41, 19.52s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=6.88e-6, train/loss_step=0.00143, global_step=2180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401] Epoch 109:   2%|▎         | 2/80 [00:43<18:50, 14.50s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.00143, train/loss_vlb_step=6.88e-6, train/loss_step=0.00143, global_step=2180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   2%|▎         | 2/80 [00:43<18:50, 14.50s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=4.02e-5, train/loss_step=0.00691, global_step=2180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   4%|▍         | 3/80 [00:43<14:06, 11.00s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.00691, train/loss_vlb_step=4.02e-5, train/loss_step=0.00691, global_step=2180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   4%|▍         | 3/80 [00:43<14:06, 11.00s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=1.9e-5, train/loss_step=0.00561, global_step=2180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401] Epoch 109:   5%|▌         | 4/80 [00:44<11:16,  8.90s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00561, train/loss_vlb_step=1.9e-5, train/loss_step=0.00561, global_step=2180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   5%|▌         | 4/80 [00:44<11:16,  8.90s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000412, train/loss_step=0.0185, global_step=2180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   6%|▋         | 5/80 [00:45<09:22,  7.50s/it, loss=0.00327, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.000412, train/loss_step=0.0185, global_step=2180.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   6%|▋         | 5/80 [00:45<09:22,  7.50s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.36e-6, train/loss_step=0.00104, global_step=2181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   8%|▊         | 6/80 [00:45<08:01,  6.51s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=5.36e-6, train/loss_step=0.00104, global_step=2181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   8%|▊         | 6/80 [00:45<08:01,  6.51s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=1.71e-5, train/loss_step=0.00487, global_step=2181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   9%|▉         | 7/80 [00:46<07:00,  5.76s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.00487, train/loss_vlb_step=1.71e-5, train/loss_step=0.00487, global_step=2181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:   9%|▉         | 7/80 [00:46<07:00,  5.76s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=8.45e-6, train/loss_step=0.00123, global_step=2181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  10%|█         | 8/80 [01:22<11:00,  9.17s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=8.45e-6, train/loss_step=0.00123, global_step=2181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  10%|█         | 8/80 [01:22<11:00,  9.17s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=1.13e-5, train/loss_step=0.00135, global_step=2181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  11%|█▏        | 9/80 [01:23<09:50,  8.32s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=1.13e-5, train/loss_step=0.00135, global_step=2181.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  11%|█▏        | 9/80 [01:23<09:50,  8.32s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=5e-5, train/loss_step=0.00168, global_step=2182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]    Epoch 109:  12%|█▎        | 10/80 [01:29<09:28,  8.12s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=5e-5, train/loss_step=0.00168, global_step=2182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  12%|█▎        | 10/80 [01:29<09:28,  8.12s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=2.72e-5, train/loss_step=0.00614, global_step=2182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  14%|█▍        | 11/80 [01:31<08:47,  7.64s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=2.72e-5, train/loss_step=0.00614, global_step=2182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  14%|█▍        | 11/80 [01:31<08:47,  7.64s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=3.64e-6, train/loss_step=0.000748, global_step=2182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  15%|█▌        | 12/80 [01:32<08:02,  7.09s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=3.64e-6, train/loss_step=0.000748, global_step=2182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  15%|█▌        | 12/80 [01:32<08:02,  7.09s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.18e-6, train/loss_step=0.000718, global_step=2182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  16%|█▋        | 13/80 [01:32<07:23,  6.62s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000718, train/loss_vlb_step=3.18e-6, train/loss_step=0.000718, global_step=2182.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  16%|█▋        | 13/80 [01:32<07:23,  6.62s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000484, train/loss_vlb_step=2.38e-6, train/loss_step=0.000484, global_step=2183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  18%|█▊        | 14/80 [01:33<06:49,  6.21s/it, loss=0.00292, v_num=0, train/loss_simple_step=0.000484, train/loss_vlb_step=2.38e-6, train/loss_step=0.000484, global_step=2183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  18%|█▊        | 14/80 [01:33<06:49,  6.21s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000177, train/loss_step=0.0143, global_step=2183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]   Epoch 109:  19%|█▉        | 15/80 [01:33<06:20,  5.85s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0143, train/loss_vlb_step=0.000177, train/loss_step=0.0143, global_step=2183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  19%|█▉        | 15/80 [01:33<06:20,  5.85s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000149, train/loss_vlb_step=5.65e-7, train/loss_step=0.000149, global_step=2183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  20%|██        | 16/80 [02:04<07:47,  7.30s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000149, train/loss_vlb_step=5.65e-7, train/loss_step=0.000149, global_step=2183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  20%|██        | 16/80 [02:04<07:47,  7.30s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=8.67e-6, train/loss_step=0.00249, global_step=2183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]   Epoch 109:  21%|██▏       | 17/80 [02:04<07:16,  6.93s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00249, train/loss_vlb_step=8.67e-6, train/loss_step=0.00249, global_step=2183.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  21%|██▏       | 17/80 [02:04<07:16,  6.93s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.21e-5, train/loss_step=0.0033, global_step=2184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401] Epoch 109:  22%|██▎       | 18/80 [02:12<07:13,  7.00s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0033, train/loss_vlb_step=1.21e-5, train/loss_step=0.0033, global_step=2184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  22%|██▎       | 18/80 [02:12<07:13,  7.00s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=2.38e-6, train/loss_step=0.000341, global_step=2184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  24%|██▍       | 19/80 [02:13<06:46,  6.67s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=2.38e-6, train/loss_step=0.000341, global_step=2184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  24%|██▍       | 19/80 [02:13<06:46,  6.67s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.42e-5, train/loss_step=0.000444, global_step=2184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  25%|██▌       | 20/80 [02:18<06:34,  6.58s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000444, train/loss_vlb_step=1.42e-5, train/loss_step=0.000444, global_step=2184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  25%|██▌       | 20/80 [02:18<06:34,  6.58s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=6.12e-6, train/loss_step=0.000968, global_step=2184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  26%|██▋       | 21/80 [02:18<06:12,  6.31s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000968, train/loss_vlb_step=6.12e-6, train/loss_step=0.000968, global_step=2184.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  26%|██▋       | 21/80 [02:18<06:12,  6.31s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000103, train/loss_vlb_step=3.98e-7, train/loss_step=0.000103, global_step=2185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  28%|██▊       | 22/80 [02:19<05:51,  6.05s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.000103, train/loss_vlb_step=3.98e-7, train/loss_step=0.000103, global_step=2185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  28%|██▊       | 22/80 [02:19<05:51,  6.05s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=7.89e-7, train/loss_step=0.000186, global_step=2185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  29%|██▉       | 23/80 [02:19<05:31,  5.82s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=7.89e-7, train/loss_step=0.000186, global_step=2185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  29%|██▉       | 23/80 [02:19<05:31,  5.82s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=3.73e-6, train/loss_step=0.000788, global_step=2185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  30%|███       | 24/80 [02:53<06:28,  6.94s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.000788, train/loss_vlb_step=3.73e-6, train/loss_step=0.000788, global_step=2185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  30%|███       | 24/80 [02:53<06:28,  6.94s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=1.93e-6, train/loss_step=0.000342, global_step=2185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  31%|███▏      | 25/80 [02:54<06:08,  6.70s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=1.93e-6, train/loss_step=0.000342, global_step=2185.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  31%|███▏      | 25/80 [02:54<06:08,  6.70s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=2.22e-6, train/loss_step=0.000295, global_step=2186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  32%|███▎      | 26/80 [02:54<05:49,  6.47s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=2.22e-6, train/loss_step=0.000295, global_step=2186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  32%|███▎      | 26/80 [02:54<05:49,  6.47s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=1.49e-6, train/loss_step=0.000224, global_step=2186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  34%|███▍      | 27/80 [02:55<05:31,  6.25s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=1.49e-6, train/loss_step=0.000224, global_step=2186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  34%|███▍      | 27/80 [02:55<05:31,  6.25s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.52e-5, train/loss_step=0.00472, global_step=2186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 109:  35%|███▌      | 28/80 [03:11<05:43,  6.60s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.00472, train/loss_vlb_step=2.52e-5, train/loss_step=0.00472, global_step=2186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  35%|███▌      | 28/80 [03:11<05:43,  6.60s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00876, train/loss_vlb_step=5.48e-5, train/loss_step=0.00876, global_step=2186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  36%|███▋      | 29/80 [03:11<05:26,  6.40s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.00876, train/loss_vlb_step=5.48e-5, train/loss_step=0.00876, global_step=2186.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  36%|███▋      | 29/80 [03:11<05:26,  6.40s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=7.57e-7, train/loss_step=0.000165, global_step=2187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  38%|███▊      | 30/80 [03:12<05:10,  6.21s/it, loss=0.00228, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=7.57e-7, train/loss_step=0.000165, global_step=2187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  38%|███▊      | 30/80 [03:12<05:10,  6.21s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000159, train/loss_step=0.0274, global_step=2187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]   Epoch 109:  39%|███▉      | 31/80 [03:12<04:55,  6.03s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.0274, train/loss_vlb_step=0.000159, train/loss_step=0.0274, global_step=2187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  39%|███▉      | 31/80 [03:12<04:55,  6.03s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.7e-5, train/loss_step=0.0045, global_step=2187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 109:  40%|████      | 32/80 [03:34<05:12,  6.51s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.7e-5, train/loss_step=0.0045, global_step=2187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  40%|████      | 32/80 [03:34<05:12,  6.51s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.000503, train/loss_step=0.0157, global_step=2187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0157, train/loss_vlb_step=0.000503, train/loss_step=0.0157, global_step=2187.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  41%|████▏     | 33/80 [03:35<04:57,  6.34s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=4.62e-6, train/loss_step=0.00109, global_step=2188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  42%|████▎     | 34/80 [03:35<04:43,  6.17s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00109, train/loss_vlb_step=4.62e-6, train/loss_step=0.00109, global_step=2188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  42%|████▎     | 34/80 [03:35<04:43,  6.17s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=4.21e-6, train/loss_step=0.00028, global_step=2188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  44%|████▍     | 35/80 [03:36<04:30,  6.01s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=4.21e-6, train/loss_step=0.00028, global_step=2188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  44%|████▍     | 35/80 [03:36<04:30,  6.01s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000156, train/loss_vlb_step=7.61e-7, train/loss_step=0.000156, global_step=2188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  45%|████▌     | 36/80 [04:01<04:46,  6.52s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000156, train/loss_vlb_step=7.61e-7, train/loss_step=0.000156, global_step=2188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  45%|████▌     | 36/80 [04:01<04:46,  6.52s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=2.72e-6, train/loss_step=0.000282, global_step=2188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401] Epoch 109:  46%|████▋     | 37/80 [04:01<04:33,  6.36s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=2.72e-6, train/loss_step=0.000282, global_step=2188.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  46%|████▋     | 37/80 [04:01<04:33,  6.36s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000527, train/loss_vlb_step=1.07e-5, train/loss_step=0.000527, global_step=2189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  48%|████▊     | 38/80 [04:02<04:21,  6.22s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000527, train/loss_vlb_step=1.07e-5, train/loss_step=0.000527, global_step=2189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  48%|████▊     | 38/80 [04:02<04:21,  6.22s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=5.61e-5, train/loss_step=0.000673, global_step=2189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  49%|████▉     | 39/80 [04:03<04:09,  6.08s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000673, train/loss_vlb_step=5.61e-5, train/loss_step=0.000673, global_step=2189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  49%|████▉     | 39/80 [04:03<04:09,  6.08s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=0.000557, train/loss_step=0.00128, global_step=2189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401] Epoch 109:  50%|█████     | 40/80 [04:13<04:06,  6.17s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=0.000557, train/loss_step=0.00128, global_step=2189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  50%|█████     | 40/80 [04:13<04:06,  6.17s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000238, train/loss_vlb_step=2.41e-6, train/loss_step=0.000238, global_step=2189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  51%|█████▏    | 41/80 [04:13<03:55,  6.04s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000238, train/loss_vlb_step=2.41e-6, train/loss_step=0.000238, global_step=2189.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  51%|█████▏    | 41/80 [04:13<03:55,  6.04s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=6.97e-6, train/loss_step=0.00158, global_step=2190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 109:  52%|█████▎    | 42/80 [04:14<03:44,  5.91s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=6.97e-6, train/loss_step=0.00158, global_step=2190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  52%|█████▎    | 42/80 [04:14<03:44,  5.91s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=3.45e-6, train/loss_step=0.000662, global_step=2190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000662, train/loss_vlb_step=3.45e-6, train/loss_step=0.000662, global_step=2190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000577, train/loss_vlb_step=2.36e-6, train/loss_step=0.000577, global_step=2190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  55%|█████▌    | 44/80 [04:34<03:39,  6.10s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000577, train/loss_vlb_step=2.36e-6, train/loss_step=0.000577, global_step=2190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  55%|█████▌    | 44/80 [04:34<03:39,  6.10s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=2.3e-5, train/loss_step=0.00614, global_step=2190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]   Epoch 109:  56%|█████▋    | 45/80 [04:35<03:29,  5.98s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00614, train/loss_vlb_step=2.3e-5, train/loss_step=0.00614, global_step=2190.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  56%|█████▋    | 45/80 [04:35<03:29,  5.98s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.07e-7, train/loss_step=0.000139, global_step=2191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  57%|█████▊    | 46/80 [04:35<03:19,  5.87s/it, loss=0.00375, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=6.07e-7, train/loss_step=0.000139, global_step=2191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  57%|█████▊    | 46/80 [04:35<03:19,  5.87s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.6e-5, train/loss_step=0.00435, global_step=2191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]   Epoch 109:  59%|█████▉    | 47/80 [04:36<03:09,  5.75s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00435, train/loss_vlb_step=2.6e-5, train/loss_step=0.00435, global_step=2191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  59%|█████▉    | 47/80 [04:36<03:09,  5.75s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=3.44e-6, train/loss_step=0.000303, global_step=2191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  60%|██████    | 48/80 [05:03<03:17,  6.18s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=3.44e-6, train/loss_step=0.000303, global_step=2191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  60%|██████    | 48/80 [05:03<03:17,  6.18s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=2.91e-5, train/loss_step=0.000564, global_step=2191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  61%|██████▏   | 49/80 [05:03<03:08,  6.07s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.000564, train/loss_vlb_step=2.91e-5, train/loss_step=0.000564, global_step=2191.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  61%|██████▏   | 49/80 [05:03<03:08,  6.07s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.06e-6, train/loss_step=0.000573, global_step=2192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  62%|██████▎   | 50/80 [05:04<02:58,  5.96s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000573, train/loss_vlb_step=2.06e-6, train/loss_step=0.000573, global_step=2192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  62%|██████▎   | 50/80 [05:04<02:58,  5.96s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=1.36e-6, train/loss_step=0.00023, global_step=2192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 109:  64%|██████▍   | 51/80 [05:12<02:54,  6.02s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=1.36e-6, train/loss_step=0.00023, global_step=2192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  64%|██████▍   | 51/80 [05:12<02:54,  6.02s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.36e-6, train/loss_step=0.000464, global_step=2192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  65%|██████▌   | 52/80 [05:13<02:45,  5.91s/it, loss=0.00179, v_num=0, train/loss_simple_step=0.000464, train/loss_vlb_step=2.36e-6, train/loss_step=0.000464, global_step=2192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  65%|██████▌   | 52/80 [05:13<02:45,  5.91s/it, loss=0.00106, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.23e-6, train/loss_step=0.00102, global_step=2192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 109:  66%|██████▋   | 53/80 [05:14<02:37,  5.82s/it, loss=0.00106, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=5.23e-6, train/loss_step=0.00102, global_step=2192.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  66%|██████▋   | 53/80 [05:14<02:37,  5.82s/it, loss=0.00121, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.67e-5, train/loss_step=0.00419, global_step=2193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  68%|██████▊   | 54/80 [05:14<02:28,  5.72s/it, loss=0.00121, v_num=0, train/loss_simple_step=0.00419, train/loss_vlb_step=1.67e-5, train/loss_step=0.00419, global_step=2193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  68%|██████▊   | 54/80 [05:14<02:28,  5.72s/it, loss=0.00123, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=1.46e-5, train/loss_step=0.00075, global_step=2193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  69%|██████▉   | 55/80 [05:15<02:20,  5.63s/it, loss=0.00123, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=1.46e-5, train/loss_step=0.00075, global_step=2193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  69%|██████▉   | 55/80 [05:15<02:20,  5.63s/it, loss=0.00136, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=8.67e-6, train/loss_step=0.00263, global_step=2193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  70%|███████   | 56/80 [05:34<02:21,  5.88s/it, loss=0.00136, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=8.67e-6, train/loss_step=0.00263, global_step=2193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  70%|███████   | 56/80 [05:34<02:21,  5.88s/it, loss=0.00155, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.53e-5, train/loss_step=0.00402, global_step=2193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  71%|███████▏  | 57/80 [05:35<02:13,  5.79s/it, loss=0.00155, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.53e-5, train/loss_step=0.00402, global_step=2193.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  71%|███████▏  | 57/80 [05:35<02:13,  5.79s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=1.97e-5, train/loss_step=0.0058, global_step=2194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 109:  72%|███████▎  | 58/80 [05:48<02:09,  5.91s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=1.97e-5, train/loss_step=0.0058, global_step=2194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  72%|███████▎  | 58/80 [05:48<02:09,  5.91s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.000161, train/loss_vlb_step=6.9e-7, train/loss_step=0.000161, global_step=2194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  74%|███████▍  | 59/80 [05:56<02:04,  5.94s/it, loss=0.00178, v_num=0, train/loss_simple_step=0.000161, train/loss_vlb_step=6.9e-7, train/loss_step=0.000161, global_step=2194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  74%|███████▍  | 59/80 [05:56<02:04,  5.94s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=2.29e-5, train/loss_step=0.00597, global_step=2194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401] Epoch 109:  75%|███████▌  | 60/80 [05:57<01:57,  5.85s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.00597, train/loss_vlb_step=2.29e-5, train/loss_step=0.00597, global_step=2194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  75%|███████▌  | 60/80 [05:57<01:57,  5.85s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=1.64e-6, train/loss_step=0.000441, global_step=2194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  76%|███████▋  | 61/80 [05:57<01:49,  5.77s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=1.64e-6, train/loss_step=0.000441, global_step=2194.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  76%|███████▋  | 61/80 [05:57<01:49,  5.77s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.76e-5, train/loss_step=0.00349, global_step=2195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 109:  78%|███████▊  | 62/80 [05:58<01:42,  5.69s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.00349, train/loss_vlb_step=1.76e-5, train/loss_step=0.00349, global_step=2195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  78%|███████▊  | 62/80 [05:58<01:42,  5.69s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=8.74e-6, train/loss_step=0.00242, global_step=2195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  79%|███████▉  | 63/80 [05:58<01:35,  5.60s/it, loss=0.00221, v_num=0, train/loss_simple_step=0.00242, train/loss_vlb_step=8.74e-6, train/loss_step=0.00242, global_step=2195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  79%|███████▉  | 63/80 [05:58<01:35,  5.60s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=2.55e-5, train/loss_step=0.00704, global_step=2195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  80%|████████  | 64/80 [06:16<01:32,  5.79s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00704, train/loss_vlb_step=2.55e-5, train/loss_step=0.00704, global_step=2195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  80%|████████  | 64/80 [06:16<01:32,  5.79s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000188, train/loss_step=0.026, global_step=2195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]   Epoch 109:  81%|████████▏ | 65/80 [06:17<01:25,  5.72s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.026, train/loss_vlb_step=0.000188, train/loss_step=0.026, global_step=2195.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  81%|████████▏ | 65/80 [06:17<01:25,  5.72s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.57e-5, train/loss_step=0.00754, global_step=2196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  82%|████████▎ | 66/80 [06:21<01:19,  5.70s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=3.57e-5, train/loss_step=0.00754, global_step=2196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  82%|████████▎ | 66/80 [06:21<01:19,  5.70s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=0.000618, train/loss_step=0.00558, global_step=2196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  84%|████████▍ | 67/80 [06:25<01:13,  5.68s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.00558, train/loss_vlb_step=0.000618, train/loss_step=0.00558, global_step=2196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  84%|████████▍ | 67/80 [06:25<01:13,  5.68s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=5.66e-5, train/loss_step=0.00898, global_step=2196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 109:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00898, train/loss_vlb_step=5.66e-5, train/loss_step=0.00898, global_step=2196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  85%|████████▌ | 68/80 [06:28<01:07,  5.63s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.43e-5, train/loss_step=0.00402, global_step=2196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  86%|████████▋ | 69/80 [06:35<01:02,  5.65s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.00402, train/loss_vlb_step=1.43e-5, train/loss_step=0.00402, global_step=2196.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  86%|████████▋ | 69/80 [06:35<01:02,  5.65s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.57e-5, train/loss_step=0.00451, global_step=2197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  88%|████████▊ | 70/80 [06:36<00:55,  5.58s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.57e-5, train/loss_step=0.00451, global_step=2197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  88%|████████▊ | 70/80 [06:36<00:55,  5.58s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=2.04e-6, train/loss_step=0.00042, global_step=2197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  89%|████████▉ | 71/80 [06:36<00:49,  5.51s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00042, train/loss_vlb_step=2.04e-6, train/loss_step=0.00042, global_step=2197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  89%|████████▉ | 71/80 [06:36<00:49,  5.51s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.000865, train/loss_step=0.0191, global_step=2197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 109:  90%|█████████ | 72/80 [06:47<00:44,  5.58s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.0191, train/loss_vlb_step=0.000865, train/loss_step=0.0191, global_step=2197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  90%|█████████ | 72/80 [06:47<00:44,  5.58s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=2.74e-5, train/loss_step=0.000883, global_step=2197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  91%|█████████▏| 73/80 [06:47<00:38,  5.51s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=2.74e-5, train/loss_step=0.000883, global_step=2197.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  91%|█████████▏| 73/80 [06:47<00:38,  5.51s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000739, train/loss_vlb_step=3.1e-6, train/loss_step=0.000739, global_step=2198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  92%|█████████▎| 74/80 [06:59<00:33,  5.59s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000739, train/loss_vlb_step=3.1e-6, train/loss_step=0.000739, global_step=2198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  92%|█████████▎| 74/80 [06:59<00:33,  5.59s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.000135, train/loss_vlb_step=5.94e-7, train/loss_step=0.000135, global_step=2198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  94%|█████████▍| 75/80 [06:59<00:27,  5.52s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.000135, train/loss_vlb_step=5.94e-7, train/loss_step=0.000135, global_step=2198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  94%|█████████▍| 75/80 [06:59<00:27,  5.52s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=8.86e-5, train/loss_step=0.0137, global_step=2198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]    Epoch 109:  95%|█████████▌| 76/80 [07:12<00:22,  5.62s/it, loss=0.00605, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=8.86e-5, train/loss_step=0.0137, global_step=2198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  95%|█████████▌| 76/80 [07:12<00:22,  5.62s/it, loss=0.00691, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=0.000162, train/loss_step=0.0212, global_step=2198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  96%|█████████▋| 77/80 [07:13<00:16,  5.55s/it, loss=0.00691, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=0.000162, train/loss_step=0.0212, global_step=2198.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  96%|█████████▋| 77/80 [07:13<00:16,  5.55s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=3.11e-6, train/loss_step=0.000494, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  98%|█████████▊| 78/80 [07:13<00:10,  5.49s/it, loss=0.00664, v_num=0, train/loss_simple_step=0.000494, train/loss_vlb_step=3.11e-6, train/loss_step=0.000494, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  98%|█████████▊| 78/80 [07:13<00:10,  5.49s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=3.11e-6, train/loss_step=0.000712, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.00667, v_num=0, train/loss_simple_step=0.000712, train/loss_vlb_step=3.11e-6, train/loss_step=0.000712, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=0.000262, train/loss_step=0.00623, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401] Epoch 109: 100%|██████████| 80/80 [07:14<00:00,  5.37s/it, loss=0.00668, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=0.000262, train/loss_step=0.00623, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 109: 100%|██████████| 80/80 [07:14<00:00,  5.37s/it, loss=0.00881, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000484, train/loss_step=0.0431, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Average Epoch time: 434.69 seconds
+Average Peak memory 29567.26MiB
+Epoch 109:   0%|          | 0/80 [00:00<00:00, 3986.98it/s, loss=0.00881, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000484, train/loss_step=0.0431, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 110:   0%|          | 0/80 [00:00<00:00, 1844.46it/s, loss=0.00881, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000484, train/loss_step=0.0431, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]Epoch 110:   1%|▏         | 1/80 [00:36<24:03, 18.27s/it, loss=0.00881, v_num=0, train/loss_simple_step=0.0431, train/loss_vlb_step=0.000484, train/loss_step=0.0431, global_step=2199.0, lr_abs=0.0001, train/loss_simple_epoch=0.00401, train/loss_vlb_epoch=0.000134, train/loss_epoch=0.00401]  Epoch 110:   1%|▏         | 1/80 [00:36<24:03, 18.27s/it, loss=0.00956, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.01e-5, train/loss_step=0.0184, global_step=2200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412] Epoch 110:   2%|▎         | 2/80 [00:47<20:26, 15.73s/it, loss=0.00956, v_num=0, train/loss_simple_step=0.0184, train/loss_vlb_step=8.01e-5, train/loss_step=0.0184, global_step=2200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:   2%|▎         | 2/80 [00:47<20:26, 15.73s/it, loss=0.00948, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=2.41e-5, train/loss_step=0.000831, global_step=2200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:   4%|▍         | 3/80 [00:47<15:18, 11.92s/it, loss=0.00948, v_num=0, train/loss_simple_step=0.000831, train/loss_vlb_step=2.41e-5, train/loss_step=0.000831, global_step=2200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:   4%|▍         | 3/80 [00:47<15:18, 11.92s/it, loss=0.00914, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=2.28e-6, train/loss_step=0.000236, global_step=2200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:   5%|▌         | 4/80 [00:48<12:12,  9.64s/it, loss=0.00914, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=2.28e-6, train/loss_step=0.000236, global_step=2200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:   5%|▌         | 4/80 [00:48<12:12,  9.64s/it, loss=0.00915, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.00265, train/loss_step=0.0263, global_step=2200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]    Epoch 110:   6%|▋         | 5/80 [00:48<10:09,  8.12s/it, loss=0.00915, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.00265, train/loss_step=0.0263, global_step=2200.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:   6%|▋         | 5/80 [00:48<10:09,  8.12s/it, loss=0.00884, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=0.000269, train/loss_step=0.00136, global_step=2201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:   8%|▊         | 6/80 [00:49<08:40,  7.03s/it, loss=0.00884, v_num=0, train/loss_simple_step=0.00136, train/loss_vlb_step=0.000269, train/loss_step=0.00136, global_step=2201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:   8%|▊         | 6/80 [00:49<08:40,  7.03s/it, loss=0.00879, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.22e-5, train/loss_step=0.00456, global_step=2201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412] Epoch 110:   9%|▉         | 7/80 [00:49<07:33,  6.21s/it, loss=0.00879, v_num=0, train/loss_simple_step=0.00456, train/loss_vlb_step=2.22e-5, train/loss_step=0.00456, global_step=2201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:   9%|▉         | 7/80 [00:49<07:33,  6.21s/it, loss=0.00975, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000605, train/loss_step=0.0282, global_step=2201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412] Epoch 110:  10%|█         | 8/80 [01:13<09:46,  8.15s/it, loss=0.00975, v_num=0, train/loss_simple_step=0.0282, train/loss_vlb_step=0.000605, train/loss_step=0.0282, global_step=2201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  10%|█         | 8/80 [01:13<09:46,  8.15s/it, loss=0.00959, v_num=0, train/loss_simple_step=0.000743, train/loss_vlb_step=7.69e-6, train/loss_step=0.000743, global_step=2201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  11%|█▏        | 9/80 [01:13<08:44,  7.39s/it, loss=0.00959, v_num=0, train/loss_simple_step=0.000743, train/loss_vlb_step=7.69e-6, train/loss_step=0.000743, global_step=2201.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  11%|█▏        | 9/80 [01:13<08:44,  7.39s/it, loss=0.00957, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=1.44e-5, train/loss_step=0.00422, global_step=2202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  12%|█▎        | 10/80 [01:37<10:21,  8.88s/it, loss=0.00957, v_num=0, train/loss_simple_step=0.00422, train/loss_vlb_step=1.44e-5, train/loss_step=0.00422, global_step=2202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  12%|█▎        | 10/80 [01:37<10:21,  8.88s/it, loss=0.00977, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=1.46e-5, train/loss_step=0.00438, global_step=2202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  14%|█▍        | 11/80 [01:38<09:24,  8.19s/it, loss=0.00977, v_num=0, train/loss_simple_step=0.00438, train/loss_vlb_step=1.46e-5, train/loss_step=0.00438, global_step=2202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  14%|█▍        | 11/80 [01:38<09:24,  8.19s/it, loss=0.00898, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.14e-5, train/loss_step=0.00335, global_step=2202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  15%|█▌        | 12/80 [01:38<08:36,  7.60s/it, loss=0.00898, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.14e-5, train/loss_step=0.00335, global_step=2202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  15%|█▌        | 12/80 [01:38<08:36,  7.60s/it, loss=0.00895, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=1.32e-6, train/loss_step=0.000233, global_step=2202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  16%|█▋        | 13/80 [01:39<07:55,  7.09s/it, loss=0.00895, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=1.32e-6, train/loss_step=0.000233, global_step=2202.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  16%|█▋        | 13/80 [01:39<07:55,  7.09s/it, loss=0.00901, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=8.17e-6, train/loss_step=0.00195, global_step=2203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  18%|█▊        | 14/80 [01:39<07:18,  6.65s/it, loss=0.00901, v_num=0, train/loss_simple_step=0.00195, train/loss_vlb_step=8.17e-6, train/loss_step=0.00195, global_step=2203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  18%|█▊        | 14/80 [01:39<07:18,  6.65s/it, loss=0.00924, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=0.000325, train/loss_step=0.00462, global_step=2203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  19%|█▉        | 15/80 [01:40<06:47,  6.26s/it, loss=0.00924, v_num=0, train/loss_simple_step=0.00462, train/loss_vlb_step=0.000325, train/loss_step=0.00462, global_step=2203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  19%|█▉        | 15/80 [01:40<06:47,  6.27s/it, loss=0.00856, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=6.8e-7, train/loss_step=0.000157, global_step=2203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  20%|██        | 16/80 [01:53<07:07,  6.69s/it, loss=0.00856, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=6.8e-7, train/loss_step=0.000157, global_step=2203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  20%|██        | 16/80 [01:53<07:07,  6.69s/it, loss=0.00754, v_num=0, train/loss_simple_step=0.000872, train/loss_vlb_step=8.14e-6, train/loss_step=0.000872, global_step=2203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  21%|██▏       | 17/80 [01:54<06:39,  6.34s/it, loss=0.00754, v_num=0, train/loss_simple_step=0.000872, train/loss_vlb_step=8.14e-6, train/loss_step=0.000872, global_step=2203.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  21%|██▏       | 17/80 [01:54<06:39,  6.34s/it, loss=0.00775, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.04e-5, train/loss_step=0.00455, global_step=2204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  22%|██▎       | 18/80 [02:21<07:42,  7.46s/it, loss=0.00775, v_num=0, train/loss_simple_step=0.00455, train/loss_vlb_step=2.04e-5, train/loss_step=0.00455, global_step=2204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  22%|██▎       | 18/80 [02:21<07:42,  7.46s/it, loss=0.00823, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.53e-5, train/loss_step=0.0104, global_step=2204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  24%|██▍       | 19/80 [02:22<07:13,  7.11s/it, loss=0.00823, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=5.53e-5, train/loss_step=0.0104, global_step=2204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  24%|██▍       | 19/80 [02:22<07:13,  7.11s/it, loss=0.00881, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000315, train/loss_step=0.0178, global_step=2204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  25%|██▌       | 20/80 [02:26<06:57,  6.96s/it, loss=0.00881, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000315, train/loss_step=0.0178, global_step=2204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  25%|██▌       | 20/80 [02:26<06:57,  6.96s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.16e-5, train/loss_step=0.00606, global_step=2204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  26%|██▋       | 21/80 [02:26<06:33,  6.67s/it, loss=0.00696, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.16e-5, train/loss_step=0.00606, global_step=2204.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  26%|██▋       | 21/80 [02:26<06:33,  6.67s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=9.04e-6, train/loss_step=0.000606, global_step=2205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  28%|██▊       | 22/80 [02:27<06:11,  6.40s/it, loss=0.00607, v_num=0, train/loss_simple_step=0.000606, train/loss_vlb_step=9.04e-6, train/loss_step=0.000606, global_step=2205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  28%|██▊       | 22/80 [02:27<06:11,  6.40s/it, loss=0.00682, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000374, train/loss_step=0.0158, global_step=2205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]   Epoch 110:  29%|██▉       | 23/80 [02:27<05:50,  6.16s/it, loss=0.00682, v_num=0, train/loss_simple_step=0.0158, train/loss_vlb_step=0.000374, train/loss_step=0.0158, global_step=2205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  29%|██▉       | 23/80 [02:27<05:50,  6.16s/it, loss=0.00682, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=1.12e-6, train/loss_step=0.000225, global_step=2205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  30%|███       | 24/80 [02:48<06:18,  6.75s/it, loss=0.00682, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=1.12e-6, train/loss_step=0.000225, global_step=2205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  30%|███       | 24/80 [02:48<06:18,  6.75s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=9.61e-6, train/loss_step=0.00272, global_step=2205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  31%|███▏      | 25/80 [02:49<05:58,  6.52s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=9.61e-6, train/loss_step=0.00272, global_step=2205.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  31%|███▏      | 25/80 [02:49<05:58,  6.52s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=0.000832, train/loss_step=0.0198, global_step=2206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412] Epoch 110:  32%|███▎      | 26/80 [03:02<06:04,  6.76s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.0198, train/loss_vlb_step=0.000832, train/loss_step=0.0198, global_step=2206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  32%|███▎      | 26/80 [03:02<06:04,  6.76s/it, loss=0.00674, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.27e-5, train/loss_step=0.00821, global_step=2206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  34%|███▍      | 27/80 [03:02<05:46,  6.53s/it, loss=0.00674, v_num=0, train/loss_simple_step=0.00821, train/loss_vlb_step=3.27e-5, train/loss_step=0.00821, global_step=2206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  34%|███▍      | 27/80 [03:02<05:46,  6.53s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000681, train/loss_vlb_step=2.4e-6, train/loss_step=0.000681, global_step=2206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  35%|███▌      | 28/80 [03:10<05:41,  6.57s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000681, train/loss_vlb_step=2.4e-6, train/loss_step=0.000681, global_step=2206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  35%|███▌      | 28/80 [03:10<05:41,  6.57s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=3.55e-6, train/loss_step=0.000798, global_step=2206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  36%|███▋      | 29/80 [03:10<05:24,  6.37s/it, loss=0.00537, v_num=0, train/loss_simple_step=0.000798, train/loss_vlb_step=3.55e-6, train/loss_step=0.000798, global_step=2206.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  36%|███▋      | 29/80 [03:10<05:24,  6.37s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=1.85e-5, train/loss_step=0.00522, global_step=2207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  38%|███▊      | 30/80 [03:11<05:09,  6.19s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.00522, train/loss_vlb_step=1.85e-5, train/loss_step=0.00522, global_step=2207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  38%|███▊      | 30/80 [03:11<05:09,  6.19s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000565, train/loss_vlb_step=4.38e-6, train/loss_step=0.000565, global_step=2207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  39%|███▉      | 31/80 [03:12<04:54,  6.01s/it, loss=0.00523, v_num=0, train/loss_simple_step=0.000565, train/loss_vlb_step=4.38e-6, train/loss_step=0.000565, global_step=2207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  39%|███▉      | 31/80 [03:12<04:54,  6.01s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=1.21e-6, train/loss_step=0.000233, global_step=2207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  40%|████      | 32/80 [03:26<05:00,  6.25s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000233, train/loss_vlb_step=1.21e-6, train/loss_step=0.000233, global_step=2207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  40%|████      | 32/80 [03:26<05:00,  6.25s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=8.97e-7, train/loss_step=0.000209, global_step=2207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  41%|████▏     | 33/80 [03:26<04:46,  6.09s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=8.97e-7, train/loss_step=0.000209, global_step=2207.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  41%|████▏     | 33/80 [03:26<04:46,  6.09s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00055, train/loss_vlb_step=2.12e-6, train/loss_step=0.00055, global_step=2208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]    Epoch 110:  42%|████▎     | 34/80 [03:50<05:03,  6.60s/it, loss=0.005, v_num=0, train/loss_simple_step=0.00055, train/loss_vlb_step=2.12e-6, train/loss_step=0.00055, global_step=2208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  42%|████▎     | 34/80 [03:50<05:03,  6.60s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=1.43e-5, train/loss_step=0.00393, global_step=2208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  44%|████▍     | 35/80 [03:51<04:49,  6.43s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00393, train/loss_vlb_step=1.43e-5, train/loss_step=0.00393, global_step=2208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  44%|████▍     | 35/80 [03:51<04:49,  6.43s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.00013, train/loss_step=0.0154, global_step=2208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  45%|████▌     | 36/80 [03:55<04:39,  6.35s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.0154, train/loss_vlb_step=0.00013, train/loss_step=0.0154, global_step=2208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  45%|████▌     | 36/80 [03:55<04:39,  6.35s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=4.74e-6, train/loss_step=0.000883, global_step=2208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  46%|████▋     | 37/80 [03:55<04:26,  6.21s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=4.74e-6, train/loss_step=0.000883, global_step=2208.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  46%|████▋     | 37/80 [03:55<04:26,  6.21s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.14e-6, train/loss_step=0.000271, global_step=2209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  48%|████▊     | 38/80 [03:56<04:14,  6.06s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.000271, train/loss_vlb_step=1.14e-6, train/loss_step=0.000271, global_step=2209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  48%|████▊     | 38/80 [03:56<04:14,  6.06s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=9.42e-7, train/loss_step=0.000248, global_step=2209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  49%|████▉     | 39/80 [03:56<04:02,  5.92s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=9.42e-7, train/loss_step=0.000248, global_step=2209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  49%|████▉     | 39/80 [03:56<04:02,  5.92s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=2.49e-5, train/loss_step=0.0058, global_step=2209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]    Epoch 110:  50%|█████     | 40/80 [04:04<03:58,  5.96s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0058, train/loss_vlb_step=2.49e-5, train/loss_step=0.0058, global_step=2209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  50%|█████     | 40/80 [04:04<03:58,  5.96s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000528, train/loss_vlb_step=2.4e-6, train/loss_step=0.000528, global_step=2209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  51%|█████▏    | 41/80 [04:05<03:47,  5.83s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.000528, train/loss_vlb_step=2.4e-6, train/loss_step=0.000528, global_step=2209.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  51%|█████▏    | 41/80 [04:05<03:47,  5.83s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.19e-5, train/loss_step=0.00853, global_step=2210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412] Epoch 110:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=4.19e-5, train/loss_step=0.00853, global_step=2210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  52%|█████▎    | 42/80 [04:25<03:54,  6.18s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.93e-6, train/loss_step=0.000416, global_step=2210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.93e-6, train/loss_step=0.000416, global_step=2210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.00114, train/loss_step=0.0131, global_step=2210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]    Epoch 110:  55%|█████▌    | 44/80 [04:34<03:39,  6.10s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=0.00114, train/loss_step=0.0131, global_step=2210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  55%|█████▌    | 44/80 [04:34<03:39,  6.10s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=8.58e-6, train/loss_step=0.00131, global_step=2210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  56%|█████▋    | 45/80 [04:35<03:29,  5.98s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=8.58e-6, train/loss_step=0.00131, global_step=2210.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  56%|█████▋    | 45/80 [04:35<03:29,  5.98s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.09e-6, train/loss_step=0.00115, global_step=2211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412] Epoch 110:  57%|█████▊    | 46/80 [04:37<03:20,  5.90s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00115, train/loss_vlb_step=5.09e-6, train/loss_step=0.00115, global_step=2211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  57%|█████▊    | 46/80 [04:37<03:20,  5.90s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.55e-6, train/loss_step=0.00256, global_step=2211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  59%|█████▉    | 47/80 [04:37<03:10,  5.78s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.55e-6, train/loss_step=0.00256, global_step=2211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  59%|█████▉    | 47/80 [04:37<03:10,  5.78s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=1.57e-5, train/loss_step=0.00101, global_step=2211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  60%|██████    | 48/80 [04:53<03:11,  6.00s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=1.57e-5, train/loss_step=0.00101, global_step=2211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  60%|██████    | 48/80 [04:53<03:11,  6.00s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.69e-5, train/loss_step=0.0103, global_step=2211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  61%|██████▏   | 49/80 [04:54<03:02,  5.89s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=4.69e-5, train/loss_step=0.0103, global_step=2211.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  61%|██████▏   | 49/80 [04:54<03:02,  5.89s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.42e-5, train/loss_step=0.00284, global_step=2212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  62%|██████▎   | 50/80 [05:01<02:57,  5.92s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00284, train/loss_vlb_step=1.42e-5, train/loss_step=0.00284, global_step=2212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  62%|██████▎   | 50/80 [05:01<02:57,  5.92s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.54e-5, train/loss_step=0.011, global_step=2212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]    Epoch 110:  64%|██████▍   | 51/80 [05:02<02:48,  5.81s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.54e-5, train/loss_step=0.011, global_step=2212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  64%|██████▍   | 51/80 [05:02<02:48,  5.81s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.26e-5, train/loss_step=0.0134, global_step=2212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  65%|██████▌   | 52/80 [05:26<02:52,  6.16s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=6.26e-5, train/loss_step=0.0134, global_step=2212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  65%|██████▌   | 52/80 [05:26<02:52,  6.16s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.65e-5, train/loss_step=0.00405, global_step=2212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  66%|██████▋   | 53/80 [05:26<02:43,  6.05s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=2.65e-5, train/loss_step=0.00405, global_step=2212.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  66%|██████▋   | 53/80 [05:26<02:43,  6.05s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=9.82e-6, train/loss_step=0.00203, global_step=2213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  68%|██████▊   | 54/80 [05:27<02:34,  5.95s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=9.82e-6, train/loss_step=0.00203, global_step=2213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  68%|██████▊   | 54/80 [05:27<02:34,  5.95s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.09e-5, train/loss_step=0.00966, global_step=2213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  69%|██████▉   | 55/80 [05:27<02:26,  5.86s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.00966, train/loss_vlb_step=4.09e-5, train/loss_step=0.00966, global_step=2213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  69%|██████▉   | 55/80 [05:27<02:26,  5.86s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=8.54e-6, train/loss_step=0.00148, global_step=2213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  70%|███████   | 56/80 [05:36<02:21,  5.90s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=8.54e-6, train/loss_step=0.00148, global_step=2213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  70%|███████   | 56/80 [05:36<02:21,  5.90s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=4.52e-5, train/loss_step=0.000748, global_step=2213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  71%|███████▏  | 57/80 [05:36<02:13,  5.81s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000748, train/loss_vlb_step=4.52e-5, train/loss_step=0.000748, global_step=2213.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  71%|███████▏  | 57/80 [05:36<02:13,  5.81s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000473, train/loss_vlb_step=2.34e-6, train/loss_step=0.000473, global_step=2214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  72%|███████▎  | 58/80 [05:41<02:07,  5.78s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000473, train/loss_vlb_step=2.34e-6, train/loss_step=0.000473, global_step=2214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  72%|███████▎  | 58/80 [05:41<02:07,  5.78s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=1.79e-5, train/loss_step=0.00404, global_step=2214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=1.79e-5, train/loss_step=0.00404, global_step=2214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=1.57e-6, train/loss_step=0.00045, global_step=2214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  75%|███████▌  | 60/80 [06:10<02:01,  6.08s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=1.57e-6, train/loss_step=0.00045, global_step=2214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  75%|███████▌  | 60/80 [06:10<02:01,  6.08s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.54e-5, train/loss_step=0.00579, global_step=2214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  76%|███████▋  | 61/80 [06:11<01:53,  5.99s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.54e-5, train/loss_step=0.00579, global_step=2214.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  76%|███████▋  | 61/80 [06:11<01:53,  5.99s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=1.65e-5, train/loss_step=0.00454, global_step=2215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  78%|███████▊  | 62/80 [06:11<01:46,  5.90s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00454, train/loss_vlb_step=1.65e-5, train/loss_step=0.00454, global_step=2215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  78%|███████▊  | 62/80 [06:11<01:46,  5.90s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=4.56e-6, train/loss_step=0.000368, global_step=2215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  79%|███████▉  | 63/80 [06:12<01:38,  5.82s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=4.56e-6, train/loss_step=0.000368, global_step=2215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  79%|███████▉  | 63/80 [06:12<01:38,  5.82s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=6.73e-5, train/loss_step=0.00967, global_step=2215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  80%|████████  | 64/80 [06:19<01:33,  5.84s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00967, train/loss_vlb_step=6.73e-5, train/loss_step=0.00967, global_step=2215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  80%|████████  | 64/80 [06:19<01:33,  5.84s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=9.97e-6, train/loss_step=0.0028, global_step=2215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  81%|████████▏ | 65/80 [06:20<01:26,  5.76s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=9.97e-6, train/loss_step=0.0028, global_step=2215.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  81%|████████▏ | 65/80 [06:20<01:26,  5.76s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.11e-5, train/loss_step=0.00606, global_step=2216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  82%|████████▎ | 66/80 [06:20<01:19,  5.68s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00606, train/loss_vlb_step=2.11e-5, train/loss_step=0.00606, global_step=2216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  82%|████████▎ | 66/80 [06:20<01:19,  5.68s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.000439, train/loss_vlb_step=1.93e-6, train/loss_step=0.000439, global_step=2216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  84%|████████▍ | 67/80 [06:21<01:12,  5.60s/it, loss=0.00456, v_num=0, train/loss_simple_step=0.000439, train/loss_vlb_step=1.93e-6, train/loss_step=0.000439, global_step=2216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  84%|████████▍ | 67/80 [06:21<01:12,  5.60s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=2.41e-6, train/loss_step=0.000376, global_step=2216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  85%|████████▌ | 68/80 [06:53<01:11,  5.99s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000376, train/loss_vlb_step=2.41e-6, train/loss_step=0.000376, global_step=2216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  85%|████████▌ | 68/80 [06:53<01:11,  5.99s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=3.84e-6, train/loss_step=0.000787, global_step=2216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  86%|████████▋ | 69/80 [06:53<01:05,  5.91s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000787, train/loss_vlb_step=3.84e-6, train/loss_step=0.000787, global_step=2216.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  86%|████████▋ | 69/80 [06:53<01:05,  5.91s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000929, train/loss_vlb_step=1.21e-5, train/loss_step=0.000929, global_step=2217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  88%|████████▊ | 70/80 [06:54<00:58,  5.83s/it, loss=0.00396, v_num=0, train/loss_simple_step=0.000929, train/loss_vlb_step=1.21e-5, train/loss_step=0.000929, global_step=2217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  88%|████████▊ | 70/80 [06:54<00:58,  5.83s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=7.27e-7, train/loss_step=0.000192, global_step=2217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  89%|████████▉ | 71/80 [06:54<00:51,  5.76s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=7.27e-7, train/loss_step=0.000192, global_step=2217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  89%|████████▉ | 71/80 [06:54<00:51,  5.76s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=2.97e-5, train/loss_step=0.000684, global_step=2217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  90%|█████████ | 72/80 [06:57<00:45,  5.72s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=2.97e-5, train/loss_step=0.000684, global_step=2217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  90%|█████████ | 72/80 [06:57<00:45,  5.72s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=1.16e-6, train/loss_step=0.000225, global_step=2217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  91%|█████████▏| 73/80 [06:58<00:39,  5.65s/it, loss=0.00259, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=1.16e-6, train/loss_step=0.000225, global_step=2217.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  91%|█████████▏| 73/80 [06:58<00:39,  5.65s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000873, train/loss_vlb_step=1.68e-5, train/loss_step=0.000873, global_step=2218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  92%|█████████▎| 74/80 [07:04<00:33,  5.66s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.000873, train/loss_vlb_step=1.68e-5, train/loss_step=0.000873, global_step=2218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  92%|█████████▎| 74/80 [07:04<00:33,  5.66s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=0.00102, train/loss_step=0.00222, global_step=2218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  94%|█████████▍| 75/80 [07:04<00:27,  5.59s/it, loss=0.00216, v_num=0, train/loss_simple_step=0.00222, train/loss_vlb_step=0.00102, train/loss_step=0.00222, global_step=2218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  94%|█████████▍| 75/80 [07:04<00:27,  5.59s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000657, train/loss_vlb_step=3.25e-6, train/loss_step=0.000657, global_step=2218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  95%|█████████▌| 76/80 [07:35<00:23,  5.92s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.000657, train/loss_vlb_step=3.25e-6, train/loss_step=0.000657, global_step=2218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  95%|█████████▌| 76/80 [07:35<00:23,  5.92s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.94e-5, train/loss_step=0.00499, global_step=2218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 110:  96%|█████████▋| 77/80 [07:36<00:17,  5.85s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.94e-5, train/loss_step=0.00499, global_step=2218.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  96%|█████████▋| 77/80 [07:36<00:17,  5.85s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=7.65e-5, train/loss_step=0.00231, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  98%|█████████▊| 78/80 [07:36<00:11,  5.78s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=7.65e-5, train/loss_step=0.00231, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  98%|█████████▊| 78/80 [07:36<00:11,  5.78s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=6.71e-6, train/loss_step=0.00144, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  99%|█████████▉| 79/80 [07:36<00:05,  5.71s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=6.71e-6, train/loss_step=0.00144, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110:  99%|█████████▉| 79/80 [07:36<00:05,  5.71s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000644, train/loss_vlb_step=3.44e-6, train/loss_step=0.000644, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110: 100%|██████████| 80/80 [07:37<00:00,  5.65s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000644, train/loss_vlb_step=3.44e-6, train/loss_step=0.000644, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 110: 100%|██████████| 80/80 [07:37<00:00,  5.65s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.79e-5, train/loss_step=0.0212, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]   Average Epoch time: 457.49 seconds
+Average Peak memory 29564.30MiB
+Epoch 110:   0%|          | 0/80 [00:00<00:00, 5203.85it/s, loss=0.00307, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.79e-5, train/loss_step=0.0212, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 111:   0%|          | 0/80 [00:00<00:00, 2073.31it/s, loss=0.00307, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.79e-5, train/loss_step=0.0212, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]Epoch 111:   1%|▏         | 1/80 [00:35<23:03, 17.51s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.0212, train/loss_vlb_step=8.79e-5, train/loss_step=0.0212, global_step=2219.0, lr_abs=0.0001, train/loss_simple_epoch=0.00412, train/loss_vlb_epoch=0.000163, train/loss_epoch=0.00412]  Epoch 111:   1%|▏         | 1/80 [00:35<23:03, 17.51s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=0.00017, train/loss_step=0.0201, global_step=2220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426] Epoch 111:   2%|▎         | 2/80 [00:35<15:23, 11.84s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.0201, train/loss_vlb_step=0.00017, train/loss_step=0.0201, global_step=2220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   2%|▎         | 2/80 [00:35<15:23, 11.84s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=4.62e-6, train/loss_step=0.00075, global_step=2220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   4%|▍         | 3/80 [00:43<13:49, 10.77s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00075, train/loss_vlb_step=4.62e-6, train/loss_step=0.00075, global_step=2220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   4%|▍         | 3/80 [00:43<13:49, 10.77s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=3.91e-6, train/loss_step=0.000337, global_step=2220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   5%|▌         | 4/80 [00:48<12:20,  9.74s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000337, train/loss_vlb_step=3.91e-6, train/loss_step=0.000337, global_step=2220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   5%|▌         | 4/80 [00:48<12:20,  9.74s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000503, train/loss_vlb_step=6.74e-6, train/loss_step=0.000503, global_step=2220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   6%|▋         | 5/80 [00:49<10:15,  8.21s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.000503, train/loss_vlb_step=6.74e-6, train/loss_step=0.000503, global_step=2220.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   6%|▋         | 5/80 [00:49<10:15,  8.21s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000553, train/loss_vlb_step=2.99e-6, train/loss_step=0.000553, global_step=2221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   8%|▊         | 6/80 [00:49<08:45,  7.10s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000553, train/loss_vlb_step=2.99e-6, train/loss_step=0.000553, global_step=2221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   8%|▊         | 6/80 [00:49<08:45,  7.10s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000206, train/loss_vlb_step=1.19e-6, train/loss_step=0.000206, global_step=2221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:   9%|▉         | 7/80 [00:50<07:38,  6.28s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000206, train/loss_vlb_step=1.19e-6, train/loss_step=0.000206, global_step=2221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:   9%|▉         | 7/80 [00:50<07:38,  6.28s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=6.23e-6, train/loss_step=0.000424, global_step=2221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  10%|█         | 8/80 [01:16<10:10,  8.47s/it, loss=0.003, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=6.23e-6, train/loss_step=0.000424, global_step=2221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  10%|█         | 8/80 [01:16<10:10,  8.47s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=3.8e-5, train/loss_step=0.00943, global_step=2221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426] Epoch 111:  11%|█▏        | 9/80 [01:16<09:05,  7.68s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00943, train/loss_vlb_step=3.8e-5, train/loss_step=0.00943, global_step=2221.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  11%|█▏        | 9/80 [01:16<09:05,  7.68s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.63e-5, train/loss_step=0.00611, global_step=2222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  12%|█▎        | 10/80 [01:17<08:11,  7.03s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00611, train/loss_vlb_step=3.63e-5, train/loss_step=0.00611, global_step=2222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  12%|█▎        | 10/80 [01:17<08:11,  7.03s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000863, train/loss_vlb_step=3.73e-6, train/loss_step=0.000863, global_step=2222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  14%|█▍        | 11/80 [01:19<07:36,  6.61s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000863, train/loss_vlb_step=3.73e-6, train/loss_step=0.000863, global_step=2222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  14%|█▍        | 11/80 [01:19<07:36,  6.62s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.23e-5, train/loss_step=0.00356, global_step=2222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  15%|█▌        | 12/80 [01:32<08:02,  7.10s/it, loss=0.00387, v_num=0, train/loss_simple_step=0.00356, train/loss_vlb_step=1.23e-5, train/loss_step=0.00356, global_step=2222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  15%|█▌        | 12/80 [01:32<08:02,  7.10s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=7.59e-6, train/loss_step=0.00169, global_step=2222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  16%|█▋        | 13/80 [01:32<07:24,  6.63s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00169, train/loss_vlb_step=7.59e-6, train/loss_step=0.00169, global_step=2222.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  16%|█▋        | 13/80 [01:32<07:24,  6.63s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=2.91e-6, train/loss_step=0.000851, global_step=2223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  18%|█▊        | 14/80 [01:33<06:50,  6.22s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000851, train/loss_vlb_step=2.91e-6, train/loss_step=0.000851, global_step=2223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  18%|█▊        | 14/80 [01:33<06:50,  6.22s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000697, train/loss_step=0.0325, global_step=2223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]   Epoch 111:  19%|█▉        | 15/80 [01:33<06:20,  5.86s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.0325, train/loss_vlb_step=0.000697, train/loss_step=0.0325, global_step=2223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  19%|█▉        | 15/80 [01:33<06:20,  5.86s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.57e-5, train/loss_step=0.00515, global_step=2223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  20%|██        | 16/80 [01:51<06:59,  6.56s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.00515, train/loss_vlb_step=2.57e-5, train/loss_step=0.00515, global_step=2223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  20%|██        | 16/80 [01:51<06:59,  6.56s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.29e-5, train/loss_step=0.0024, global_step=2223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  21%|██▏       | 17/80 [01:52<06:32,  6.22s/it, loss=0.00555, v_num=0, train/loss_simple_step=0.0024, train/loss_vlb_step=1.29e-5, train/loss_step=0.0024, global_step=2223.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  21%|██▏       | 17/80 [01:52<06:32,  6.22s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=1.54e-5, train/loss_step=0.00405, global_step=2224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  22%|██▎       | 18/80 [01:52<06:07,  5.92s/it, loss=0.00564, v_num=0, train/loss_simple_step=0.00405, train/loss_vlb_step=1.54e-5, train/loss_step=0.00405, global_step=2224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  22%|██▎       | 18/80 [01:52<06:07,  5.92s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000457, train/loss_vlb_step=2.95e-6, train/loss_step=0.000457, global_step=2224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  24%|██▍       | 19/80 [02:04<06:20,  6.25s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.000457, train/loss_vlb_step=2.95e-6, train/loss_step=0.000457, global_step=2224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  24%|██▍       | 19/80 [02:04<06:20,  6.25s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000944, train/loss_vlb_step=3.66e-6, train/loss_step=0.000944, global_step=2224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  25%|██▌       | 20/80 [02:25<06:54,  6.91s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000944, train/loss_vlb_step=3.66e-6, train/loss_step=0.000944, global_step=2224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  25%|██▌       | 20/80 [02:25<06:54,  6.91s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=3.46e-5, train/loss_step=0.00572, global_step=2224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  26%|██▋       | 21/80 [02:25<06:30,  6.62s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.00572, train/loss_vlb_step=3.46e-5, train/loss_step=0.00572, global_step=2224.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  26%|██▋       | 21/80 [02:25<06:30,  6.62s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.45e-5, train/loss_step=0.00892, global_step=2225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  28%|██▊       | 22/80 [02:26<06:08,  6.35s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=4.45e-5, train/loss_step=0.00892, global_step=2225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  28%|██▊       | 22/80 [02:26<06:08,  6.35s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.75e-5, train/loss_step=0.00512, global_step=2225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  29%|██▉       | 23/80 [02:26<05:48,  6.11s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00512, train/loss_vlb_step=1.75e-5, train/loss_step=0.00512, global_step=2225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  29%|██▉       | 23/80 [02:26<05:48,  6.11s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=2.26e-6, train/loss_step=0.000209, global_step=2225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  30%|███       | 24/80 [02:27<05:29,  5.88s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.000209, train/loss_vlb_step=2.26e-6, train/loss_step=0.000209, global_step=2225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  30%|███       | 24/80 [02:27<05:29,  5.88s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.98e-7, train/loss_step=0.000207, global_step=2225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  31%|███▏      | 25/80 [02:31<05:21,  5.84s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.98e-7, train/loss_step=0.000207, global_step=2225.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  31%|███▏      | 25/80 [02:31<05:21,  5.84s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.06e-6, train/loss_step=0.000241, global_step=2226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  32%|███▎      | 26/80 [02:32<05:04,  5.64s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.06e-6, train/loss_step=0.000241, global_step=2226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  32%|███▎      | 26/80 [02:32<05:04,  5.64s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=1.45e-5, train/loss_step=0.004, global_step=2226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]      Epoch 111:  34%|███▍      | 27/80 [02:39<05:01,  5.70s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.004, train/loss_vlb_step=1.45e-5, train/loss_step=0.004, global_step=2226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  34%|███▍      | 27/80 [02:39<05:01,  5.70s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=1.86e-6, train/loss_step=0.000292, global_step=2226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  35%|███▌      | 28/80 [03:07<05:35,  6.45s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000292, train/loss_vlb_step=1.86e-6, train/loss_step=0.000292, global_step=2226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  35%|███▌      | 28/80 [03:07<05:35,  6.45s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=2.57e-6, train/loss_step=0.00028, global_step=2226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  36%|███▋      | 29/80 [03:07<05:18,  6.25s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00028, train/loss_vlb_step=2.57e-6, train/loss_step=0.00028, global_step=2226.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  36%|███▋      | 29/80 [03:07<05:18,  6.25s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000112, train/loss_step=0.011, global_step=2227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]   Epoch 111:  38%|███▊      | 30/80 [03:08<05:03,  6.06s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000112, train/loss_step=0.011, global_step=2227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  38%|███▊      | 30/80 [03:08<05:03,  6.06s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000429, train/loss_vlb_step=2.34e-6, train/loss_step=0.000429, global_step=2227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  39%|███▉      | 31/80 [03:08<04:48,  5.89s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000429, train/loss_vlb_step=2.34e-6, train/loss_step=0.000429, global_step=2227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  39%|███▉      | 31/80 [03:08<04:48,  5.89s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=4.42e-6, train/loss_step=0.000817, global_step=2227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  40%|████      | 32/80 [03:14<04:43,  5.90s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000817, train/loss_vlb_step=4.42e-6, train/loss_step=0.000817, global_step=2227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  40%|████      | 32/80 [03:14<04:43,  5.90s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=3.18e-6, train/loss_step=0.000245, global_step=2227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426] Epoch 111:  41%|████▏     | 33/80 [03:15<04:29,  5.74s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.000245, train/loss_vlb_step=3.18e-6, train/loss_step=0.000245, global_step=2227.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  41%|████▏     | 33/80 [03:15<04:29,  5.74s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=6.95e-5, train/loss_step=0.0038, global_step=2228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]   Epoch 111:  42%|████▎     | 34/80 [03:15<04:17,  5.59s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0038, train/loss_vlb_step=6.95e-5, train/loss_step=0.0038, global_step=2228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  42%|████▎     | 34/80 [03:15<04:17,  5.59s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.14e-6, train/loss_step=0.000248, global_step=2228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  44%|████▍     | 35/80 [03:25<04:17,  5.71s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.000248, train/loss_vlb_step=1.14e-6, train/loss_step=0.000248, global_step=2228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  44%|████▍     | 35/80 [03:25<04:17,  5.71s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=8.43e-6, train/loss_step=0.00213, global_step=2228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  45%|████▌     | 36/80 [03:46<04:28,  6.11s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00213, train/loss_vlb_step=8.43e-6, train/loss_step=0.00213, global_step=2228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  45%|████▌     | 36/80 [03:46<04:28,  6.11s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=7.55e-6, train/loss_step=0.00201, global_step=2228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  46%|████▋     | 37/80 [03:46<04:16,  5.97s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=7.55e-6, train/loss_step=0.00201, global_step=2228.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  46%|████▋     | 37/80 [03:46<04:16,  5.97s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=2.93e-6, train/loss_step=0.000321, global_step=2229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  48%|████▊     | 38/80 [03:47<04:04,  5.83s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=2.93e-6, train/loss_step=0.000321, global_step=2229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  48%|████▊     | 38/80 [03:47<04:04,  5.83s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.000169, train/loss_vlb_step=7.62e-7, train/loss_step=0.000169, global_step=2229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  49%|████▉     | 39/80 [03:47<03:53,  5.70s/it, loss=0.00236, v_num=0, train/loss_simple_step=0.000169, train/loss_vlb_step=7.62e-7, train/loss_step=0.000169, global_step=2229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  49%|████▉     | 39/80 [03:47<03:53,  5.70s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=1.04e-6, train/loss_step=0.00023, global_step=2229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  50%|█████     | 40/80 [03:55<03:49,  5.74s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00023, train/loss_vlb_step=1.04e-6, train/loss_step=0.00023, global_step=2229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  50%|█████     | 40/80 [03:55<03:49,  5.74s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=2.71e-6, train/loss_step=0.000561, global_step=2229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  51%|█████▏    | 41/80 [03:55<03:39,  5.62s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000561, train/loss_vlb_step=2.71e-6, train/loss_step=0.000561, global_step=2229.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  51%|█████▏    | 41/80 [03:55<03:39,  5.62s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000181, train/loss_step=0.0192, global_step=2230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]   Epoch 111:  52%|█████▎    | 42/80 [03:58<03:30,  5.54s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000181, train/loss_step=0.0192, global_step=2230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  52%|█████▎    | 42/80 [03:58<03:30,  5.54s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=0.000129, train/loss_step=0.00368, global_step=2230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  54%|█████▍    | 43/80 [04:04<03:25,  5.56s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00368, train/loss_vlb_step=0.000129, train/loss_step=0.00368, global_step=2230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  54%|█████▍    | 43/80 [04:04<03:25,  5.56s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=4.68e-6, train/loss_step=0.000322, global_step=2230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  55%|█████▌    | 44/80 [04:30<03:36,  6.00s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.000322, train/loss_vlb_step=4.68e-6, train/loss_step=0.000322, global_step=2230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  55%|█████▌    | 44/80 [04:30<03:36,  6.00s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=3.99e-6, train/loss_step=0.000747, global_step=2230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=3.99e-6, train/loss_step=0.000747, global_step=2230.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00013, train/loss_vlb_step=6.74e-7, train/loss_step=0.00013, global_step=2231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  57%|█████▊    | 46/80 [04:31<03:16,  5.77s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00013, train/loss_vlb_step=6.74e-7, train/loss_step=0.00013, global_step=2231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  57%|█████▊    | 46/80 [04:31<03:16,  5.77s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=1.2e-6, train/loss_step=0.000189, global_step=2231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  59%|█████▉    | 47/80 [04:31<03:06,  5.66s/it, loss=0.00234, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=1.2e-6, train/loss_step=0.000189, global_step=2231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  59%|█████▉    | 47/80 [04:31<03:06,  5.66s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=6.67e-6, train/loss_step=0.0019, global_step=2231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]   Epoch 111:  60%|██████    | 48/80 [04:35<02:59,  5.62s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=6.67e-6, train/loss_step=0.0019, global_step=2231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  60%|██████    | 48/80 [04:35<02:59,  5.62s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.17e-5, train/loss_step=0.00345, global_step=2231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  61%|██████▏   | 49/80 [04:35<02:51,  5.52s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.17e-5, train/loss_step=0.00345, global_step=2231.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  61%|██████▏   | 49/80 [04:35<02:51,  5.52s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.53e-5, train/loss_step=0.0147, global_step=2232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  62%|██████▎   | 50/80 [04:42<02:46,  5.54s/it, loss=0.00277, v_num=0, train/loss_simple_step=0.0147, train/loss_vlb_step=6.53e-5, train/loss_step=0.0147, global_step=2232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  62%|██████▎   | 50/80 [04:42<02:46,  5.54s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000636, train/loss_vlb_step=2.47e-6, train/loss_step=0.000636, global_step=2232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  64%|██████▍   | 51/80 [04:47<02:40,  5.52s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000636, train/loss_vlb_step=2.47e-6, train/loss_step=0.000636, global_step=2232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  64%|██████▍   | 51/80 [04:47<02:40,  5.52s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=5.38e-6, train/loss_step=0.000777, global_step=2232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  65%|██████▌   | 52/80 [05:21<02:49,  6.07s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000777, train/loss_vlb_step=5.38e-6, train/loss_step=0.000777, global_step=2232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  65%|██████▌   | 52/80 [05:21<02:49,  6.07s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=5.57e-6, train/loss_step=0.000805, global_step=2232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426] Epoch 111:  66%|██████▋   | 53/80 [05:21<02:40,  5.96s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.000805, train/loss_vlb_step=5.57e-6, train/loss_step=0.000805, global_step=2232.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  66%|██████▋   | 53/80 [05:21<02:40,  5.96s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.0001, train/loss_vlb_step=3.8e-7, train/loss_step=0.0001, global_step=2233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]    Epoch 111:  68%|██████▊   | 54/80 [05:22<02:32,  5.86s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.0001, train/loss_vlb_step=3.8e-7, train/loss_step=0.0001, global_step=2233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  68%|██████▊   | 54/80 [05:22<02:32,  5.86s/it, loss=0.00261, v_num=0, train/loss_simple_step=9.89e-5, train/loss_vlb_step=3.66e-7, train/loss_step=9.89e-5, global_step=2233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  69%|██████▉   | 55/80 [05:22<02:24,  5.77s/it, loss=0.00261, v_num=0, train/loss_simple_step=9.89e-5, train/loss_vlb_step=3.66e-7, train/loss_step=9.89e-5, global_step=2233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  69%|██████▉   | 55/80 [05:22<02:24,  5.77s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.75e-6, train/loss_step=0.0015, global_step=2233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  70%|███████   | 56/80 [05:23<02:16,  5.68s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=6.75e-6, train/loss_step=0.0015, global_step=2233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  70%|███████   | 56/80 [05:23<02:16,  5.68s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000731, train/loss_vlb_step=5.74e-6, train/loss_step=0.000731, global_step=2233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  71%|███████▏  | 57/80 [05:24<02:08,  5.59s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000731, train/loss_vlb_step=5.74e-6, train/loss_step=0.000731, global_step=2233.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  71%|███████▏  | 57/80 [05:24<02:08,  5.59s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=9.55e-5, train/loss_step=0.0207, global_step=2234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]    Epoch 111:  72%|███████▎  | 58/80 [05:29<02:03,  5.59s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0207, train/loss_vlb_step=9.55e-5, train/loss_step=0.0207, global_step=2234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  72%|███████▎  | 58/80 [05:29<02:03,  5.59s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.73e-7, train/loss_step=0.00018, global_step=2234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  74%|███████▍  | 59/80 [05:33<01:56,  5.55s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.73e-7, train/loss_step=0.00018, global_step=2234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  74%|███████▍  | 59/80 [05:33<01:56,  5.55s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.24e-5, train/loss_step=0.00372, global_step=2234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  75%|███████▌  | 60/80 [05:57<01:57,  5.86s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00372, train/loss_vlb_step=1.24e-5, train/loss_step=0.00372, global_step=2234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  75%|███████▌  | 60/80 [05:57<01:57,  5.86s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=7.11e-6, train/loss_step=0.00111, global_step=2234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  76%|███████▋  | 61/80 [05:57<01:49,  5.77s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=7.11e-6, train/loss_step=0.00111, global_step=2234.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  76%|███████▋  | 61/80 [05:57<01:49,  5.77s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=6.48e-7, train/loss_step=0.000157, global_step=2235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  78%|███████▊  | 62/80 [05:58<01:42,  5.69s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=6.48e-7, train/loss_step=0.000157, global_step=2235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  78%|███████▊  | 62/80 [05:58<01:42,  5.69s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000117, train/loss_step=0.015, global_step=2235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]     Epoch 111:  79%|███████▉  | 63/80 [05:58<01:35,  5.61s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000117, train/loss_step=0.015, global_step=2235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  79%|███████▉  | 63/80 [05:58<01:35,  5.61s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=5.97e-7, train/loss_step=0.000166, global_step=2235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  80%|████████  | 64/80 [05:59<01:28,  5.53s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=5.97e-7, train/loss_step=0.000166, global_step=2235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  80%|████████  | 64/80 [05:59<01:28,  5.53s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.43e-6, train/loss_step=0.00135, global_step=2235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  81%|████████▏ | 65/80 [06:00<01:21,  5.46s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.00135, train/loss_vlb_step=5.43e-6, train/loss_step=0.00135, global_step=2235.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  81%|████████▏ | 65/80 [06:00<01:21,  5.46s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=5.59e-6, train/loss_step=0.00138, global_step=2236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  82%|████████▎ | 66/80 [06:13<01:18,  5.57s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00138, train/loss_vlb_step=5.59e-6, train/loss_step=0.00138, global_step=2236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  82%|████████▎ | 66/80 [06:13<01:18,  5.57s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=1.83e-6, train/loss_step=0.000531, global_step=2236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  84%|████████▍ | 67/80 [06:13<01:11,  5.50s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000531, train/loss_vlb_step=1.83e-6, train/loss_step=0.000531, global_step=2236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  84%|████████▍ | 67/80 [06:13<01:11,  5.50s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000124, train/loss_vlb_step=5.61e-7, train/loss_step=0.000124, global_step=2236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000124, train/loss_vlb_step=5.61e-7, train/loss_step=0.000124, global_step=2236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  85%|████████▌ | 68/80 [06:37<01:09,  5.76s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=8.87e-5, train/loss_step=0.0102, global_step=2236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]     Epoch 111:  86%|████████▋ | 69/80 [06:38<01:02,  5.69s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=8.87e-5, train/loss_step=0.0102, global_step=2236.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  86%|████████▋ | 69/80 [06:38<01:02,  5.69s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=1.38e-5, train/loss_step=0.00108, global_step=2237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  88%|████████▊ | 70/80 [06:38<00:56,  5.62s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=1.38e-5, train/loss_step=0.00108, global_step=2237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  88%|████████▊ | 70/80 [06:38<00:56,  5.62s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.37e-7, train/loss_step=0.00018, global_step=2237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  89%|████████▉ | 71/80 [06:39<00:49,  5.54s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.37e-7, train/loss_step=0.00018, global_step=2237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  89%|████████▉ | 71/80 [06:39<00:49,  5.54s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.00259, train/loss_step=0.0379, global_step=2237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  90%|█████████ | 72/80 [06:41<00:43,  5.50s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.0379, train/loss_vlb_step=0.00259, train/loss_step=0.0379, global_step=2237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  90%|█████████ | 72/80 [06:41<00:43,  5.50s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=4.55e-7, train/loss_step=0.000113, global_step=2237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  91%|█████████▏| 73/80 [06:41<00:37,  5.43s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.000113, train/loss_vlb_step=4.55e-7, train/loss_step=0.000113, global_step=2237.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  91%|█████████▏| 73/80 [06:41<00:37,  5.43s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000128, train/loss_vlb_step=5.54e-7, train/loss_step=0.000128, global_step=2238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  92%|█████████▎| 74/80 [06:42<00:32,  5.37s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000128, train/loss_vlb_step=5.54e-7, train/loss_step=0.000128, global_step=2238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  92%|█████████▎| 74/80 [06:42<00:32,  5.37s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=5.68e-7, train/loss_step=0.000139, global_step=2238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  94%|█████████▍| 75/80 [06:56<00:27,  5.48s/it, loss=0.00482, v_num=0, train/loss_simple_step=0.000139, train/loss_vlb_step=5.68e-7, train/loss_step=0.000139, global_step=2238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  94%|█████████▍| 75/80 [06:56<00:27,  5.48s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=2.78e-6, train/loss_step=0.00068, global_step=2238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 111:  95%|█████████▌| 76/80 [07:05<00:22,  5.52s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00068, train/loss_vlb_step=2.78e-6, train/loss_step=0.00068, global_step=2238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  95%|█████████▌| 76/80 [07:05<00:22,  5.52s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.02e-5, train/loss_step=0.00559, global_step=2238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00502, v_num=0, train/loss_simple_step=0.00559, train/loss_vlb_step=2.02e-5, train/loss_step=0.00559, global_step=2238.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=8.75e-6, train/loss_step=0.00183, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00183, train/loss_vlb_step=8.75e-6, train/loss_step=0.00183, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=2.28e-5, train/loss_step=0.00661, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426] Epoch 111:  99%|█████████▉| 79/80 [07:06<00:05,  5.34s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=2.28e-5, train/loss_step=0.00661, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111:  99%|█████████▉| 79/80 [07:06<00:05,  5.34s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=2.83e-6, train/loss_step=0.00062, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00425, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=2.83e-6, train/loss_step=0.00062, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 111: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00419, v_num=0, train/loss_simple_step=5.65e-5, train/loss_vlb_step=2.23e-7, train/loss_step=5.65e-5, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Average Epoch time: 427.34 seconds
+Average Peak memory 29560.37MiB
+Epoch 111:   0%|          | 0/80 [00:00<00:00, 3934.62it/s, loss=0.00419, v_num=0, train/loss_simple_step=5.65e-5, train/loss_vlb_step=2.23e-7, train/loss_step=5.65e-5, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 112:   0%|          | 0/80 [00:00<00:00, 1818.87it/s, loss=0.00419, v_num=0, train/loss_simple_step=5.65e-5, train/loss_vlb_step=2.23e-7, train/loss_step=5.65e-5, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]Epoch 112:   1%|▏         | 1/80 [00:42<27:42, 21.05s/it, loss=0.00419, v_num=0, train/loss_simple_step=5.65e-5, train/loss_vlb_step=2.23e-7, train/loss_step=5.65e-5, global_step=2239.0, lr_abs=0.0001, train/loss_simple_epoch=0.00426, train/loss_vlb_epoch=9.86e-5, train/loss_epoch=0.00426]  Epoch 112:   1%|▏         | 1/80 [00:42<27:42, 21.05s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000291, train/loss_step=0.0242, global_step=2240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:   2%|▎         | 2/80 [00:50<21:41, 16.69s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000291, train/loss_step=0.0242, global_step=2240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   2%|▎         | 2/80 [00:50<21:41, 16.69s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=1.39e-5, train/loss_step=0.00386, global_step=2240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   4%|▍         | 3/80 [00:50<16:13, 12.64s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=1.39e-5, train/loss_step=0.00386, global_step=2240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   4%|▍         | 3/80 [00:50<16:13, 12.64s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=1.87e-5, train/loss_step=0.00551, global_step=2240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   5%|▌         | 4/80 [00:51<12:56, 10.21s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=1.87e-5, train/loss_step=0.00551, global_step=2240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   5%|▌         | 4/80 [00:51<12:56, 10.21s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000316, train/loss_step=0.0271, global_step=2240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:   6%|▋         | 5/80 [00:51<10:44,  8.60s/it, loss=0.00639, v_num=0, train/loss_simple_step=0.0271, train/loss_vlb_step=0.000316, train/loss_step=0.0271, global_step=2240.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   6%|▋         | 5/80 [00:51<10:44,  8.60s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.07e-5, train/loss_step=0.00274, global_step=2241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   8%|▊         | 6/80 [00:52<09:10,  7.44s/it, loss=0.00646, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.07e-5, train/loss_step=0.00274, global_step=2241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   8%|▊         | 6/80 [00:52<09:10,  7.44s/it, loss=0.00691, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=3.49e-5, train/loss_step=0.00939, global_step=2241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   9%|▉         | 7/80 [00:52<07:59,  6.57s/it, loss=0.00691, v_num=0, train/loss_simple_step=0.00939, train/loss_vlb_step=3.49e-5, train/loss_step=0.00939, global_step=2241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:   9%|▉         | 7/80 [00:52<07:59,  6.57s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=3.11e-6, train/loss_step=0.000422, global_step=2241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  10%|█         | 8/80 [01:23<11:09,  9.29s/it, loss=0.00692, v_num=0, train/loss_simple_step=0.000422, train/loss_vlb_step=3.11e-6, train/loss_step=0.000422, global_step=2241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  10%|█         | 8/80 [01:23<11:09,  9.29s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=1.11e-6, train/loss_step=0.000215, global_step=2241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  11%|█▏        | 9/80 [01:24<09:58,  8.43s/it, loss=0.00642, v_num=0, train/loss_simple_step=0.000215, train/loss_vlb_step=1.11e-6, train/loss_step=0.000215, global_step=2241.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  11%|█▏        | 9/80 [01:24<09:58,  8.43s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=8.07e-6, train/loss_step=0.00214, global_step=2242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  12%|█▎        | 10/80 [01:31<09:42,  8.33s/it, loss=0.00647, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=8.07e-6, train/loss_step=0.00214, global_step=2242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  12%|█▎        | 10/80 [01:31<09:42,  8.33s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=2.13e-6, train/loss_step=0.000332, global_step=2242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  14%|█▍        | 11/80 [01:32<08:49,  7.68s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=2.13e-6, train/loss_step=0.000332, global_step=2242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  14%|█▍        | 11/80 [01:32<08:49,  7.68s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=5.57e-5, train/loss_step=0.0102, global_step=2242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]     Epoch 112:  15%|█▌        | 12/80 [01:32<08:04,  7.13s/it, loss=0.0051, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=5.57e-5, train/loss_step=0.0102, global_step=2242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  15%|█▌        | 12/80 [01:32<08:04,  7.13s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=5.73e-6, train/loss_step=0.00162, global_step=2242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  16%|█▋        | 13/80 [01:33<07:25,  6.65s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=5.73e-6, train/loss_step=0.00162, global_step=2242.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  16%|█▋        | 13/80 [01:33<07:25,  6.65s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000868, train/loss_vlb_step=5.92e-6, train/loss_step=0.000868, global_step=2243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  18%|█▊        | 14/80 [01:33<06:51,  6.24s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000868, train/loss_vlb_step=5.92e-6, train/loss_step=0.000868, global_step=2243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  18%|█▊        | 14/80 [01:33<06:51,  6.24s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=0.00068, train/loss_step=0.00404, global_step=2243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]   Epoch 112:  19%|█▉        | 15/80 [01:34<06:22,  5.88s/it, loss=0.0054, v_num=0, train/loss_simple_step=0.00404, train/loss_vlb_step=0.00068, train/loss_step=0.00404, global_step=2243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  19%|█▉        | 15/80 [01:34<06:22,  5.88s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=7.06e-7, train/loss_step=0.000183, global_step=2243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  20%|██        | 16/80 [02:11<08:15,  7.74s/it, loss=0.00538, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=7.06e-7, train/loss_step=0.000183, global_step=2243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  20%|██        | 16/80 [02:11<08:15,  7.74s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=2.03e-6, train/loss_step=0.00045, global_step=2243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  21%|██▏       | 17/80 [02:12<07:42,  7.34s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00045, train/loss_vlb_step=2.03e-6, train/loss_step=0.00045, global_step=2243.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  21%|██▏       | 17/80 [02:12<07:42,  7.34s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.69e-6, train/loss_step=0.00035, global_step=2244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  22%|██▎       | 18/80 [02:12<07:12,  6.98s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=1.69e-6, train/loss_step=0.00035, global_step=2244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  22%|██▎       | 18/80 [02:12<07:12,  6.98s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=1.83e-5, train/loss_step=0.00494, global_step=2244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  24%|██▍       | 19/80 [02:13<06:46,  6.66s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00494, train/loss_vlb_step=1.83e-5, train/loss_step=0.00494, global_step=2244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  24%|██▍       | 19/80 [02:13<06:46,  6.66s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=1.85e-6, train/loss_step=0.000446, global_step=2244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  25%|██▌       | 20/80 [02:13<06:21,  6.37s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000446, train/loss_vlb_step=1.85e-6, train/loss_step=0.000446, global_step=2244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  25%|██▌       | 20/80 [02:13<06:21,  6.37s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.37e-5, train/loss_step=0.00313, global_step=2244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  26%|██▋       | 21/80 [02:14<05:59,  6.10s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00313, train/loss_vlb_step=1.37e-5, train/loss_step=0.00313, global_step=2244.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  26%|██▋       | 21/80 [02:14<05:59,  6.10s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=2.66e-5, train/loss_step=0.00748, global_step=2245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  28%|██▊       | 22/80 [02:14<05:39,  5.86s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00748, train/loss_vlb_step=2.66e-5, train/loss_step=0.00748, global_step=2245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  28%|██▊       | 22/80 [02:14<05:39,  5.86s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=0.000414, train/loss_step=0.00111, global_step=2245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  29%|██▉       | 23/80 [02:15<05:21,  5.63s/it, loss=0.00413, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=0.000414, train/loss_step=0.00111, global_step=2245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  29%|██▉       | 23/80 [02:15<05:21,  5.63s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=7.41e-6, train/loss_step=0.00151, global_step=2245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:  30%|███       | 24/80 [02:54<06:31,  6.99s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=7.41e-6, train/loss_step=0.00151, global_step=2245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  30%|███       | 24/80 [02:54<06:31,  6.99s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=6.98e-5, train/loss_step=0.00824, global_step=2245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  31%|███▏      | 25/80 [02:55<06:10,  6.74s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00824, train/loss_vlb_step=6.98e-5, train/loss_step=0.00824, global_step=2245.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  31%|███▏      | 25/80 [02:55<06:10,  6.74s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=2.62e-5, train/loss_step=0.00744, global_step=2246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  32%|███▎      | 26/80 [02:55<05:51,  6.51s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00744, train/loss_vlb_step=2.62e-5, train/loss_step=0.00744, global_step=2246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  32%|███▎      | 26/80 [02:55<05:51,  6.51s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.09e-5, train/loss_step=0.00304, global_step=2246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  34%|███▍      | 27/80 [02:56<05:33,  6.29s/it, loss=0.00291, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.09e-5, train/loss_step=0.00304, global_step=2246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  34%|███▍      | 27/80 [02:56<05:33,  6.29s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.0182, train/loss_step=0.054, global_step=2246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]     Epoch 112:  35%|███▌      | 28/80 [02:56<05:16,  6.09s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.054, train/loss_vlb_step=0.0182, train/loss_step=0.054, global_step=2246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  35%|███▌      | 28/80 [02:56<05:16,  6.09s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=1.9e-6, train/loss_step=0.000434, global_step=2246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  36%|███▋      | 29/80 [02:57<05:01,  5.91s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=1.9e-6, train/loss_step=0.000434, global_step=2246.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  36%|███▋      | 29/80 [02:57<05:01,  5.91s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.37e-5, train/loss_step=0.00557, global_step=2247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  38%|███▊      | 30/80 [02:57<04:46,  5.73s/it, loss=0.00577, v_num=0, train/loss_simple_step=0.00557, train/loss_vlb_step=2.37e-5, train/loss_step=0.00557, global_step=2247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  38%|███▊      | 30/80 [02:57<04:46,  5.73s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.00066, train/loss_vlb_step=4.79e-5, train/loss_step=0.00066, global_step=2247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  39%|███▉      | 31/80 [02:58<04:32,  5.57s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.00066, train/loss_vlb_step=4.79e-5, train/loss_step=0.00066, global_step=2247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  39%|███▉      | 31/80 [02:58<04:32,  5.57s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=3.96e-6, train/loss_step=0.000315, global_step=2247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  40%|████      | 32/80 [03:37<05:15,  6.58s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.000315, train/loss_vlb_step=3.96e-6, train/loss_step=0.000315, global_step=2247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  40%|████      | 32/80 [03:37<05:15,  6.58s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.74e-6, train/loss_step=0.000251, global_step=2247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  41%|████▏     | 33/80 [03:37<05:01,  6.40s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.000251, train/loss_vlb_step=1.74e-6, train/loss_step=0.000251, global_step=2247.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  41%|████▏     | 33/80 [03:37<05:01,  6.40s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000575, train/loss_vlb_step=3.48e-6, train/loss_step=0.000575, global_step=2248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  42%|████▎     | 34/80 [03:38<04:46,  6.24s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.000575, train/loss_vlb_step=3.48e-6, train/loss_step=0.000575, global_step=2248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  42%|████▎     | 34/80 [03:38<04:46,  6.24s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.43e-6, train/loss_step=0.000511, global_step=2248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  44%|████▍     | 35/80 [03:38<04:33,  6.08s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.43e-6, train/loss_step=0.000511, global_step=2248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  44%|████▍     | 35/80 [03:38<04:33,  6.08s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000902, train/loss_vlb_step=3.47e-6, train/loss_step=0.000902, global_step=2248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  45%|████▌     | 36/80 [03:39<04:20,  5.93s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000902, train/loss_vlb_step=3.47e-6, train/loss_step=0.000902, global_step=2248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  45%|████▌     | 36/80 [03:39<04:20,  5.93s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=2.57e-6, train/loss_step=0.000349, global_step=2248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  46%|████▋     | 37/80 [03:39<04:08,  5.78s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.000349, train/loss_vlb_step=2.57e-6, train/loss_step=0.000349, global_step=2248.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  46%|████▋     | 37/80 [03:39<04:08,  5.78s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.000158, train/loss_vlb_step=6.52e-7, train/loss_step=0.000158, global_step=2249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  48%|████▊     | 38/80 [03:40<03:57,  5.65s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.000158, train/loss_vlb_step=6.52e-7, train/loss_step=0.000158, global_step=2249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  48%|████▊     | 38/80 [03:40<03:57,  5.65s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=2.64e-6, train/loss_step=0.000619, global_step=2249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  49%|████▉     | 39/80 [03:40<03:46,  5.52s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.000619, train/loss_vlb_step=2.64e-6, train/loss_step=0.000619, global_step=2249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  49%|████▉     | 39/80 [03:40<03:46,  5.52s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00063, train/loss_vlb_step=2.42e-6, train/loss_step=0.00063, global_step=2249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  50%|█████     | 40/80 [04:20<04:14,  6.37s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00063, train/loss_vlb_step=2.42e-6, train/loss_step=0.00063, global_step=2249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  50%|█████     | 40/80 [04:20<04:14,  6.37s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=1.66e-5, train/loss_step=0.00418, global_step=2249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:  51%|█████▏    | 41/80 [04:21<04:02,  6.23s/it, loss=0.0049, v_num=0, train/loss_simple_step=0.00418, train/loss_vlb_step=1.66e-5, train/loss_step=0.00418, global_step=2249.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  51%|█████▏    | 41/80 [04:21<04:02,  6.23s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=2.95e-6, train/loss_step=0.000472, global_step=2250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  52%|█████▎    | 42/80 [04:22<03:51,  6.09s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=2.95e-6, train/loss_step=0.000472, global_step=2250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  52%|█████▎    | 42/80 [04:22<03:51,  6.09s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00087, train/loss_vlb_step=3.36e-6, train/loss_step=0.00087, global_step=2250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.00087, train/loss_vlb_step=3.36e-6, train/loss_step=0.00087, global_step=2250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=5.66e-6, train/loss_step=0.00108, global_step=2250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  55%|█████▌    | 44/80 [04:30<03:36,  6.02s/it, loss=0.00452, v_num=0, train/loss_simple_step=0.00108, train/loss_vlb_step=5.66e-6, train/loss_step=0.00108, global_step=2250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  55%|█████▌    | 44/80 [04:30<03:36,  6.02s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=1.43e-6, train/loss_step=0.000386, global_step=2250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  56%|█████▋    | 45/80 [04:31<03:26,  5.90s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000386, train/loss_vlb_step=1.43e-6, train/loss_step=0.000386, global_step=2250.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  56%|█████▋    | 45/80 [04:31<03:26,  5.90s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=0.00055, train/loss_step=0.00198, global_step=2251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  57%|█████▊    | 46/80 [04:31<03:16,  5.78s/it, loss=0.00385, v_num=0, train/loss_simple_step=0.00198, train/loss_vlb_step=0.00055, train/loss_step=0.00198, global_step=2251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  57%|█████▊    | 46/80 [04:31<03:16,  5.78s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=4.52e-5, train/loss_step=0.00478, global_step=2251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  59%|█████▉    | 47/80 [04:32<03:07,  5.67s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00478, train/loss_vlb_step=4.52e-5, train/loss_step=0.00478, global_step=2251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  59%|█████▉    | 47/80 [04:32<03:07,  5.67s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=4.99e-5, train/loss_step=0.0127, global_step=2251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  60%|██████    | 48/80 [04:52<03:10,  5.96s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=4.99e-5, train/loss_step=0.0127, global_step=2251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  60%|██████    | 48/80 [04:52<03:10,  5.96s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=2.97e-6, train/loss_step=0.000395, global_step=2251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  61%|██████▏   | 49/80 [04:52<03:01,  5.85s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.000395, train/loss_vlb_step=2.97e-6, train/loss_step=0.000395, global_step=2251.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  61%|██████▏   | 49/80 [04:52<03:01,  5.85s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=3.17e-5, train/loss_step=0.00866, global_step=2252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  62%|██████▎   | 50/80 [05:04<02:59,  5.97s/it, loss=0.00202, v_num=0, train/loss_simple_step=0.00866, train/loss_vlb_step=3.17e-5, train/loss_step=0.00866, global_step=2252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  62%|██████▎   | 50/80 [05:04<02:59,  5.97s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.15e-5, train/loss_step=0.00272, global_step=2252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  64%|██████▍   | 51/80 [05:05<02:50,  5.87s/it, loss=0.00212, v_num=0, train/loss_simple_step=0.00272, train/loss_vlb_step=1.15e-5, train/loss_step=0.00272, global_step=2252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  64%|██████▍   | 51/80 [05:05<02:50,  5.87s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=1.6e-5, train/loss_step=0.00426, global_step=2252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:  65%|██████▌   | 52/80 [05:16<02:46,  5.96s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.00426, train/loss_vlb_step=1.6e-5, train/loss_step=0.00426, global_step=2252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  65%|██████▌   | 52/80 [05:16<02:46,  5.96s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=3.95e-6, train/loss_step=0.000416, global_step=2252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  66%|██████▋   | 53/80 [05:16<02:38,  5.86s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=3.95e-6, train/loss_step=0.000416, global_step=2252.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  66%|██████▋   | 53/80 [05:16<02:38,  5.86s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=0.000153, train/loss_step=0.00683, global_step=2253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:  68%|██████▊   | 54/80 [05:17<02:29,  5.76s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00683, train/loss_vlb_step=0.000153, train/loss_step=0.00683, global_step=2253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  68%|██████▊   | 54/80 [05:17<02:29,  5.76s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=3.88e-6, train/loss_step=0.000341, global_step=2253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000341, train/loss_vlb_step=3.88e-6, train/loss_step=0.000341, global_step=2253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.31e-5, train/loss_step=0.0028, global_step=2253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]    Epoch 112:  70%|███████   | 56/80 [05:44<02:25,  6.04s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.31e-5, train/loss_step=0.0028, global_step=2253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  70%|███████   | 56/80 [05:44<02:25,  6.04s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=8.73e-5, train/loss_step=0.00784, global_step=2253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  71%|███████▏  | 57/80 [05:45<02:16,  5.95s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=8.73e-5, train/loss_step=0.00784, global_step=2253.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  71%|███████▏  | 57/80 [05:45<02:16,  5.95s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000664, train/loss_vlb_step=2.48e-6, train/loss_step=0.000664, global_step=2254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  72%|███████▎  | 58/80 [05:51<02:10,  5.95s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000664, train/loss_vlb_step=2.48e-6, train/loss_step=0.000664, global_step=2254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  72%|███████▎  | 58/80 [05:51<02:10,  5.95s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.34e-6, train/loss_step=0.00105, global_step=2254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  74%|███████▍  | 59/80 [05:51<02:03,  5.86s/it, loss=0.00315, v_num=0, train/loss_simple_step=0.00105, train/loss_vlb_step=4.34e-6, train/loss_step=0.00105, global_step=2254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  74%|███████▍  | 59/80 [05:51<02:03,  5.86s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=2.17e-6, train/loss_step=0.000259, global_step=2254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  75%|███████▌  | 60/80 [05:59<01:57,  5.90s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=2.17e-6, train/loss_step=0.000259, global_step=2254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  75%|███████▌  | 60/80 [05:59<01:57,  5.90s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000475, train/loss_step=0.0182, global_step=2254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]   Epoch 112:  76%|███████▋  | 61/80 [06:00<01:50,  5.81s/it, loss=0.00383, v_num=0, train/loss_simple_step=0.0182, train/loss_vlb_step=0.000475, train/loss_step=0.0182, global_step=2254.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  76%|███████▋  | 61/80 [06:00<01:50,  5.81s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=2.77e-5, train/loss_step=0.00705, global_step=2255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  78%|███████▊  | 62/80 [06:00<01:43,  5.72s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00705, train/loss_vlb_step=2.77e-5, train/loss_step=0.00705, global_step=2255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  78%|███████▊  | 62/80 [06:00<01:43,  5.72s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00069, train/loss_vlb_step=2.86e-5, train/loss_step=0.00069, global_step=2255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  79%|███████▉  | 63/80 [06:01<01:35,  5.64s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.00069, train/loss_vlb_step=2.86e-5, train/loss_step=0.00069, global_step=2255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  79%|███████▉  | 63/80 [06:01<01:35,  5.64s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=1e-6, train/loss_step=0.000243, global_step=2255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:  80%|████████  | 64/80 [06:23<01:34,  5.90s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=1e-6, train/loss_step=0.000243, global_step=2255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  80%|████████  | 64/80 [06:23<01:34,  5.90s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=5.83e-6, train/loss_step=0.000684, global_step=2255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  81%|████████▏ | 65/80 [06:24<01:27,  5.82s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000684, train/loss_vlb_step=5.83e-6, train/loss_step=0.000684, global_step=2255.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  81%|████████▏ | 65/80 [06:24<01:27,  5.82s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=5.08e-6, train/loss_step=0.00101, global_step=2256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  82%|████████▎ | 66/80 [06:33<01:22,  5.87s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=5.08e-6, train/loss_step=0.00101, global_step=2256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  82%|████████▎ | 66/80 [06:33<01:22,  5.87s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.44e-5, train/loss_step=0.00218, global_step=2256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  84%|████████▍ | 67/80 [06:33<01:15,  5.79s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00218, train/loss_vlb_step=1.44e-5, train/loss_step=0.00218, global_step=2256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  84%|████████▍ | 67/80 [06:33<01:15,  5.79s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.24e-6, train/loss_step=0.00167, global_step=2256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:  85%|████████▌ | 68/80 [06:34<01:08,  5.72s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.24e-6, train/loss_step=0.00167, global_step=2256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  85%|████████▌ | 68/80 [06:34<01:08,  5.72s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=1.32e-6, train/loss_step=0.000368, global_step=2256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  86%|████████▋ | 69/80 [06:34<01:02,  5.64s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=1.32e-6, train/loss_step=0.000368, global_step=2256.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  86%|████████▋ | 69/80 [06:34<01:02,  5.64s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=0.000163, train/loss_step=0.0114, global_step=2257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 112:  88%|████████▊ | 70/80 [06:35<00:55,  5.57s/it, loss=0.00353, v_num=0, train/loss_simple_step=0.0114, train/loss_vlb_step=0.000163, train/loss_step=0.0114, global_step=2257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  88%|████████▊ | 70/80 [06:35<00:55,  5.57s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000249, train/loss_vlb_step=1.52e-6, train/loss_step=0.000249, global_step=2257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  89%|████████▉ | 71/80 [06:35<00:49,  5.50s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000249, train/loss_vlb_step=1.52e-6, train/loss_step=0.000249, global_step=2257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  89%|████████▉ | 71/80 [06:35<00:49,  5.50s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=6.73e-7, train/loss_step=0.000187, global_step=2257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.000187, train/loss_vlb_step=6.73e-7, train/loss_step=0.000187, global_step=2257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  90%|█████████ | 72/80 [07:00<00:46,  5.76s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=1.1e-5, train/loss_step=0.0015, global_step=2257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]     Epoch 112:  91%|█████████▏| 73/80 [07:02<00:39,  5.71s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.0015, train/loss_vlb_step=1.1e-5, train/loss_step=0.0015, global_step=2257.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  91%|█████████▏| 73/80 [07:02<00:39,  5.71s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.47e-6, train/loss_step=0.000304, global_step=2258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  92%|█████████▎| 74/80 [07:08<00:34,  5.71s/it, loss=0.00293, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.47e-6, train/loss_step=0.000304, global_step=2258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  92%|█████████▎| 74/80 [07:08<00:34,  5.71s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=0.000476, train/loss_step=0.00134, global_step=2258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:  94%|█████████▍| 75/80 [07:09<00:28,  5.64s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=0.000476, train/loss_step=0.00134, global_step=2258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  94%|█████████▍| 75/80 [07:09<00:28,  5.64s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=3.13e-5, train/loss_step=0.00784, global_step=2258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:  95%|█████████▌| 76/80 [07:09<00:22,  5.58s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00784, train/loss_vlb_step=3.13e-5, train/loss_step=0.00784, global_step=2258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  95%|█████████▌| 76/80 [07:09<00:22,  5.58s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=2.82e-5, train/loss_step=0.00775, global_step=2258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  96%|█████████▋| 77/80 [07:10<00:16,  5.51s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00775, train/loss_vlb_step=2.82e-5, train/loss_step=0.00775, global_step=2258.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  96%|█████████▋| 77/80 [07:10<00:16,  5.51s/it, loss=0.0032, v_num=0, train/loss_simple_step=9.69e-5, train/loss_vlb_step=3.89e-7, train/loss_step=9.69e-5, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372] Epoch 112:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.0032, v_num=0, train/loss_simple_step=9.69e-5, train/loss_vlb_step=3.89e-7, train/loss_step=9.69e-5, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.68e-5, train/loss_step=0.00165, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  99%|█████████▉| 79/80 [07:10<00:05,  5.39s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=1.68e-5, train/loss_step=0.00165, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112:  99%|█████████▉| 79/80 [07:10<00:05,  5.39s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=7.64e-6, train/loss_step=0.00204, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00204, train/loss_vlb_step=7.64e-6, train/loss_step=0.00204, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 112: 100%|██████████| 80/80 [07:11<00:00,  5.33s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000109, train/loss_vlb_step=3.92e-7, train/loss_step=0.000109, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Average Epoch time: 431.50 seconds
+Average Peak memory 29561.17MiB
+Epoch 112:   0%|          | 0/80 [00:00<00:00, 6017.65it/s, loss=0.00242, v_num=0, train/loss_simple_step=0.000109, train/loss_vlb_step=3.92e-7, train/loss_step=0.000109, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 113:   0%|          | 0/80 [00:00<00:00, 2327.58it/s, loss=0.00242, v_num=0, train/loss_simple_step=0.000109, train/loss_vlb_step=3.92e-7, train/loss_step=0.000109, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]Epoch 113:   1%|▏         | 1/80 [00:35<23:32, 17.88s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000109, train/loss_vlb_step=3.92e-7, train/loss_step=0.000109, global_step=2259.0, lr_abs=0.0001, train/loss_simple_epoch=0.00372, train/loss_vlb_epoch=5.85e-5, train/loss_epoch=0.00372]  Epoch 113:   1%|▏         | 1/80 [00:35<23:32, 17.88s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=2.52e-6, train/loss_step=0.000381, global_step=2260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   2%|▎         | 2/80 [00:44<19:07, 14.71s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=2.52e-6, train/loss_step=0.000381, global_step=2260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   2%|▎         | 2/80 [00:44<19:07, 14.71s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000162, train/loss_vlb_step=7.27e-7, train/loss_step=0.000162, global_step=2260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   4%|▍         | 3/80 [00:44<14:19, 11.16s/it, loss=0.00206, v_num=0, train/loss_simple_step=0.000162, train/loss_vlb_step=7.27e-7, train/loss_step=0.000162, global_step=2260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   4%|▍         | 3/80 [00:44<14:19, 11.16s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=2.96e-5, train/loss_step=0.00104, global_step=2260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]   Epoch 113:   5%|▌         | 4/80 [00:45<11:26,  9.03s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.00104, train/loss_vlb_step=2.96e-5, train/loss_step=0.00104, global_step=2260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   5%|▌         | 4/80 [00:45<11:26,  9.03s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.41e-6, train/loss_step=0.000264, global_step=2260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   6%|▋         | 5/80 [00:45<09:30,  7.61s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.000264, train/loss_vlb_step=1.41e-6, train/loss_step=0.000264, global_step=2260.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   6%|▋         | 5/80 [00:45<09:30,  7.61s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.28e-6, train/loss_step=0.000275, global_step=2261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   8%|▊         | 6/80 [00:46<08:07,  6.59s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.000275, train/loss_vlb_step=1.28e-6, train/loss_step=0.000275, global_step=2261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   8%|▊         | 6/80 [00:46<08:07,  6.59s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.000382, train/loss_vlb_step=2.06e-6, train/loss_step=0.000382, global_step=2261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   9%|▉         | 7/80 [00:46<07:05,  5.83s/it, loss=0.00195, v_num=0, train/loss_simple_step=0.000382, train/loss_vlb_step=2.06e-6, train/loss_step=0.000382, global_step=2261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:   9%|▉         | 7/80 [00:46<07:05,  5.83s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=2.99e-5, train/loss_step=0.00111, global_step=2261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 113:  10%|█         | 8/80 [01:25<11:22,  9.47s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=2.99e-5, train/loss_step=0.00111, global_step=2261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  10%|█         | 8/80 [01:25<11:22,  9.47s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.36e-6, train/loss_step=0.000241, global_step=2261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  11%|█▏        | 9/80 [01:28<10:26,  8.82s/it, loss=0.00192, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.36e-6, train/loss_step=0.000241, global_step=2261.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  11%|█▏        | 9/80 [01:28<10:26,  8.82s/it, loss=0.00136, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=1.08e-6, train/loss_step=0.000175, global_step=2262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  12%|█▎        | 10/80 [01:37<10:21,  8.88s/it, loss=0.00136, v_num=0, train/loss_simple_step=0.000175, train/loss_vlb_step=1.08e-6, train/loss_step=0.000175, global_step=2262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  12%|█▎        | 10/80 [01:37<10:21,  8.88s/it, loss=0.00165, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=5.45e-5, train/loss_step=0.00619, global_step=2262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 113:  14%|█▍        | 11/80 [01:38<09:24,  8.18s/it, loss=0.00165, v_num=0, train/loss_simple_step=0.00619, train/loss_vlb_step=5.45e-5, train/loss_step=0.00619, global_step=2262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  14%|█▍        | 11/80 [01:38<09:24,  8.18s/it, loss=0.00166, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.41e-6, train/loss_step=0.000255, global_step=2262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  15%|█▌        | 12/80 [01:38<08:36,  7.59s/it, loss=0.00166, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.41e-6, train/loss_step=0.000255, global_step=2262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  15%|█▌        | 12/80 [01:38<08:36,  7.59s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.77e-5, train/loss_step=0.00451, global_step=2262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 113:  16%|█▋        | 13/80 [01:39<07:54,  7.09s/it, loss=0.00181, v_num=0, train/loss_simple_step=0.00451, train/loss_vlb_step=1.77e-5, train/loss_step=0.00451, global_step=2262.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  16%|█▋        | 13/80 [01:39<07:54,  7.09s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.3e-6, train/loss_step=0.000255, global_step=2263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  18%|█▊        | 14/80 [01:39<07:18,  6.65s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.000255, train/loss_vlb_step=1.3e-6, train/loss_step=0.000255, global_step=2263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  18%|█▊        | 14/80 [01:39<07:18,  6.65s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.000124, train/loss_vlb_step=4.39e-7, train/loss_step=0.000124, global_step=2263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  19%|█▉        | 15/80 [01:40<06:46,  6.26s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.000124, train/loss_vlb_step=4.39e-7, train/loss_step=0.000124, global_step=2263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  19%|█▉        | 15/80 [01:40<06:46,  6.26s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=9.52e-5, train/loss_step=0.0166, global_step=2263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]    Epoch 113:  20%|██        | 16/80 [01:59<07:29,  7.02s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=9.52e-5, train/loss_step=0.0166, global_step=2263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  20%|██        | 16/80 [01:59<07:29,  7.02s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=6.94e-6, train/loss_step=0.00122, global_step=2263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  21%|██▏       | 17/80 [02:15<07:55,  7.54s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.00122, train/loss_vlb_step=6.94e-6, train/loss_step=0.00122, global_step=2263.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  21%|██▏       | 17/80 [02:15<07:55,  7.54s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000112, train/loss_vlb_step=5.5e-7, train/loss_step=0.000112, global_step=2264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  22%|██▎       | 18/80 [02:16<07:25,  7.19s/it, loss=0.00185, v_num=0, train/loss_simple_step=0.000112, train/loss_vlb_step=5.5e-7, train/loss_step=0.000112, global_step=2264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  22%|██▎       | 18/80 [02:16<07:25,  7.19s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.000529, train/loss_vlb_step=1.87e-6, train/loss_step=0.000529, global_step=2264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  24%|██▍       | 19/80 [02:17<06:58,  6.85s/it, loss=0.0018, v_num=0, train/loss_simple_step=0.000529, train/loss_vlb_step=1.87e-6, train/loss_step=0.000529, global_step=2264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  24%|██▍       | 19/80 [02:17<06:58,  6.85s/it, loss=0.0017, v_num=0, train/loss_simple_step=0.000131, train/loss_vlb_step=4.98e-7, train/loss_step=0.000131, global_step=2264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  25%|██▌       | 20/80 [02:17<06:33,  6.55s/it, loss=0.0017, v_num=0, train/loss_simple_step=0.000131, train/loss_vlb_step=4.98e-7, train/loss_step=0.000131, global_step=2264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  25%|██▌       | 20/80 [02:17<06:33,  6.55s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=2.45e-5, train/loss_step=0.00247, global_step=2264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  26%|██▋       | 21/80 [02:18<06:10,  6.28s/it, loss=0.00182, v_num=0, train/loss_simple_step=0.00247, train/loss_vlb_step=2.45e-5, train/loss_step=0.00247, global_step=2264.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  26%|██▋       | 21/80 [02:18<06:10,  6.28s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.5e-5, train/loss_step=0.00323, global_step=2265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  28%|██▊       | 22/80 [02:18<05:49,  6.03s/it, loss=0.00196, v_num=0, train/loss_simple_step=0.00323, train/loss_vlb_step=1.5e-5, train/loss_step=0.00323, global_step=2265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  28%|██▊       | 22/80 [02:18<05:49,  6.03s/it, loss=0.00201, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=1.13e-5, train/loss_step=0.00111, global_step=2265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  29%|██▉       | 23/80 [02:19<05:30,  5.80s/it, loss=0.00201, v_num=0, train/loss_simple_step=0.00111, train/loss_vlb_step=1.13e-5, train/loss_step=0.00111, global_step=2265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  29%|██▉       | 23/80 [02:19<05:30,  5.80s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.68e-6, train/loss_step=0.000307, global_step=2265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  30%|███       | 24/80 [02:48<06:17,  6.74s/it, loss=0.00197, v_num=0, train/loss_simple_step=0.000307, train/loss_vlb_step=1.68e-6, train/loss_step=0.000307, global_step=2265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  30%|███       | 24/80 [02:48<06:17,  6.74s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=0.000265, train/loss_step=0.00369, global_step=2265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  31%|███▏      | 25/80 [02:50<06:01,  6.56s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.00369, train/loss_vlb_step=0.000265, train/loss_step=0.00369, global_step=2265.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  31%|███▏      | 25/80 [02:50<06:01,  6.56s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=3.48e-6, train/loss_step=0.000347, global_step=2266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  32%|███▎      | 26/80 [03:04<06:08,  6.82s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000347, train/loss_vlb_step=3.48e-6, train/loss_step=0.000347, global_step=2266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  32%|███▎      | 26/80 [03:04<06:08,  6.82s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.79e-6, train/loss_step=0.000303, global_step=2266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  34%|███▍      | 27/80 [03:04<05:49,  6.60s/it, loss=0.00215, v_num=0, train/loss_simple_step=0.000303, train/loss_vlb_step=1.79e-6, train/loss_step=0.000303, global_step=2266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  34%|███▍      | 27/80 [03:04<05:49,  6.60s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=5.18e-6, train/loss_step=0.00088, global_step=2266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 113:  35%|███▌      | 28/80 [03:05<05:32,  6.39s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.00088, train/loss_vlb_step=5.18e-6, train/loss_step=0.00088, global_step=2266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  35%|███▌      | 28/80 [03:05<05:32,  6.39s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000136, train/loss_vlb_step=6.62e-7, train/loss_step=0.000136, global_step=2266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  36%|███▋      | 29/80 [03:05<05:15,  6.19s/it, loss=0.00213, v_num=0, train/loss_simple_step=0.000136, train/loss_vlb_step=6.62e-7, train/loss_step=0.000136, global_step=2266.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  36%|███▋      | 29/80 [03:05<05:15,  6.19s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.99e-5, train/loss_step=0.0115, global_step=2267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]     Epoch 113:  38%|███▊      | 30/80 [03:06<05:00,  6.01s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.99e-5, train/loss_step=0.0115, global_step=2267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  38%|███▊      | 30/80 [03:06<05:00,  6.01s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.61e-5, train/loss_step=0.00144, global_step=2267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  39%|███▉      | 31/80 [03:06<04:46,  5.84s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00144, train/loss_vlb_step=1.61e-5, train/loss_step=0.00144, global_step=2267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  39%|███▉      | 31/80 [03:06<04:46,  5.84s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.94e-6, train/loss_step=0.00114, global_step=2267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  40%|████      | 32/80 [03:30<05:05,  6.37s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=4.94e-6, train/loss_step=0.00114, global_step=2267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  40%|████      | 32/80 [03:30<05:05,  6.37s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=2.72e-6, train/loss_step=0.000544, global_step=2267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  41%|████▏     | 33/80 [03:30<04:51,  6.20s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=2.72e-6, train/loss_step=0.000544, global_step=2267.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  41%|████▏     | 33/80 [03:30<04:51,  6.20s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.000625, train/loss_vlb_step=2.82e-6, train/loss_step=0.000625, global_step=2268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  42%|████▎     | 34/80 [03:53<05:06,  6.66s/it, loss=0.00232, v_num=0, train/loss_simple_step=0.000625, train/loss_vlb_step=2.82e-6, train/loss_step=0.000625, global_step=2268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  42%|████▎     | 34/80 [03:53<05:06,  6.66s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=1.49e-5, train/loss_step=0.00423, global_step=2268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 113:  44%|████▍     | 35/80 [03:53<04:52,  6.49s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00423, train/loss_vlb_step=1.49e-5, train/loss_step=0.00423, global_step=2268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  44%|████▍     | 35/80 [03:53<04:52,  6.49s/it, loss=0.00194, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.44e-5, train/loss_step=0.00475, global_step=2268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  45%|████▌     | 36/80 [03:54<04:38,  6.33s/it, loss=0.00194, v_num=0, train/loss_simple_step=0.00475, train/loss_vlb_step=2.44e-5, train/loss_step=0.00475, global_step=2268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  45%|████▌     | 36/80 [03:54<04:38,  6.33s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.5e-5, train/loss_step=0.00314, global_step=2268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  46%|████▋     | 37/80 [03:54<04:25,  6.18s/it, loss=0.00203, v_num=0, train/loss_simple_step=0.00314, train/loss_vlb_step=1.5e-5, train/loss_step=0.00314, global_step=2268.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  46%|████▋     | 37/80 [03:54<04:25,  6.18s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=0.000132, train/loss_step=0.0204, global_step=2269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  48%|████▊     | 38/80 [03:55<04:13,  6.03s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.0204, train/loss_vlb_step=0.000132, train/loss_step=0.0204, global_step=2269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  48%|████▊     | 38/80 [03:55<04:13,  6.03s/it, loss=0.00302, v_num=0, train/loss_simple_step=9.81e-5, train/loss_vlb_step=4.68e-7, train/loss_step=9.81e-5, global_step=2269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  49%|████▉     | 39/80 [03:55<04:01,  5.89s/it, loss=0.00302, v_num=0, train/loss_simple_step=9.81e-5, train/loss_vlb_step=4.68e-7, train/loss_step=9.81e-5, global_step=2269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  49%|████▉     | 39/80 [03:55<04:01,  5.89s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=1.1e-6, train/loss_step=0.000157, global_step=2269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  50%|█████     | 40/80 [04:18<04:12,  6.31s/it, loss=0.00303, v_num=0, train/loss_simple_step=0.000157, train/loss_vlb_step=1.1e-6, train/loss_step=0.000157, global_step=2269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  50%|█████     | 40/80 [04:18<04:12,  6.31s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.14e-5, train/loss_step=0.00335, global_step=2269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  51%|█████▏    | 41/80 [04:19<04:00,  6.17s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00335, train/loss_vlb_step=1.14e-5, train/loss_step=0.00335, global_step=2269.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  51%|█████▏    | 41/80 [04:19<04:00,  6.17s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.56e-5, train/loss_step=0.015, global_step=2270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]    Epoch 113:  52%|█████▎    | 42/80 [04:37<04:04,  6.44s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=6.56e-5, train/loss_step=0.015, global_step=2270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  52%|█████▎    | 42/80 [04:37<04:04,  6.44s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=5.47e-7, train/loss_step=0.00015, global_step=2270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  54%|█████▍    | 43/80 [04:37<03:53,  6.31s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=5.47e-7, train/loss_step=0.00015, global_step=2270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  54%|█████▍    | 43/80 [04:37<03:53,  6.31s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00066, train/loss_vlb_step=9.34e-5, train/loss_step=0.00066, global_step=2270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  55%|█████▌    | 44/80 [04:38<03:42,  6.18s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00066, train/loss_vlb_step=9.34e-5, train/loss_step=0.00066, global_step=2270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  55%|█████▌    | 44/80 [04:38<03:42,  6.18s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=0.000924, train/loss_step=0.00828, global_step=2270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  56%|█████▋    | 45/80 [04:38<03:31,  6.06s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.00828, train/loss_vlb_step=0.000924, train/loss_step=0.00828, global_step=2270.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  56%|█████▋    | 45/80 [04:38<03:31,  6.06s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.54e-6, train/loss_step=0.00153, global_step=2271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  57%|█████▊    | 46/80 [04:39<03:21,  5.94s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.54e-6, train/loss_step=0.00153, global_step=2271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  57%|█████▊    | 46/80 [04:39<03:21,  5.94s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=3.12e-6, train/loss_step=0.000293, global_step=2271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  59%|█████▉    | 47/80 [04:39<03:12,  5.82s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000293, train/loss_vlb_step=3.12e-6, train/loss_step=0.000293, global_step=2271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  59%|█████▉    | 47/80 [04:39<03:12,  5.82s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=1.77e-6, train/loss_step=0.000423, global_step=2271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  60%|██████    | 48/80 [05:00<03:16,  6.14s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.000423, train/loss_vlb_step=1.77e-6, train/loss_step=0.000423, global_step=2271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  60%|██████    | 48/80 [05:00<03:16,  6.14s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.16e-5, train/loss_step=0.00825, global_step=2271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]   Epoch 113:  61%|██████▏   | 49/80 [05:01<03:06,  6.03s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.00825, train/loss_vlb_step=4.16e-5, train/loss_step=0.00825, global_step=2271.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  61%|██████▏   | 49/80 [05:01<03:06,  6.03s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=1.7e-5, train/loss_step=0.005, global_step=2272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]    Epoch 113:  62%|██████▎   | 50/80 [05:18<03:07,  6.25s/it, loss=0.00397, v_num=0, train/loss_simple_step=0.005, train/loss_vlb_step=1.7e-5, train/loss_step=0.005, global_step=2272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  62%|██████▎   | 50/80 [05:19<03:07,  6.25s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=7.91e-6, train/loss_step=0.000455, global_step=2272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  64%|██████▍   | 51/80 [05:19<02:58,  6.14s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=7.91e-6, train/loss_step=0.000455, global_step=2272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  64%|██████▍   | 51/80 [05:19<02:58,  6.14s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.4e-5, train/loss_step=0.0105, global_step=2272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]     Epoch 113:  65%|██████▌   | 52/80 [05:20<02:49,  6.04s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=4.4e-5, train/loss_step=0.0105, global_step=2272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  65%|██████▌   | 52/80 [05:20<02:49,  6.04s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=9.24e-6, train/loss_step=0.00208, global_step=2272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  66%|██████▋   | 53/80 [05:20<02:40,  5.94s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00208, train/loss_vlb_step=9.24e-6, train/loss_step=0.00208, global_step=2272.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  66%|██████▋   | 53/80 [05:20<02:40,  5.94s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.0004, train/loss_vlb_step=5.32e-6, train/loss_step=0.0004, global_step=2273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 113:  68%|██████▊   | 54/80 [05:21<02:31,  5.84s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.0004, train/loss_vlb_step=5.32e-6, train/loss_step=0.0004, global_step=2273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  68%|██████▊   | 54/80 [05:21<02:31,  5.84s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.65e-5, train/loss_step=0.0162, global_step=2273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  69%|██████▉   | 55/80 [05:21<02:23,  5.74s/it, loss=0.00506, v_num=0, train/loss_simple_step=0.0162, train/loss_vlb_step=7.65e-5, train/loss_step=0.0162, global_step=2273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  69%|██████▉   | 55/80 [05:21<02:23,  5.74s/it, loss=0.00482, v_num=0, train/loss_simple_step=7.39e-5, train/loss_vlb_step=3.3e-7, train/loss_step=7.39e-5, global_step=2273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  70%|███████   | 56/80 [05:44<02:25,  6.05s/it, loss=0.00482, v_num=0, train/loss_simple_step=7.39e-5, train/loss_vlb_step=3.3e-7, train/loss_step=7.39e-5, global_step=2273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  70%|███████   | 56/80 [05:44<02:25,  6.05s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.83e-6, train/loss_step=0.00107, global_step=2273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  71%|███████▏  | 57/80 [05:45<02:16,  5.95s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.83e-6, train/loss_step=0.00107, global_step=2273.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  71%|███████▏  | 57/80 [05:45<02:16,  5.95s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=3.85e-5, train/loss_step=0.00843, global_step=2274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  72%|███████▎  | 58/80 [06:02<02:14,  6.14s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00843, train/loss_vlb_step=3.85e-5, train/loss_step=0.00843, global_step=2274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  72%|███████▎  | 58/80 [06:02<02:14,  6.14s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=0.000116, train/loss_step=0.0148, global_step=2274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  74%|███████▍  | 59/80 [06:02<02:06,  6.04s/it, loss=0.00486, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=0.000116, train/loss_step=0.0148, global_step=2274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  74%|███████▍  | 59/80 [06:02<02:06,  6.04s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.5e-5, train/loss_step=0.00408, global_step=2274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  75%|███████▌  | 60/80 [06:03<01:59,  5.95s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00408, train/loss_vlb_step=1.5e-5, train/loss_step=0.00408, global_step=2274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  75%|███████▌  | 60/80 [06:03<01:59,  5.95s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000379, train/loss_vlb_step=6.21e-6, train/loss_step=0.000379, global_step=2274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  76%|███████▋  | 61/80 [06:03<01:51,  5.86s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.000379, train/loss_vlb_step=6.21e-6, train/loss_step=0.000379, global_step=2274.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  76%|███████▋  | 61/80 [06:03<01:51,  5.86s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.16e-5, train/loss_step=0.00304, global_step=2275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 113:  78%|███████▊  | 62/80 [06:04<01:44,  5.78s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00304, train/loss_vlb_step=1.16e-5, train/loss_step=0.00304, global_step=2275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  78%|███████▊  | 62/80 [06:04<01:44,  5.78s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=5.57e-5, train/loss_step=0.00837, global_step=2275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  79%|███████▉  | 63/80 [06:04<01:36,  5.70s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00837, train/loss_vlb_step=5.57e-5, train/loss_step=0.00837, global_step=2275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  79%|███████▉  | 63/80 [06:04<01:36,  5.70s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=2.39e-6, train/loss_step=0.000368, global_step=2275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  80%|████████  | 64/80 [06:16<01:32,  5.79s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=2.39e-6, train/loss_step=0.000368, global_step=2275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  80%|████████  | 64/80 [06:16<01:32,  5.79s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=8.39e-7, train/loss_step=0.000231, global_step=2275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.0043, v_num=0, train/loss_simple_step=0.000231, train/loss_vlb_step=8.39e-7, train/loss_step=0.000231, global_step=2275.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=1.06e-6, train/loss_step=0.000226, global_step=2276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  82%|████████▎ | 66/80 [06:37<01:23,  5.93s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=1.06e-6, train/loss_step=0.000226, global_step=2276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  82%|████████▎ | 66/80 [06:37<01:23,  5.93s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=7.14e-5, train/loss_step=0.0123, global_step=2276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]    Epoch 113:  84%|████████▍ | 67/80 [06:38<01:16,  5.85s/it, loss=0.00484, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=7.14e-5, train/loss_step=0.0123, global_step=2276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  84%|████████▍ | 67/80 [06:38<01:16,  5.85s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000272, train/loss_vlb_step=2.75e-6, train/loss_step=0.000272, global_step=2276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  85%|████████▌ | 68/80 [06:38<01:09,  5.78s/it, loss=0.00483, v_num=0, train/loss_simple_step=0.000272, train/loss_vlb_step=2.75e-6, train/loss_step=0.000272, global_step=2276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  85%|████████▌ | 68/80 [06:38<01:09,  5.78s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.38e-5, train/loss_step=0.0101, global_step=2276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]    Epoch 113:  86%|████████▋ | 69/80 [06:39<01:02,  5.70s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=3.38e-5, train/loss_step=0.0101, global_step=2276.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  86%|████████▋ | 69/80 [06:39<01:02,  5.70s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.15e-5, train/loss_step=0.00575, global_step=2277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00575, train/loss_vlb_step=2.15e-5, train/loss_step=0.00575, global_step=2277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  88%|████████▊ | 70/80 [06:39<00:56,  5.63s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=2.35e-6, train/loss_step=0.000558, global_step=2277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000558, train/loss_vlb_step=2.35e-6, train/loss_step=0.000558, global_step=2277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  89%|████████▉ | 71/80 [06:40<00:50,  5.56s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=5.51e-7, train/loss_step=0.00015, global_step=2277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 113:  90%|█████████ | 72/80 [06:59<00:45,  5.75s/it, loss=0.00445, v_num=0, train/loss_simple_step=0.00015, train/loss_vlb_step=5.51e-7, train/loss_step=0.00015, global_step=2277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  90%|█████████ | 72/80 [06:59<00:45,  5.75s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000653, train/loss_vlb_step=3.04e-6, train/loss_step=0.000653, global_step=2277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  91%|█████████▏| 73/80 [07:06<00:40,  5.77s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000653, train/loss_vlb_step=3.04e-6, train/loss_step=0.000653, global_step=2277.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  91%|█████████▏| 73/80 [07:06<00:40,  5.77s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.36e-5, train/loss_step=0.00262, global_step=2278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 113:  92%|█████████▎| 74/80 [07:20<00:35,  5.87s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00262, train/loss_vlb_step=1.36e-5, train/loss_step=0.00262, global_step=2278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  92%|█████████▎| 74/80 [07:20<00:35,  5.87s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=0.000402, train/loss_step=0.0043, global_step=2278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  94%|█████████▍| 75/80 [07:20<00:29,  5.80s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=0.000402, train/loss_step=0.0043, global_step=2278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  94%|█████████▍| 75/80 [07:20<00:29,  5.80s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=3.29e-5, train/loss_step=0.0092, global_step=2278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391] Epoch 113:  95%|█████████▌| 76/80 [07:21<00:22,  5.73s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.0092, train/loss_vlb_step=3.29e-5, train/loss_step=0.0092, global_step=2278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  95%|█████████▌| 76/80 [07:21<00:22,  5.73s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=3.35e-5, train/loss_step=0.00964, global_step=2278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  96%|█████████▋| 77/80 [07:21<00:16,  5.67s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.00964, train/loss_vlb_step=3.35e-5, train/loss_step=0.00964, global_step=2278.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  96%|█████████▋| 77/80 [07:21<00:16,  5.67s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=2.44e-6, train/loss_step=0.000243, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  98%|█████████▊| 78/80 [07:22<00:11,  5.60s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000243, train/loss_vlb_step=2.44e-6, train/loss_step=0.000243, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  98%|█████████▊| 78/80 [07:22<00:11,  5.60s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=6.3e-5, train/loss_step=0.0123, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]     Epoch 113:  99%|█████████▉| 79/80 [07:22<00:05,  5.54s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0123, train/loss_vlb_step=6.3e-5, train/loss_step=0.0123, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113:  99%|█████████▉| 79/80 [07:22<00:05,  5.54s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=2.55e-5, train/loss_step=0.00319, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113: 100%|██████████| 80/80 [07:23<00:00,  5.47s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=2.55e-5, train/loss_step=0.00319, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 113: 100%|██████████| 80/80 [07:23<00:00,  5.47s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=5.44e-7, train/loss_step=0.000148, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Average Epoch time: 443.46 seconds
+Average Peak memory 29566.69MiB
+Epoch 113:   0%|          | 0/80 [00:00<00:00, 5315.97it/s, loss=0.00418, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=5.44e-7, train/loss_step=0.000148, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 114:   0%|          | 0/80 [00:00<00:00, 2149.82it/s, loss=0.00418, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=5.44e-7, train/loss_step=0.000148, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]Epoch 114:   1%|▏         | 1/80 [00:42<27:40, 21.02s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000148, train/loss_vlb_step=5.44e-7, train/loss_step=0.000148, global_step=2279.0, lr_abs=0.0001, train/loss_simple_epoch=0.00391, train/loss_vlb_epoch=8.97e-5, train/loss_epoch=0.00391]  Epoch 114:   1%|▏         | 1/80 [00:42<27:40, 21.02s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.34e-6, train/loss_step=0.00117, global_step=2280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:   2%|▎         | 2/80 [00:44<19:27, 14.96s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.34e-6, train/loss_step=0.00117, global_step=2280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:   2%|▎         | 2/80 [00:44<19:27, 14.96s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=6.25e-6, train/loss_step=0.00102, global_step=2280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:   4%|▍         | 3/80 [00:45<14:33, 11.35s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=6.25e-6, train/loss_step=0.00102, global_step=2280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:   4%|▍         | 3/80 [00:45<14:33, 11.35s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.12e-5, train/loss_step=0.0028, global_step=2280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:   5%|▌         | 4/80 [00:45<11:37,  9.18s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0028, train/loss_vlb_step=1.12e-5, train/loss_step=0.0028, global_step=2280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:   5%|▌         | 4/80 [00:45<11:37,  9.18s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000114, train/loss_vlb_step=4.78e-7, train/loss_step=0.000114, global_step=2280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:   6%|▋         | 5/80 [00:46<09:46,  7.82s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000114, train/loss_vlb_step=4.78e-7, train/loss_step=0.000114, global_step=2280.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:   6%|▋         | 5/80 [00:46<09:46,  7.82s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=9.1e-6, train/loss_step=0.00216, global_step=2281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]   Epoch 114:   8%|▊         | 6/80 [00:47<08:20,  6.77s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00216, train/loss_vlb_step=9.1e-6, train/loss_step=0.00216, global_step=2281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:   8%|▊         | 6/80 [00:47<08:20,  6.77s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000109, train/loss_step=0.0188, global_step=2281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:   9%|▉         | 7/80 [00:47<07:16,  5.98s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000109, train/loss_step=0.0188, global_step=2281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:   9%|▉         | 7/80 [00:47<07:16,  5.98s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=8.88e-6, train/loss_step=0.00194, global_step=2281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  10%|█         | 8/80 [01:14<09:52,  8.23s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=8.88e-6, train/loss_step=0.00194, global_step=2281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  10%|█         | 8/80 [01:14<09:52,  8.23s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=6.97e-6, train/loss_step=0.00102, global_step=2281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  11%|█▏        | 9/80 [01:22<09:46,  8.27s/it, loss=0.00389, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=6.97e-6, train/loss_step=0.00102, global_step=2281.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  11%|█▏        | 9/80 [01:22<09:46,  8.27s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.51e-5, train/loss_step=0.0117, global_step=2282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  12%|█▎        | 10/80 [01:25<09:05,  7.80s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.0117, train/loss_vlb_step=5.51e-5, train/loss_step=0.0117, global_step=2282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  12%|█▎        | 10/80 [01:25<09:05,  7.80s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000101, train/loss_step=0.0119, global_step=2282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  14%|█▍        | 11/80 [01:26<08:15,  7.19s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.0119, train/loss_vlb_step=0.000101, train/loss_step=0.0119, global_step=2282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  14%|█▍        | 11/80 [01:26<08:15,  7.19s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000998, train/loss_vlb_step=2.01e-5, train/loss_step=0.000998, global_step=2282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  15%|█▌        | 12/80 [01:26<07:33,  6.68s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.000998, train/loss_vlb_step=2.01e-5, train/loss_step=0.000998, global_step=2282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  15%|█▌        | 12/80 [01:26<07:33,  6.68s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=0.00179, train/loss_step=0.00411, global_step=2282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  16%|█▋        | 13/80 [01:30<07:13,  6.47s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.00411, train/loss_vlb_step=0.00179, train/loss_step=0.00411, global_step=2282.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  16%|█▋        | 13/80 [01:30<07:13,  6.47s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.29e-5, train/loss_step=0.0115, global_step=2283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  18%|█▊        | 14/80 [01:31<06:40,  6.08s/it, loss=0.00541, v_num=0, train/loss_simple_step=0.0115, train/loss_vlb_step=7.29e-5, train/loss_step=0.0115, global_step=2283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  18%|█▊        | 14/80 [01:31<06:40,  6.08s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000495, train/loss_step=0.0109, global_step=2283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  19%|█▉        | 15/80 [01:33<06:18,  5.82s/it, loss=0.00574, v_num=0, train/loss_simple_step=0.0109, train/loss_vlb_step=0.000495, train/loss_step=0.0109, global_step=2283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  19%|█▉        | 15/80 [01:33<06:18,  5.82s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=7.57e-5, train/loss_step=0.00133, global_step=2283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  20%|██        | 16/80 [01:58<07:27,  7.00s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.00133, train/loss_vlb_step=7.57e-5, train/loss_step=0.00133, global_step=2283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  20%|██        | 16/80 [01:58<07:27,  7.00s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000636, train/loss_vlb_step=2.98e-6, train/loss_step=0.000636, global_step=2283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  21%|██▏       | 17/80 [02:01<07:05,  6.75s/it, loss=0.00489, v_num=0, train/loss_simple_step=0.000636, train/loss_vlb_step=2.98e-6, train/loss_step=0.000636, global_step=2283.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  21%|██▏       | 17/80 [02:01<07:05,  6.75s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=4.81e-6, train/loss_step=0.00074, global_step=2284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  22%|██▎       | 18/80 [02:07<06:55,  6.71s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=4.81e-6, train/loss_step=0.00074, global_step=2284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  22%|██▎       | 18/80 [02:07<06:55,  6.71s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=0.000954, train/loss_step=0.00745, global_step=2284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  24%|██▍       | 19/80 [02:07<06:30,  6.40s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.00745, train/loss_vlb_step=0.000954, train/loss_step=0.00745, global_step=2284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  24%|██▍       | 19/80 [02:07<06:30,  6.40s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.3e-6, train/loss_step=0.000314, global_step=2284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  25%|██▌       | 20/80 [02:08<06:07,  6.12s/it, loss=0.00453, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=1.3e-6, train/loss_step=0.000314, global_step=2284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  25%|██▌       | 20/80 [02:08<06:07,  6.12s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000835, train/loss_vlb_step=7.56e-6, train/loss_step=0.000835, global_step=2284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  26%|██▋       | 21/80 [02:20<06:17,  6.39s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000835, train/loss_vlb_step=7.56e-6, train/loss_step=0.000835, global_step=2284.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  26%|██▋       | 21/80 [02:20<06:17,  6.39s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=1.81e-5, train/loss_step=0.00527, global_step=2285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  28%|██▊       | 22/80 [02:21<05:55,  6.14s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00527, train/loss_vlb_step=1.81e-5, train/loss_step=0.00527, global_step=2285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  28%|██▊       | 22/80 [02:21<05:55,  6.14s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=5.23e-6, train/loss_step=0.000604, global_step=2285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  29%|██▉       | 23/80 [02:21<05:36,  5.90s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=5.23e-6, train/loss_step=0.000604, global_step=2285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  29%|██▉       | 23/80 [02:21<05:36,  5.90s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=2.25e-5, train/loss_step=0.0014, global_step=2285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]    Epoch 114:  30%|███       | 24/80 [02:36<05:51,  6.28s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=2.25e-5, train/loss_step=0.0014, global_step=2285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  30%|███       | 24/80 [02:36<05:51,  6.28s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=6.2e-6, train/loss_step=0.00152, global_step=2285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  31%|███▏      | 25/80 [02:41<05:41,  6.22s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=6.2e-6, train/loss_step=0.00152, global_step=2285.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  31%|███▏      | 25/80 [02:41<05:41,  6.22s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=5.15e-6, train/loss_step=0.00101, global_step=2286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  32%|███▎      | 26/80 [02:48<05:36,  6.23s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00101, train/loss_vlb_step=5.15e-6, train/loss_step=0.00101, global_step=2286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  32%|███▎      | 26/80 [02:48<05:36,  6.23s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000174, train/loss_vlb_step=7.49e-7, train/loss_step=0.000174, global_step=2286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  34%|███▍      | 27/80 [02:48<05:19,  6.03s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000174, train/loss_vlb_step=7.49e-7, train/loss_step=0.000174, global_step=2286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  34%|███▍      | 27/80 [02:48<05:19,  6.03s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=2.11e-6, train/loss_step=0.000301, global_step=2286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  35%|███▌      | 28/80 [02:49<05:03,  5.84s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000301, train/loss_vlb_step=2.11e-6, train/loss_step=0.000301, global_step=2286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  35%|███▌      | 28/80 [02:49<05:03,  5.84s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.41e-5, train/loss_step=0.00613, global_step=2286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  36%|███▋      | 29/80 [03:05<05:15,  6.20s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00613, train/loss_vlb_step=2.41e-5, train/loss_step=0.00613, global_step=2286.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  36%|███▋      | 29/80 [03:05<05:15,  6.20s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=1.21e-5, train/loss_step=0.000601, global_step=2287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  38%|███▊      | 30/80 [03:06<05:00,  6.01s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000601, train/loss_vlb_step=1.21e-5, train/loss_step=0.000601, global_step=2287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  38%|███▊      | 30/80 [03:06<05:00,  6.01s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000616, train/loss_vlb_step=7.1e-6, train/loss_step=0.000616, global_step=2287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379] Epoch 114:  39%|███▉      | 31/80 [03:06<04:46,  5.84s/it, loss=0.00282, v_num=0, train/loss_simple_step=0.000616, train/loss_vlb_step=7.1e-6, train/loss_step=0.000616, global_step=2287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  39%|███▉      | 31/80 [03:06<04:46,  5.84s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.11e-5, train/loss_step=0.0169, global_step=2287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]   Epoch 114:  40%|████      | 32/80 [03:14<04:42,  5.89s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.0169, train/loss_vlb_step=6.11e-5, train/loss_step=0.0169, global_step=2287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  40%|████      | 32/80 [03:14<04:42,  5.89s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=1.74e-5, train/loss_step=0.00519, global_step=2287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  41%|████▏     | 33/80 [03:30<04:51,  6.19s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00519, train/loss_vlb_step=1.74e-5, train/loss_step=0.00519, global_step=2287.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  41%|████▏     | 33/80 [03:30<04:51,  6.19s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.22e-5, train/loss_step=0.00483, global_step=2288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  42%|████▎     | 34/80 [03:31<04:37,  6.03s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=2.22e-5, train/loss_step=0.00483, global_step=2288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  42%|████▎     | 34/80 [03:31<04:37,  6.03s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.13e-5, train/loss_step=0.00583, global_step=2288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  44%|████▍     | 35/80 [03:31<04:24,  5.88s/it, loss=0.00308, v_num=0, train/loss_simple_step=0.00583, train/loss_vlb_step=2.13e-5, train/loss_step=0.00583, global_step=2288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  44%|████▍     | 35/80 [03:31<04:24,  5.88s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=4.13e-6, train/loss_step=0.000586, global_step=2288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  45%|████▌     | 36/80 [03:32<04:12,  5.74s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=4.13e-6, train/loss_step=0.000586, global_step=2288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  45%|████▌     | 36/80 [03:32<04:12,  5.74s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.15e-5, train/loss_step=0.014, global_step=2288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]      Epoch 114:  46%|████▋     | 37/80 [03:42<04:12,  5.86s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.014, train/loss_vlb_step=6.15e-5, train/loss_step=0.014, global_step=2288.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  46%|████▋     | 37/80 [03:42<04:12,  5.86s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=8.06e-5, train/loss_step=0.0131, global_step=2289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  48%|████▊     | 38/80 [03:43<04:00,  5.73s/it, loss=0.00433, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=8.06e-5, train/loss_step=0.0131, global_step=2289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  48%|████▊     | 38/80 [03:43<04:00,  5.73s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=7.57e-5, train/loss_step=0.0142, global_step=2289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  49%|████▉     | 39/80 [03:50<03:56,  5.76s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0142, train/loss_vlb_step=7.57e-5, train/loss_step=0.0142, global_step=2289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  49%|████▉     | 39/80 [03:50<03:56,  5.76s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=8.09e-6, train/loss_step=0.000735, global_step=2289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  50%|█████     | 40/80 [03:51<03:46,  5.66s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.000735, train/loss_vlb_step=8.09e-6, train/loss_step=0.000735, global_step=2289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  50%|█████     | 40/80 [03:51<03:46,  5.66s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=4.22e-5, train/loss_step=0.00719, global_step=2289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  51%|█████▏    | 41/80 [04:04<03:47,  5.83s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00719, train/loss_vlb_step=4.22e-5, train/loss_step=0.00719, global_step=2289.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  51%|█████▏    | 41/80 [04:04<03:47,  5.83s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.000174, train/loss_step=0.0194, global_step=2290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379] Epoch 114:  52%|█████▎    | 42/80 [04:11<03:42,  5.85s/it, loss=0.00571, v_num=0, train/loss_simple_step=0.0194, train/loss_vlb_step=0.000174, train/loss_step=0.0194, global_step=2290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  52%|█████▎    | 42/80 [04:11<03:42,  5.85s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.75e-5, train/loss_step=0.00503, global_step=2290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  54%|█████▍    | 43/80 [04:11<03:31,  5.73s/it, loss=0.00593, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.75e-5, train/loss_step=0.00503, global_step=2290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  54%|█████▍    | 43/80 [04:11<03:31,  5.73s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000445, train/loss_vlb_step=1.9e-6, train/loss_step=0.000445, global_step=2290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  55%|█████▌    | 44/80 [04:12<03:22,  5.61s/it, loss=0.00589, v_num=0, train/loss_simple_step=0.000445, train/loss_vlb_step=1.9e-6, train/loss_step=0.000445, global_step=2290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  55%|█████▌    | 44/80 [04:12<03:22,  5.61s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=1.81e-5, train/loss_step=0.00399, global_step=2290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379] Epoch 114:  56%|█████▋    | 45/80 [04:35<03:29,  6.00s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.00399, train/loss_vlb_step=1.81e-5, train/loss_step=0.00399, global_step=2290.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  56%|█████▋    | 45/80 [04:35<03:29,  6.00s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=1.4e-6, train/loss_step=0.000282, global_step=2291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  57%|█████▊    | 46/80 [04:36<03:19,  5.88s/it, loss=0.00597, v_num=0, train/loss_simple_step=0.000282, train/loss_vlb_step=1.4e-6, train/loss_step=0.000282, global_step=2291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  57%|█████▊    | 46/80 [04:36<03:19,  5.88s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000704, train/loss_vlb_step=1.49e-5, train/loss_step=0.000704, global_step=2291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379] Epoch 114:  59%|█████▉    | 47/80 [04:37<03:10,  5.78s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000704, train/loss_vlb_step=1.49e-5, train/loss_step=0.000704, global_step=2291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  59%|█████▉    | 47/80 [04:37<03:10,  5.78s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=3.65e-6, train/loss_step=0.000357, global_step=2291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  60%|██████    | 48/80 [04:37<03:01,  5.67s/it, loss=0.006, v_num=0, train/loss_simple_step=0.000357, train/loss_vlb_step=3.65e-6, train/loss_step=0.000357, global_step=2291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  60%|██████    | 48/80 [04:37<03:01,  5.67s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000103, train/loss_step=0.0125, global_step=2291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379] Epoch 114:  61%|██████▏   | 49/80 [04:42<02:55,  5.65s/it, loss=0.00632, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000103, train/loss_step=0.0125, global_step=2291.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  61%|██████▏   | 49/80 [04:42<02:55,  5.65s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.84e-5, train/loss_step=0.00287, global_step=2292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  62%|██████▎   | 50/80 [04:51<02:51,  5.72s/it, loss=0.00643, v_num=0, train/loss_simple_step=0.00287, train/loss_vlb_step=1.84e-5, train/loss_step=0.00287, global_step=2292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  62%|██████▎   | 50/80 [04:51<02:51,  5.72s/it, loss=0.00641, v_num=0, train/loss_simple_step=0.000219, train/loss_vlb_step=1.12e-6, train/loss_step=0.000219, global_step=2292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  64%|██████▍   | 51/80 [05:03<02:49,  5.84s/it, loss=0.00641, v_num=0, train/loss_simple_step=0.000219, train/loss_vlb_step=1.12e-6, train/loss_step=0.000219, global_step=2292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  64%|██████▍   | 51/80 [05:03<02:49,  5.84s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=9.15e-6, train/loss_step=0.00191, global_step=2292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  65%|██████▌   | 52/80 [05:04<02:40,  5.74s/it, loss=0.00566, v_num=0, train/loss_simple_step=0.00191, train/loss_vlb_step=9.15e-6, train/loss_step=0.00191, global_step=2292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  65%|██████▌   | 52/80 [05:04<02:40,  5.74s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=5.04e-6, train/loss_step=0.00107, global_step=2292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  66%|██████▋   | 53/80 [05:15<02:37,  5.85s/it, loss=0.00546, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=5.04e-6, train/loss_step=0.00107, global_step=2292.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  66%|██████▋   | 53/80 [05:15<02:37,  5.85s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=8.8e-6, train/loss_step=0.000604, global_step=2293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  68%|██████▊   | 54/80 [05:16<02:29,  5.76s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000604, train/loss_vlb_step=8.8e-6, train/loss_step=0.000604, global_step=2293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  68%|██████▊   | 54/80 [05:16<02:29,  5.76s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=1.34e-5, train/loss_step=0.000643, global_step=2293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.000643, train/loss_vlb_step=1.34e-5, train/loss_step=0.000643, global_step=2293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  69%|██████▉   | 55/80 [05:17<02:21,  5.67s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.53e-5, train/loss_step=0.003, global_step=2293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]      Epoch 114:  70%|███████   | 56/80 [05:36<02:21,  5.90s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.53e-5, train/loss_step=0.003, global_step=2293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  70%|███████   | 56/80 [05:36<02:21,  5.90s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=2.63e-6, train/loss_step=0.000402, global_step=2293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  71%|███████▏  | 57/80 [05:37<02:13,  5.81s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.000402, train/loss_vlb_step=2.63e-6, train/loss_step=0.000402, global_step=2293.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  71%|███████▏  | 57/80 [05:37<02:13,  5.81s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000716, train/loss_vlb_step=3.54e-6, train/loss_step=0.000716, global_step=2294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  72%|███████▎  | 58/80 [05:40<02:07,  5.78s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.000716, train/loss_vlb_step=3.54e-6, train/loss_step=0.000716, global_step=2294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  72%|███████▎  | 58/80 [05:40<02:07,  5.78s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.55e-5, train/loss_step=0.00151, global_step=2294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  74%|███████▍  | 59/80 [05:43<02:00,  5.73s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.00151, train/loss_vlb_step=1.55e-5, train/loss_step=0.00151, global_step=2294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  74%|███████▍  | 59/80 [05:43<02:00,  5.73s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=0.000174, train/loss_step=0.00877, global_step=2294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  75%|███████▌  | 60/80 [05:50<01:55,  5.75s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00877, train/loss_vlb_step=0.000174, train/loss_step=0.00877, global_step=2294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  75%|███████▌  | 60/80 [05:50<01:55,  5.75s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.00023, train/loss_step=0.0286, global_step=2294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]   Epoch 114:  76%|███████▋  | 61/80 [06:00<01:50,  5.81s/it, loss=0.00465, v_num=0, train/loss_simple_step=0.0286, train/loss_vlb_step=0.00023, train/loss_step=0.0286, global_step=2294.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  76%|███████▋  | 61/80 [06:00<01:50,  5.81s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.87e-6, train/loss_step=0.000557, global_step=2295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  78%|███████▊  | 62/80 [06:00<01:43,  5.73s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.87e-6, train/loss_step=0.000557, global_step=2295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  78%|███████▊  | 62/80 [06:00<01:43,  5.73s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000269, train/loss_vlb_step=1.43e-6, train/loss_step=0.000269, global_step=2295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  79%|███████▉  | 63/80 [06:01<01:35,  5.64s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000269, train/loss_vlb_step=1.43e-6, train/loss_step=0.000269, global_step=2295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  79%|███████▉  | 63/80 [06:01<01:35,  5.64s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000151, train/loss_vlb_step=6.3e-7, train/loss_step=0.000151, global_step=2295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379] Epoch 114:  80%|████████  | 64/80 [06:17<01:32,  5.81s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000151, train/loss_vlb_step=6.3e-7, train/loss_step=0.000151, global_step=2295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  80%|████████  | 64/80 [06:17<01:32,  5.81s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.51e-6, train/loss_step=0.000455, global_step=2295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  81%|████████▏ | 65/80 [06:18<01:25,  5.73s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.51e-6, train/loss_step=0.000455, global_step=2295.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  81%|████████▏ | 65/80 [06:18<01:25,  5.73s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=2.94e-5, train/loss_step=0.00754, global_step=2296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  82%|████████▎ | 66/80 [06:27<01:21,  5.79s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=2.94e-5, train/loss_step=0.00754, global_step=2296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  82%|████████▎ | 66/80 [06:27<01:21,  5.79s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.53e-6, train/loss_step=0.000317, global_step=2296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000317, train/loss_vlb_step=1.53e-6, train/loss_step=0.000317, global_step=2296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  84%|████████▍ | 67/80 [06:28<01:14,  5.71s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=7.27e-5, train/loss_step=0.0118, global_step=2296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]     Epoch 114:  85%|████████▌ | 68/80 [06:31<01:08,  5.68s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=7.27e-5, train/loss_step=0.0118, global_step=2296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  85%|████████▌ | 68/80 [06:31<01:08,  5.68s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=1.79e-6, train/loss_step=0.000499, global_step=2296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  86%|████████▋ | 69/80 [06:40<01:02,  5.71s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=1.79e-6, train/loss_step=0.000499, global_step=2296.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  86%|████████▋ | 69/80 [06:40<01:02,  5.71s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.68e-6, train/loss_step=0.000355, global_step=2297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  88%|████████▊ | 70/80 [06:40<00:56,  5.64s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.68e-6, train/loss_step=0.000355, global_step=2297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  88%|████████▊ | 70/80 [06:40<00:56,  5.64s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.3e-6, train/loss_step=0.000312, global_step=2297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379] Epoch 114:  89%|████████▉ | 71/80 [06:40<00:50,  5.57s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.3e-6, train/loss_step=0.000312, global_step=2297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  89%|████████▉ | 71/80 [06:40<00:50,  5.57s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=3.13e-5, train/loss_step=0.0018, global_step=2297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]   Epoch 114:  90%|█████████ | 72/80 [06:56<00:45,  5.70s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.0018, train/loss_vlb_step=3.13e-5, train/loss_step=0.0018, global_step=2297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  90%|█████████ | 72/80 [06:56<00:45,  5.70s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=0.000896, train/loss_step=0.00803, global_step=2297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  91%|█████████▏| 73/80 [06:56<00:39,  5.63s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.00803, train/loss_vlb_step=0.000896, train/loss_step=0.00803, global_step=2297.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  91%|█████████▏| 73/80 [06:56<00:39,  5.63s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=8.05e-5, train/loss_step=0.0125, global_step=2298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]   Epoch 114:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=8.05e-5, train/loss_step=0.0125, global_step=2298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000244, train/loss_vlb_step=1.28e-6, train/loss_step=0.000244, global_step=2298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  94%|█████████▍| 75/80 [06:57<00:27,  5.50s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000244, train/loss_vlb_step=1.28e-6, train/loss_step=0.000244, global_step=2298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  94%|█████████▍| 75/80 [06:57<00:27,  5.50s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=9.76e-6, train/loss_step=0.00223, global_step=2298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379] Epoch 114:  95%|█████████▌| 76/80 [07:01<00:21,  5.47s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.00223, train/loss_vlb_step=9.76e-6, train/loss_step=0.00223, global_step=2298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  95%|█████████▌| 76/80 [07:01<00:21,  5.47s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=1.16e-6, train/loss_step=0.000229, global_step=2298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  96%|█████████▋| 77/80 [07:13<00:16,  5.56s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=1.16e-6, train/loss_step=0.000229, global_step=2298.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  96%|█████████▋| 77/80 [07:13<00:16,  5.56s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.81e-5, train/loss_step=0.00469, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114:  98%|█████████▊| 78/80 [07:14<00:10,  5.50s/it, loss=0.00455, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.81e-5, train/loss_step=0.00469, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  98%|█████████▊| 78/80 [07:14<00:10,  5.50s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=4.37e-6, train/loss_step=0.00035, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.00449, v_num=0, train/loss_simple_step=0.00035, train/loss_vlb_step=4.37e-6, train/loss_step=0.00035, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114:  99%|█████████▉| 79/80 [07:14<00:05,  5.43s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=4.98e-5, train/loss_step=0.0131, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 114: 100%|██████████| 80/80 [07:15<00:00,  5.37s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0131, train/loss_vlb_step=4.98e-5, train/loss_step=0.0131, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 114: 100%|██████████| 80/80 [07:15<00:00,  5.37s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=9.37e-7, train/loss_step=0.00024, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Average Epoch time: 435.30 seconds
+Average Peak memory 29565.38MiB
+Epoch 114:   0%|          | 0/80 [00:00<00:00, 4310.69it/s, loss=0.00329, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=9.37e-7, train/loss_step=0.00024, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 115:   0%|          | 0/80 [00:00<00:00, 1846.90it/s, loss=0.00329, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=9.37e-7, train/loss_step=0.00024, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]Epoch 115:   1%|▏         | 1/80 [00:40<26:34, 20.18s/it, loss=0.00329, v_num=0, train/loss_simple_step=0.00024, train/loss_vlb_step=9.37e-7, train/loss_step=0.00024, global_step=2299.0, lr_abs=0.0001, train/loss_simple_epoch=0.00379, train/loss_vlb_epoch=9.42e-5, train/loss_epoch=0.00379]  Epoch 115:   1%|▏         | 1/80 [00:40<26:34, 20.18s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=5.42e-6, train/loss_step=0.00145, global_step=2300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   2%|▎         | 2/80 [00:40<17:41, 13.61s/it, loss=0.00333, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=5.42e-6, train/loss_step=0.00145, global_step=2300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   2%|▎         | 2/80 [00:40<17:41, 13.62s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000136, train/loss_step=0.0192, global_step=2300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:   4%|▍         | 3/80 [00:41<13:15, 10.33s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.0192, train/loss_vlb_step=0.000136, train/loss_step=0.0192, global_step=2300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   4%|▍         | 3/80 [00:41<13:15, 10.33s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.1e-5, train/loss_step=0.00308, global_step=2300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   5%|▌         | 4/80 [00:41<10:36,  8.37s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.00308, train/loss_vlb_step=1.1e-5, train/loss_step=0.00308, global_step=2300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   5%|▌         | 4/80 [00:41<10:36,  8.37s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=0.000561, train/loss_step=0.00119, global_step=2300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   6%|▋         | 5/80 [00:42<08:49,  7.06s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.00119, train/loss_vlb_step=0.000561, train/loss_step=0.00119, global_step=2300.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   6%|▋         | 5/80 [00:42<08:49,  7.06s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=1.14e-5, train/loss_step=0.000645, global_step=2301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   8%|▊         | 6/80 [00:42<07:33,  6.12s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.000645, train/loss_vlb_step=1.14e-5, train/loss_step=0.000645, global_step=2301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   8%|▊         | 6/80 [00:42<07:33,  6.12s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.27e-5, train/loss_step=0.00329, global_step=2301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:   9%|▉         | 7/80 [00:43<06:35,  5.42s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00329, train/loss_vlb_step=1.27e-5, train/loss_step=0.00329, global_step=2301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:   9%|▉         | 7/80 [00:43<06:35,  5.42s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.02e-5, train/loss_step=0.00256, global_step=2301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  10%|█         | 8/80 [01:19<10:32,  8.79s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=9.02e-5, train/loss_step=0.00256, global_step=2301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  10%|█         | 8/80 [01:19<10:32,  8.79s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.22e-5, train/loss_step=0.00692, global_step=2301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  11%|█▏        | 9/80 [01:19<09:25,  7.96s/it, loss=0.00412, v_num=0, train/loss_simple_step=0.00692, train/loss_vlb_step=3.22e-5, train/loss_step=0.00692, global_step=2301.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  11%|█▏        | 9/80 [01:19<09:25,  7.96s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.4e-5, train/loss_step=0.0113, global_step=2302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]   Epoch 115:  12%|█▎        | 10/80 [01:20<08:29,  7.28s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=4.4e-5, train/loss_step=0.0113, global_step=2302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  12%|█▎        | 10/80 [01:20<08:29,  7.28s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000146, train/loss_vlb_step=7.23e-7, train/loss_step=0.000146, global_step=2302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  14%|█▍        | 11/80 [01:20<07:43,  6.72s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.000146, train/loss_vlb_step=7.23e-7, train/loss_step=0.000146, global_step=2302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  14%|█▍        | 11/80 [01:20<07:43,  6.72s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=0.000281, train/loss_step=0.00229, global_step=2302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  15%|█▌        | 12/80 [01:21<07:04,  6.24s/it, loss=0.00469, v_num=0, train/loss_simple_step=0.00229, train/loss_vlb_step=0.000281, train/loss_step=0.00229, global_step=2302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  15%|█▌        | 12/80 [01:21<07:04,  6.24s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000142, train/loss_step=0.0205, global_step=2302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  16%|█▋        | 13/80 [01:21<06:30,  5.83s/it, loss=0.00531, v_num=0, train/loss_simple_step=0.0205, train/loss_vlb_step=0.000142, train/loss_step=0.0205, global_step=2302.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  16%|█▋        | 13/80 [01:21<06:30,  5.83s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.53e-5, train/loss_step=0.00857, global_step=2303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  18%|█▊        | 14/80 [01:22<06:01,  5.47s/it, loss=0.00511, v_num=0, train/loss_simple_step=0.00857, train/loss_vlb_step=4.53e-5, train/loss_step=0.00857, global_step=2303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  18%|█▊        | 14/80 [01:22<06:01,  5.47s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=6.48e-5, train/loss_step=0.0116, global_step=2303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  19%|█▉        | 15/80 [01:41<06:52,  6.35s/it, loss=0.00568, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=6.48e-5, train/loss_step=0.0116, global_step=2303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  19%|█▉        | 15/80 [01:41<06:52,  6.35s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=2.29e-6, train/loss_step=0.000236, global_step=2303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  20%|██        | 16/80 [01:56<07:19,  6.87s/it, loss=0.00558, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=2.29e-6, train/loss_step=0.000236, global_step=2303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  20%|██        | 16/80 [01:56<07:19,  6.87s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=7.48e-5, train/loss_step=0.00538, global_step=2303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  21%|██▏       | 17/80 [01:57<06:50,  6.52s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=7.48e-5, train/loss_step=0.00538, global_step=2303.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  21%|██▏       | 17/80 [01:57<06:50,  6.52s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=1e-6, train/loss_step=0.000222, global_step=2304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  22%|██▎       | 18/80 [01:57<06:24,  6.20s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=1e-6, train/loss_step=0.000222, global_step=2304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  22%|██▎       | 18/80 [01:57<06:24,  6.20s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=9.05e-7, train/loss_step=0.000171, global_step=2304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  24%|██▍       | 19/80 [01:58<06:01,  5.92s/it, loss=0.00561, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=9.05e-7, train/loss_step=0.000171, global_step=2304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  24%|██▍       | 19/80 [01:58<06:01,  5.93s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=2.95e-5, train/loss_step=0.0076, global_step=2304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]    Epoch 115:  25%|██▌       | 20/80 [02:07<06:04,  6.07s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0076, train/loss_vlb_step=2.95e-5, train/loss_step=0.0076, global_step=2304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  25%|██▌       | 20/80 [02:07<06:04,  6.07s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=1.9e-5, train/loss_step=0.00551, global_step=2304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  26%|██▋       | 21/80 [02:07<05:43,  5.82s/it, loss=0.00559, v_num=0, train/loss_simple_step=0.00551, train/loss_vlb_step=1.9e-5, train/loss_step=0.00551, global_step=2304.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  26%|██▋       | 21/80 [02:07<05:43,  5.82s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000693, train/loss_vlb_step=1.08e-5, train/loss_step=0.000693, global_step=2305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  28%|██▊       | 22/80 [02:08<05:23,  5.59s/it, loss=0.00556, v_num=0, train/loss_simple_step=0.000693, train/loss_vlb_step=1.08e-5, train/loss_step=0.000693, global_step=2305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  28%|██▊       | 22/80 [02:08<05:23,  5.59s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.23e-6, train/loss_step=0.00236, global_step=2305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  29%|██▉       | 23/80 [02:23<05:40,  5.97s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=8.23e-6, train/loss_step=0.00236, global_step=2305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  29%|██▉       | 23/80 [02:23<05:40,  5.97s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.13e-6, train/loss_step=0.000254, global_step=2305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  30%|███       | 24/80 [02:34<05:46,  6.19s/it, loss=0.00457, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.13e-6, train/loss_step=0.000254, global_step=2305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  30%|███       | 24/80 [02:34<05:46,  6.19s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=2.65e-5, train/loss_step=0.00737, global_step=2305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  31%|███▏      | 25/80 [02:35<05:28,  5.98s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.00737, train/loss_vlb_step=2.65e-5, train/loss_step=0.00737, global_step=2305.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  31%|███▏      | 25/80 [02:35<05:28,  5.98s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=3.77e-5, train/loss_step=0.00386, global_step=2306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  32%|███▎      | 26/80 [02:39<05:18,  5.90s/it, loss=0.00504, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=3.77e-5, train/loss_step=0.00386, global_step=2306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  32%|███▎      | 26/80 [02:39<05:18,  5.90s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.66e-5, train/loss_step=0.0068, global_step=2306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  34%|███▍      | 27/80 [02:39<05:02,  5.71s/it, loss=0.00522, v_num=0, train/loss_simple_step=0.0068, train/loss_vlb_step=3.66e-5, train/loss_step=0.0068, global_step=2306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  34%|███▍      | 27/80 [02:39<05:02,  5.71s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000517, train/loss_vlb_step=4.94e-6, train/loss_step=0.000517, global_step=2306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  35%|███▌      | 28/80 [02:52<05:10,  5.96s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.000517, train/loss_vlb_step=4.94e-6, train/loss_step=0.000517, global_step=2306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  35%|███▌      | 28/80 [02:52<05:10,  5.96s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=7.2e-6, train/loss_step=0.00202, global_step=2306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]   Epoch 115:  36%|███▋      | 29/80 [02:53<04:54,  5.78s/it, loss=0.00487, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=7.2e-6, train/loss_step=0.00202, global_step=2306.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  36%|███▋      | 29/80 [02:53<04:54,  5.78s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=7.03e-6, train/loss_step=0.00062, global_step=2307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  38%|███▊      | 30/80 [02:53<04:40,  5.61s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00062, train/loss_vlb_step=7.03e-6, train/loss_step=0.00062, global_step=2307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  38%|███▊      | 30/80 [02:53<04:40,  5.61s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=9.41e-7, train/loss_step=0.0002, global_step=2307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  39%|███▉      | 31/80 [03:10<04:51,  5.96s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0002, train/loss_vlb_step=9.41e-7, train/loss_step=0.0002, global_step=2307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  39%|███▉      | 31/80 [03:10<04:51,  5.96s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=1.66e-5, train/loss_step=0.00493, global_step=2307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  40%|████      | 32/80 [03:11<04:38,  5.79s/it, loss=0.00447, v_num=0, train/loss_simple_step=0.00493, train/loss_vlb_step=1.66e-5, train/loss_step=0.00493, global_step=2307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  40%|████      | 32/80 [03:11<04:38,  5.79s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=2.4e-5, train/loss_step=0.00623, global_step=2307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  41%|████▏     | 33/80 [03:14<04:28,  5.72s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.00623, train/loss_vlb_step=2.4e-5, train/loss_step=0.00623, global_step=2307.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  41%|████▏     | 33/80 [03:14<04:28,  5.72s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000473, train/loss_vlb_step=2.21e-6, train/loss_step=0.000473, global_step=2308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  42%|████▎     | 34/80 [03:29<04:35,  5.98s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000473, train/loss_vlb_step=2.21e-6, train/loss_step=0.000473, global_step=2308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  42%|████▎     | 34/80 [03:29<04:35,  5.98s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=1.17e-6, train/loss_step=0.000229, global_step=2308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  44%|████▍     | 35/80 [03:29<04:22,  5.83s/it, loss=0.00278, v_num=0, train/loss_simple_step=0.000229, train/loss_vlb_step=1.17e-6, train/loss_step=0.000229, global_step=2308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  44%|████▍     | 35/80 [03:29<04:22,  5.83s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.32e-5, train/loss_step=0.00873, global_step=2308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  45%|████▌     | 36/80 [03:47<04:30,  6.15s/it, loss=0.00321, v_num=0, train/loss_simple_step=0.00873, train/loss_vlb_step=4.32e-5, train/loss_step=0.00873, global_step=2308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  45%|████▌     | 36/80 [03:47<04:30,  6.15s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000135, train/loss_vlb_step=5.76e-7, train/loss_step=0.000135, global_step=2308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  46%|████▋     | 37/80 [03:48<04:18,  6.01s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.000135, train/loss_vlb_step=5.76e-7, train/loss_step=0.000135, global_step=2308.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  46%|████▋     | 37/80 [03:48<04:18,  6.01s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000108, train/loss_vlb_step=4.7e-7, train/loss_step=0.000108, global_step=2309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  48%|████▊     | 38/80 [03:48<04:06,  5.86s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000108, train/loss_vlb_step=4.7e-7, train/loss_step=0.000108, global_step=2309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  48%|████▊     | 38/80 [03:48<04:06,  5.86s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00894, train/loss_vlb_step=3.05e-5, train/loss_step=0.00894, global_step=2309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  49%|████▉     | 39/80 [04:05<04:11,  6.13s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00894, train/loss_vlb_step=3.05e-5, train/loss_step=0.00894, global_step=2309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  49%|████▉     | 39/80 [04:05<04:11,  6.13s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=8.75e-6, train/loss_step=0.00202, global_step=2309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  50%|█████     | 40/80 [04:05<03:59,  5.99s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=8.75e-6, train/loss_step=0.00202, global_step=2309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  50%|█████     | 40/80 [04:05<03:59,  5.99s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=4.81e-6, train/loss_step=0.000279, global_step=2309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  51%|█████▏    | 41/80 [04:06<03:48,  5.86s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000279, train/loss_vlb_step=4.81e-6, train/loss_step=0.000279, global_step=2309.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  51%|█████▏    | 41/80 [04:06<03:48,  5.86s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000237, train/loss_step=0.0178, global_step=2310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]   Epoch 115:  52%|█████▎    | 42/80 [04:08<03:39,  5.77s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000237, train/loss_step=0.0178, global_step=2310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  52%|█████▎    | 42/80 [04:08<03:39,  5.77s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=9.69e-6, train/loss_step=0.00267, global_step=2310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  54%|█████▍    | 43/80 [04:08<03:29,  5.65s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00267, train/loss_vlb_step=9.69e-6, train/loss_step=0.00267, global_step=2310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  54%|█████▍    | 43/80 [04:08<03:29,  5.65s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=1.37e-6, train/loss_step=0.00019, global_step=2310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  55%|█████▌    | 44/80 [04:31<03:36,  6.02s/it, loss=0.00371, v_num=0, train/loss_simple_step=0.00019, train/loss_vlb_step=1.37e-6, train/loss_step=0.00019, global_step=2310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  55%|█████▌    | 44/80 [04:31<03:36,  6.02s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=0.000605, train/loss_step=0.0016, global_step=2310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  56%|█████▋    | 45/80 [04:31<03:26,  5.90s/it, loss=0.00342, v_num=0, train/loss_simple_step=0.0016, train/loss_vlb_step=0.000605, train/loss_step=0.0016, global_step=2310.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  56%|█████▋    | 45/80 [04:31<03:26,  5.90s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000109, train/loss_vlb_step=4.02e-7, train/loss_step=0.000109, global_step=2311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  57%|█████▊    | 46/80 [04:32<03:16,  5.79s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.000109, train/loss_vlb_step=4.02e-7, train/loss_step=0.000109, global_step=2311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  57%|█████▊    | 46/80 [04:32<03:16,  5.79s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=6.84e-6, train/loss_step=0.00186, global_step=2311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  59%|█████▉    | 47/80 [04:50<03:19,  6.06s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=6.84e-6, train/loss_step=0.00186, global_step=2311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  59%|█████▉    | 47/80 [04:50<03:19,  6.06s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=5.04e-5, train/loss_step=0.00594, global_step=2311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  60%|██████    | 48/80 [04:51<03:10,  5.94s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00594, train/loss_vlb_step=5.04e-5, train/loss_step=0.00594, global_step=2311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  60%|██████    | 48/80 [04:51<03:10,  5.94s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=2.96e-6, train/loss_step=0.000253, global_step=2311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  61%|██████▏   | 49/80 [04:51<03:00,  5.84s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000253, train/loss_vlb_step=2.96e-6, train/loss_step=0.000253, global_step=2311.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  61%|██████▏   | 49/80 [04:51<03:00,  5.84s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=3.04e-5, train/loss_step=0.00131, global_step=2312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]   Epoch 115:  62%|██████▎   | 50/80 [04:52<02:51,  5.73s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00131, train/loss_vlb_step=3.04e-5, train/loss_step=0.00131, global_step=2312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  62%|██████▎   | 50/80 [04:52<02:51,  5.73s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.04e-6, train/loss_step=0.00123, global_step=2312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  64%|██████▍   | 51/80 [04:52<02:43,  5.63s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=5.04e-6, train/loss_step=0.00123, global_step=2312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  64%|██████▍   | 51/80 [04:52<02:43,  5.63s/it, loss=0.00301, v_num=0, train/loss_simple_step=6.23e-5, train/loss_vlb_step=2.64e-7, train/loss_step=6.23e-5, global_step=2312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  65%|██████▌   | 52/80 [05:14<02:46,  5.94s/it, loss=0.00301, v_num=0, train/loss_simple_step=6.23e-5, train/loss_vlb_step=2.64e-7, train/loss_step=6.23e-5, global_step=2312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  65%|██████▌   | 52/80 [05:14<02:46,  5.94s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.44e-5, train/loss_step=0.00309, global_step=2312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  66%|██████▋   | 53/80 [05:15<02:37,  5.84s/it, loss=0.00285, v_num=0, train/loss_simple_step=0.00309, train/loss_vlb_step=1.44e-5, train/loss_step=0.00309, global_step=2312.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  66%|██████▋   | 53/80 [05:15<02:37,  5.84s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=6.06e-5, train/loss_step=0.00322, global_step=2313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.00299, v_num=0, train/loss_simple_step=0.00322, train/loss_vlb_step=6.06e-5, train/loss_step=0.00322, global_step=2313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00012, train/loss_vlb_step=5.44e-7, train/loss_step=0.00012, global_step=2313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  69%|██████▉   | 55/80 [05:39<02:31,  6.07s/it, loss=0.00298, v_num=0, train/loss_simple_step=0.00012, train/loss_vlb_step=5.44e-7, train/loss_step=0.00012, global_step=2313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  69%|██████▉   | 55/80 [05:39<02:31,  6.07s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=3.22e-6, train/loss_step=0.000389, global_step=2313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  70%|███████   | 56/80 [05:40<02:23,  5.97s/it, loss=0.00257, v_num=0, train/loss_simple_step=0.000389, train/loss_vlb_step=3.22e-6, train/loss_step=0.000389, global_step=2313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  70%|███████   | 56/80 [05:40<02:23,  5.97s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.98e-6, train/loss_step=0.00128, global_step=2313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  71%|███████▏  | 57/80 [05:40<02:15,  5.87s/it, loss=0.00262, v_num=0, train/loss_simple_step=0.00128, train/loss_vlb_step=5.98e-6, train/loss_step=0.00128, global_step=2313.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  71%|███████▏  | 57/80 [05:40<02:15,  5.87s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00998, train/loss_vlb_step=5.94e-5, train/loss_step=0.00998, global_step=2314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  72%|███████▎  | 58/80 [05:41<02:07,  5.78s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00998, train/loss_vlb_step=5.94e-5, train/loss_step=0.00998, global_step=2314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  72%|███████▎  | 58/80 [05:41<02:07,  5.78s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.61e-6, train/loss_step=0.0014, global_step=2314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00274, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.61e-6, train/loss_step=0.0014, global_step=2314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  74%|███████▍  | 59/80 [05:41<01:59,  5.70s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=2.44e-6, train/loss_step=0.000441, global_step=2314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  75%|███████▌  | 60/80 [05:55<01:56,  5.83s/it, loss=0.00266, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=2.44e-6, train/loss_step=0.000441, global_step=2314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  75%|███████▌  | 60/80 [05:55<01:56,  5.83s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.71e-5, train/loss_step=0.0107, global_step=2314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]    Epoch 115:  76%|███████▋  | 61/80 [05:55<01:49,  5.74s/it, loss=0.00318, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=5.71e-5, train/loss_step=0.0107, global_step=2314.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  76%|███████▋  | 61/80 [05:55<01:49,  5.74s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=1.2e-6, train/loss_step=0.000192, global_step=2315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  78%|███████▊  | 62/80 [05:56<01:41,  5.66s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=1.2e-6, train/loss_step=0.000192, global_step=2315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  78%|███████▊  | 62/80 [05:56<01:41,  5.66s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=1.5e-5, train/loss_step=0.00421, global_step=2315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  79%|███████▉  | 63/80 [06:18<01:40,  5.91s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00421, train/loss_vlb_step=1.5e-5, train/loss_step=0.00421, global_step=2315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  79%|███████▉  | 63/80 [06:18<01:40,  5.91s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=7.4e-6, train/loss_step=0.0017, global_step=2315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 115:  80%|████████  | 64/80 [06:18<01:33,  5.83s/it, loss=0.00245, v_num=0, train/loss_simple_step=0.0017, train/loss_vlb_step=7.4e-6, train/loss_step=0.0017, global_step=2315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  80%|████████  | 64/80 [06:18<01:33,  5.83s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=7.48e-7, train/loss_step=0.000192, global_step=2315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=7.48e-7, train/loss_step=0.000192, global_step=2315.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=6e-6, train/loss_step=0.00156, global_step=2316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]     Epoch 115:  82%|████████▎ | 66/80 [06:19<01:19,  5.67s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=6e-6, train/loss_step=0.00156, global_step=2316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  82%|████████▎ | 66/80 [06:19<01:19,  5.67s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=9.88e-6, train/loss_step=0.00293, global_step=2316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  84%|████████▍ | 67/80 [06:20<01:12,  5.59s/it, loss=0.00251, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=9.88e-6, train/loss_step=0.00293, global_step=2316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  84%|████████▍ | 67/80 [06:20<01:12,  5.59s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.0002, train/loss_step=0.0124, global_step=2316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]   Epoch 115:  85%|████████▌ | 68/80 [06:36<01:09,  5.75s/it, loss=0.00283, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=0.0002, train/loss_step=0.0124, global_step=2316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  85%|████████▌ | 68/80 [06:36<01:09,  5.75s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=2.66e-6, train/loss_step=0.000537, global_step=2316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00284, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=2.66e-6, train/loss_step=0.000537, global_step=2316.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  86%|████████▋ | 69/80 [06:37<01:02,  5.68s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=2.48e-5, train/loss_step=0.0073, global_step=2317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]    Epoch 115:  88%|████████▊ | 70/80 [06:37<00:56,  5.61s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.0073, train/loss_vlb_step=2.48e-5, train/loss_step=0.0073, global_step=2317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  88%|████████▊ | 70/80 [06:37<00:56,  5.61s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.03e-5, train/loss_step=0.00156, global_step=2317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  89%|████████▉ | 71/80 [06:52<00:51,  5.73s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.03e-5, train/loss_step=0.00156, global_step=2317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  89%|████████▉ | 71/80 [06:52<00:51,  5.73s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=1.1e-6, train/loss_step=0.000297, global_step=2317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  90%|█████████ | 72/80 [06:53<00:45,  5.66s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000297, train/loss_vlb_step=1.1e-6, train/loss_step=0.000297, global_step=2317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  90%|█████████ | 72/80 [06:53<00:45,  5.66s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.57e-5, train/loss_step=0.00469, global_step=2317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  91%|█████████▏| 73/80 [06:53<00:39,  5.59s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.00469, train/loss_vlb_step=1.57e-5, train/loss_step=0.00469, global_step=2317.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  91%|█████████▏| 73/80 [06:53<00:39,  5.59s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=8.72e-5, train/loss_step=0.0161, global_step=2318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]   Epoch 115:  92%|█████████▎| 74/80 [06:54<00:33,  5.52s/it, loss=0.0039, v_num=0, train/loss_simple_step=0.0161, train/loss_vlb_step=8.72e-5, train/loss_step=0.0161, global_step=2318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  92%|█████████▎| 74/80 [06:54<00:33,  5.52s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=2.97e-6, train/loss_step=0.000431, global_step=2318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  94%|█████████▍| 75/80 [06:54<00:27,  5.45s/it, loss=0.00391, v_num=0, train/loss_simple_step=0.000431, train/loss_vlb_step=2.97e-6, train/loss_step=0.000431, global_step=2318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  94%|█████████▍| 75/80 [06:54<00:27,  5.45s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000841, train/loss_vlb_step=3.99e-6, train/loss_step=0.000841, global_step=2318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  95%|█████████▌| 76/80 [07:08<00:22,  5.56s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000841, train/loss_vlb_step=3.99e-6, train/loss_step=0.000841, global_step=2318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  95%|█████████▌| 76/80 [07:08<00:22,  5.56s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.5e-6, train/loss_step=0.00118, global_step=2318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]   Epoch 115:  96%|█████████▋| 77/80 [07:10<00:16,  5.52s/it, loss=0.00393, v_num=0, train/loss_simple_step=0.00118, train/loss_vlb_step=5.5e-6, train/loss_step=0.00118, global_step=2318.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  96%|█████████▋| 77/80 [07:10<00:16,  5.52s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=2.19e-6, train/loss_step=0.000477, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000477, train/loss_vlb_step=2.19e-6, train/loss_step=0.000477, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  98%|█████████▊| 78/80 [07:11<00:10,  5.46s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=8.39e-7, train/loss_step=0.000218, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115:  99%|█████████▉| 79/80 [07:11<00:05,  5.40s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000218, train/loss_vlb_step=8.39e-7, train/loss_step=0.000218, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115:  99%|█████████▉| 79/80 [07:11<00:05,  5.40s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=5.78e-5, train/loss_step=0.00593, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418] Epoch 115: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.00593, train/loss_vlb_step=5.78e-5, train/loss_step=0.00593, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 115: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2.61e-6, train/loss_step=0.000398, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Average Epoch time: 432.32 seconds
+Average Peak memory 29566.50MiB
+Epoch 115:   0%|          | 0/80 [00:00<00:00, 4315.13it/s, loss=0.00316, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2.61e-6, train/loss_step=0.000398, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 116:   0%|          | 0/80 [00:00<00:00, 1760.83it/s, loss=0.00316, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2.61e-6, train/loss_step=0.000398, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]Epoch 116:   1%|▏         | 1/80 [00:42<27:45, 21.08s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000398, train/loss_vlb_step=2.61e-6, train/loss_step=0.000398, global_step=2319.0, lr_abs=0.0001, train/loss_simple_epoch=0.00418, train/loss_vlb_epoch=7.21e-5, train/loss_epoch=0.00418]  Epoch 116:   1%|▏         | 1/80 [00:42<27:45, 21.08s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.76e-6, train/loss_step=0.000333, global_step=2320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   2%|▎         | 2/80 [00:42<18:28, 14.22s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000333, train/loss_vlb_step=1.76e-6, train/loss_step=0.000333, global_step=2320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   2%|▎         | 2/80 [00:42<18:28, 14.22s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=3.67e-5, train/loss_step=0.00532, global_step=2320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]  Epoch 116:   4%|▍         | 3/80 [00:43<13:50, 10.79s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.00532, train/loss_vlb_step=3.67e-5, train/loss_step=0.00532, global_step=2320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   4%|▍         | 3/80 [00:43<13:50, 10.79s/it, loss=0.00314, v_num=0, train/loss_simple_step=8.36e-5, train/loss_vlb_step=2.85e-7, train/loss_step=8.36e-5, global_step=2320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   5%|▌         | 4/80 [00:43<11:03,  8.73s/it, loss=0.00314, v_num=0, train/loss_simple_step=8.36e-5, train/loss_vlb_step=2.85e-7, train/loss_step=8.36e-5, global_step=2320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   5%|▌         | 4/80 [00:43<11:03,  8.73s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=1.64e-6, train/loss_step=0.000213, global_step=2320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   6%|▋         | 5/80 [00:44<09:12,  7.36s/it, loss=0.00314, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=1.64e-6, train/loss_step=0.000213, global_step=2320.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   6%|▋         | 5/80 [00:44<09:12,  7.36s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=0.000272, train/loss_step=0.00203, global_step=2321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:   8%|▊         | 6/80 [00:44<07:52,  6.38s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=0.000272, train/loss_step=0.00203, global_step=2321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   8%|▊         | 6/80 [00:44<07:52,  6.38s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000128, train/loss_vlb_step=6.66e-7, train/loss_step=0.000128, global_step=2321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   9%|▉         | 7/80 [00:45<06:51,  5.64s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000128, train/loss_vlb_step=6.66e-7, train/loss_step=0.000128, global_step=2321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:   9%|▉         | 7/80 [00:45<06:51,  5.64s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.9e-6, train/loss_step=0.000392, global_step=2321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  10%|█         | 8/80 [01:24<11:19,  9.44s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.000392, train/loss_vlb_step=1.9e-6, train/loss_step=0.000392, global_step=2321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  10%|█         | 8/80 [01:24<11:19,  9.44s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.87e-6, train/loss_step=0.00148, global_step=2321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  11%|█▏        | 9/80 [01:25<10:06,  8.54s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.87e-6, train/loss_step=0.00148, global_step=2321.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  11%|█▏        | 9/80 [01:25<10:06,  8.54s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=3.69e-5, train/loss_step=0.00238, global_step=2322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  12%|█▎        | 10/80 [01:25<09:06,  7.81s/it, loss=0.00223, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=3.69e-5, train/loss_step=0.00238, global_step=2322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  12%|█▎        | 10/80 [01:25<09:06,  7.81s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.000571, train/loss_vlb_step=8.74e-6, train/loss_step=0.000571, global_step=2322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  14%|█▍        | 11/80 [01:26<08:16,  7.20s/it, loss=0.00218, v_num=0, train/loss_simple_step=0.000571, train/loss_vlb_step=8.74e-6, train/loss_step=0.000571, global_step=2322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  14%|█▍        | 11/80 [01:26<08:16,  7.20s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.2e-5, train/loss_step=0.00332, global_step=2322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]   Epoch 116:  15%|█▌        | 12/80 [01:26<07:34,  6.69s/it, loss=0.00233, v_num=0, train/loss_simple_step=0.00332, train/loss_vlb_step=1.2e-5, train/loss_step=0.00332, global_step=2322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  15%|█▌        | 12/80 [01:26<07:34,  6.69s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=1.07e-6, train/loss_step=0.000189, global_step=2322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  16%|█▋        | 13/80 [01:27<06:58,  6.25s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=1.07e-6, train/loss_step=0.000189, global_step=2322.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  16%|█▋        | 13/80 [01:27<06:58,  6.25s/it, loss=0.00175, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=8.14e-5, train/loss_step=0.00905, global_step=2323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  18%|█▊        | 14/80 [01:28<06:27,  5.87s/it, loss=0.00175, v_num=0, train/loss_simple_step=0.00905, train/loss_vlb_step=8.14e-5, train/loss_step=0.00905, global_step=2323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  18%|█▊        | 14/80 [01:28<06:27,  5.87s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.000198, train/loss_vlb_step=1.3e-6, train/loss_step=0.000198, global_step=2323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  19%|█▉        | 15/80 [01:28<05:59,  5.53s/it, loss=0.00174, v_num=0, train/loss_simple_step=0.000198, train/loss_vlb_step=1.3e-6, train/loss_step=0.000198, global_step=2323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  19%|█▉        | 15/80 [01:28<05:59,  5.53s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=3.95e-5, train/loss_step=0.0112, global_step=2323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]   Epoch 116:  20%|██        | 16/80 [02:16<08:35,  8.05s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.0112, train/loss_vlb_step=3.95e-5, train/loss_step=0.0112, global_step=2323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  20%|██        | 16/80 [02:16<08:35,  8.05s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=4.12e-5, train/loss_step=0.00365, global_step=2323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  21%|██▏       | 17/80 [02:17<08:00,  7.63s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.00365, train/loss_vlb_step=4.12e-5, train/loss_step=0.00365, global_step=2323.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  21%|██▏       | 17/80 [02:17<08:00,  7.63s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000539, train/loss_vlb_step=2.32e-6, train/loss_step=0.000539, global_step=2324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  22%|██▎       | 18/80 [02:17<07:29,  7.25s/it, loss=0.00238, v_num=0, train/loss_simple_step=0.000539, train/loss_vlb_step=2.32e-6, train/loss_step=0.000539, global_step=2324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  22%|██▎       | 18/80 [02:17<07:29,  7.25s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.81e-5, train/loss_step=0.00706, global_step=2324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]  Epoch 116:  24%|██▍       | 19/80 [02:18<07:01,  6.92s/it, loss=0.00272, v_num=0, train/loss_simple_step=0.00706, train/loss_vlb_step=2.81e-5, train/loss_step=0.00706, global_step=2324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  24%|██▍       | 19/80 [02:18<07:01,  6.92s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.000754, train/loss_vlb_step=6.72e-6, train/loss_step=0.000754, global_step=2324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  25%|██▌       | 20/80 [02:18<06:36,  6.61s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.000754, train/loss_vlb_step=6.72e-6, train/loss_step=0.000754, global_step=2324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  25%|██▌       | 20/80 [02:18<06:36,  6.61s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000936, train/loss_vlb_step=7.22e-5, train/loss_step=0.000936, global_step=2324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  26%|██▋       | 21/80 [02:19<06:13,  6.33s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.000936, train/loss_vlb_step=7.22e-5, train/loss_step=0.000936, global_step=2324.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  26%|██▋       | 21/80 [02:19<06:13,  6.33s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=2.53e-6, train/loss_step=0.000549, global_step=2325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.0025, v_num=0, train/loss_simple_step=0.000549, train/loss_vlb_step=2.53e-6, train/loss_step=0.000549, global_step=2325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  28%|██▊       | 22/80 [02:19<05:52,  6.08s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.34e-5, train/loss_step=0.00362, global_step=2325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00362, train/loss_vlb_step=1.34e-5, train/loss_step=0.00362, global_step=2325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  29%|██▉       | 23/80 [02:20<05:33,  5.85s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.53e-6, train/loss_step=0.000299, global_step=2325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  30%|███       | 24/80 [02:42<06:04,  6.51s/it, loss=0.00243, v_num=0, train/loss_simple_step=0.000299, train/loss_vlb_step=1.53e-6, train/loss_step=0.000299, global_step=2325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  30%|███       | 24/80 [02:42<06:04,  6.51s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=0.000164, train/loss_step=0.00102, global_step=2325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  31%|███▏      | 25/80 [02:50<06:01,  6.57s/it, loss=0.00247, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=0.000164, train/loss_step=0.00102, global_step=2325.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  31%|███▏      | 25/80 [02:50<06:01,  6.57s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=9.63e-6, train/loss_step=0.000747, global_step=2326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  32%|███▎      | 26/80 [02:51<05:42,  6.34s/it, loss=0.0024, v_num=0, train/loss_simple_step=0.000747, train/loss_vlb_step=9.63e-6, train/loss_step=0.000747, global_step=2326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  32%|███▎      | 26/80 [02:51<05:42,  6.34s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=0.00114, train/loss_step=0.00292, global_step=2326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  34%|███▍      | 27/80 [02:51<05:25,  6.13s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=0.00114, train/loss_step=0.00292, global_step=2326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  34%|███▍      | 27/80 [02:51<05:25,  6.14s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.44e-5, train/loss_step=0.012, global_step=2326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]    Epoch 116:  35%|███▌      | 28/80 [02:52<05:09,  5.95s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.44e-5, train/loss_step=0.012, global_step=2326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  35%|███▌      | 28/80 [02:52<05:09,  5.95s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=1.87e-5, train/loss_step=0.00164, global_step=2326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  36%|███▋      | 29/80 [02:52<04:53,  5.76s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00164, train/loss_vlb_step=1.87e-5, train/loss_step=0.00164, global_step=2326.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  36%|███▋      | 29/80 [02:52<04:53,  5.76s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.3e-5, train/loss_step=0.0036, global_step=2327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]   Epoch 116:  38%|███▊      | 30/80 [02:53<04:39,  5.59s/it, loss=0.00319, v_num=0, train/loss_simple_step=0.0036, train/loss_vlb_step=1.3e-5, train/loss_step=0.0036, global_step=2327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  38%|███▊      | 30/80 [02:53<04:39,  5.59s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=2.62e-6, train/loss_step=0.000658, global_step=2327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  39%|███▉      | 31/80 [02:53<04:26,  5.44s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000658, train/loss_vlb_step=2.62e-6, train/loss_step=0.000658, global_step=2327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  39%|███▉      | 31/80 [02:53<04:26,  5.44s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=8.05e-6, train/loss_step=0.00185, global_step=2327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  40%|████      | 32/80 [03:24<04:56,  6.18s/it, loss=0.00312, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=8.05e-6, train/loss_step=0.00185, global_step=2327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  40%|████      | 32/80 [03:24<04:56,  6.18s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=5.73e-6, train/loss_step=0.000893, global_step=2327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  41%|████▏     | 33/80 [03:34<04:56,  6.31s/it, loss=0.00316, v_num=0, train/loss_simple_step=0.000893, train/loss_vlb_step=5.73e-6, train/loss_step=0.000893, global_step=2327.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  41%|████▏     | 33/80 [03:34<04:56,  6.31s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=1.72e-5, train/loss_step=0.00485, global_step=2328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]  Epoch 116:  42%|████▎     | 34/80 [03:35<04:42,  6.15s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00485, train/loss_vlb_step=1.72e-5, train/loss_step=0.00485, global_step=2328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  42%|████▎     | 34/80 [03:35<04:42,  6.15s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=0.000101, train/loss_step=0.0129, global_step=2328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  44%|████▍     | 35/80 [03:35<04:29,  5.99s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.0129, train/loss_vlb_step=0.000101, train/loss_step=0.0129, global_step=2328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  44%|████▍     | 35/80 [03:35<04:29,  5.99s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000458, train/loss_vlb_step=2.05e-6, train/loss_step=0.000458, global_step=2328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  45%|████▌     | 36/80 [03:36<04:17,  5.84s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000458, train/loss_vlb_step=2.05e-6, train/loss_step=0.000458, global_step=2328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  45%|████▌     | 36/80 [03:36<04:17,  5.84s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.11e-5, train/loss_step=0.00317, global_step=2328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]  Epoch 116:  46%|████▋     | 37/80 [03:36<04:05,  5.70s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.00317, train/loss_vlb_step=1.11e-5, train/loss_step=0.00317, global_step=2328.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  46%|████▋     | 37/80 [03:36<04:05,  5.70s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=8.84e-7, train/loss_step=0.000222, global_step=2329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  48%|████▊     | 38/80 [03:37<03:53,  5.57s/it, loss=0.00301, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=8.84e-7, train/loss_step=0.000222, global_step=2329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  48%|████▊     | 38/80 [03:37<03:53,  5.57s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.85e-5, train/loss_step=0.0151, global_step=2329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]    Epoch 116:  49%|████▉     | 39/80 [03:37<03:43,  5.44s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.0151, train/loss_vlb_step=6.85e-5, train/loss_step=0.0151, global_step=2329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  49%|████▉     | 39/80 [03:37<03:43,  5.44s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.19e-5, train/loss_step=0.017, global_step=2329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]  Epoch 116:  50%|█████     | 40/80 [04:06<04:00,  6.01s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.017, train/loss_vlb_step=7.19e-5, train/loss_step=0.017, global_step=2329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  50%|█████     | 40/80 [04:06<04:00,  6.01s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=6.72e-6, train/loss_step=0.000294, global_step=2329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  51%|█████▏    | 41/80 [04:15<03:57,  6.08s/it, loss=0.00419, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=6.72e-6, train/loss_step=0.000294, global_step=2329.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  51%|█████▏    | 41/80 [04:15<03:57,  6.08s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000151, train/loss_vlb_step=6.01e-7, train/loss_step=0.000151, global_step=2330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  52%|█████▎    | 42/80 [04:16<03:46,  5.95s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000151, train/loss_vlb_step=6.01e-7, train/loss_step=0.000151, global_step=2330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  52%|█████▎    | 42/80 [04:16<03:46,  5.95s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=1.71e-5, train/loss_step=0.00502, global_step=2330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]  Epoch 116:  54%|█████▍    | 43/80 [04:16<03:35,  5.83s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.00502, train/loss_vlb_step=1.71e-5, train/loss_step=0.00502, global_step=2330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  54%|█████▍    | 43/80 [04:16<03:35,  5.83s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000158, train/loss_vlb_step=5.93e-7, train/loss_step=0.000158, global_step=2330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  55%|█████▌    | 44/80 [04:17<03:25,  5.71s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.000158, train/loss_vlb_step=5.93e-7, train/loss_step=0.000158, global_step=2330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  55%|█████▌    | 44/80 [04:17<03:25,  5.71s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=5.6e-6, train/loss_step=0.000524, global_step=2330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  56%|█████▋    | 45/80 [04:17<03:16,  5.60s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000524, train/loss_vlb_step=5.6e-6, train/loss_step=0.000524, global_step=2330.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  56%|█████▋    | 45/80 [04:17<03:16,  5.60s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=1.49e-6, train/loss_step=0.000228, global_step=2331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  57%|█████▊    | 46/80 [04:18<03:06,  5.49s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=1.49e-6, train/loss_step=0.000228, global_step=2331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  57%|█████▊    | 46/80 [04:18<03:06,  5.49s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=0.00016, train/loss_step=0.0225, global_step=2331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]    Epoch 116:  59%|█████▉    | 47/80 [04:18<02:57,  5.39s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.0225, train/loss_vlb_step=0.00016, train/loss_step=0.0225, global_step=2331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  59%|█████▉    | 47/80 [04:18<02:57,  5.39s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=3.4e-6, train/loss_step=0.000342, global_step=2331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  60%|██████    | 48/80 [04:52<03:11,  5.97s/it, loss=0.00458, v_num=0, train/loss_simple_step=0.000342, train/loss_vlb_step=3.4e-6, train/loss_step=0.000342, global_step=2331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  60%|██████    | 48/80 [04:52<03:11,  5.97s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.14e-6, train/loss_step=0.000295, global_step=2331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  61%|██████▏   | 49/80 [05:00<03:06,  6.00s/it, loss=0.00451, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=1.14e-6, train/loss_step=0.000295, global_step=2331.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  61%|██████▏   | 49/80 [05:00<03:06,  6.00s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=9.45e-7, train/loss_step=0.000199, global_step=2332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=9.45e-7, train/loss_step=0.000199, global_step=2332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  62%|██████▎   | 50/80 [05:00<02:56,  5.89s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000136, train/loss_vlb_step=6.42e-7, train/loss_step=0.000136, global_step=2332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  64%|██████▍   | 51/80 [05:01<02:47,  5.79s/it, loss=0.00432, v_num=0, train/loss_simple_step=0.000136, train/loss_vlb_step=6.42e-7, train/loss_step=0.000136, global_step=2332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  64%|██████▍   | 51/80 [05:01<02:47,  5.79s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0004, train/loss_vlb_step=9.07e-6, train/loss_step=0.0004, global_step=2332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]    Epoch 116:  65%|██████▌   | 52/80 [05:01<02:39,  5.69s/it, loss=0.00424, v_num=0, train/loss_simple_step=0.0004, train/loss_vlb_step=9.07e-6, train/loss_step=0.0004, global_step=2332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  65%|██████▌   | 52/80 [05:01<02:39,  5.69s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.17e-5, train/loss_step=0.00231, global_step=2332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  66%|██████▋   | 53/80 [05:02<02:31,  5.60s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00231, train/loss_vlb_step=1.17e-5, train/loss_step=0.00231, global_step=2332.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  66%|██████▋   | 53/80 [05:02<02:31,  5.60s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00016, train/loss_vlb_step=5.85e-7, train/loss_step=0.00016, global_step=2333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  68%|██████▊   | 54/80 [05:02<02:23,  5.50s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00016, train/loss_vlb_step=5.85e-7, train/loss_step=0.00016, global_step=2333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  68%|██████▊   | 54/80 [05:02<02:23,  5.50s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=9.26e-6, train/loss_step=0.00235, global_step=2333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  69%|██████▉   | 55/80 [05:03<02:15,  5.41s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00235, train/loss_vlb_step=9.26e-6, train/loss_step=0.00235, global_step=2333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  69%|██████▉   | 55/80 [05:03<02:15,  5.41s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=7.55e-6, train/loss_step=0.00203, global_step=2333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  70%|███████   | 56/80 [05:42<02:24,  6.02s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.00203, train/loss_vlb_step=7.55e-6, train/loss_step=0.00203, global_step=2333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  70%|███████   | 56/80 [05:42<02:24,  6.02s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.51e-5, train/loss_step=0.00337, global_step=2333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  71%|███████▏  | 57/80 [05:43<02:16,  5.92s/it, loss=0.00364, v_num=0, train/loss_simple_step=0.00337, train/loss_vlb_step=1.51e-5, train/loss_step=0.00337, global_step=2333.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  71%|███████▏  | 57/80 [05:43<02:16,  5.92s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=5.33e-5, train/loss_step=0.00831, global_step=2334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  72%|███████▎  | 58/80 [05:43<02:08,  5.83s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00831, train/loss_vlb_step=5.33e-5, train/loss_step=0.00831, global_step=2334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  72%|███████▎  | 58/80 [05:43<02:08,  5.83s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.3e-6, train/loss_step=0.000351, global_step=2334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  74%|███████▍  | 59/80 [05:44<02:00,  5.74s/it, loss=0.00331, v_num=0, train/loss_simple_step=0.000351, train/loss_vlb_step=1.3e-6, train/loss_step=0.000351, global_step=2334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  74%|███████▍  | 59/80 [05:44<02:00,  5.74s/it, loss=0.00246, v_num=0, train/loss_simple_step=4.87e-5, train/loss_vlb_step=2.39e-7, train/loss_step=4.87e-5, global_step=2334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  75%|███████▌  | 60/80 [05:46<01:53,  5.69s/it, loss=0.00246, v_num=0, train/loss_simple_step=4.87e-5, train/loss_vlb_step=2.39e-7, train/loss_step=4.87e-5, global_step=2334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  75%|███████▌  | 60/80 [05:46<01:53,  5.69s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=0.000198, train/loss_step=0.00156, global_step=2334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  76%|███████▋  | 61/80 [05:47<01:46,  5.61s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=0.000198, train/loss_step=0.00156, global_step=2334.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  76%|███████▋  | 61/80 [05:47<01:46,  5.61s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=6.56e-7, train/loss_step=0.000164, global_step=2335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  78%|███████▊  | 62/80 [05:48<01:39,  5.53s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.000164, train/loss_vlb_step=6.56e-7, train/loss_step=0.000164, global_step=2335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  78%|███████▊  | 62/80 [05:48<01:39,  5.53s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=2.22e-6, train/loss_step=0.000472, global_step=2335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  79%|███████▉  | 63/80 [05:48<01:32,  5.45s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000472, train/loss_vlb_step=2.22e-6, train/loss_step=0.000472, global_step=2335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  79%|███████▉  | 63/80 [05:48<01:32,  5.45s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000152, train/loss_vlb_step=1.52e-6, train/loss_step=0.000152, global_step=2335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  80%|████████  | 64/80 [06:31<01:36,  6.03s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000152, train/loss_vlb_step=1.52e-6, train/loss_step=0.000152, global_step=2335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  80%|████████  | 64/80 [06:31<01:36,  6.03s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=3.09e-6, train/loss_step=0.000883, global_step=2335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  81%|████████▏ | 65/80 [06:32<01:29,  5.95s/it, loss=0.00231, v_num=0, train/loss_simple_step=0.000883, train/loss_vlb_step=3.09e-6, train/loss_step=0.000883, global_step=2335.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  81%|████████▏ | 65/80 [06:32<01:29,  5.95s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000144, train/loss_step=0.0178, global_step=2336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]    Epoch 116:  82%|████████▎ | 66/80 [06:33<01:22,  5.87s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.0178, train/loss_vlb_step=0.000144, train/loss_step=0.0178, global_step=2336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  82%|████████▎ | 66/80 [06:33<01:22,  5.87s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=3.93e-6, train/loss_step=0.000332, global_step=2336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  84%|████████▍ | 67/80 [06:33<01:15,  5.79s/it, loss=0.00209, v_num=0, train/loss_simple_step=0.000332, train/loss_vlb_step=3.93e-6, train/loss_step=0.000332, global_step=2336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  84%|████████▍ | 67/80 [06:33<01:15,  5.79s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000665, train/loss_vlb_step=2.57e-6, train/loss_step=0.000665, global_step=2336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  85%|████████▌ | 68/80 [06:34<01:08,  5.71s/it, loss=0.0021, v_num=0, train/loss_simple_step=0.000665, train/loss_vlb_step=2.57e-6, train/loss_step=0.000665, global_step=2336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  85%|████████▌ | 68/80 [06:34<01:08,  5.71s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=3.99e-5, train/loss_step=0.00922, global_step=2336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386] Epoch 116:  86%|████████▋ | 69/80 [06:34<01:02,  5.64s/it, loss=0.00255, v_num=0, train/loss_simple_step=0.00922, train/loss_vlb_step=3.99e-5, train/loss_step=0.00922, global_step=2336.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  86%|████████▋ | 69/80 [06:34<01:02,  5.64s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.15e-5, train/loss_step=0.00233, global_step=2337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  88%|████████▊ | 70/80 [06:35<00:55,  5.56s/it, loss=0.00265, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=1.15e-5, train/loss_step=0.00233, global_step=2337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  88%|████████▊ | 70/80 [06:35<00:55,  5.56s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=2.06e-6, train/loss_step=0.00051, global_step=2337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  89%|████████▉ | 71/80 [06:35<00:49,  5.49s/it, loss=0.00267, v_num=0, train/loss_simple_step=0.00051, train/loss_vlb_step=2.06e-6, train/loss_step=0.00051, global_step=2337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  89%|████████▉ | 71/80 [06:35<00:49,  5.49s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=8.72e-6, train/loss_step=0.000582, global_step=2337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  90%|█████████ | 72/80 [07:07<00:46,  5.85s/it, loss=0.00268, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=8.72e-6, train/loss_step=0.000582, global_step=2337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  90%|█████████ | 72/80 [07:07<00:46,  5.85s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.63e-6, train/loss_step=0.000321, global_step=2337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  91%|█████████▏| 73/80 [07:07<00:40,  5.78s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.63e-6, train/loss_step=0.000321, global_step=2337.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  91%|█████████▏| 73/80 [07:07<00:40,  5.78s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=8.16e-7, train/loss_step=0.000189, global_step=2338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  92%|█████████▎| 74/80 [07:08<00:34,  5.71s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.000189, train/loss_vlb_step=8.16e-7, train/loss_step=0.000189, global_step=2338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  92%|█████████▎| 74/80 [07:08<00:34,  5.71s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=0.00116, train/loss_step=0.00293, global_step=2338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]  Epoch 116:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00261, v_num=0, train/loss_simple_step=0.00293, train/loss_vlb_step=0.00116, train/loss_step=0.00293, global_step=2338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  94%|█████████▍| 75/80 [07:08<00:28,  5.64s/it, loss=0.00252, v_num=0, train/loss_simple_step=8.43e-5, train/loss_vlb_step=3.55e-7, train/loss_step=8.43e-5, global_step=2338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  95%|█████████▌| 76/80 [07:09<00:22,  5.58s/it, loss=0.00252, v_num=0, train/loss_simple_step=8.43e-5, train/loss_vlb_step=3.55e-7, train/loss_step=8.43e-5, global_step=2338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  95%|█████████▌| 76/80 [07:09<00:22,  5.58s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00013, train/loss_vlb_step=4.92e-7, train/loss_step=0.00013, global_step=2338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00235, v_num=0, train/loss_simple_step=0.00013, train/loss_vlb_step=4.92e-7, train/loss_step=0.00013, global_step=2338.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  96%|█████████▋| 77/80 [07:09<00:16,  5.51s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=2.2e-5, train/loss_step=0.0066, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]   Epoch 116:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00227, v_num=0, train/loss_simple_step=0.0066, train/loss_vlb_step=2.2e-5, train/loss_step=0.0066, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  98%|█████████▊| 78/80 [07:10<00:10,  5.45s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.00332, train/loss_step=0.0263, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00357, v_num=0, train/loss_simple_step=0.0263, train/loss_vlb_step=0.00332, train/loss_step=0.0263, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116:  99%|█████████▉| 79/80 [07:10<00:05,  5.38s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=0.000143, train/loss_step=0.00896, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116: 100%|██████████| 80/80 [07:11<00:00,  5.32s/it, loss=0.00401, v_num=0, train/loss_simple_step=0.00896, train/loss_vlb_step=0.000143, train/loss_step=0.00896, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 116: 100%|██████████| 80/80 [07:11<00:00,  5.32s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=7.03e-7, train/loss_step=0.000154, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Average Epoch time: 431.26 seconds
+Average Peak memory 29564.27MiB
+Epoch 116:   0%|          | 0/80 [00:00<00:00, 3443.60it/s, loss=0.00394, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=7.03e-7, train/loss_step=0.000154, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 117:   0%|          | 0/80 [00:00<00:00, 1555.17it/s, loss=0.00394, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=7.03e-7, train/loss_step=0.000154, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]Epoch 117:   1%|▏         | 1/80 [00:44<29:36, 22.48s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.000154, train/loss_vlb_step=7.03e-7, train/loss_step=0.000154, global_step=2339.0, lr_abs=0.0001, train/loss_simple_epoch=0.00386, train/loss_vlb_epoch=7.88e-5, train/loss_epoch=0.00386]  Epoch 117:   1%|▏         | 1/80 [00:44<29:36, 22.48s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=0.000235, train/loss_step=0.00214, global_step=2340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:   2%|▎         | 2/80 [00:45<19:41, 15.15s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=0.000235, train/loss_step=0.00214, global_step=2340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:   2%|▎         | 2/80 [00:45<19:41, 15.15s/it, loss=0.00402, v_num=0, train/loss_simple_step=7.94e-5, train/loss_vlb_step=3.07e-7, train/loss_step=7.94e-5, global_step=2340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:   4%|▍         | 3/80 [00:52<16:49, 13.11s/it, loss=0.00402, v_num=0, train/loss_simple_step=7.94e-5, train/loss_vlb_step=3.07e-7, train/loss_step=7.94e-5, global_step=2340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:   4%|▍         | 3/80 [00:52<16:49, 13.11s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.19e-5, train/loss_step=0.00201, global_step=2340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:   5%|▌         | 4/80 [00:52<13:25, 10.59s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00201, train/loss_vlb_step=1.19e-5, train/loss_step=0.00201, global_step=2340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:   5%|▌         | 4/80 [00:52<13:25, 10.59s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=2.69e-5, train/loss_step=0.00682, global_step=2340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:   6%|▋         | 5/80 [00:53<11:08,  8.91s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.00682, train/loss_vlb_step=2.69e-5, train/loss_step=0.00682, global_step=2340.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:   6%|▋         | 5/80 [00:53<11:08,  8.91s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=0.000158, train/loss_step=0.00256, global_step=2341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:   8%|▊         | 6/80 [00:53<09:30,  7.71s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.00256, train/loss_vlb_step=0.000158, train/loss_step=0.00256, global_step=2341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:   8%|▊         | 6/80 [00:53<09:30,  7.71s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=3.63e-5, train/loss_step=0.00948, global_step=2341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 117:   9%|▉         | 7/80 [00:54<08:17,  6.81s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00948, train/loss_vlb_step=3.63e-5, train/loss_step=0.00948, global_step=2341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:   9%|▉         | 7/80 [00:54<08:17,  6.81s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=8.65e-6, train/loss_step=0.00199, global_step=2341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  10%|█         | 8/80 [01:27<11:43,  9.77s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.00199, train/loss_vlb_step=8.65e-6, train/loss_step=0.00199, global_step=2341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  10%|█         | 8/80 [01:27<11:43,  9.77s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.84e-6, train/loss_step=0.000336, global_step=2341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  11%|█▏        | 9/80 [01:28<10:27,  8.84s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=1.84e-6, train/loss_step=0.000336, global_step=2341.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  11%|█▏        | 9/80 [01:28<10:27,  8.84s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=0.000971, train/loss_step=0.0206, global_step=2342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]   Epoch 117:  12%|█▎        | 10/80 [01:28<09:25,  8.08s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=0.000971, train/loss_step=0.0206, global_step=2342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  12%|█▎        | 10/80 [01:28<09:25,  8.08s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=1.72e-6, train/loss_step=0.000434, global_step=2342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  14%|█▍        | 11/80 [01:29<08:34,  7.45s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000434, train/loss_vlb_step=1.72e-6, train/loss_step=0.000434, global_step=2342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  14%|█▍        | 11/80 [01:29<08:34,  7.45s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000542, train/loss_vlb_step=2.77e-6, train/loss_step=0.000542, global_step=2342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  15%|█▌        | 12/80 [01:32<08:03,  7.11s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000542, train/loss_vlb_step=2.77e-6, train/loss_step=0.000542, global_step=2342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  15%|█▌        | 12/80 [01:32<08:03,  7.11s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.18e-6, train/loss_step=0.000344, global_step=2342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  16%|█▋        | 13/80 [01:32<07:25,  6.64s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000344, train/loss_vlb_step=1.18e-6, train/loss_step=0.000344, global_step=2342.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  16%|█▋        | 13/80 [01:32<07:25,  6.64s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=7.49e-6, train/loss_step=0.00214, global_step=2343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 117:  18%|█▊        | 14/80 [01:33<06:51,  6.23s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.00214, train/loss_vlb_step=7.49e-6, train/loss_step=0.00214, global_step=2343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  18%|█▊        | 14/80 [01:33<06:51,  6.23s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000234, train/loss_vlb_step=1.47e-6, train/loss_step=0.000234, global_step=2343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  19%|█▉        | 15/80 [01:33<06:21,  5.87s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.000234, train/loss_vlb_step=1.47e-6, train/loss_step=0.000234, global_step=2343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  19%|█▉        | 15/80 [01:33<06:21,  5.87s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=4.63e-6, train/loss_step=0.00123, global_step=2343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:  20%|██        | 16/80 [02:03<07:46,  7.28s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00123, train/loss_vlb_step=4.63e-6, train/loss_step=0.00123, global_step=2343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  20%|██        | 16/80 [02:03<07:46,  7.28s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=4.38e-5, train/loss_step=0.00764, global_step=2343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  21%|██▏       | 17/80 [02:04<07:15,  6.91s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00764, train/loss_vlb_step=4.38e-5, train/loss_step=0.00764, global_step=2343.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  21%|██▏       | 17/80 [02:04<07:15,  6.91s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=2.55e-5, train/loss_step=0.00739, global_step=2344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  22%|██▎       | 18/80 [02:04<06:47,  6.57s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.00739, train/loss_vlb_step=2.55e-5, train/loss_step=0.00739, global_step=2344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  22%|██▎       | 18/80 [02:04<06:47,  6.57s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=0.000102, train/loss_step=0.0116, global_step=2344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:  24%|██▍       | 19/80 [02:16<06:57,  6.84s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.0116, train/loss_vlb_step=0.000102, train/loss_step=0.0116, global_step=2344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  24%|██▍       | 19/80 [02:16<06:57,  6.84s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.24e-5, train/loss_step=0.00538, global_step=2344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  25%|██▌       | 20/80 [02:17<06:32,  6.54s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.00538, train/loss_vlb_step=2.24e-5, train/loss_step=0.00538, global_step=2344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  25%|██▌       | 20/80 [02:17<06:32,  6.54s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000408, train/loss_vlb_step=3.21e-6, train/loss_step=0.000408, global_step=2344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  26%|██▋       | 21/80 [02:18<06:10,  6.27s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.000408, train/loss_vlb_step=3.21e-6, train/loss_step=0.000408, global_step=2344.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  26%|██▋       | 21/80 [02:18<06:10,  6.27s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.87e-6, train/loss_step=0.00239, global_step=2345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 117:  28%|██▊       | 22/80 [02:18<05:49,  6.02s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.87e-6, train/loss_step=0.00239, global_step=2345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  28%|██▊       | 22/80 [02:18<05:49,  6.02s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=2.79e-6, train/loss_step=0.000582, global_step=2345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  29%|██▉       | 23/80 [02:19<05:30,  5.79s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000582, train/loss_vlb_step=2.79e-6, train/loss_step=0.000582, global_step=2345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  29%|██▉       | 23/80 [02:19<05:30,  5.79s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=9.65e-6, train/loss_step=0.00176, global_step=2345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]   Epoch 117:  30%|███       | 24/80 [02:38<05:55,  6.35s/it, loss=0.0042, v_num=0, train/loss_simple_step=0.00176, train/loss_vlb_step=9.65e-6, train/loss_step=0.00176, global_step=2345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  30%|███       | 24/80 [02:38<05:55,  6.35s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=7.5e-7, train/loss_step=0.000168, global_step=2345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  31%|███▏      | 25/80 [02:42<05:43,  6.25s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=7.5e-7, train/loss_step=0.000168, global_step=2345.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  31%|███▏      | 25/80 [02:42<05:43,  6.25s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=0.000159, train/loss_step=0.00758, global_step=2346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  32%|███▎      | 26/80 [02:42<05:25,  6.03s/it, loss=0.00411, v_num=0, train/loss_simple_step=0.00758, train/loss_vlb_step=0.000159, train/loss_step=0.00758, global_step=2346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  32%|███▎      | 26/80 [02:42<05:25,  6.03s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000608, train/loss_vlb_step=5.23e-6, train/loss_step=0.000608, global_step=2346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  34%|███▍      | 27/80 [02:55<05:31,  6.26s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000608, train/loss_vlb_step=5.23e-6, train/loss_step=0.000608, global_step=2346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  34%|███▍      | 27/80 [02:55<05:31,  6.26s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=1.27e-6, train/loss_step=0.000228, global_step=2346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  35%|███▌      | 28/80 [03:03<05:29,  6.34s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.000228, train/loss_vlb_step=1.27e-6, train/loss_step=0.000228, global_step=2346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  35%|███▌      | 28/80 [03:03<05:29,  6.34s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=9.72e-5, train/loss_step=0.0165, global_step=2346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]    Epoch 117:  36%|███▋      | 29/80 [03:04<05:13,  6.15s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.0165, train/loss_vlb_step=9.72e-5, train/loss_step=0.0165, global_step=2346.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  36%|███▋      | 29/80 [03:04<05:13,  6.15s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.46e-5, train/loss_step=0.00687, global_step=2347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  38%|███▊      | 30/80 [03:04<04:58,  5.96s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00687, train/loss_vlb_step=2.46e-5, train/loss_step=0.00687, global_step=2347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  38%|███▊      | 30/80 [03:04<04:58,  5.96s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000736, train/loss_vlb_step=1.37e-5, train/loss_step=0.000736, global_step=2347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  39%|███▉      | 31/80 [03:05<04:43,  5.79s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000736, train/loss_vlb_step=1.37e-5, train/loss_step=0.000736, global_step=2347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  39%|███▉      | 31/80 [03:05<04:43,  5.79s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=2.53e-6, train/loss_step=0.000462, global_step=2347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  40%|████      | 32/80 [03:21<04:53,  6.11s/it, loss=0.00372, v_num=0, train/loss_simple_step=0.000462, train/loss_vlb_step=2.53e-6, train/loss_step=0.000462, global_step=2347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  40%|████      | 32/80 [03:21<04:53,  6.11s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.000424, train/loss_step=0.0107, global_step=2347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]   Epoch 117:  41%|████▏     | 33/80 [03:22<04:39,  5.95s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.0107, train/loss_vlb_step=0.000424, train/loss_step=0.0107, global_step=2347.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  41%|████▏     | 33/80 [03:22<04:39,  5.95s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=8.74e-6, train/loss_step=0.000499, global_step=2348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  42%|████▎     | 34/80 [03:22<04:26,  5.79s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.000499, train/loss_vlb_step=8.74e-6, train/loss_step=0.000499, global_step=2348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  42%|████▎     | 34/80 [03:22<04:26,  5.79s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000242, train/loss_step=0.0188, global_step=2348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]   Epoch 117:  44%|████▍     | 35/80 [03:28<04:20,  5.79s/it, loss=0.00508, v_num=0, train/loss_simple_step=0.0188, train/loss_vlb_step=0.000242, train/loss_step=0.0188, global_step=2348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  44%|████▍     | 35/80 [03:28<04:20,  5.79s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.11e-5, train/loss_step=0.00553, global_step=2348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  45%|████▌     | 36/80 [03:41<04:23,  5.98s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00553, train/loss_vlb_step=2.11e-5, train/loss_step=0.00553, global_step=2348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  45%|████▌     | 36/80 [03:41<04:23,  5.98s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000979, train/loss_vlb_step=0.000117, train/loss_step=0.000979, global_step=2348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  46%|████▋     | 37/80 [03:41<04:10,  5.83s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000979, train/loss_vlb_step=0.000117, train/loss_step=0.000979, global_step=2348.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  46%|████▋     | 37/80 [03:41<04:10,  5.83s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.68e-5, train/loss_step=0.00503, global_step=2349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]   Epoch 117:  48%|████▊     | 38/80 [03:42<03:59,  5.70s/it, loss=0.00485, v_num=0, train/loss_simple_step=0.00503, train/loss_vlb_step=1.68e-5, train/loss_step=0.00503, global_step=2349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  48%|████▊     | 38/80 [03:42<03:59,  5.70s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000352, train/loss_vlb_step=1.65e-6, train/loss_step=0.000352, global_step=2349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  49%|████▉     | 39/80 [03:42<03:48,  5.57s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000352, train/loss_vlb_step=1.65e-6, train/loss_step=0.000352, global_step=2349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  49%|████▉     | 39/80 [03:42<03:48,  5.57s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=1.95e-6, train/loss_step=0.000417, global_step=2349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  50%|█████     | 40/80 [03:58<03:52,  5.81s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.000417, train/loss_vlb_step=1.95e-6, train/loss_step=0.000417, global_step=2349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  50%|█████     | 40/80 [03:58<03:52,  5.81s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.2e-7, train/loss_step=0.000165, global_step=2349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:  51%|█████▏    | 41/80 [04:03<03:46,  5.80s/it, loss=0.00402, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=6.2e-7, train/loss_step=0.000165, global_step=2349.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  51%|█████▏    | 41/80 [04:03<03:46,  5.80s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=2.24e-5, train/loss_step=0.00645, global_step=2350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:  52%|█████▎    | 42/80 [04:04<03:35,  5.68s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00645, train/loss_vlb_step=2.24e-5, train/loss_step=0.00645, global_step=2350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  52%|█████▎    | 42/80 [04:04<03:35,  5.68s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=2.88e-6, train/loss_step=0.000547, global_step=2350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  54%|█████▍    | 43/80 [04:12<03:32,  5.74s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.000547, train/loss_vlb_step=2.88e-6, train/loss_step=0.000547, global_step=2350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  54%|█████▍    | 43/80 [04:12<03:32,  5.74s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000481, train/loss_vlb_step=1.89e-6, train/loss_step=0.000481, global_step=2350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  55%|█████▌    | 44/80 [04:24<03:31,  5.87s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000481, train/loss_vlb_step=1.89e-6, train/loss_step=0.000481, global_step=2350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  55%|█████▌    | 44/80 [04:24<03:31,  5.87s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00065, train/loss_vlb_step=1.05e-5, train/loss_step=0.00065, global_step=2350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 117:  56%|█████▋    | 45/80 [04:25<03:21,  5.77s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00065, train/loss_vlb_step=1.05e-5, train/loss_step=0.00065, global_step=2350.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  56%|█████▋    | 45/80 [04:25<03:21,  5.77s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.9e-6, train/loss_step=0.000308, global_step=2351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  57%|█████▊    | 46/80 [04:25<03:12,  5.65s/it, loss=0.00382, v_num=0, train/loss_simple_step=0.000308, train/loss_vlb_step=1.9e-6, train/loss_step=0.000308, global_step=2351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  57%|█████▊    | 46/80 [04:25<03:12,  5.65s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.44e-6, train/loss_step=0.000298, global_step=2351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  59%|█████▉    | 47/80 [04:26<03:03,  5.55s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000298, train/loss_vlb_step=1.44e-6, train/loss_step=0.000298, global_step=2351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  59%|█████▉    | 47/80 [04:26<03:03,  5.55s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000133, train/loss_vlb_step=5.4e-7, train/loss_step=0.000133, global_step=2351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:  60%|██████    | 48/80 [04:46<03:06,  5.84s/it, loss=0.0038, v_num=0, train/loss_simple_step=0.000133, train/loss_vlb_step=5.4e-7, train/loss_step=0.000133, global_step=2351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  60%|██████    | 48/80 [04:46<03:06,  5.84s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.0151, train/loss_step=0.0324, global_step=2351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]   Epoch 117:  61%|██████▏   | 49/80 [04:46<02:57,  5.74s/it, loss=0.00459, v_num=0, train/loss_simple_step=0.0324, train/loss_vlb_step=0.0151, train/loss_step=0.0324, global_step=2351.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  61%|██████▏   | 49/80 [04:46<02:57,  5.74s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.06e-7, train/loss_step=0.00018, global_step=2352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  62%|██████▎   | 50/80 [04:47<02:49,  5.64s/it, loss=0.00426, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.06e-7, train/loss_step=0.00018, global_step=2352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  62%|██████▎   | 50/80 [04:47<02:49,  5.64s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.000472, train/loss_step=0.022, global_step=2352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]   Epoch 117:  64%|██████▍   | 51/80 [05:00<02:47,  5.78s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.022, train/loss_vlb_step=0.000472, train/loss_step=0.022, global_step=2352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  64%|██████▍   | 51/80 [05:00<02:47,  5.78s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=8.35e-5, train/loss_step=0.00853, global_step=2352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  65%|██████▌   | 52/80 [05:02<02:39,  5.70s/it, loss=0.00573, v_num=0, train/loss_simple_step=0.00853, train/loss_vlb_step=8.35e-5, train/loss_step=0.00853, global_step=2352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  65%|██████▌   | 52/80 [05:02<02:39,  5.70s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.73e-5, train/loss_step=0.013, global_step=2352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]    Epoch 117:  66%|██████▋   | 53/80 [05:20<02:40,  5.93s/it, loss=0.00584, v_num=0, train/loss_simple_step=0.013, train/loss_vlb_step=5.73e-5, train/loss_step=0.013, global_step=2352.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  66%|██████▋   | 53/80 [05:20<02:40,  5.93s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.02e-5, train/loss_step=0.0074, global_step=2353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  68%|██████▊   | 54/80 [05:20<02:31,  5.83s/it, loss=0.00618, v_num=0, train/loss_simple_step=0.0074, train/loss_vlb_step=3.02e-5, train/loss_step=0.0074, global_step=2353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  68%|██████▊   | 54/80 [05:20<02:31,  5.83s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=6.34e-6, train/loss_step=0.00114, global_step=2353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  69%|██████▉   | 55/80 [05:21<02:23,  5.74s/it, loss=0.0053, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=6.34e-6, train/loss_step=0.00114, global_step=2353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  69%|██████▉   | 55/80 [05:21<02:23,  5.74s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=2.98e-5, train/loss_step=0.00812, global_step=2353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  70%|███████   | 56/80 [05:21<02:15,  5.65s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.00812, train/loss_vlb_step=2.98e-5, train/loss_step=0.00812, global_step=2353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  70%|███████   | 56/80 [05:21<02:15,  5.65s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.21e-6, train/loss_step=0.00239, global_step=2353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:  71%|███████▏  | 57/80 [05:24<02:08,  5.59s/it, loss=0.0055, v_num=0, train/loss_simple_step=0.00239, train/loss_vlb_step=9.21e-6, train/loss_step=0.00239, global_step=2353.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  71%|███████▏  | 57/80 [05:24<02:08,  5.59s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000343, train/loss_vlb_step=1.45e-6, train/loss_step=0.000343, global_step=2354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  72%|███████▎  | 58/80 [05:28<02:02,  5.56s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000343, train/loss_vlb_step=1.45e-6, train/loss_step=0.000343, global_step=2354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  72%|███████▎  | 58/80 [05:28<02:02,  5.56s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000145, train/loss_vlb_step=7.87e-7, train/loss_step=0.000145, global_step=2354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  74%|███████▍  | 59/80 [05:33<01:56,  5.56s/it, loss=0.00525, v_num=0, train/loss_simple_step=0.000145, train/loss_vlb_step=7.87e-7, train/loss_step=0.000145, global_step=2354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  74%|███████▍  | 59/80 [05:33<01:56,  5.56s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=4.54e-6, train/loss_step=0.000586, global_step=2354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  75%|███████▌  | 60/80 [05:44<01:52,  5.64s/it, loss=0.00526, v_num=0, train/loss_simple_step=0.000586, train/loss_vlb_step=4.54e-6, train/loss_step=0.000586, global_step=2354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  75%|███████▌  | 60/80 [05:44<01:52,  5.64s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.84e-6, train/loss_step=0.000367, global_step=2354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  76%|███████▋  | 61/80 [06:00<01:50,  5.82s/it, loss=0.00527, v_num=0, train/loss_simple_step=0.000367, train/loss_vlb_step=1.84e-6, train/loss_step=0.000367, global_step=2354.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  76%|███████▋  | 61/80 [06:00<01:50,  5.82s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000147, train/loss_step=0.015, global_step=2355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]      Epoch 117:  78%|███████▊  | 62/80 [06:01<01:43,  5.73s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.015, train/loss_vlb_step=0.000147, train/loss_step=0.015, global_step=2355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  78%|███████▊  | 62/80 [06:01<01:43,  5.73s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.9e-5, train/loss_step=0.00236, global_step=2355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  79%|███████▉  | 63/80 [06:01<01:36,  5.65s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.00236, train/loss_vlb_step=1.9e-5, train/loss_step=0.00236, global_step=2355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  79%|███████▉  | 63/80 [06:01<01:36,  5.65s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=1.92e-6, train/loss_step=0.000538, global_step=2355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  80%|████████  | 64/80 [06:15<01:32,  5.77s/it, loss=0.00579, v_num=0, train/loss_simple_step=0.000538, train/loss_vlb_step=1.92e-6, train/loss_step=0.000538, global_step=2355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  80%|████████  | 64/80 [06:15<01:32,  5.77s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.04e-5, train/loss_step=0.0106, global_step=2355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]    Epoch 117:  81%|████████▏ | 65/80 [06:15<01:25,  5.69s/it, loss=0.00629, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=4.04e-5, train/loss_step=0.0106, global_step=2355.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  81%|████████▏ | 65/80 [06:15<01:25,  5.69s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.015, train/loss_step=0.034, global_step=2356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]    Epoch 117:  82%|████████▎ | 66/80 [06:16<01:18,  5.61s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.034, train/loss_vlb_step=0.015, train/loss_step=0.034, global_step=2356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  82%|████████▎ | 66/80 [06:16<01:18,  5.61s/it, loss=0.00799, v_num=0, train/loss_simple_step=0.000629, train/loss_vlb_step=7.62e-6, train/loss_step=0.000629, global_step=2356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  84%|████████▍ | 67/80 [06:16<01:11,  5.54s/it, loss=0.00799, v_num=0, train/loss_simple_step=0.000629, train/loss_vlb_step=7.62e-6, train/loss_step=0.000629, global_step=2356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  84%|████████▍ | 67/80 [06:16<01:11,  5.54s/it, loss=0.008, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=2.98e-6, train/loss_step=0.000295, global_step=2356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 117:  85%|████████▌ | 68/80 [06:20<01:06,  5.52s/it, loss=0.008, v_num=0, train/loss_simple_step=0.000295, train/loss_vlb_step=2.98e-6, train/loss_step=0.000295, global_step=2356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  85%|████████▌ | 68/80 [06:20<01:06,  5.52s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=6.1e-5, train/loss_step=0.00142, global_step=2356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:  86%|████████▋ | 69/80 [06:35<01:02,  5.65s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00142, train/loss_vlb_step=6.1e-5, train/loss_step=0.00142, global_step=2356.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  86%|████████▋ | 69/80 [06:35<01:02,  5.65s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.000103, train/loss_vlb_step=3.85e-7, train/loss_step=0.000103, global_step=2357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  88%|████████▊ | 70/80 [06:35<00:55,  5.58s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.000103, train/loss_vlb_step=3.85e-7, train/loss_step=0.000103, global_step=2357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  88%|████████▊ | 70/80 [06:35<00:55,  5.58s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000835, train/loss_vlb_step=3.66e-6, train/loss_step=0.000835, global_step=2357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  89%|████████▉ | 71/80 [06:36<00:49,  5.51s/it, loss=0.00539, v_num=0, train/loss_simple_step=0.000835, train/loss_vlb_step=3.66e-6, train/loss_step=0.000835, global_step=2357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  89%|████████▉ | 71/80 [06:36<00:49,  5.51s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.06e-6, train/loss_step=0.00168, global_step=2357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 117:  90%|█████████ | 72/80 [06:46<00:44,  5.57s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00168, train/loss_vlb_step=7.06e-6, train/loss_step=0.00168, global_step=2357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  90%|█████████ | 72/80 [06:46<00:44,  5.57s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=7.48e-6, train/loss_step=0.0013, global_step=2357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 117:  91%|█████████▏| 73/80 [06:47<00:38,  5.51s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.0013, train/loss_vlb_step=7.48e-6, train/loss_step=0.0013, global_step=2357.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  91%|█████████▏| 73/80 [06:47<00:38,  5.51s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=9.5e-5, train/loss_step=0.0206, global_step=2358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:  92%|█████████▎| 74/80 [06:48<00:32,  5.44s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0206, train/loss_vlb_step=9.5e-5, train/loss_step=0.0206, global_step=2358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  92%|█████████▎| 74/80 [06:48<00:32,  5.44s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=1.91e-6, train/loss_step=0.000441, global_step=2358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  94%|█████████▍| 75/80 [06:48<00:26,  5.38s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.000441, train/loss_vlb_step=1.91e-6, train/loss_step=0.000441, global_step=2358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  94%|█████████▍| 75/80 [06:48<00:26,  5.38s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=1.78e-5, train/loss_step=0.00508, global_step=2358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 117:  95%|█████████▌| 76/80 [06:54<00:21,  5.39s/it, loss=0.00494, v_num=0, train/loss_simple_step=0.00508, train/loss_vlb_step=1.78e-5, train/loss_step=0.00508, global_step=2358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  95%|█████████▌| 76/80 [06:54<00:21,  5.39s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=0.000147, train/loss_step=0.0101, global_step=2358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373] Epoch 117:  96%|█████████▋| 77/80 [07:11<00:16,  5.53s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0101, train/loss_vlb_step=0.000147, train/loss_step=0.0101, global_step=2358.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  96%|█████████▋| 77/80 [07:11<00:16,  5.53s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=1.08e-6, train/loss_step=0.000224, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  98%|█████████▊| 78/80 [07:11<00:10,  5.47s/it, loss=0.00532, v_num=0, train/loss_simple_step=0.000224, train/loss_vlb_step=1.08e-6, train/loss_step=0.000224, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  98%|█████████▊| 78/80 [07:11<00:10,  5.47s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=2.21e-5, train/loss_step=0.00643, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 117:  99%|█████████▉| 79/80 [07:12<00:05,  5.40s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.00643, train/loss_vlb_step=2.21e-5, train/loss_step=0.00643, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117:  99%|█████████▉| 79/80 [07:12<00:05,  5.40s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=1.55e-6, train/loss_step=0.000425, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.00563, v_num=0, train/loss_simple_step=0.000425, train/loss_vlb_step=1.55e-6, train/loss_step=0.000425, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 117: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=9.76e-6, train/loss_step=0.0019, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]     Average Epoch time: 432.77 seconds
+Average Peak memory 29567.57MiB
+Epoch 117:   0%|          | 0/80 [00:00<00:00, 5577.53it/s, loss=0.0057, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=9.76e-6, train/loss_step=0.0019, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 118:   0%|          | 0/80 [00:00<00:00, 2079.48it/s, loss=0.0057, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=9.76e-6, train/loss_step=0.0019, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]Epoch 118:   1%|▏         | 1/80 [00:39<26:10, 19.88s/it, loss=0.0057, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=9.76e-6, train/loss_step=0.0019, global_step=2359.0, lr_abs=0.0001, train/loss_simple_epoch=0.00373, train/loss_vlb_epoch=9.14e-5, train/loss_epoch=0.00373]  Epoch 118:   1%|▏         | 1/80 [00:39<26:10, 19.88s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000147, train/loss_vlb_step=1.08e-6, train/loss_step=0.000147, global_step=2360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:   2%|▎         | 2/80 [00:41<18:05, 13.92s/it, loss=0.00496, v_num=0, train/loss_simple_step=0.000147, train/loss_vlb_step=1.08e-6, train/loss_step=0.000147, global_step=2360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:   2%|▎         | 2/80 [00:41<18:05, 13.92s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=2.58e-5, train/loss_step=0.00661, global_step=2360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:   4%|▍         | 3/80 [00:42<13:33, 10.56s/it, loss=0.00517, v_num=0, train/loss_simple_step=0.00661, train/loss_vlb_step=2.58e-5, train/loss_step=0.00661, global_step=2360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:   4%|▍         | 3/80 [00:42<13:33, 10.56s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=5.1e-5, train/loss_step=0.00791, global_step=2360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397] Epoch 118:   5%|▌         | 4/80 [00:52<13:13, 10.44s/it, loss=0.00554, v_num=0, train/loss_simple_step=0.00791, train/loss_vlb_step=5.1e-5, train/loss_step=0.00791, global_step=2360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:   5%|▌         | 4/80 [00:52<13:13, 10.44s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=3.4e-6, train/loss_step=0.00074, global_step=2360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:   6%|▋         | 5/80 [00:52<10:58,  8.78s/it, loss=0.00505, v_num=0, train/loss_simple_step=0.00074, train/loss_vlb_step=3.4e-6, train/loss_step=0.00074, global_step=2360.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:   6%|▋         | 5/80 [00:52<10:58,  8.78s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=8.81e-7, train/loss_step=0.000227, global_step=2361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:   8%|▊         | 6/80 [00:53<09:22,  7.60s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.000227, train/loss_vlb_step=8.81e-7, train/loss_step=0.000227, global_step=2361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:   8%|▊         | 6/80 [00:53<09:22,  7.60s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.06e-5, train/loss_step=0.00298, global_step=2361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:   9%|▉         | 7/80 [00:53<08:09,  6.71s/it, loss=0.00347, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.06e-5, train/loss_step=0.00298, global_step=2361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:   9%|▉         | 7/80 [00:53<08:09,  6.71s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=3.55e-6, train/loss_step=0.000865, global_step=2361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  10%|█         | 8/80 [01:26<11:31,  9.60s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000865, train/loss_vlb_step=3.55e-6, train/loss_step=0.000865, global_step=2361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  10%|█         | 8/80 [01:26<11:31,  9.60s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000481, train/loss_vlb_step=3.16e-6, train/loss_step=0.000481, global_step=2361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  11%|█▏        | 9/80 [01:26<10:17,  8.70s/it, loss=0.00346, v_num=0, train/loss_simple_step=0.000481, train/loss_vlb_step=3.16e-6, train/loss_step=0.000481, global_step=2361.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  11%|█▏        | 9/80 [01:26<10:17,  8.70s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000546, train/loss_vlb_step=2.25e-6, train/loss_step=0.000546, global_step=2362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  12%|█▎        | 10/80 [01:27<09:16,  7.95s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.000546, train/loss_vlb_step=2.25e-6, train/loss_step=0.000546, global_step=2362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  12%|█▎        | 10/80 [01:27<09:16,  7.95s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.31e-6, train/loss_step=0.000241, global_step=2362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  14%|█▍        | 11/80 [01:27<08:25,  7.33s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.31e-6, train/loss_step=0.000241, global_step=2362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  14%|█▍        | 11/80 [01:27<08:25,  7.33s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=2.52e-6, train/loss_step=0.000222, global_step=2362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  15%|█▌        | 12/80 [01:38<08:35,  7.58s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=2.52e-6, train/loss_step=0.000222, global_step=2362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  15%|█▌        | 12/80 [01:38<08:35,  7.58s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=9.17e-7, train/loss_step=0.00018, global_step=2362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  16%|█▋        | 13/80 [01:39<07:54,  7.08s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=9.17e-7, train/loss_step=0.00018, global_step=2362.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  16%|█▋        | 13/80 [01:39<07:54,  7.08s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000106, train/loss_vlb_step=3.81e-7, train/loss_step=0.000106, global_step=2363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  18%|█▊        | 14/80 [01:39<07:18,  6.64s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000106, train/loss_vlb_step=3.81e-7, train/loss_step=0.000106, global_step=2363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  18%|█▊        | 14/80 [01:39<07:18,  6.64s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000491, train/loss_vlb_step=5.09e-6, train/loss_step=0.000491, global_step=2363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397] Epoch 118:  19%|█▉        | 15/80 [01:40<06:46,  6.26s/it, loss=0.0023, v_num=0, train/loss_simple_step=0.000491, train/loss_vlb_step=5.09e-6, train/loss_step=0.000491, global_step=2363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  19%|█▉        | 15/80 [01:40<06:46,  6.26s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=9.55e-5, train/loss_step=0.0141, global_step=2363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]   Epoch 118:  20%|██        | 16/80 [02:05<07:52,  7.39s/it, loss=0.00275, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=9.55e-5, train/loss_step=0.0141, global_step=2363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  20%|██        | 16/80 [02:05<07:52,  7.39s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=2.62e-5, train/loss_step=0.00642, global_step=2363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  21%|██▏       | 17/80 [02:06<07:21,  7.01s/it, loss=0.00256, v_num=0, train/loss_simple_step=0.00642, train/loss_vlb_step=2.62e-5, train/loss_step=0.00642, global_step=2363.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  21%|██▏       | 17/80 [02:06<07:21,  7.01s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=1.35e-5, train/loss_step=0.00103, global_step=2364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397] Epoch 118:  22%|██▎       | 18/80 [02:06<06:53,  6.67s/it, loss=0.0026, v_num=0, train/loss_simple_step=0.00103, train/loss_vlb_step=1.35e-5, train/loss_step=0.00103, global_step=2364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  22%|██▎       | 18/80 [02:06<06:53,  6.67s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=8.82e-7, train/loss_step=0.000168, global_step=2364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  24%|██▍       | 19/80 [02:07<06:27,  6.36s/it, loss=0.00229, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=8.82e-7, train/loss_step=0.000168, global_step=2364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  24%|██▍       | 19/80 [02:07<06:27,  6.36s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=7.52e-6, train/loss_step=0.00205, global_step=2364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  25%|██▌       | 20/80 [02:21<06:43,  6.73s/it, loss=0.00237, v_num=0, train/loss_simple_step=0.00205, train/loss_vlb_step=7.52e-6, train/loss_step=0.00205, global_step=2364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  25%|██▌       | 20/80 [02:21<06:43,  6.73s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.37e-5, train/loss_step=0.00509, global_step=2364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  26%|██▋       | 21/80 [02:21<06:20,  6.44s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00509, train/loss_vlb_step=2.37e-5, train/loss_step=0.00509, global_step=2364.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  26%|██▋       | 21/80 [02:21<06:20,  6.44s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.19e-7, train/loss_step=0.00018, global_step=2365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  28%|██▊       | 22/80 [02:22<05:58,  6.18s/it, loss=0.00253, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.19e-7, train/loss_step=0.00018, global_step=2365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  28%|██▊       | 22/80 [02:22<05:58,  6.18s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=1.43e-5, train/loss_step=0.000733, global_step=2365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  29%|██▉       | 23/80 [02:22<05:39,  5.95s/it, loss=0.00224, v_num=0, train/loss_simple_step=0.000733, train/loss_vlb_step=1.43e-5, train/loss_step=0.000733, global_step=2365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  29%|██▉       | 23/80 [02:22<05:39,  5.95s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.0005, train/loss_vlb_step=2.44e-6, train/loss_step=0.0005, global_step=2365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]    Epoch 118:  30%|███       | 24/80 [03:00<06:44,  7.22s/it, loss=0.00187, v_num=0, train/loss_simple_step=0.0005, train/loss_vlb_step=2.44e-6, train/loss_step=0.0005, global_step=2365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  30%|███       | 24/80 [03:00<06:44,  7.22s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.07e-5, train/loss_step=0.0032, global_step=2365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  31%|███▏      | 25/80 [03:01<06:23,  6.97s/it, loss=0.00199, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.07e-5, train/loss_step=0.0032, global_step=2365.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  31%|███▏      | 25/80 [03:01<06:23,  6.97s/it, loss=0.002, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.71e-6, train/loss_step=0.00033, global_step=2366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  32%|███▎      | 26/80 [03:01<06:03,  6.73s/it, loss=0.002, v_num=0, train/loss_simple_step=0.00033, train/loss_vlb_step=1.71e-6, train/loss_step=0.00033, global_step=2366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  32%|███▎      | 26/80 [03:01<06:03,  6.73s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.96e-5, train/loss_step=0.00458, global_step=2366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  34%|███▍      | 27/80 [03:02<05:44,  6.50s/it, loss=0.00208, v_num=0, train/loss_simple_step=0.00458, train/loss_vlb_step=1.96e-5, train/loss_step=0.00458, global_step=2366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  34%|███▍      | 27/80 [03:02<05:44,  6.50s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=1.63e-6, train/loss_step=0.000378, global_step=2366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  35%|███▌      | 28/80 [03:02<05:28,  6.31s/it, loss=0.00205, v_num=0, train/loss_simple_step=0.000378, train/loss_vlb_step=1.63e-6, train/loss_step=0.000378, global_step=2366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  35%|███▌      | 28/80 [03:02<05:28,  6.31s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.62e-5, train/loss_step=0.0045, global_step=2366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]    Epoch 118:  36%|███▋      | 29/80 [03:03<05:11,  6.12s/it, loss=0.00225, v_num=0, train/loss_simple_step=0.0045, train/loss_vlb_step=1.62e-5, train/loss_step=0.0045, global_step=2366.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  36%|███▋      | 29/80 [03:03<05:11,  6.12s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000619, train/loss_step=0.0353, global_step=2367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.0353, train/loss_vlb_step=0.000619, train/loss_step=0.0353, global_step=2367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  38%|███▊      | 30/80 [03:03<04:56,  5.93s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=1.77e-6, train/loss_step=0.000221, global_step=2367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000221, train/loss_vlb_step=1.77e-6, train/loss_step=0.000221, global_step=2367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  39%|███▉      | 31/80 [03:04<04:42,  5.76s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=1.55e-6, train/loss_step=0.000226, global_step=2367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  40%|████      | 32/80 [03:42<05:23,  6.73s/it, loss=0.00399, v_num=0, train/loss_simple_step=0.000226, train/loss_vlb_step=1.55e-6, train/loss_step=0.000226, global_step=2367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  40%|████      | 32/80 [03:42<05:23,  6.73s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.74e-6, train/loss_step=0.00167, global_step=2367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  41%|████▏     | 33/80 [03:42<05:07,  6.55s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00167, train/loss_vlb_step=7.74e-6, train/loss_step=0.00167, global_step=2367.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  41%|████▏     | 33/80 [03:42<05:07,  6.55s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.31e-5, train/loss_step=0.003, global_step=2368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]    Epoch 118:  42%|████▎     | 34/80 [03:43<04:53,  6.37s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.003, train/loss_vlb_step=1.31e-5, train/loss_step=0.003, global_step=2368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  42%|████▎     | 34/80 [03:43<04:53,  6.37s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=4.5e-6, train/loss_step=0.000452, global_step=2368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  44%|████▍     | 35/80 [03:43<04:39,  6.21s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=4.5e-6, train/loss_step=0.000452, global_step=2368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  44%|████▍     | 35/80 [03:43<04:39,  6.21s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=2.38e-6, train/loss_step=0.000368, global_step=2368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  45%|████▌     | 36/80 [03:44<04:26,  6.06s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000368, train/loss_vlb_step=2.38e-6, train/loss_step=0.000368, global_step=2368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  45%|████▌     | 36/80 [03:44<04:26,  6.06s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.82e-5, train/loss_step=0.00499, global_step=2368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  46%|████▋     | 37/80 [03:44<04:14,  5.91s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00499, train/loss_vlb_step=1.82e-5, train/loss_step=0.00499, global_step=2368.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  46%|████▋     | 37/80 [03:44<04:14,  5.91s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=7.82e-6, train/loss_step=0.00194, global_step=2369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  48%|████▊     | 38/80 [03:45<04:02,  5.77s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.00194, train/loss_vlb_step=7.82e-6, train/loss_step=0.00194, global_step=2369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  48%|████▊     | 38/80 [03:45<04:02,  5.77s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=3.01e-5, train/loss_step=0.00427, global_step=2369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397] Epoch 118:  49%|████▉     | 39/80 [03:45<03:51,  5.64s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00427, train/loss_vlb_step=3.01e-5, train/loss_step=0.00427, global_step=2369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  49%|████▉     | 39/80 [03:45<03:51,  5.64s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=1.6e-5, train/loss_step=0.00483, global_step=2369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  50%|█████     | 40/80 [04:20<04:14,  6.36s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.00483, train/loss_vlb_step=1.6e-5, train/loss_step=0.00483, global_step=2369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  50%|█████     | 40/80 [04:20<04:14,  6.36s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.58e-6, train/loss_step=0.000355, global_step=2369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  51%|█████▏    | 41/80 [04:21<04:02,  6.23s/it, loss=0.0036, v_num=0, train/loss_simple_step=0.000355, train/loss_vlb_step=1.58e-6, train/loss_step=0.000355, global_step=2369.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  51%|█████▏    | 41/80 [04:21<04:02,  6.23s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000881, train/loss_vlb_step=3.6e-6, train/loss_step=0.000881, global_step=2370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  52%|█████▎    | 42/80 [04:21<03:51,  6.09s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000881, train/loss_vlb_step=3.6e-6, train/loss_step=0.000881, global_step=2370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  52%|█████▎    | 42/80 [04:21<03:51,  6.09s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=1.81e-6, train/loss_step=0.00025, global_step=2370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397] Epoch 118:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.00025, train/loss_vlb_step=1.81e-6, train/loss_step=0.00025, global_step=2370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  54%|█████▍    | 43/80 [04:22<03:40,  5.97s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=2.59e-5, train/loss_step=0.00701, global_step=2370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00394, v_num=0, train/loss_simple_step=0.00701, train/loss_vlb_step=2.59e-5, train/loss_step=0.00701, global_step=2370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  55%|█████▌    | 44/80 [04:23<03:30,  5.85s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=1.76e-5, train/loss_step=0.00511, global_step=2370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  56%|█████▋    | 45/80 [04:34<03:29,  5.98s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.00511, train/loss_vlb_step=1.76e-5, train/loss_step=0.00511, global_step=2370.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  56%|█████▋    | 45/80 [04:34<03:29,  5.98s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=5.29e-6, train/loss_step=0.00134, global_step=2371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  57%|█████▊    | 46/80 [04:35<03:19,  5.86s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00134, train/loss_vlb_step=5.29e-6, train/loss_step=0.00134, global_step=2371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  57%|█████▊    | 46/80 [04:35<03:19,  5.86s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.17e-5, train/loss_step=0.00264, global_step=2371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  59%|█████▉    | 47/80 [04:35<03:09,  5.75s/it, loss=0.00398, v_num=0, train/loss_simple_step=0.00264, train/loss_vlb_step=1.17e-5, train/loss_step=0.00264, global_step=2371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  59%|█████▉    | 47/80 [04:35<03:09,  5.75s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.64e-5, train/loss_step=0.00228, global_step=2371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  60%|██████    | 48/80 [05:08<03:21,  6.29s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00228, train/loss_vlb_step=1.64e-5, train/loss_step=0.00228, global_step=2371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  60%|██████    | 48/80 [05:08<03:21,  6.29s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=9.22e-7, train/loss_step=0.000168, global_step=2371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  61%|██████▏   | 49/80 [05:08<03:11,  6.17s/it, loss=0.00386, v_num=0, train/loss_simple_step=0.000168, train/loss_vlb_step=9.22e-7, train/loss_step=0.000168, global_step=2371.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  61%|██████▏   | 49/80 [05:08<03:11,  6.17s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000129, train/loss_step=0.0125, global_step=2372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]   Epoch 118:  62%|██████▎   | 50/80 [05:09<03:01,  6.06s/it, loss=0.00273, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=0.000129, train/loss_step=0.0125, global_step=2372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  62%|██████▎   | 50/80 [05:09<03:01,  6.06s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=0.000233, train/loss_step=0.0166, global_step=2372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  64%|██████▍   | 51/80 [05:09<02:52,  5.96s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.0166, train/loss_vlb_step=0.000233, train/loss_step=0.0166, global_step=2372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  64%|██████▍   | 51/80 [05:09<02:52,  5.96s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000432, train/loss_vlb_step=1.54e-6, train/loss_step=0.000432, global_step=2372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  65%|██████▌   | 52/80 [05:10<02:43,  5.85s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000432, train/loss_vlb_step=1.54e-6, train/loss_step=0.000432, global_step=2372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  65%|██████▌   | 52/80 [05:10<02:43,  5.85s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=9.14e-7, train/loss_step=0.00022, global_step=2372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  66%|██████▋   | 53/80 [05:17<02:38,  5.88s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00022, train/loss_vlb_step=9.14e-7, train/loss_step=0.00022, global_step=2372.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  66%|██████▋   | 53/80 [05:17<02:38,  5.88s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=1.99e-6, train/loss_step=0.000452, global_step=2373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  68%|██████▊   | 54/80 [05:18<02:30,  5.79s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.000452, train/loss_vlb_step=1.99e-6, train/loss_step=0.000452, global_step=2373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  68%|██████▊   | 54/80 [05:18<02:30,  5.79s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.21e-6, train/loss_step=0.000237, global_step=2373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  69%|██████▉   | 55/80 [05:18<02:22,  5.69s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.000237, train/loss_vlb_step=1.21e-6, train/loss_step=0.000237, global_step=2373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  69%|██████▉   | 55/80 [05:18<02:22,  5.69s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.38e-5, train/loss_step=0.0032, global_step=2373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]    Epoch 118:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.0032, train/loss_vlb_step=1.38e-5, train/loss_step=0.0032, global_step=2373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  70%|███████   | 56/80 [05:41<02:23,  5.99s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=1.39e-6, train/loss_step=0.000316, global_step=2373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  71%|███████▏  | 57/80 [05:41<02:15,  5.89s/it, loss=0.00325, v_num=0, train/loss_simple_step=0.000316, train/loss_vlb_step=1.39e-6, train/loss_step=0.000316, global_step=2373.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  71%|███████▏  | 57/80 [05:41<02:15,  5.89s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.38e-6, train/loss_step=0.000287, global_step=2374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  72%|███████▎  | 58/80 [05:42<02:07,  5.80s/it, loss=0.00317, v_num=0, train/loss_simple_step=0.000287, train/loss_vlb_step=1.38e-6, train/loss_step=0.000287, global_step=2374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  72%|███████▎  | 58/80 [05:42<02:07,  5.80s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.08e-5, train/loss_step=0.00298, global_step=2374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]   Epoch 118:  74%|███████▍  | 59/80 [05:49<02:02,  5.83s/it, loss=0.0031, v_num=0, train/loss_simple_step=0.00298, train/loss_vlb_step=1.08e-5, train/loss_step=0.00298, global_step=2374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  74%|███████▍  | 59/80 [05:49<02:02,  5.83s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.54e-6, train/loss_step=0.000554, global_step=2374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000554, train/loss_vlb_step=3.54e-6, train/loss_step=0.000554, global_step=2374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  75%|███████▌  | 60/80 [05:50<01:54,  5.74s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=4.96e-5, train/loss_step=0.0134, global_step=2374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]    Epoch 118:  76%|███████▋  | 61/80 [05:55<01:48,  5.73s/it, loss=0.00354, v_num=0, train/loss_simple_step=0.0134, train/loss_vlb_step=4.96e-5, train/loss_step=0.0134, global_step=2374.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  76%|███████▋  | 61/80 [05:55<01:48,  5.73s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=2.48e-5, train/loss_step=0.00162, global_step=2375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00358, v_num=0, train/loss_simple_step=0.00162, train/loss_vlb_step=2.48e-5, train/loss_step=0.00162, global_step=2375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  78%|███████▊  | 62/80 [05:55<01:41,  5.64s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000902, train/loss_vlb_step=4.14e-6, train/loss_step=0.000902, global_step=2375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  79%|███████▉  | 63/80 [05:56<01:34,  5.56s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000902, train/loss_vlb_step=4.14e-6, train/loss_step=0.000902, global_step=2375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  79%|███████▉  | 63/80 [05:56<01:34,  5.56s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.37e-6, train/loss_step=0.000241, global_step=2375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  80%|████████  | 64/80 [06:22<01:34,  5.89s/it, loss=0.00328, v_num=0, train/loss_simple_step=0.000241, train/loss_vlb_step=1.37e-6, train/loss_step=0.000241, global_step=2375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  80%|████████  | 64/80 [06:22<01:34,  5.89s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=7.48e-6, train/loss_step=0.00217, global_step=2375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00313, v_num=0, train/loss_simple_step=0.00217, train/loss_vlb_step=7.48e-6, train/loss_step=0.00217, global_step=2375.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  81%|████████▏ | 65/80 [06:23<01:27,  5.81s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.03e-5, train/loss_step=0.00586, global_step=2376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00586, train/loss_vlb_step=2.03e-5, train/loss_step=0.00586, global_step=2376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  82%|████████▎ | 66/80 [06:23<01:20,  5.73s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.51e-5, train/loss_step=0.00312, global_step=2376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  84%|████████▍ | 67/80 [06:26<01:13,  5.69s/it, loss=0.00338, v_num=0, train/loss_simple_step=0.00312, train/loss_vlb_step=1.51e-5, train/loss_step=0.00312, global_step=2376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  84%|████████▍ | 67/80 [06:26<01:13,  5.69s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=7.85e-5, train/loss_step=0.0152, global_step=2376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  85%|████████▌ | 68/80 [06:28<01:07,  5.64s/it, loss=0.00403, v_num=0, train/loss_simple_step=0.0152, train/loss_vlb_step=7.85e-5, train/loss_step=0.0152, global_step=2376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  85%|████████▌ | 68/80 [06:28<01:07,  5.64s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000674, train/loss_vlb_step=8.43e-6, train/loss_step=0.000674, global_step=2376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  86%|████████▋ | 69/80 [06:32<01:01,  5.61s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.000674, train/loss_vlb_step=8.43e-6, train/loss_step=0.000674, global_step=2376.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  86%|████████▋ | 69/80 [06:32<01:01,  5.61s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=1.61e-5, train/loss_step=0.0047, global_step=2377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]    Epoch 118:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.0047, train/loss_vlb_step=1.61e-5, train/loss_step=0.0047, global_step=2377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  88%|████████▊ | 70/80 [06:33<00:55,  5.54s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.000559, train/loss_vlb_step=2.73e-6, train/loss_step=0.000559, global_step=2377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  89%|████████▉ | 71/80 [06:33<00:49,  5.47s/it, loss=0.00286, v_num=0, train/loss_simple_step=0.000559, train/loss_vlb_step=2.73e-6, train/loss_step=0.000559, global_step=2377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  89%|████████▉ | 71/80 [06:33<00:49,  5.47s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.96e-5, train/loss_step=0.00263, global_step=2377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  90%|█████████ | 72/80 [06:56<00:45,  5.71s/it, loss=0.00297, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=1.96e-5, train/loss_step=0.00263, global_step=2377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  90%|█████████ | 72/80 [06:56<00:45,  5.71s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=4.8e-5, train/loss_step=0.00789, global_step=2377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397] Epoch 118:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00335, v_num=0, train/loss_simple_step=0.00789, train/loss_vlb_step=4.8e-5, train/loss_step=0.00789, global_step=2377.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  91%|█████████▏| 73/80 [06:57<00:39,  5.64s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000729, train/loss_vlb_step=3.12e-6, train/loss_step=0.000729, global_step=2378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00337, v_num=0, train/loss_simple_step=0.000729, train/loss_vlb_step=3.12e-6, train/loss_step=0.000729, global_step=2378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  92%|█████████▎| 74/80 [06:57<00:33,  5.57s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.66e-6, train/loss_step=0.00107, global_step=2378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  94%|█████████▍| 75/80 [07:00<00:27,  5.54s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.00107, train/loss_vlb_step=4.66e-6, train/loss_step=0.00107, global_step=2378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  94%|█████████▍| 75/80 [07:00<00:27,  5.54s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=8.09e-7, train/loss_step=0.000183, global_step=2378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.00326, v_num=0, train/loss_simple_step=0.000183, train/loss_vlb_step=8.09e-7, train/loss_step=0.000183, global_step=2378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  95%|█████████▌| 76/80 [07:02<00:21,  5.49s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=1.37e-5, train/loss_step=0.00382, global_step=2378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 118:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.00382, train/loss_vlb_step=1.37e-5, train/loss_step=0.00382, global_step=2378.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  96%|█████████▋| 77/80 [07:05<00:16,  5.46s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=2.17e-6, train/loss_step=0.000314, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.00343, v_num=0, train/loss_simple_step=0.000314, train/loss_vlb_step=2.17e-6, train/loss_step=0.000314, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  98%|█████████▊| 78/80 [07:06<00:10,  5.40s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.00364, train/loss_step=0.037, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]      Epoch 118:  99%|█████████▉| 79/80 [07:06<00:05,  5.34s/it, loss=0.00514, v_num=0, train/loss_simple_step=0.037, train/loss_vlb_step=0.00364, train/loss_step=0.037, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118:  99%|█████████▉| 79/80 [07:06<00:05,  5.34s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.000369, train/loss_vlb_step=2.44e-6, train/loss_step=0.000369, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.000369, train/loss_vlb_step=2.44e-6, train/loss_step=0.000369, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 118: 100%|██████████| 80/80 [07:07<00:00,  5.28s/it, loss=0.00446, v_num=0, train/loss_simple_step=5.74e-5, train/loss_vlb_step=2.02e-7, train/loss_step=5.74e-5, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Average Epoch time: 427.46 seconds
+Average Peak memory 29571.40MiB
+Epoch 118:   0%|          | 0/80 [00:00<00:00, 3111.50it/s, loss=0.00446, v_num=0, train/loss_simple_step=5.74e-5, train/loss_vlb_step=2.02e-7, train/loss_step=5.74e-5, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 119:   0%|          | 0/80 [00:00<00:00, 1559.80it/s, loss=0.00446, v_num=0, train/loss_simple_step=5.74e-5, train/loss_vlb_step=2.02e-7, train/loss_step=5.74e-5, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]Epoch 119:   1%|▏         | 1/80 [00:43<28:26, 21.60s/it, loss=0.00446, v_num=0, train/loss_simple_step=5.74e-5, train/loss_vlb_step=2.02e-7, train/loss_step=5.74e-5, global_step=2379.0, lr_abs=0.0001, train/loss_simple_epoch=0.00397, train/loss_vlb_epoch=0.000125, train/loss_epoch=0.00397]  Epoch 119:   1%|▏         | 1/80 [00:43<28:26, 21.60s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000875, train/loss_vlb_step=7.13e-6, train/loss_step=0.000875, global_step=2380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:   2%|▎         | 2/80 [00:43<18:55, 14.56s/it, loss=0.00442, v_num=0, train/loss_simple_step=0.000875, train/loss_vlb_step=7.13e-6, train/loss_step=0.000875, global_step=2380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:   2%|▎         | 2/80 [00:43<18:55, 14.56s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=2.29e-6, train/loss_step=0.00043, global_step=2380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]   Epoch 119:   4%|▍         | 3/80 [00:46<14:51, 11.58s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=2.29e-6, train/loss_step=0.00043, global_step=2380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:   4%|▍         | 3/80 [00:46<14:51, 11.58s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=8.79e-7, train/loss_step=0.000235, global_step=2380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:   5%|▌         | 4/80 [00:46<11:51,  9.36s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.000235, train/loss_vlb_step=8.79e-7, train/loss_step=0.000235, global_step=2380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:   5%|▌         | 4/80 [00:46<11:51,  9.36s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=3.98e-6, train/loss_step=0.00113, global_step=2380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344] Epoch 119:   6%|▋         | 5/80 [00:47<09:51,  7.89s/it, loss=0.00434, v_num=0, train/loss_simple_step=0.00113, train/loss_vlb_step=3.98e-6, train/loss_step=0.00113, global_step=2380.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:   6%|▋         | 5/80 [00:47<09:51,  7.89s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000717, train/loss_vlb_step=3.65e-6, train/loss_step=0.000717, global_step=2381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:   8%|▊         | 6/80 [00:47<08:25,  6.83s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000717, train/loss_vlb_step=3.65e-6, train/loss_step=0.000717, global_step=2381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:   8%|▊         | 6/80 [00:47<08:25,  6.83s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=4.78e-5, train/loss_step=0.00685, global_step=2381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:   9%|▉         | 7/80 [00:48<07:20,  6.04s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.00685, train/loss_vlb_step=4.78e-5, train/loss_step=0.00685, global_step=2381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:   9%|▉         | 7/80 [00:48<07:20,  6.04s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000118, train/loss_step=0.011, global_step=2381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]   Epoch 119:  10%|█         | 8/80 [01:25<11:20,  9.45s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=0.000118, train/loss_step=0.011, global_step=2381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  10%|█         | 8/80 [01:25<11:20,  9.45s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.26e-5, train/loss_step=0.00525, global_step=2381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  11%|█▏        | 9/80 [01:31<10:50,  9.17s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00525, train/loss_vlb_step=2.26e-5, train/loss_step=0.00525, global_step=2381.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  11%|█▏        | 9/80 [01:31<10:50,  9.17s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=2.52e-5, train/loss_step=0.00749, global_step=2382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  12%|█▎        | 10/80 [01:32<09:46,  8.38s/it, loss=0.00443, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=2.52e-5, train/loss_step=0.00749, global_step=2382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  12%|█▎        | 10/80 [01:32<09:46,  8.38s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=3.94e-5, train/loss_step=0.0102, global_step=2382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  14%|█▍        | 11/80 [01:32<08:52,  7.72s/it, loss=0.00491, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=3.94e-5, train/loss_step=0.0102, global_step=2382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  14%|█▍        | 11/80 [01:32<08:52,  7.72s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=3.8e-5, train/loss_step=0.0113, global_step=2382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344] Epoch 119:  15%|█▌        | 12/80 [01:33<08:09,  7.19s/it, loss=0.00534, v_num=0, train/loss_simple_step=0.0113, train/loss_vlb_step=3.8e-5, train/loss_step=0.0113, global_step=2382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  15%|█▌        | 12/80 [01:33<08:09,  7.19s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=5.98e-6, train/loss_step=0.00165, global_step=2382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  16%|█▋        | 13/80 [01:34<07:29,  6.72s/it, loss=0.00503, v_num=0, train/loss_simple_step=0.00165, train/loss_vlb_step=5.98e-6, train/loss_step=0.00165, global_step=2382.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  16%|█▋        | 13/80 [01:34<07:29,  6.72s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=2.49e-5, train/loss_step=0.00589, global_step=2383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  18%|█▊        | 14/80 [01:34<06:55,  6.30s/it, loss=0.00529, v_num=0, train/loss_simple_step=0.00589, train/loss_vlb_step=2.49e-5, train/loss_step=0.00589, global_step=2383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  18%|█▊        | 14/80 [01:34<06:55,  6.30s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=6.57e-6, train/loss_step=0.0019, global_step=2383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  19%|█▉        | 15/80 [01:35<06:25,  5.94s/it, loss=0.00533, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=6.57e-6, train/loss_step=0.0019, global_step=2383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  19%|█▉        | 15/80 [01:35<06:25,  5.94s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=0.000112, train/loss_step=0.00398, global_step=2383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  20%|██        | 16/80 [02:04<07:46,  7.30s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00398, train/loss_vlb_step=0.000112, train/loss_step=0.00398, global_step=2383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  20%|██        | 16/80 [02:04<07:46,  7.30s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.05e-5, train/loss_step=0.0159, global_step=2383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]   Epoch 119:  21%|██▏       | 17/80 [02:04<07:15,  6.92s/it, loss=0.00612, v_num=0, train/loss_simple_step=0.0159, train/loss_vlb_step=6.05e-5, train/loss_step=0.0159, global_step=2383.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  21%|██▏       | 17/80 [02:04<07:15,  6.92s/it, loss=0.00641, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=2.27e-5, train/loss_step=0.00601, global_step=2384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  22%|██▎       | 18/80 [02:05<06:48,  6.58s/it, loss=0.00641, v_num=0, train/loss_simple_step=0.00601, train/loss_vlb_step=2.27e-5, train/loss_step=0.00601, global_step=2384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  22%|██▎       | 18/80 [02:05<06:48,  6.58s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=7.91e-6, train/loss_step=0.00152, global_step=2384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  24%|██▍       | 19/80 [02:09<06:36,  6.50s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.00152, train/loss_vlb_step=7.91e-6, train/loss_step=0.00152, global_step=2384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  24%|██▍       | 19/80 [02:09<06:36,  6.50s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.62e-6, train/loss_step=0.000511, global_step=2384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  25%|██▌       | 20/80 [02:10<06:12,  6.21s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.000511, train/loss_vlb_step=2.62e-6, train/loss_step=0.000511, global_step=2384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  25%|██▌       | 20/80 [02:10<06:12,  6.21s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=3.1e-6, train/loss_step=0.000732, global_step=2384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344] Epoch 119:  26%|██▋       | 21/80 [02:11<05:52,  5.97s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.000732, train/loss_vlb_step=3.1e-6, train/loss_step=0.000732, global_step=2384.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  26%|██▋       | 21/80 [02:11<05:52,  5.98s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.94e-5, train/loss_step=0.00153, global_step=2385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344] Epoch 119:  28%|██▊       | 22/80 [02:11<05:32,  5.74s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.00153, train/loss_vlb_step=7.94e-5, train/loss_step=0.00153, global_step=2385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  28%|██▊       | 22/80 [02:11<05:32,  5.74s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=8.75e-6, train/loss_step=0.00158, global_step=2385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  29%|██▉       | 23/80 [02:12<05:14,  5.52s/it, loss=0.00476, v_num=0, train/loss_simple_step=0.00158, train/loss_vlb_step=8.75e-6, train/loss_step=0.00158, global_step=2385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  29%|██▉       | 23/80 [02:12<05:14,  5.52s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000419, train/loss_vlb_step=1.63e-6, train/loss_step=0.000419, global_step=2385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  30%|███       | 24/80 [02:55<06:32,  7.02s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000419, train/loss_vlb_step=1.63e-6, train/loss_step=0.000419, global_step=2385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  30%|███       | 24/80 [02:55<06:32,  7.02s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=0.000103, train/loss_step=0.00146, global_step=2385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344] Epoch 119:  31%|███▏      | 25/80 [02:55<06:12,  6.77s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00146, train/loss_vlb_step=0.000103, train/loss_step=0.00146, global_step=2385.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  31%|███▏      | 25/80 [02:55<06:12,  6.77s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=5.57e-6, train/loss_step=0.000459, global_step=2386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  32%|███▎      | 26/80 [02:56<05:52,  6.54s/it, loss=0.00478, v_num=0, train/loss_simple_step=0.000459, train/loss_vlb_step=5.57e-6, train/loss_step=0.000459, global_step=2386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  32%|███▎      | 26/80 [02:56<05:52,  6.54s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.12e-5, train/loss_step=0.011, global_step=2386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]      Epoch 119:  34%|███▍      | 27/80 [02:56<05:34,  6.32s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.12e-5, train/loss_step=0.011, global_step=2386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  34%|███▍      | 27/80 [02:56<05:34,  6.32s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00989, train/loss_vlb_step=0.000156, train/loss_step=0.00989, global_step=2386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  35%|███▌      | 28/80 [02:57<05:18,  6.13s/it, loss=0.00493, v_num=0, train/loss_simple_step=0.00989, train/loss_vlb_step=0.000156, train/loss_step=0.00989, global_step=2386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  35%|███▌      | 28/80 [02:57<05:18,  6.13s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=9.01e-6, train/loss_step=0.00233, global_step=2386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344] Epoch 119:  36%|███▋      | 29/80 [02:58<05:03,  5.95s/it, loss=0.00479, v_num=0, train/loss_simple_step=0.00233, train/loss_vlb_step=9.01e-6, train/loss_step=0.00233, global_step=2386.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  36%|███▋      | 29/80 [02:58<05:03,  5.95s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=2.26e-6, train/loss_step=0.000489, global_step=2387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  38%|███▊      | 30/80 [02:58<04:48,  5.77s/it, loss=0.00444, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=2.26e-6, train/loss_step=0.000489, global_step=2387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  38%|███▊      | 30/80 [02:58<04:48,  5.77s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=2e-6, train/loss_step=0.00043, global_step=2387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]     Epoch 119:  39%|███▉      | 31/80 [02:59<04:34,  5.61s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00043, train/loss_vlb_step=2e-6, train/loss_step=0.00043, global_step=2387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  39%|███▉      | 31/80 [02:59<04:34,  5.61s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=1.73e-6, train/loss_step=0.000356, global_step=2387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  40%|████      | 32/80 [03:38<05:17,  6.62s/it, loss=0.0034, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=1.73e-6, train/loss_step=0.000356, global_step=2387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  40%|████      | 32/80 [03:38<05:17,  6.62s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000198, train/loss_step=0.0256, global_step=2387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]   Epoch 119:  41%|████▏     | 33/80 [03:39<05:02,  6.44s/it, loss=0.0046, v_num=0, train/loss_simple_step=0.0256, train/loss_vlb_step=0.000198, train/loss_step=0.0256, global_step=2387.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  41%|████▏     | 33/80 [03:39<05:02,  6.44s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=6.92e-6, train/loss_step=0.00182, global_step=2388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  42%|████▎     | 34/80 [03:39<04:48,  6.27s/it, loss=0.0044, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=6.92e-6, train/loss_step=0.00182, global_step=2388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  42%|████▎     | 34/80 [03:39<04:48,  6.27s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.3e-5, train/loss_step=0.00347, global_step=2388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  44%|████▍     | 35/80 [03:40<04:35,  6.11s/it, loss=0.00448, v_num=0, train/loss_simple_step=0.00347, train/loss_vlb_step=1.3e-5, train/loss_step=0.00347, global_step=2388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  44%|████▍     | 35/80 [03:40<04:35,  6.11s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=9.5e-7, train/loss_step=0.000222, global_step=2388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  45%|████▌     | 36/80 [03:40<04:22,  5.96s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.000222, train/loss_vlb_step=9.5e-7, train/loss_step=0.000222, global_step=2388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  45%|████▌     | 36/80 [03:40<04:22,  5.96s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.26e-6, train/loss_step=0.000471, global_step=2388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  46%|████▋     | 37/80 [03:41<04:10,  5.82s/it, loss=0.00352, v_num=0, train/loss_simple_step=0.000471, train/loss_vlb_step=2.26e-6, train/loss_step=0.000471, global_step=2388.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  46%|████▋     | 37/80 [03:41<04:10,  5.82s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=4.75e-5, train/loss_step=0.0124, global_step=2389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]    Epoch 119:  48%|████▊     | 38/80 [03:41<03:58,  5.68s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=4.75e-5, train/loss_step=0.0124, global_step=2389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  48%|████▊     | 38/80 [03:41<03:58,  5.68s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=3.16e-6, train/loss_step=0.000424, global_step=2389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  49%|████▉     | 39/80 [03:42<03:47,  5.55s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000424, train/loss_vlb_step=3.16e-6, train/loss_step=0.000424, global_step=2389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  49%|████▉     | 39/80 [03:42<03:47,  5.55s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.56e-5, train/loss_step=0.012, global_step=2389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]      Epoch 119:  50%|█████     | 40/80 [04:24<04:18,  6.45s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=4.56e-5, train/loss_step=0.012, global_step=2389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  50%|█████     | 40/80 [04:24<04:18,  6.45s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=3.79e-5, train/loss_step=0.00892, global_step=2389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  51%|█████▏    | 41/80 [04:25<04:06,  6.31s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.00892, train/loss_vlb_step=3.79e-5, train/loss_step=0.00892, global_step=2389.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  51%|█████▏    | 41/80 [04:25<04:06,  6.31s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.32e-6, train/loss_step=0.000455, global_step=2390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  52%|█████▎    | 42/80 [04:25<03:54,  6.17s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.000455, train/loss_vlb_step=3.32e-6, train/loss_step=0.000455, global_step=2390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  52%|█████▎    | 42/80 [04:25<03:54,  6.17s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=1.06e-5, train/loss_step=0.00052, global_step=2390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.00052, train/loss_vlb_step=1.06e-5, train/loss_step=0.00052, global_step=2390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  54%|█████▍    | 43/80 [04:26<03:43,  6.05s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000792, train/loss_vlb_step=8.32e-6, train/loss_step=0.000792, global_step=2390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  55%|█████▌    | 44/80 [04:26<03:33,  5.93s/it, loss=0.00468, v_num=0, train/loss_simple_step=0.000792, train/loss_vlb_step=8.32e-6, train/loss_step=0.000792, global_step=2390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  55%|█████▌    | 44/80 [04:26<03:33,  5.93s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=2.7e-5, train/loss_step=0.00771, global_step=2390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]   Epoch 119:  56%|█████▋    | 45/80 [04:27<03:23,  5.81s/it, loss=0.00499, v_num=0, train/loss_simple_step=0.00771, train/loss_vlb_step=2.7e-5, train/loss_step=0.00771, global_step=2390.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  56%|█████▋    | 45/80 [04:27<03:23,  5.81s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000144, train/loss_step=0.0127, global_step=2391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344] Epoch 119:  57%|█████▊    | 46/80 [04:27<03:13,  5.70s/it, loss=0.0056, v_num=0, train/loss_simple_step=0.0127, train/loss_vlb_step=0.000144, train/loss_step=0.0127, global_step=2391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  57%|█████▊    | 46/80 [04:27<03:13,  5.70s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.27e-6, train/loss_step=0.000418, global_step=2391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.000418, train/loss_vlb_step=2.27e-6, train/loss_step=0.000418, global_step=2391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  59%|█████▉    | 47/80 [04:28<03:04,  5.59s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.8e-5, train/loss_step=0.00238, global_step=2391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]    Epoch 119:  60%|██████    | 48/80 [05:13<03:25,  6.41s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00238, train/loss_vlb_step=1.8e-5, train/loss_step=0.00238, global_step=2391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  60%|██████    | 48/80 [05:13<03:25,  6.41s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=5.05e-6, train/loss_step=0.000834, global_step=2391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  61%|���█████▏   | 49/80 [05:14<03:14,  6.29s/it, loss=0.00462, v_num=0, train/loss_simple_step=0.000834, train/loss_vlb_step=5.05e-6, train/loss_step=0.000834, global_step=2391.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  61%|██████▏   | 49/80 [05:14<03:14,  6.29s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=9.03e-6, train/loss_step=0.00241, global_step=2392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  62%|██████▎   | 50/80 [05:14<03:05,  6.17s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.00241, train/loss_vlb_step=9.03e-6, train/loss_step=0.00241, global_step=2392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  62%|██████▎   | 50/80 [05:14<03:05,  6.17s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.88e-6, train/loss_step=0.000416, global_step=2392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  64%|██████▍   | 51/80 [05:15<02:55,  6.07s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000416, train/loss_vlb_step=1.88e-6, train/loss_step=0.000416, global_step=2392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  64%|██████▍   | 51/80 [05:15<02:55,  6.07s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000379, train/loss_vlb_step=1.69e-6, train/loss_step=0.000379, global_step=2392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  65%|██████▌   | 52/80 [05:16<02:46,  5.96s/it, loss=0.00472, v_num=0, train/loss_simple_step=0.000379, train/loss_vlb_step=1.69e-6, train/loss_step=0.000379, global_step=2392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  65%|██████▌   | 52/80 [05:16<02:46,  5.96s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=0.000163, train/loss_step=0.00891, global_step=2392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344] Epoch 119:  66%|██████▋   | 53/80 [05:16<02:38,  5.87s/it, loss=0.00388, v_num=0, train/loss_simple_step=0.00891, train/loss_vlb_step=0.000163, train/loss_step=0.00891, global_step=2392.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  66%|██████▋   | 53/80 [05:16<02:38,  5.87s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=6.93e-5, train/loss_step=0.0124, global_step=2393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]   Epoch 119:  68%|██████▊   | 54/80 [05:17<02:30,  5.77s/it, loss=0.00441, v_num=0, train/loss_simple_step=0.0124, train/loss_vlb_step=6.93e-5, train/loss_step=0.0124, global_step=2393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  68%|██████▊   | 54/80 [05:17<02:30,  5.77s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7.5e-6, train/loss_step=0.00114, global_step=2393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  69%|██████▉   | 55/80 [05:17<02:21,  5.68s/it, loss=0.00429, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=7.5e-6, train/loss_step=0.00114, global_step=2393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  69%|██████▉   | 55/80 [05:17<02:21,  5.68s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=2.77e-6, train/loss_step=0.00059, global_step=2393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  70%|███████   | 56/80 [05:56<02:30,  6.26s/it, loss=0.00431, v_num=0, train/loss_simple_step=0.00059, train/loss_vlb_step=2.77e-6, train/loss_step=0.00059, global_step=2393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  70%|███████   | 56/80 [05:56<02:30,  6.26s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=8.91e-5, train/loss_step=0.0104, global_step=2393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  71%|███████▏  | 57/80 [05:57<02:21,  6.16s/it, loss=0.00481, v_num=0, train/loss_simple_step=0.0104, train/loss_vlb_step=8.91e-5, train/loss_step=0.0104, global_step=2393.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  71%|███████▏  | 57/80 [05:57<02:21,  6.16s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=0.000238, train/loss_step=0.0189, global_step=2394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  72%|███████▎  | 58/80 [05:57<02:13,  6.07s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.0189, train/loss_vlb_step=0.000238, train/loss_step=0.0189, global_step=2394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  72%|███████▎  | 58/80 [05:57<02:13,  6.07s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=7.1e-6, train/loss_step=0.0019, global_step=2394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.00521, v_num=0, train/loss_simple_step=0.0019, train/loss_vlb_step=7.1e-6, train/loss_step=0.0019, global_step=2394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  74%|███████▍  | 59/80 [05:58<02:05,  5.97s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=1.41e-5, train/loss_step=0.00377, global_step=2394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  75%|███████▌  | 60/80 [05:58<01:57,  5.88s/it, loss=0.0048, v_num=0, train/loss_simple_step=0.00377, train/loss_vlb_step=1.41e-5, train/loss_step=0.00377, global_step=2394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  75%|███████▌  | 60/80 [05:58<01:57,  5.88s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000394, train/loss_vlb_step=3e-6, train/loss_step=0.000394, global_step=2394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  76%|███████▋  | 61/80 [05:59<01:50,  5.80s/it, loss=0.00437, v_num=0, train/loss_simple_step=0.000394, train/loss_vlb_step=3e-6, train/loss_step=0.000394, global_step=2394.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  76%|███████▋  | 61/80 [05:59<01:50,  5.80s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.33e-5, train/loss_step=0.0079, global_step=2395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344] Epoch 119:  78%|███████▊  | 62/80 [05:59<01:42,  5.71s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0079, train/loss_vlb_step=3.33e-5, train/loss_step=0.0079, global_step=2395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  78%|███████▊  | 62/80 [05:59<01:42,  5.71s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000397, train/loss_vlb_step=1.73e-6, train/loss_step=0.000397, global_step=2395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.000397, train/loss_vlb_step=1.73e-6, train/loss_step=0.000397, global_step=2395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  79%|███████▉  | 63/80 [06:00<01:35,  5.63s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=2.86e-5, train/loss_step=0.0075, global_step=2395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]    Epoch 119:  80%|████████  | 64/80 [06:40<01:38,  6.16s/it, loss=0.00507, v_num=0, train/loss_simple_step=0.0075, train/loss_vlb_step=2.86e-5, train/loss_step=0.0075, global_step=2395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  80%|████████  | 64/80 [06:40<01:38,  6.16s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.22e-5, train/loss_step=0.00649, global_step=2395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  81%|████████▏ | 65/80 [06:41<01:31,  6.08s/it, loss=0.00501, v_num=0, train/loss_simple_step=0.00649, train/loss_vlb_step=2.22e-5, train/loss_step=0.00649, global_step=2395.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  81%|████████▏ | 65/80 [06:41<01:31,  6.08s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.37e-6, train/loss_step=0.000345, global_step=2396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  82%|████████▎ | 66/80 [06:41<01:23,  5.99s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.000345, train/loss_vlb_step=1.37e-6, train/loss_step=0.000345, global_step=2396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  82%|████████▎ | 66/80 [06:41<01:23,  5.99s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.72e-6, train/loss_step=0.00026, global_step=2396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  84%|████████▍ | 67/80 [06:42<01:16,  5.91s/it, loss=0.00439, v_num=0, train/loss_simple_step=0.00026, train/loss_vlb_step=1.72e-6, train/loss_step=0.00026, global_step=2396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  84%|████████▍ | 67/80 [06:42<01:16,  5.91s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000211, train/loss_vlb_step=1.12e-6, train/loss_step=0.000211, global_step=2396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  85%|████████▌ | 68/80 [06:42<01:10,  5.84s/it, loss=0.00428, v_num=0, train/loss_simple_step=0.000211, train/loss_vlb_step=1.12e-6, train/loss_step=0.000211, global_step=2396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  85%|████████▌ | 68/80 [06:42<01:10,  5.84s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=2.83e-6, train/loss_step=0.000749, global_step=2396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  86%|████████▋ | 69/80 [06:43<01:03,  5.76s/it, loss=0.00427, v_num=0, train/loss_simple_step=0.000749, train/loss_vlb_step=2.83e-6, train/loss_step=0.000749, global_step=2396.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  86%|████████▋ | 69/80 [06:43<01:03,  5.76s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=1.38e-5, train/loss_step=0.00392, global_step=2397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  88%|████████▊ | 70/80 [06:43<00:56,  5.69s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00392, train/loss_vlb_step=1.38e-5, train/loss_step=0.00392, global_step=2397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  88%|████████▊ | 70/80 [06:43<00:56,  5.69s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000738, train/loss_vlb_step=6.02e-6, train/loss_step=0.000738, global_step=2397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  89%|████████▉ | 71/80 [06:44<00:50,  5.62s/it, loss=0.00436, v_num=0, train/loss_simple_step=0.000738, train/loss_vlb_step=6.02e-6, train/loss_step=0.000738, global_step=2397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  89%|████████▉ | 71/80 [06:44<00:50,  5.62s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.21e-5, train/loss_step=0.0149, global_step=2397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]    Epoch 119:  90%|█████████ | 72/80 [07:15<00:47,  5.96s/it, loss=0.00509, v_num=0, train/loss_simple_step=0.0149, train/loss_vlb_step=6.21e-5, train/loss_step=0.0149, global_step=2397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  90%|█████████ | 72/80 [07:15<00:47,  5.96s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=0.000124, train/loss_step=0.00112, global_step=2397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  91%|█████████▏| 73/80 [07:15<00:41,  5.89s/it, loss=0.0047, v_num=0, train/loss_simple_step=0.00112, train/loss_vlb_step=0.000124, train/loss_step=0.00112, global_step=2397.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  91%|█████████▏| 73/80 [07:15<00:41,  5.89s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=3.94e-5, train/loss_step=0.00254, global_step=2398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  92%|█████████▎| 74/80 [07:16<00:34,  5.81s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00254, train/loss_vlb_step=3.94e-5, train/loss_step=0.00254, global_step=2398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  92%|█████████▎| 74/80 [07:16<00:34,  5.81s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=1.05e-6, train/loss_step=0.000236, global_step=2398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  94%|█████████▍| 75/80 [07:16<00:28,  5.74s/it, loss=0.00416, v_num=0, train/loss_simple_step=0.000236, train/loss_vlb_step=1.05e-6, train/loss_step=0.000236, global_step=2398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  94%|█████████▍| 75/80 [07:16<00:28,  5.74s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.22e-5, train/loss_step=0.00156, global_step=2398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  95%|█████████▌| 76/80 [07:17<00:22,  5.68s/it, loss=0.00421, v_num=0, train/loss_simple_step=0.00156, train/loss_vlb_step=1.22e-5, train/loss_step=0.00156, global_step=2398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  95%|█████████▌| 76/80 [07:17<00:22,  5.68s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.15e-5, train/loss_step=0.00788, global_step=2398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  96%|█████████▋| 77/80 [07:17<00:16,  5.61s/it, loss=0.00408, v_num=0, train/loss_simple_step=0.00788, train/loss_vlb_step=3.15e-5, train/loss_step=0.00788, global_step=2398.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  96%|█████████▋| 77/80 [07:17<00:16,  5.61s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=3.78e-5, train/loss_step=0.0106, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.0106, train/loss_vlb_step=3.78e-5, train/loss_step=0.0106, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  98%|█████████▊| 78/80 [07:18<00:11,  5.55s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.38e-6, train/loss_step=0.000304, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  99%|█████████▉| 79/80 [07:18<00:05,  5.48s/it, loss=0.00359, v_num=0, train/loss_simple_step=0.000304, train/loss_vlb_step=1.38e-6, train/loss_step=0.000304, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119:  99%|█████████▉| 79/80 [07:18<00:05,  5.48s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.09e-5, train/loss_step=0.00303, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 119: 100%|██████████| 80/80 [07:19<00:00,  5.42s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.00303, train/loss_vlb_step=1.09e-5, train/loss_step=0.00303, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 119: 100%|██████████| 80/80 [07:19<00:00,  5.42s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000327, train/loss_vlb_step=1.94e-6, train/loss_step=0.000327, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Average Epoch time: 439.22 seconds
+Average Peak memory 29569.40MiB
+Epoch 119:   0%|          | 0/80 [00:00<00:00, 4288.65it/s, loss=0.00355, v_num=0, train/loss_simple_step=0.000327, train/loss_vlb_step=1.94e-6, train/loss_step=0.000327, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 120:   0%|          | 0/80 [00:00<00:00, 1842.03it/s, loss=0.00355, v_num=0, train/loss_simple_step=0.000327, train/loss_vlb_step=1.94e-6, train/loss_step=0.000327, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]Epoch 120:   1%|▏         | 1/80 [00:39<26:15, 19.94s/it, loss=0.00355, v_num=0, train/loss_simple_step=0.000327, train/loss_vlb_step=1.94e-6, train/loss_step=0.000327, global_step=2399.0, lr_abs=0.0001, train/loss_simple_epoch=0.00344, train/loss_vlb_epoch=0.000105, train/loss_epoch=0.00344]  Epoch 120:   1%|▏         | 1/80 [00:39<26:15, 19.95s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=2.34e-5, train/loss_step=0.00688, global_step=2400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]    Epoch 120:   2%|▎         | 2/80 [00:45<19:55, 15.33s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.00688, train/loss_vlb_step=2.34e-5, train/loss_step=0.00688, global_step=2400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:   2%|▎         | 2/80 [00:45<19:55, 15.33s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=2.98e-6, train/loss_step=0.000468, global_step=2400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:   4%|▍         | 3/80 [00:46<14:54, 11.62s/it, loss=0.0035, v_num=0, train/loss_simple_step=0.000468, train/loss_vlb_step=2.98e-6, train/loss_step=0.000468, global_step=2400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:   4%|▍         | 3/80 [00:46<14:54, 11.62s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.3e-5, train/loss_step=0.00703, global_step=2400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]  Epoch 120:   5%|▌         | 4/80 [00:47<11:54,  9.40s/it, loss=0.00348, v_num=0, train/loss_simple_step=0.00703, train/loss_vlb_step=3.3e-5, train/loss_step=0.00703, global_step=2400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:   5%|▌         | 4/80 [00:47<11:54,  9.40s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000837, train/loss_vlb_step=0.000106, train/loss_step=0.000837, global_step=2400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:   6%|▋         | 5/80 [00:47<09:53,  7.92s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.000837, train/loss_vlb_step=0.000106, train/loss_step=0.000837, global_step=2400.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:   6%|▋         | 5/80 [00:47<09:54,  7.92s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=0.000387, train/loss_step=0.00114, global_step=2401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424] Epoch 120:   8%|▊         | 6/80 [00:49<08:47,  7.13s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00114, train/loss_vlb_step=0.000387, train/loss_step=0.00114, global_step=2401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:   8%|▊         | 6/80 [00:49<08:47,  7.13s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=1.28e-6, train/loss_step=0.00034, global_step=2401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424] Epoch 120:   9%|▉         | 7/80 [00:50<07:39,  6.30s/it, loss=0.00324, v_num=0, train/loss_simple_step=0.00034, train/loss_vlb_step=1.28e-6, train/loss_step=0.00034, global_step=2401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:   9%|▉         | 7/80 [00:50<07:39,  6.30s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.84e-5, train/loss_step=0.00433, global_step=2401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  10%|█         | 8/80 [01:27<11:41,  9.75s/it, loss=0.00345, v_num=0, train/loss_simple_step=0.00433, train/loss_vlb_step=2.84e-5, train/loss_step=0.00433, global_step=2401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  10%|█         | 8/80 [01:27<11:41,  9.75s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=4.25e-5, train/loss_step=0.00796, global_step=2401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  11%|█▏        | 9/80 [01:28<10:26,  8.82s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00796, train/loss_vlb_step=4.25e-5, train/loss_step=0.00796, global_step=2401.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  11%|█▏        | 9/80 [01:28<10:26,  8.82s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=1.23e-6, train/loss_step=0.000356, global_step=2402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  12%|█▎        | 10/80 [01:28<09:24,  8.07s/it, loss=0.00363, v_num=0, train/loss_simple_step=0.000356, train/loss_vlb_step=1.23e-6, train/loss_step=0.000356, global_step=2402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  12%|█▎        | 10/80 [01:28<09:24,  8.07s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=3.14e-6, train/loss_step=0.000544, global_step=2402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  14%|█▍        | 11/80 [01:29<08:33,  7.44s/it, loss=0.00362, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=3.14e-6, train/loss_step=0.000544, global_step=2402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  14%|█▍        | 11/80 [01:29<08:33,  7.44s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.23e-6, train/loss_step=0.00148, global_step=2402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]  Epoch 120:  15%|█▌        | 12/80 [01:29<07:49,  6.91s/it, loss=0.00295, v_num=0, train/loss_simple_step=0.00148, train/loss_vlb_step=6.23e-6, train/loss_step=0.00148, global_step=2402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  15%|█▌        | 12/80 [01:29<07:49,  6.91s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.16e-5, train/loss_step=0.00345, global_step=2402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  16%|█▋        | 13/80 [01:30<07:12,  6.45s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.00345, train/loss_vlb_step=1.16e-5, train/loss_step=0.00345, global_step=2402.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  16%|█▋        | 13/80 [01:30<07:12,  6.45s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.14e-5, train/loss_step=0.011, global_step=2403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]    Epoch 120:  18%|█▊        | 14/80 [01:43<07:34,  6.89s/it, loss=0.00349, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.14e-5, train/loss_step=0.011, global_step=2403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  18%|█▊        | 14/80 [01:43<07:34,  6.89s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=1.38e-5, train/loss_step=0.00415, global_step=2403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  19%|█▉        | 15/80 [01:43<07:01,  6.49s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00415, train/loss_vlb_step=1.38e-5, train/loss_step=0.00415, global_step=2403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  19%|█▉        | 15/80 [01:43<07:01,  6.49s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000182, train/loss_vlb_step=7.33e-7, train/loss_step=0.000182, global_step=2403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  20%|██        | 16/80 [02:07<07:59,  7.50s/it, loss=0.00361, v_num=0, train/loss_simple_step=0.000182, train/loss_vlb_step=7.33e-7, train/loss_step=0.000182, global_step=2403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  20%|██        | 16/80 [02:07<07:59,  7.50s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.00011, train/loss_step=0.0185, global_step=2403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]    Epoch 120:  21%|██▏       | 17/80 [02:08<07:28,  7.11s/it, loss=0.00414, v_num=0, train/loss_simple_step=0.0185, train/loss_vlb_step=0.00011, train/loss_step=0.0185, global_step=2403.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  21%|██▏       | 17/80 [02:08<07:28,  7.11s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000993, train/loss_vlb_step=4.69e-6, train/loss_step=0.000993, global_step=2404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  22%|██▎       | 18/80 [02:08<06:59,  6.76s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000993, train/loss_vlb_step=4.69e-6, train/loss_step=0.000993, global_step=2404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  22%|██▎       | 18/80 [02:08<06:59,  6.76s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.17e-5, train/loss_step=0.00334, global_step=2404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]  Epoch 120:  24%|██▍       | 19/80 [02:09<06:33,  6.45s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.00334, train/loss_vlb_step=1.17e-5, train/loss_step=0.00334, global_step=2404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  24%|██▍       | 19/80 [02:09<06:33,  6.45s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=1.99e-5, train/loss_step=0.00563, global_step=2404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  25%|██▌       | 20/80 [02:09<06:10,  6.18s/it, loss=0.00395, v_num=0, train/loss_simple_step=0.00563, train/loss_vlb_step=1.99e-5, train/loss_step=0.00563, global_step=2404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  25%|██▌       | 20/80 [02:09<06:10,  6.18s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.29e-5, train/loss_step=0.00336, global_step=2404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424] Epoch 120:  26%|██▋       | 21/80 [02:10<05:49,  5.92s/it, loss=0.0041, v_num=0, train/loss_simple_step=0.00336, train/loss_vlb_step=1.29e-5, train/loss_step=0.00336, global_step=2404.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  26%|██▋       | 21/80 [02:10<05:49,  5.92s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=2.28e-6, train/loss_step=0.000474, global_step=2405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  28%|██▊       | 22/80 [02:26<06:08,  6.35s/it, loss=0.00378, v_num=0, train/loss_simple_step=0.000474, train/loss_vlb_step=2.28e-6, train/loss_step=0.000474, global_step=2405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  28%|██▊       | 22/80 [02:26<06:08,  6.35s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=9.02e-7, train/loss_step=0.000207, global_step=2405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  29%|██▉       | 23/80 [02:26<05:48,  6.11s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=9.02e-7, train/loss_step=0.000207, global_step=2405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  29%|██▉       | 23/80 [02:26<05:48,  6.11s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=1.83e-5, train/loss_step=0.00543, global_step=2405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]  Epoch 120:  30%|███       | 24/80 [02:54<06:31,  6.99s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=1.83e-5, train/loss_step=0.00543, global_step=2405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  30%|███       | 24/80 [02:54<06:31,  6.99s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.52e-5, train/loss_step=0.00299, global_step=2405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  31%|███▏      | 25/80 [02:55<06:10,  6.75s/it, loss=0.00379, v_num=0, train/loss_simple_step=0.00299, train/loss_vlb_step=1.52e-5, train/loss_step=0.00299, global_step=2405.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  31%|███▏      | 25/80 [02:55<06:10,  6.75s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=6.93e-5, train/loss_step=0.00987, global_step=2406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  32%|███▎      | 26/80 [02:55<05:51,  6.51s/it, loss=0.00423, v_num=0, train/loss_simple_step=0.00987, train/loss_vlb_step=6.93e-5, train/loss_step=0.00987, global_step=2406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  32%|███▎      | 26/80 [02:55<05:51,  6.51s/it, loss=0.00421, v_num=0, train/loss_simple_step=8.08e-5, train/loss_vlb_step=3.58e-7, train/loss_step=8.08e-5, global_step=2406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  34%|███▍      | 27/80 [02:56<05:33,  6.30s/it, loss=0.00421, v_num=0, train/loss_simple_step=8.08e-5, train/loss_vlb_step=3.58e-7, train/loss_step=8.08e-5, global_step=2406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  34%|███▍      | 27/80 [02:56<05:33,  6.30s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000885, train/loss_vlb_step=3.72e-6, train/loss_step=0.000885, global_step=2406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  35%|███▌      | 28/80 [02:57<05:17,  6.11s/it, loss=0.00404, v_num=0, train/loss_simple_step=0.000885, train/loss_vlb_step=3.72e-6, train/loss_step=0.000885, global_step=2406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  35%|███▌      | 28/80 [02:57<05:17,  6.11s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000146, train/loss_vlb_step=6.06e-7, train/loss_step=0.000146, global_step=2406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  36%|███▋      | 29/80 [03:04<05:12,  6.14s/it, loss=0.00365, v_num=0, train/loss_simple_step=0.000146, train/loss_vlb_step=6.06e-7, train/loss_step=0.000146, global_step=2406.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  36%|███▋      | 29/80 [03:04<05:12,  6.14s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=2.52e-6, train/loss_step=0.000626, global_step=2407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  38%|███▊      | 30/80 [03:04<04:57,  5.95s/it, loss=0.00366, v_num=0, train/loss_simple_step=0.000626, train/loss_vlb_step=2.52e-6, train/loss_step=0.000626, global_step=2407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  38%|███▊      | 30/80 [03:04<04:57,  5.95s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000783, train/loss_vlb_step=4.35e-6, train/loss_step=0.000783, global_step=2407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  39%|███▉      | 31/80 [03:05<04:43,  5.78s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000783, train/loss_vlb_step=4.35e-6, train/loss_step=0.000783, global_step=2407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  39%|███▉      | 31/80 [03:05<04:43,  5.78s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.00108, train/loss_step=0.0211, global_step=2407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]    Epoch 120:  40%|████      | 32/80 [03:25<04:59,  6.24s/it, loss=0.00466, v_num=0, train/loss_simple_step=0.0211, train/loss_vlb_step=0.00108, train/loss_step=0.0211, global_step=2407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  40%|████      | 32/80 [03:25<04:59,  6.24s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=3.33e-5, train/loss_step=0.00863, global_step=2407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  41%|████▏     | 33/80 [03:26<04:45,  6.07s/it, loss=0.00492, v_num=0, train/loss_simple_step=0.00863, train/loss_vlb_step=3.33e-5, train/loss_step=0.00863, global_step=2407.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  41%|████▏     | 33/80 [03:26<04:45,  6.07s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=2.9e-6, train/loss_step=0.000294, global_step=2408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  42%|████▎     | 34/80 [03:27<04:32,  5.91s/it, loss=0.00438, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=2.9e-6, train/loss_step=0.000294, global_step=2408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  42%|████▎     | 34/80 [03:27<04:32,  5.91s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.34e-6, train/loss_step=0.00102, global_step=2408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424] Epoch 120:  44%|████▍     | 35/80 [03:27<04:19,  5.76s/it, loss=0.00422, v_num=0, train/loss_simple_step=0.00102, train/loss_vlb_step=4.34e-6, train/loss_step=0.00102, global_step=2408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  44%|████▍     | 35/80 [03:27<04:19,  5.76s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=3.9e-5, train/loss_step=0.00263, global_step=2408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424] Epoch 120:  45%|████▌     | 36/80 [03:28<04:07,  5.62s/it, loss=0.00435, v_num=0, train/loss_simple_step=0.00263, train/loss_vlb_step=3.9e-5, train/loss_step=0.00263, global_step=2408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  45%|████▌     | 36/80 [03:28<04:07,  5.62s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=0.000407, train/loss_step=0.00177, global_step=2408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  46%|████▋     | 37/80 [03:48<04:18,  6.00s/it, loss=0.00351, v_num=0, train/loss_simple_step=0.00177, train/loss_vlb_step=0.000407, train/loss_step=0.00177, global_step=2408.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  46%|████▋     | 37/80 [03:48<04:18,  6.00s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=4.52e-5, train/loss_step=0.00202, global_step=2409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424] Epoch 120:  48%|████▊     | 38/80 [03:49<04:07,  5.89s/it, loss=0.00356, v_num=0, train/loss_simple_step=0.00202, train/loss_vlb_step=4.52e-5, train/loss_step=0.00202, global_step=2409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  48%|████▊     | 38/80 [03:49<04:07,  5.89s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=2.52e-6, train/loss_step=0.000363, global_step=2409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  49%|████▉     | 39/80 [03:50<03:55,  5.75s/it, loss=0.00341, v_num=0, train/loss_simple_step=0.000363, train/loss_vlb_step=2.52e-6, train/loss_step=0.000363, global_step=2409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  49%|████▉     | 39/80 [03:50<03:55,  5.75s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.31e-5, train/loss_step=0.00186, global_step=2409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]  Epoch 120:  50%|█████     | 40/80 [04:09<04:03,  6.09s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.00186, train/loss_vlb_step=1.31e-5, train/loss_step=0.00186, global_step=2409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  50%|█████     | 40/80 [04:09<04:03,  6.09s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000152, train/loss_vlb_step=6.28e-7, train/loss_step=0.000152, global_step=2409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000152, train/loss_vlb_step=6.28e-7, train/loss_step=0.000152, global_step=2409.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  51%|█████▏    | 41/80 [04:10<03:52,  5.97s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=3.59e-6, train/loss_step=0.000259, global_step=2410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  52%|█████▎    | 42/80 [04:11<03:41,  5.84s/it, loss=0.00305, v_num=0, train/loss_simple_step=0.000259, train/loss_vlb_step=3.59e-6, train/loss_step=0.000259, global_step=2410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  52%|█████▎    | 42/80 [04:11<03:41,  5.84s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.31e-5, train/loss_step=0.00547, global_step=2410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]  Epoch 120:  54%|█████▍    | 43/80 [04:11<03:31,  5.72s/it, loss=0.00332, v_num=0, train/loss_simple_step=0.00547, train/loss_vlb_step=2.31e-5, train/loss_step=0.00547, global_step=2410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  54%|█████▍    | 43/80 [04:11<03:31,  5.72s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=1.3e-5, train/loss_step=0.000537, global_step=2410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  55%|█████▌    | 44/80 [04:19<03:27,  5.77s/it, loss=0.00307, v_num=0, train/loss_simple_step=0.000537, train/loss_vlb_step=1.3e-5, train/loss_step=0.000537, global_step=2410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  55%|█████▌    | 44/80 [04:19<03:27,  5.77s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.77e-6, train/loss_step=0.000321, global_step=2410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00294, v_num=0, train/loss_simple_step=0.000321, train/loss_vlb_step=1.77e-6, train/loss_step=0.000321, global_step=2410.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  56%|█████▋    | 45/80 [04:30<03:25,  5.88s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=1.29e-5, train/loss_step=0.00386, global_step=2411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]  Epoch 120:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00264, v_num=0, train/loss_simple_step=0.00386, train/loss_vlb_step=1.29e-5, train/loss_step=0.00386, global_step=2411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  57%|█████▊    | 46/80 [04:33<03:17,  5.82s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=6e-6, train/loss_step=0.0014, global_step=2411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]     Epoch 120:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.00271, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=6e-6, train/loss_step=0.0014, global_step=2411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  59%|█████▉    | 47/80 [04:33<03:08,  5.71s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.04e-5, train/loss_step=0.00277, global_step=2411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  60%|██████    | 48/80 [04:51<03:10,  5.95s/it, loss=0.0028, v_num=0, train/loss_simple_step=0.00277, train/loss_vlb_step=1.04e-5, train/loss_step=0.00277, global_step=2411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  60%|██████    | 48/80 [04:51<03:10,  5.95s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=7.77e-6, train/loss_step=0.00215, global_step=2411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  61%|██████▏   | 49/80 [04:52<03:01,  5.84s/it, loss=0.0029, v_num=0, train/loss_simple_step=0.00215, train/loss_vlb_step=7.77e-6, train/loss_step=0.00215, global_step=2411.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  61%|██████▏   | 49/80 [04:52<03:01,  5.84s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=5.38e-6, train/loss_step=0.000339, global_step=2412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  62%|██████▎   | 50/80 [04:52<02:52,  5.74s/it, loss=0.00289, v_num=0, train/loss_simple_step=0.000339, train/loss_vlb_step=5.38e-6, train/loss_step=0.000339, global_step=2412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  62%|██████▎   | 50/80 [04:52<02:52,  5.74s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=0.00016, train/loss_step=0.00714, global_step=2412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]   Epoch 120:  64%|██████▍   | 51/80 [04:53<02:43,  5.64s/it, loss=0.0032, v_num=0, train/loss_simple_step=0.00714, train/loss_vlb_step=0.00016, train/loss_step=0.00714, global_step=2412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  64%|██████▍   | 51/80 [04:53<02:43,  5.64s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.16e-5, train/loss_step=0.00543, global_step=2412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  65%|██████▌   | 52/80 [05:06<02:41,  5.77s/it, loss=0.00242, v_num=0, train/loss_simple_step=0.00543, train/loss_vlb_step=2.16e-5, train/loss_step=0.00543, global_step=2412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  65%|██████▌   | 52/80 [05:06<02:41,  5.77s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=5.87e-5, train/loss_step=0.010, global_step=2412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]    Epoch 120:  66%|██████▋   | 53/80 [05:15<02:37,  5.84s/it, loss=0.00249, v_num=0, train/loss_simple_step=0.010, train/loss_vlb_step=5.87e-5, train/loss_step=0.010, global_step=2412.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  66%|██████▋   | 53/80 [05:15<02:37,  5.84s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=1.7e-6, train/loss_step=0.000171, global_step=2413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.00248, v_num=0, train/loss_simple_step=0.000171, train/loss_vlb_step=1.7e-6, train/loss_step=0.000171, global_step=2413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  68%|██████▊   | 54/80 [05:15<02:29,  5.74s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=9.36e-6, train/loss_step=0.000467, global_step=2413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  69%|██████▉   | 55/80 [05:16<02:21,  5.65s/it, loss=0.00246, v_num=0, train/loss_simple_step=0.000467, train/loss_vlb_step=9.36e-6, train/loss_step=0.000467, global_step=2413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  69%|██████▉   | 55/80 [05:16<02:21,  5.65s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=2.57e-5, train/loss_step=0.00756, global_step=2413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]   Epoch 120:  70%|███████   | 56/80 [05:29<02:18,  5.79s/it, loss=0.0027, v_num=0, train/loss_simple_step=0.00756, train/loss_vlb_step=2.57e-5, train/loss_step=0.00756, global_step=2413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  70%|███████   | 56/80 [05:29<02:18,  5.79s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.87e-6, train/loss_step=0.000291, global_step=2413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  71%|███████▏  | 57/80 [05:30<02:11,  5.70s/it, loss=0.00263, v_num=0, train/loss_simple_step=0.000291, train/loss_vlb_step=1.87e-6, train/loss_step=0.000291, global_step=2413.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  71%|███████▏  | 57/80 [05:30<02:11,  5.70s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=8.39e-5, train/loss_step=0.0141, global_step=2414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]    Epoch 120:  72%|███████▎  | 58/80 [05:30<02:03,  5.61s/it, loss=0.00323, v_num=0, train/loss_simple_step=0.0141, train/loss_vlb_step=8.39e-5, train/loss_step=0.0141, global_step=2414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  72%|███████▎  | 58/80 [05:30<02:03,  5.61s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=1.06e-6, train/loss_step=0.000165, global_step=2414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  74%|███████▍  | 59/80 [05:31<01:55,  5.52s/it, loss=0.00322, v_num=0, train/loss_simple_step=0.000165, train/loss_vlb_step=1.06e-6, train/loss_step=0.000165, global_step=2414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  74%|███████▍  | 59/80 [05:31<01:55,  5.52s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=7.14e-5, train/loss_step=0.0137, global_step=2414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]    Epoch 120:  75%|███████▌  | 60/80 [05:54<01:56,  5.81s/it, loss=0.00381, v_num=0, train/loss_simple_step=0.0137, train/loss_vlb_step=7.14e-5, train/loss_step=0.0137, global_step=2414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  75%|███████▌  | 60/80 [05:54<01:56,  5.81s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=5.04e-6, train/loss_step=0.000635, global_step=2414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  76%|███████▋  | 61/80 [05:55<01:48,  5.74s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000635, train/loss_vlb_step=5.04e-6, train/loss_step=0.000635, global_step=2414.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  76%|███████▋  | 61/80 [05:55<01:48,  5.74s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=8.6e-7, train/loss_step=0.000192, global_step=2415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424] Epoch 120:  78%|███████▊  | 62/80 [05:56<01:41,  5.65s/it, loss=0.00384, v_num=0, train/loss_simple_step=0.000192, train/loss_vlb_step=8.6e-7, train/loss_step=0.000192, global_step=2415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  78%|███████▊  | 62/80 [05:56<01:41,  5.65s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.06e-5, train/loss_step=0.00258, global_step=2415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424] Epoch 120:  79%|███████▉  | 63/80 [05:56<01:34,  5.57s/it, loss=0.00369, v_num=0, train/loss_simple_step=0.00258, train/loss_vlb_step=1.06e-5, train/loss_step=0.00258, global_step=2415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  79%|███████▉  | 63/80 [05:56<01:34,  5.57s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=1.5e-6, train/loss_step=0.000213, global_step=2415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  80%|████████  | 64/80 [06:18<01:33,  5.83s/it, loss=0.00367, v_num=0, train/loss_simple_step=0.000213, train/loss_vlb_step=1.5e-6, train/loss_step=0.000213, global_step=2415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  80%|████████  | 64/80 [06:18<01:33,  5.83s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=3.72e-5, train/loss_step=0.0102, global_step=2415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]   Epoch 120:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00417, v_num=0, train/loss_simple_step=0.0102, train/loss_vlb_step=3.72e-5, train/loss_step=0.0102, global_step=2415.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  81%|████████▏ | 65/80 [06:19<01:26,  5.75s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.79e-6, train/loss_step=0.0014, global_step=2416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  82%|████████▎ | 66/80 [06:21<01:19,  5.69s/it, loss=0.00405, v_num=0, train/loss_simple_step=0.0014, train/loss_vlb_step=5.79e-6, train/loss_step=0.0014, global_step=2416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  82%|████████▎ | 66/80 [06:21<01:19,  5.69s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000145, train/loss_step=0.0139, global_step=2416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  84%|████████▍ | 67/80 [06:21<01:13,  5.62s/it, loss=0.00467, v_num=0, train/loss_simple_step=0.0139, train/loss_vlb_step=0.000145, train/loss_step=0.0139, global_step=2416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  84%|████████▍ | 67/80 [06:21<01:13,  5.62s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.000143, train/loss_vlb_step=6.83e-7, train/loss_step=0.000143, global_step=2416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  85%|████████▌ | 68/80 [06:41<01:09,  5.82s/it, loss=0.00454, v_num=0, train/loss_simple_step=0.000143, train/loss_vlb_step=6.83e-7, train/loss_step=0.000143, global_step=2416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  85%|████████▌ | 68/80 [06:41<01:09,  5.82s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=2.69e-6, train/loss_step=0.000489, global_step=2416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.00446, v_num=0, train/loss_simple_step=0.000489, train/loss_vlb_step=2.69e-6, train/loss_step=0.000489, global_step=2416.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  86%|████████▋ | 69/80 [06:42<01:03,  5.75s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=0.000516, train/loss_step=0.0196, global_step=2417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]   Epoch 120:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00542, v_num=0, train/loss_simple_step=0.0196, train/loss_vlb_step=0.000516, train/loss_step=0.0196, global_step=2417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  88%|████████▊ | 70/80 [06:42<00:56,  5.67s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.96e-6, train/loss_step=0.00145, global_step=2417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  89%|████████▉ | 71/80 [06:43<00:50,  5.60s/it, loss=0.00513, v_num=0, train/loss_simple_step=0.00145, train/loss_vlb_step=8.96e-6, train/loss_step=0.00145, global_step=2417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  89%|████████▉ | 71/80 [06:43<00:50,  5.60s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=7.43e-5, train/loss_step=0.00992, global_step=2417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  90%|█████████ | 72/80 [06:51<00:45,  5.64s/it, loss=0.00536, v_num=0, train/loss_simple_step=0.00992, train/loss_vlb_step=7.43e-5, train/loss_step=0.00992, global_step=2417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  90%|█████████ | 72/80 [06:51<00:45,  5.64s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000485, train/loss_vlb_step=2.27e-6, train/loss_step=0.000485, global_step=2417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  91%|█████████▏| 73/80 [06:52<00:39,  5.57s/it, loss=0.00488, v_num=0, train/loss_simple_step=0.000485, train/loss_vlb_step=2.27e-6, train/loss_step=0.000485, global_step=2417.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  91%|█████████▏| 73/80 [06:52<00:39,  5.57s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.87e-5, train/loss_step=0.00185, global_step=2418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]  Epoch 120:  92%|█████████▎| 74/80 [06:58<00:33,  5.58s/it, loss=0.00497, v_num=0, train/loss_simple_step=0.00185, train/loss_vlb_step=1.87e-5, train/loss_step=0.00185, global_step=2418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  92%|█████████▎| 74/80 [06:58<00:33,  5.58s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=2.44e-5, train/loss_step=0.00348, global_step=2418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  94%|█████████▍| 75/80 [06:59<00:27,  5.51s/it, loss=0.00512, v_num=0, train/loss_simple_step=0.00348, train/loss_vlb_step=2.44e-5, train/loss_step=0.00348, global_step=2418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  94%|█████████▍| 75/80 [06:59<00:27,  5.51s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.62e-6, train/loss_step=0.000286, global_step=2418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  95%|█████████▌| 76/80 [07:10<00:22,  5.60s/it, loss=0.00475, v_num=0, train/loss_simple_step=0.000286, train/loss_vlb_step=1.62e-6, train/loss_step=0.000286, global_step=2418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  95%|█████████▌| 76/80 [07:10<00:22,  5.60s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.65e-6, train/loss_step=0.000557, global_step=2418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  96%|█████████▋| 77/80 [07:11<00:16,  5.53s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.65e-6, train/loss_step=0.000557, global_step=2418.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  96%|█████████▋| 77/80 [07:11<00:16,  5.53s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.79e-6, train/loss_step=0.000557, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  98%|█████████▊| 78/80 [07:11<00:10,  5.47s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000557, train/loss_vlb_step=2.79e-6, train/loss_step=0.000557, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  98%|█████████▊| 78/80 [07:11<00:10,  5.47s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000178, train/loss_vlb_step=2.4e-6, train/loss_step=0.000178, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424] Epoch 120:  99%|█████████▉| 79/80 [07:12<00:05,  5.40s/it, loss=0.00409, v_num=0, train/loss_simple_step=0.000178, train/loss_vlb_step=2.4e-6, train/loss_step=0.000178, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120:  99%|█████████▉| 79/80 [07:12<00:05,  5.40s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.64e-5, train/loss_step=0.007, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]     Epoch 120: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.00376, v_num=0, train/loss_simple_step=0.007, train/loss_vlb_step=3.64e-5, train/loss_step=0.007, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 120: 100%|██████████| 80/80 [07:12<00:00,  5.34s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.29e-7, train/loss_step=0.00018, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Average Epoch time: 432.82 seconds
+Average Peak memory 29567.36MiB
+Epoch 120:   0%|          | 0/80 [00:00<00:00, 5482.75it/s, loss=0.00373, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.29e-7, train/loss_step=0.00018, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 121:   0%|          | 0/80 [00:00<00:00, 2086.72it/s, loss=0.00373, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.29e-7, train/loss_step=0.00018, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]Epoch 121:   1%|▏         | 1/80 [00:42<28:14, 21.45s/it, loss=0.00373, v_num=0, train/loss_simple_step=0.00018, train/loss_vlb_step=7.29e-7, train/loss_step=0.00018, global_step=2419.0, lr_abs=0.0001, train/loss_simple_epoch=0.00424, train/loss_vlb_epoch=8.28e-5, train/loss_epoch=0.00424]  Epoch 121:   1%|▏         | 1/80 [00:42<28:14, 21.45s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.77e-6, train/loss_step=0.000312, global_step=2420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   2%|▎         | 2/80 [00:43<18:47, 14.46s/it, loss=0.00374, v_num=0, train/loss_simple_step=0.000312, train/loss_vlb_step=1.77e-6, train/loss_step=0.000312, global_step=2420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   2%|▎         | 2/80 [00:43<18:47, 14.46s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00894, train/loss_vlb_step=3.41e-5, train/loss_step=0.00894, global_step=2420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]  Epoch 121:   4%|▍         | 3/80 [00:43<14:04, 10.97s/it, loss=0.00406, v_num=0, train/loss_simple_step=0.00894, train/loss_vlb_step=3.41e-5, train/loss_step=0.00894, global_step=2420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   4%|▍         | 3/80 [00:43<14:04, 10.97s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.01e-5, train/loss_step=0.00274, global_step=2420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   5%|▌         | 4/80 [00:44<11:14,  8.88s/it, loss=0.00418, v_num=0, train/loss_simple_step=0.00274, train/loss_vlb_step=1.01e-5, train/loss_step=0.00274, global_step=2420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   5%|▌         | 4/80 [00:44<11:14,  8.88s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=8.06e-7, train/loss_step=0.000166, global_step=2420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   6%|▋         | 5/80 [00:44<09:21,  7.48s/it, loss=0.00368, v_num=0, train/loss_simple_step=0.000166, train/loss_vlb_step=8.06e-7, train/loss_step=0.000166, global_step=2420.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   6%|▋         | 5/80 [00:44<09:21,  7.48s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=7.87e-6, train/loss_step=0.00179, global_step=2421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]   Epoch 121:   8%|▊         | 6/80 [00:45<07:59,  6.48s/it, loss=0.0037, v_num=0, train/loss_simple_step=0.00179, train/loss_vlb_step=7.87e-6, train/loss_step=0.00179, global_step=2421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   8%|▊         | 6/80 [00:45<07:59,  6.48s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000262, train/loss_vlb_step=3.07e-6, train/loss_step=0.000262, global_step=2421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   9%|▉         | 7/80 [00:45<06:58,  5.74s/it, loss=0.00302, v_num=0, train/loss_simple_step=0.000262, train/loss_vlb_step=3.07e-6, train/loss_step=0.000262, global_step=2421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:   9%|▉         | 7/80 [00:45<06:58,  5.74s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.45e-5, train/loss_step=0.00654, global_step=2421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]  Epoch 121:  10%|█         | 8/80 [01:18<10:24,  8.68s/it, loss=0.00334, v_num=0, train/loss_simple_step=0.00654, train/loss_vlb_step=2.45e-5, train/loss_step=0.00654, global_step=2421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  10%|█         | 8/80 [01:18<10:24,  8.68s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.0009, train/loss_vlb_step=3.8e-6, train/loss_step=0.0009, global_step=2421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]   Epoch 121:  11%|█▏        | 9/80 [01:20<09:32,  8.06s/it, loss=0.00336, v_num=0, train/loss_simple_step=0.0009, train/loss_vlb_step=3.8e-6, train/loss_step=0.0009, global_step=2421.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  11%|█▏        | 9/80 [01:20<09:32,  8.06s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=6.54e-5, train/loss_step=0.00319, global_step=2422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  12%|█▎        | 10/80 [01:21<08:36,  7.37s/it, loss=0.00254, v_num=0, train/loss_simple_step=0.00319, train/loss_vlb_step=6.54e-5, train/loss_step=0.00319, global_step=2422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  12%|█▎        | 10/80 [01:21<08:36,  7.37s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=1.71e-5, train/loss_step=0.0011, global_step=2422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]  Epoch 121:  14%|█▍        | 11/80 [01:24<08:05,  7.03s/it, loss=0.00252, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=1.71e-5, train/loss_step=0.0011, global_step=2422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  14%|█▍        | 11/80 [01:24<08:05,  7.03s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=8.3e-7, train/loss_step=0.000225, global_step=2422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  15%|█▌        | 12/80 [01:24<07:24,  6.53s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.000225, train/loss_vlb_step=8.3e-7, train/loss_step=0.000225, global_step=2422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  15%|█▌        | 12/80 [01:24<07:24,  6.53s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=8.43e-6, train/loss_step=0.000605, global_step=2422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  16%|█▋        | 13/80 [01:38<07:52,  7.05s/it, loss=0.00204, v_num=0, train/loss_simple_step=0.000605, train/loss_vlb_step=8.43e-6, train/loss_step=0.000605, global_step=2422.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  16%|█▋        | 13/80 [01:38<07:52,  7.05s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=4.5e-5, train/loss_step=0.0125, global_step=2423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]     Epoch 121:  18%|█▊        | 14/80 [01:39<07:16,  6.61s/it, loss=0.00258, v_num=0, train/loss_simple_step=0.0125, train/loss_vlb_step=4.5e-5, train/loss_step=0.0125, global_step=2423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  18%|█▊        | 14/80 [01:39<07:16,  6.61s/it, loss=0.003, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=8.89e-5, train/loss_step=0.012, global_step=2423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]   Epoch 121:  19%|█▉        | 15/80 [01:39<06:45,  6.23s/it, loss=0.003, v_num=0, train/loss_simple_step=0.012, train/loss_vlb_step=8.89e-5, train/loss_step=0.012, global_step=2423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  19%|█▉        | 15/80 [01:39<06:45,  6.23s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.00099, train/loss_step=0.0232, global_step=2423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  20%|██        | 16/80 [02:03<07:46,  7.29s/it, loss=0.00415, v_num=0, train/loss_simple_step=0.0232, train/loss_vlb_step=0.00099, train/loss_step=0.0232, global_step=2423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  20%|██        | 16/80 [02:03<07:46,  7.29s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=7.99e-5, train/loss_step=0.0118, global_step=2423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  21%|██▏       | 17/80 [02:04<07:15,  6.91s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0118, train/loss_vlb_step=7.99e-5, train/loss_step=0.0118, global_step=2423.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  21%|██▏       | 17/80 [02:04<07:15,  6.91s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=3.72e-6, train/loss_step=0.0011, global_step=2424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  22%|██▎       | 18/80 [02:04<06:47,  6.57s/it, loss=0.00474, v_num=0, train/loss_simple_step=0.0011, train/loss_vlb_step=3.72e-6, train/loss_step=0.0011, global_step=2424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  22%|██▎       | 18/80 [02:04<06:47,  6.57s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000799, train/loss_vlb_step=4.06e-6, train/loss_step=0.000799, global_step=2424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  24%|██▍       | 19/80 [02:05<06:22,  6.27s/it, loss=0.00477, v_num=0, train/loss_simple_step=0.000799, train/loss_vlb_step=4.06e-6, train/loss_step=0.000799, global_step=2424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  24%|██▍       | 19/80 [02:05<06:22,  6.27s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.0199, train/loss_step=0.0427, global_step=2424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]     Epoch 121:  25%|██▌       | 20/80 [02:06<06:00,  6.01s/it, loss=0.00656, v_num=0, train/loss_simple_step=0.0427, train/loss_vlb_step=0.0199, train/loss_step=0.0427, global_step=2424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  25%|██▌       | 20/80 [02:06<06:00,  6.01s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=3.95e-6, train/loss_step=0.000377, global_step=2424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  26%|██▋       | 21/80 [02:35<06:57,  7.07s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.000377, train/loss_vlb_step=3.95e-6, train/loss_step=0.000377, global_step=2424.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  26%|██▋       | 21/80 [02:35<06:57,  7.07s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=2.25e-6, train/loss_step=0.000381, global_step=2425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  28%|██▊       | 22/80 [02:35<06:33,  6.78s/it, loss=0.00657, v_num=0, train/loss_simple_step=0.000381, train/loss_vlb_step=2.25e-6, train/loss_step=0.000381, global_step=2425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  28%|██▊       | 22/80 [02:35<06:33,  6.78s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.00055, train/loss_vlb_step=2.04e-6, train/loss_step=0.00055, global_step=2425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]  Epoch 121:  29%|██▉       | 23/80 [02:36<06:11,  6.52s/it, loss=0.00615, v_num=0, train/loss_simple_step=0.00055, train/loss_vlb_step=2.04e-6, train/loss_step=0.00055, global_step=2425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  29%|██▉       | 23/80 [02:36<06:11,  6.52s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=3.36e-5, train/loss_step=0.00874, global_step=2425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  30%|███       | 24/80 [02:52<06:26,  6.90s/it, loss=0.00645, v_num=0, train/loss_simple_step=0.00874, train/loss_vlb_step=3.36e-5, train/loss_step=0.00874, global_step=2425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  30%|███       | 24/80 [02:52<06:26,  6.90s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.000724, train/loss_vlb_step=2.85e-5, train/loss_step=0.000724, global_step=2425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  31%|███▏      | 25/80 [02:52<06:05,  6.65s/it, loss=0.00648, v_num=0, train/loss_simple_step=0.000724, train/loss_vlb_step=2.85e-5, train/loss_step=0.000724, global_step=2425.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  31%|███▏      | 25/80 [02:52<06:05,  6.65s/it, loss=0.00681, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.58e-5, train/loss_step=0.00844, global_step=2426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]  Epoch 121:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.00681, v_num=0, train/loss_simple_step=0.00844, train/loss_vlb_step=3.58e-5, train/loss_step=0.00844, global_step=2426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  32%|███▎      | 26/80 [02:53<05:46,  6.42s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=2.97e-6, train/loss_step=0.000661, global_step=2426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  34%|███▍      | 27/80 [02:53<05:29,  6.21s/it, loss=0.00683, v_num=0, train/loss_simple_step=0.000661, train/loss_vlb_step=2.97e-6, train/loss_step=0.000661, global_step=2426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  34%|███▍      | 27/80 [02:53<05:29,  6.21s/it, loss=0.00711, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000129, train/loss_step=0.0121, global_step=2426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]   Epoch 121:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00711, v_num=0, train/loss_simple_step=0.0121, train/loss_vlb_step=0.000129, train/loss_step=0.0121, global_step=2426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  35%|███▌      | 28/80 [02:54<05:12,  6.01s/it, loss=0.00774, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=0.000112, train/loss_step=0.0135, global_step=2426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  36%|███▋      | 29/80 [03:21<05:42,  6.72s/it, loss=0.00774, v_num=0, train/loss_simple_step=0.0135, train/loss_vlb_step=0.000112, train/loss_step=0.0135, global_step=2426.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  36%|███▋      | 29/80 [03:21<05:42,  6.72s/it, loss=0.00797, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=2.89e-5, train/loss_step=0.0078, global_step=2427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409] Epoch 121:  38%|███▊      | 30/80 [03:22<05:26,  6.52s/it, loss=0.00797, v_num=0, train/loss_simple_step=0.0078, train/loss_vlb_step=2.89e-5, train/loss_step=0.0078, global_step=2427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  38%|███▊      | 30/80 [03:22<05:26,  6.52s/it, loss=0.00793, v_num=0, train/loss_simple_step=0.000335, train/loss_vlb_step=2.16e-6, train/loss_step=0.000335, global_step=2427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  39%|███▉      | 31/80 [03:22<05:10,  6.33s/it, loss=0.00793, v_num=0, train/loss_simple_step=0.000335, train/loss_vlb_step=2.16e-6, train/loss_step=0.000335, global_step=2427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  39%|███▉      | 31/80 [03:22<05:10,  6.33s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.000358, train/loss_vlb_step=1.49e-6, train/loss_step=0.000358, global_step=2427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  40%|████      | 32/80 [03:38<05:17,  6.62s/it, loss=0.00794, v_num=0, train/loss_simple_step=0.000358, train/loss_vlb_step=1.49e-6, train/loss_step=0.000358, global_step=2427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  40%|████      | 32/80 [03:38<05:17,  6.62s/it, loss=0.00823, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=2.55e-5, train/loss_step=0.00646, global_step=2427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]  Epoch 121:  41%|████▏     | 33/80 [03:39<05:02,  6.44s/it, loss=0.00823, v_num=0, train/loss_simple_step=0.00646, train/loss_vlb_step=2.55e-5, train/loss_step=0.00646, global_step=2427.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  41%|████▏     | 33/80 [03:39<05:02,  6.44s/it, loss=0.00765, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=4.04e-6, train/loss_step=0.000887, global_step=2428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  42%|████▎     | 34/80 [03:39<04:48,  6.27s/it, loss=0.00765, v_num=0, train/loss_simple_step=0.000887, train/loss_vlb_step=4.04e-6, train/loss_step=0.000887, global_step=2428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  42%|████▎     | 34/80 [03:39<04:48,  6.27s/it, loss=0.00714, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=6.89e-6, train/loss_step=0.00182, global_step=2428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]  Epoch 121:  44%|████▍     | 35/80 [03:40<04:35,  6.11s/it, loss=0.00714, v_num=0, train/loss_simple_step=0.00182, train/loss_vlb_step=6.89e-6, train/loss_step=0.00182, global_step=2428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  44%|████▍     | 35/80 [03:40<04:35,  6.11s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.000694, train/loss_vlb_step=3.12e-6, train/loss_step=0.000694, global_step=2428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  45%|████▌     | 36/80 [03:40<04:22,  5.96s/it, loss=0.00601, v_num=0, train/loss_simple_step=0.000694, train/loss_vlb_step=3.12e-6, train/loss_step=0.000694, global_step=2428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  45%|████▌     | 36/80 [03:40<04:22,  5.96s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=1.08e-6, train/loss_step=0.000186, global_step=2428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  46%|████▋     | 37/80 [03:59<04:30,  6.30s/it, loss=0.00543, v_num=0, train/loss_simple_step=0.000186, train/loss_vlb_step=1.08e-6, train/loss_step=0.000186, global_step=2428.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  46%|████▋     | 37/80 [03:59<04:30,  6.30s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.07e-5, train/loss_step=0.00292, global_step=2429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]  Epoch 121:  48%|████▊     | 38/80 [03:59<04:18,  6.15s/it, loss=0.00552, v_num=0, train/loss_simple_step=0.00292, train/loss_vlb_step=1.07e-5, train/loss_step=0.00292, global_step=2429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  48%|████▊     | 38/80 [03:59<04:18,  6.15s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.04e-6, train/loss_step=0.000254, global_step=2429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  49%|████▉     | 39/80 [04:00<04:06,  6.01s/it, loss=0.00549, v_num=0, train/loss_simple_step=0.000254, train/loss_vlb_step=1.04e-6, train/loss_step=0.000254, global_step=2429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  49%|████▉     | 39/80 [04:00<04:06,  6.01s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=8.07e-6, train/loss_step=0.000544, global_step=2429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  50%|█████     | 40/80 [04:19<04:13,  6.34s/it, loss=0.00339, v_num=0, train/loss_simple_step=0.000544, train/loss_vlb_step=8.07e-6, train/loss_step=0.000544, global_step=2429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  50%|█████     | 40/80 [04:19<04:13,  6.34s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.23e-5, train/loss_step=0.011, global_step=2429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]      Epoch 121:  51%|█████▏    | 41/80 [04:20<04:01,  6.20s/it, loss=0.00392, v_num=0, train/loss_simple_step=0.011, train/loss_vlb_step=4.23e-5, train/loss_step=0.011, global_step=2429.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  51%|█████▏    | 41/80 [04:20<04:01,  6.20s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=8.55e-5, train/loss_step=0.0148, global_step=2430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  52%|█████▎    | 42/80 [04:20<03:50,  6.07s/it, loss=0.00464, v_num=0, train/loss_simple_step=0.0148, train/loss_vlb_step=8.55e-5, train/loss_step=0.0148, global_step=2430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  52%|█████▎    | 42/80 [04:20<03:50,  6.07s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=4.07e-6, train/loss_step=0.000294, global_step=2430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  54%|█████▍    | 43/80 [04:21<03:40,  5.95s/it, loss=0.00463, v_num=0, train/loss_simple_step=0.000294, train/loss_vlb_step=4.07e-6, train/loss_step=0.000294, global_step=2430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  54%|█████▍    | 43/80 [04:21<03:40,  5.95s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=7.75e-5, train/loss_step=0.0103, global_step=2430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]    Epoch 121:  55%|█████▌    | 44/80 [04:22<03:29,  5.83s/it, loss=0.00471, v_num=0, train/loss_simple_step=0.0103, train/loss_vlb_step=7.75e-5, train/loss_step=0.0103, global_step=2430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  55%|█████▌    | 44/80 [04:22<03:29,  5.83s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00975, train/loss_vlb_step=4.05e-5, train/loss_step=0.00975, global_step=2430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  56%|█████▋    | 45/80 [04:48<03:39,  6.27s/it, loss=0.00516, v_num=0, train/loss_simple_step=0.00975, train/loss_vlb_step=4.05e-5, train/loss_step=0.00975, global_step=2430.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  56%|█████▋    | 45/80 [04:48<03:39,  6.27s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=0.00129, train/loss_step=0.0233, global_step=2431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]   Epoch 121:  57%|█████▊    | 46/80 [04:48<03:28,  6.15s/it, loss=0.0059, v_num=0, train/loss_simple_step=0.0233, train/loss_vlb_step=0.00129, train/loss_step=0.0233, global_step=2431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  57%|█████▊    | 46/80 [04:48<03:28,  6.15s/it, loss=0.00708, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000183, train/loss_step=0.0242, global_step=2431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  59%|█████▉    | 47/80 [04:49<03:18,  6.03s/it, loss=0.00708, v_num=0, train/loss_simple_step=0.0242, train/loss_vlb_step=0.000183, train/loss_step=0.0242, global_step=2431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  59%|█████▉    | 47/80 [04:49<03:18,  6.03s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=9.75e-6, train/loss_step=0.00283, global_step=2431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  60%|██████    | 48/80 [04:53<03:11,  5.99s/it, loss=0.00661, v_num=0, train/loss_simple_step=0.00283, train/loss_vlb_step=9.75e-6, train/loss_step=0.00283, global_step=2431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  60%|██████    | 48/80 [04:53<03:11,  5.99s/it, loss=0.006, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=0.000137, train/loss_step=0.0012, global_step=2431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]   Epoch 121:  61%|██████▏   | 49/80 [04:54<03:02,  5.88s/it, loss=0.006, v_num=0, train/loss_simple_step=0.0012, train/loss_vlb_step=0.000137, train/loss_step=0.0012, global_step=2431.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  61%|██████▏   | 49/80 [04:54<03:02,  5.88s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=2.71e-5, train/loss_step=0.00749, global_step=2432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  62%|██████▎   | 50/80 [04:54<02:53,  5.78s/it, loss=0.00598, v_num=0, train/loss_simple_step=0.00749, train/loss_vlb_step=2.71e-5, train/loss_step=0.00749, global_step=2432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  62%|██████▎   | 50/80 [04:54<02:53,  5.78s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=4.65e-5, train/loss_step=0.00674, global_step=2432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409] Epoch 121:  64%|██████▍   | 51/80 [05:01<02:48,  5.80s/it, loss=0.0063, v_num=0, train/loss_simple_step=0.00674, train/loss_vlb_step=4.65e-5, train/loss_step=0.00674, global_step=2432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  64%|██████▍   | 51/80 [05:01<02:48,  5.80s/it, loss=0.00681, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=9.98e-5, train/loss_step=0.0105, global_step=2432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409] Epoch 121:  65%|██████▌   | 52/80 [05:01<02:39,  5.70s/it, loss=0.00681, v_num=0, train/loss_simple_step=0.0105, train/loss_vlb_step=9.98e-5, train/loss_step=0.0105, global_step=2432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  65%|██████▌   | 52/80 [05:01<02:39,  5.70s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=3.03e-6, train/loss_step=0.000336, global_step=2432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  66%|██████▋   | 53/80 [05:35<02:47,  6.22s/it, loss=0.00651, v_num=0, train/loss_simple_step=0.000336, train/loss_vlb_step=3.03e-6, train/loss_step=0.000336, global_step=2432.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  66%|██████▋   | 53/80 [05:35<02:47,  6.22s/it, loss=0.00803, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.0157, train/loss_step=0.0313, global_step=2433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]     Epoch 121:  68%|██████▊   | 54/80 [05:36<02:39,  6.12s/it, loss=0.00803, v_num=0, train/loss_simple_step=0.0313, train/loss_vlb_step=0.0157, train/loss_step=0.0313, global_step=2433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  68%|██████▊   | 54/80 [05:36<02:39,  6.12s/it, loss=0.00797, v_num=0, train/loss_simple_step=0.000652, train/loss_vlb_step=3.03e-6, train/loss_step=0.000652, global_step=2433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  69%|██████▉   | 55/80 [05:36<02:30,  6.02s/it, loss=0.00797, v_num=0, train/loss_simple_step=0.000652, train/loss_vlb_step=3.03e-6, train/loss_step=0.000652, global_step=2433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  69%|██████▉   | 55/80 [05:36<02:30,  6.02s/it, loss=0.00796, v_num=0, train/loss_simple_step=0.000568, train/loss_vlb_step=2.13e-6, train/loss_step=0.000568, global_step=2433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  70%|███████   | 56/80 [05:38<02:22,  5.93s/it, loss=0.00796, v_num=0, train/loss_simple_step=0.000568, train/loss_vlb_step=2.13e-6, train/loss_step=0.000568, global_step=2433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  70%|███████   | 56/80 [05:38<02:22,  5.93s/it, loss=0.00796, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.92e-7, train/loss_step=0.000207, global_step=2433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  71%|███████▏  | 57/80 [05:39<02:14,  5.85s/it, loss=0.00796, v_num=0, train/loss_simple_step=0.000207, train/loss_vlb_step=8.92e-7, train/loss_step=0.000207, global_step=2433.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  71%|███████▏  | 57/80 [05:39<02:14,  5.85s/it, loss=0.00811, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.06e-5, train/loss_step=0.00579, global_step=2434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]  Epoch 121:  72%|███████▎  | 58/80 [05:39<02:06,  5.76s/it, loss=0.00811, v_num=0, train/loss_simple_step=0.00579, train/loss_vlb_step=2.06e-5, train/loss_step=0.00579, global_step=2434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  72%|███████▎  | 58/80 [05:39<02:06,  5.76s/it, loss=0.00834, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=1.68e-5, train/loss_step=0.00492, global_step=2434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  74%|███████▍  | 59/80 [05:51<02:02,  5.85s/it, loss=0.00834, v_num=0, train/loss_simple_step=0.00492, train/loss_vlb_step=1.68e-5, train/loss_step=0.00492, global_step=2434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  74%|███████▍  | 59/80 [05:51<02:02,  5.85s/it, loss=0.00837, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.7e-6, train/loss_step=0.00117, global_step=2434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409] Epoch 121:  75%|███████▌  | 60/80 [05:51<01:55,  5.77s/it, loss=0.00837, v_num=0, train/loss_simple_step=0.00117, train/loss_vlb_step=5.7e-6, train/loss_step=0.00117, global_step=2434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  75%|███████▌  | 60/80 [05:51<01:55,  5.77s/it, loss=0.00804, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.43e-5, train/loss_step=0.0043, global_step=2434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409] Epoch 121:  76%|███████▋  | 61/80 [06:19<01:56,  6.12s/it, loss=0.00804, v_num=0, train/loss_simple_step=0.0043, train/loss_vlb_step=1.43e-5, train/loss_step=0.0043, global_step=2434.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  76%|███████▋  | 61/80 [06:19<01:56,  6.12s/it, loss=0.00777, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=5.03e-5, train/loss_step=0.00946, global_step=2435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  78%|███████▊  | 62/80 [06:20<01:48,  6.03s/it, loss=0.00777, v_num=0, train/loss_simple_step=0.00946, train/loss_vlb_step=5.03e-5, train/loss_step=0.00946, global_step=2435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  78%|███████▊  | 62/80 [06:20<01:48,  6.03s/it, loss=0.00813, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=2.53e-5, train/loss_step=0.00754, global_step=2435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  79%|███████▉  | 63/80 [06:20<01:41,  5.95s/it, loss=0.00813, v_num=0, train/loss_simple_step=0.00754, train/loss_vlb_step=2.53e-5, train/loss_step=0.00754, global_step=2435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  79%|███████▉  | 63/80 [06:20<01:41,  5.95s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=2.51e-5, train/loss_step=0.00721, global_step=2435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  80%|████████  | 64/80 [06:21<01:33,  5.86s/it, loss=0.00798, v_num=0, train/loss_simple_step=0.00721, train/loss_vlb_step=2.51e-5, train/loss_step=0.00721, global_step=2435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  80%|████████  | 64/80 [06:21<01:33,  5.86s/it, loss=0.0075, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=9.52e-7, train/loss_step=0.000199, global_step=2435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  81%|████████▏ | 65/80 [06:21<01:26,  5.79s/it, loss=0.0075, v_num=0, train/loss_simple_step=0.000199, train/loss_vlb_step=9.52e-7, train/loss_step=0.000199, global_step=2435.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  81%|████████▏ | 65/80 [06:21<01:26,  5.79s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=7.58e-6, train/loss_step=0.00209, global_step=2436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409] Epoch 121:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.00644, v_num=0, train/loss_simple_step=0.00209, train/loss_vlb_step=7.58e-6, train/loss_step=0.00209, global_step=2436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409]Epoch 121:  82%|████████▎ | 66/80 [06:22<01:19,  5.71s/it, loss=0.00627, v_num=0, train/loss_simple_step=0.0208, train/loss_vlb_step=0.000322, train/loss_step=0.0208, global_step=2436.0, lr_abs=0.0001, train/loss_simple_epoch=0.00409, train/loss_vlb_epoch=0.000103, train/loss_epoch=0.00409] 
\ No newline at end of file