Training in progress, step 42600

Browse files

Files changed (13) hide show

checkpoint-42600/config.json +117 -0
checkpoint-42600/optimizer.pt +3 -0
checkpoint-42600/preprocessor_config.json +9 -0
checkpoint-42600/pytorch_model.bin +3 -0
checkpoint-42600/rng_state.pth +3 -0
checkpoint-42600/scaler.pt +3 -0
checkpoint-42600/scheduler.pt +3 -0
checkpoint-42600/trainer_state.json +106 -0
checkpoint-42600/training_args.bin +3 -0
pytorch_model.bin +2 -2
runs/Apr02_11-39-56_364af271dda7/1775136463.0385299/events.out.tfevents.1775136463.364af271dda7.26706.1 +3 -0
runs/Apr02_11-39-56_364af271dda7/events.out.tfevents.1775136463.364af271dda7.26706.0 +3 -0
training_args.bin +2 -2

checkpoint-42600/config.json ADDED Viewed

	@@ -0,0 +1,117 @@

+{
+  "_name_or_path": "facebook/wav2vec2-base",
+  "activation_dropout": 0.0,
+  "adapter_kernel_size": 3,
+  "adapter_stride": 2,
+  "add_adapter": false,
+  "apply_spec_augment": true,
+  "architectures": [
+    "Wav2Vec2ForCTC"
+  ],
+  "attention_dropout": 0.1,
+  "bos_token_id": 1,
+  "classifier_proj_size": 256,
+  "codevector_dim": 256,
+  "contrastive_logits_temperature": 0.1,
+  "conv_bias": false,
+  "conv_dim": [
+    512,
+    512,
+    512,
+    512,
+    512,
+    512,
+    512
+  ],
+  "conv_kernel": [
+    10,
+    3,
+    3,
+    3,
+    3,
+    2,
+    2
+  ],
+  "conv_stride": [
+    5,
+    2,
+    2,
+    2,
+    2,
+    2,
+    2
+  ],
+  "ctc_loss_reduction": "mean",
+  "ctc_zero_infinity": false,
+  "diversity_loss_weight": 0.1,
+  "do_stable_layer_norm": false,
+  "eos_token_id": 2,
+  "feat_extract_activation": "gelu",
+  "feat_extract_norm": "group",
+  "feat_proj_dropout": 0.1,
+  "feat_quantizer_dropout": 0.0,
+  "final_dropout": 0.0,
+  "freeze_feat_extract_train": true,
+  "hidden_act": "gelu",
+  "hidden_dropout": 0.1,
+  "hidden_size": 768,
+  "initializer_range": 0.02,
+  "intermediate_size": 3072,
+  "layer_norm_eps": 1e-05,
+  "layerdrop": 0.0,
+  "mask_channel_length": 10,
+  "mask_channel_min_space": 1,
+  "mask_channel_other": 0.0,
+  "mask_channel_prob": 0.0,
+  "mask_channel_selection": "static",
+  "mask_feature_length": 10,
+  "mask_feature_min_masks": 0,
+  "mask_feature_prob": 0.0,
+  "mask_time_length": 10,
+  "mask_time_min_masks": 2,
+  "mask_time_min_space": 1,
+  "mask_time_other": 0.0,
+  "mask_time_prob": 0.05,
+  "mask_time_selection": "static",
+  "model_type": "wav2vec2",
+  "no_mask_channel_overlap": false,
+  "no_mask_time_overlap": false,
+  "num_adapter_layers": 3,
+  "num_attention_heads": 12,
+  "num_codevector_groups": 2,
+  "num_codevectors_per_group": 320,
+  "num_conv_pos_embedding_groups": 16,
+  "num_conv_pos_embeddings": 128,
+  "num_feat_extract_layers": 7,
+  "num_hidden_layers": 12,
+  "num_negatives": 100,
+  "output_hidden_size": 768,
+  "pad_token_id": 29,
+  "proj_codevector_dim": 256,
+  "tdnn_dilation": [
+    1,
+    2,
+    3,
+    1,
+    1
+  ],
+  "tdnn_dim": [
+    512,
+    512,
+    512,
+    512,
+    1500
+  ],
+  "tdnn_kernel": [
+    5,
+    3,
+    3,
+    1,
+    1
+  ],
+  "torch_dtype": "float32",
+  "transformers_version": "4.17.0",
+  "use_weighted_layer_sum": false,
+  "vocab_size": 32,
+  "xvector_output_dim": 512
+}

checkpoint-42600/optimizer.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:0b4c4b333b97f0149964651f74eaa66101d66e936fbc61ebe79da9a0ee2c197c
+size 721687098

checkpoint-42600/preprocessor_config.json ADDED Viewed

	@@ -0,0 +1,9 @@

+{
+  "do_normalize": true,
+  "feature_extractor_type": "Wav2Vec2FeatureExtractor",
+  "feature_size": 1,
+  "padding_side": "right",
+  "padding_value": 0.0,
+  "return_attention_mask": false,
+  "sampling_rate": 16000
+}

checkpoint-42600/pytorch_model.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:8d71780a36fc085126b5a0a4ef930e98f7ece9349bee575d90e4a0f81c475c48
+size 377673950

checkpoint-42600/rng_state.pth ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7b5ec54c45daae3ad43ee6e040a40ed36b5d581e594bbd01e674c86829218d1f
+size 14308

checkpoint-42600/scaler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:6d73036264655c5c1491cf5fff954a0cc29c3156f389e14cb5234dfaa4706556
+size 988

checkpoint-42600/scheduler.pt ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:a37fc39caa933e6c8f072c0eacc110c699acb993c4c2163f268da0d9550b53f2
+size 1064

checkpoint-42600/trainer_state.json ADDED Viewed

	@@ -0,0 +1,106 @@

+{
+  "best_metric": 0.711880624294281,
+  "best_model_checkpoint": "JuanPajero/FT-S5-LM/checkpoint-28400",
+  "epoch": 5.924895688456189,
+  "global_step": 42600,
+  "is_hyper_param_search": false,
+  "is_local_process_zero": true,
+  "is_world_process_zero": true,
+  "log_history": [
+    {
+      "epoch": 0.99,
+      "learning_rate": 2.9599443671766344e-05,
+      "loss": 1.9414,
+      "step": 7100
+    },
+    {
+      "epoch": 0.99,
+      "eval_loss": 0.8335326910018921,
+      "eval_runtime": 1360.1504,
+      "eval_samples_per_second": 14.653,
+      "eval_steps_per_second": 1.832,
+      "eval_wer": 0.36493978206843813,
+      "step": 7100
+    },
+    {
+      "epoch": 1.97,
+      "learning_rate": 2.67538247566064e-05,
+      "loss": 0.408,
+      "step": 14200
+    },
+    {
+      "epoch": 1.97,
+      "eval_loss": 0.7351572513580322,
+      "eval_runtime": 1358.9899,
+      "eval_samples_per_second": 14.665,
+      "eval_steps_per_second": 1.834,
+      "eval_wer": 0.30366915185114385,
+      "step": 14200
+    },
+    {
+      "epoch": 2.96,
+      "learning_rate": 2.3463606861381546e-05,
+      "loss": 0.3353,
+      "step": 21300
+    },
+    {
+      "epoch": 2.96,
+      "eval_loss": 0.7796653509140015,
+      "eval_runtime": 1356.2281,
+      "eval_samples_per_second": 14.695,
+      "eval_steps_per_second": 1.837,
+      "eval_wer": 0.29224494997769707,
+      "step": 21300
+    },
+    {
+      "epoch": 3.95,
+      "learning_rate": 2.01733889661567e-05,
+      "loss": 0.2987,
+      "step": 28400
+    },
+    {
+      "epoch": 3.95,
+      "eval_loss": 0.711880624294281,
+      "eval_runtime": 1361.6488,
+      "eval_samples_per_second": 14.637,
+      "eval_steps_per_second": 1.83,
+      "eval_wer": 0.28044605875230993,
+      "step": 28400
+    },
+    {
+      "epoch": 4.94,
+      "learning_rate": 1.6881780250347706e-05,
+      "loss": 0.2745,
+      "step": 35500
+    },
+    {
+      "epoch": 4.94,
+      "eval_loss": 0.7512252926826477,
+      "eval_runtime": 1356.3308,
+      "eval_samples_per_second": 14.694,
+      "eval_steps_per_second": 1.837,
+      "eval_wer": 0.27383164468234245,
+      "step": 35500
+    },
+    {
+      "epoch": 5.92,
+      "learning_rate": 1.3592025961984237e-05,
+      "loss": 0.2565,
+      "step": 42600
+    },
+    {
+      "epoch": 5.92,
+      "eval_loss": 0.7549805045127869,
+      "eval_runtime": 1225.2522,
+      "eval_samples_per_second": 16.264,
+      "eval_steps_per_second": 2.033,
+      "eval_wer": 0.2705310068428191,
+      "step": 42600
+    }
+  ],
+  "max_steps": 71900,
+  "num_train_epochs": 10,
+  "total_flos": 5.089903415040246e+19,
+  "trial_name": null,
+  "trial_params": null
+}

checkpoint-42600/training_args.bin ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:edb5c936e2bed1fcba8598d1651ae9feb05ba224acab141e9c89fb7fe00c9faa
+size 3512

pytorch_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:25eb6802cf1c505fb18c7da90333257255ed42790e9d9309091793334e84d9ba
-size 377674359

 version https://git-lfs.github.com/spec/v1
+oid sha256:8d71780a36fc085126b5a0a4ef930e98f7ece9349bee575d90e4a0f81c475c48
+size 377673950

runs/Apr02_11-39-56_364af271dda7/1775136463.0385299/events.out.tfevents.1775136463.364af271dda7.26706.1 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:7293118f5fe1b81fb5079d62149f69bdbf76b78789b29d1380851c1cbb7b4cb3
+size 4856

runs/Apr02_11-39-56_364af271dda7/events.out.tfevents.1775136463.364af271dda7.26706.0 ADDED Viewed

	@@ -0,0 +1,3 @@

+version https://git-lfs.github.com/spec/v1
+oid sha256:cafb75901d86850ccd1d9dad6035c3bfa63329990af11fd40c05026ce873859a
+size 5554

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:92831e3dde557c0ac1ed5581de6b5f29e4012bc89328c613f8ee387cb824f24f
-size 3921

 version https://git-lfs.github.com/spec/v1
+oid sha256:edb5c936e2bed1fcba8598d1651ae9feb05ba224acab141e9c89fb7fe00c9faa
+size 3512