TableGPT2-7B / trainer_state.json

Revert "eval (#6)"

6a74973 over 1 year ago

379 kB

	{
	"best_metric": null,
	"best_model_checkpoint": null,
	"epoch": 0.8806026624471123,
	"eval_steps": 200,
	"global_step": 3200,
	"is_hyper_param_search": false,
	"is_local_process_zero": true,
	"is_world_process_zero": true,
	"log_history": [
	{
	"epoch": 0.0005503766640294451,
	"grad_norm": 2.2015435695648193,
	"learning_rate": 1.4775011317868612e-06,
	"loss": 0.7802,
	"step": 2
	},
	{
	"epoch": 0.0011007533280588903,
	"grad_norm": 2.0623114109039307,
	"learning_rate": 2.9550022635737224e-06,
	"loss": 0.6659,
	"step": 4
	},
	{
	"epoch": 0.0016511299920883354,
	"grad_norm": 0.8444932699203491,
	"learning_rate": 3.819285020442103e-06,
	"loss": 0.6275,
	"step": 6
	},
	{
	"epoch": 0.0022015066561177805,
	"grad_norm": 0.7291238307952881,
	"learning_rate": 4.432503395360583e-06,
	"loss": 0.5955,
	"step": 8
	},
	{
	"epoch": 0.0027518833201472257,
	"grad_norm": 0.591098427772522,
	"learning_rate": 4.90815251991065e-06,
	"loss": 0.5906,
	"step": 10
	},
	{
	"epoch": 0.003302259984176671,
	"grad_norm": 0.6075527667999268,
	"learning_rate": 5.2967861522289644e-06,
	"loss": 0.5451,
	"step": 12
	},
	{
	"epoch": 0.003852636648206116,
	"grad_norm": 0.5598031878471375,
	"learning_rate": 5.625371206454386e-06,
	"loss": 0.5539,
	"step": 14
	},
	{
	"epoch": 0.004403013312235561,
	"grad_norm": 0.5352339148521423,
	"learning_rate": 5.910004527147445e-06,
	"loss": 0.5452,
	"step": 16
	},
	{
	"epoch": 0.004953389976265006,
	"grad_norm": 0.524741530418396,
	"learning_rate": 6.161068909097345e-06,
	"loss": 0.5536,
	"step": 18
	},
	{
	"epoch": 0.005503766640294451,
	"grad_norm": 0.4852159321308136,
	"learning_rate": 6.38565365169751e-06,
	"loss": 0.5439,
	"step": 20
	},
	{
	"epoch": 0.0060541433043238965,
	"grad_norm": 0.4764852225780487,
	"learning_rate": 6.5888152636627215e-06,
	"loss": 0.5468,
	"step": 22
	},
	{
	"epoch": 0.006604519968353342,
	"grad_norm": 0.463278591632843,
	"learning_rate": 6.774287284015826e-06,
	"loss": 0.541,
	"step": 24
	},
	{
	"epoch": 0.007154896632382787,
	"grad_norm": 0.4566305875778198,
	"learning_rate": 6.944905003449378e-06,
	"loss": 0.5258,
	"step": 26
	},
	{
	"epoch": 0.007705273296412232,
	"grad_norm": 0.4572094678878784,
	"learning_rate": 7.102872338241248e-06,
	"loss": 0.5385,
	"step": 28
	},
	{
	"epoch": 0.008255649960441678,
	"grad_norm": 0.4581094980239868,
	"learning_rate": 7.2499364085658915e-06,
	"loss": 0.5258,
	"step": 30
	},
	{
	"epoch": 0.008806026624471122,
	"grad_norm": 0.4602491557598114,
	"learning_rate": 7.387505658934305e-06,
	"loss": 0.5239,
	"step": 32
	},
	{
	"epoch": 0.009356403288500568,
	"grad_norm": 0.4633028507232666,
	"learning_rate": 7.516732105870977e-06,
	"loss": 0.5237,
	"step": 34
	},
	{
	"epoch": 0.009906779952530012,
	"grad_norm": 0.4267115592956543,
	"learning_rate": 7.638570040884206e-06,
	"loss": 0.5467,
	"step": 36
	},
	{
	"epoch": 0.010457156616559458,
	"grad_norm": 0.4587521255016327,
	"learning_rate": 7.753818840648305e-06,
	"loss": 0.5282,
	"step": 38
	},
	{
	"epoch": 0.011007533280588903,
	"grad_norm": 0.44529175758361816,
	"learning_rate": 7.863154783484372e-06,
	"loss": 0.536,
	"step": 40
	},
	{
	"epoch": 0.011557909944618349,
	"grad_norm": 0.436199814081192,
	"learning_rate": 7.967155095109629e-06,
	"loss": 0.5259,
	"step": 42
	},
	{
	"epoch": 0.012108286608647793,
	"grad_norm": 0.43157511949539185,
	"learning_rate": 8.066316395449581e-06,
	"loss": 0.5173,
	"step": 44
	},
	{
	"epoch": 0.012658663272677239,
	"grad_norm": 0.4393196105957031,
	"learning_rate": 8.161069041569085e-06,
	"loss": 0.5037,
	"step": 46
	},
	{
	"epoch": 0.013209039936706683,
	"grad_norm": 0.5085024237632751,
	"learning_rate": 8.251788415802687e-06,
	"loss": 0.5015,
	"step": 48
	},
	{
	"epoch": 0.01375941660073613,
	"grad_norm": 0.40056705474853516,
	"learning_rate": 8.338803908034438e-06,
	"loss": 0.5194,
	"step": 50
	},
	{
	"epoch": 0.014309793264765574,
	"grad_norm": 0.43617382645606995,
	"learning_rate": 8.422406135236239e-06,
	"loss": 0.5327,
	"step": 52
	},
	{
	"epoch": 0.01486016992879502,
	"grad_norm": 0.42528873682022095,
	"learning_rate": 8.502852797752587e-06,
	"loss": 0.5245,
	"step": 54
	},
	{
	"epoch": 0.015410546592824464,
	"grad_norm": 0.40340831875801086,
	"learning_rate": 8.58037347002811e-06,
	"loss": 0.5059,
	"step": 56
	},
	{
	"epoch": 0.015960923256853908,
	"grad_norm": 0.40859195590019226,
	"learning_rate": 8.65517355028691e-06,
	"loss": 0.5136,
	"step": 58
	},
	{
	"epoch": 0.016511299920883356,
	"grad_norm": 0.42262887954711914,
	"learning_rate": 8.727437540352753e-06,
	"loss": 0.5011,
	"step": 60
	},
	{
	"epoch": 0.0170616765849128,
	"grad_norm": 0.4255228638648987,
	"learning_rate": 8.79733178747776e-06,
	"loss": 0.5218,
	"step": 62
	},
	{
	"epoch": 0.017612053248942244,
	"grad_norm": 0.4350854754447937,
	"learning_rate": 8.865006790721166e-06,
	"loss": 0.5334,
	"step": 64
	},
	{
	"epoch": 0.01816242991297169,
	"grad_norm": 0.41395291686058044,
	"learning_rate": 8.930599152317962e-06,
	"loss": 0.5233,
	"step": 66
	},
	{
	"epoch": 0.018712806577001136,
	"grad_norm": 0.4127484858036041,
	"learning_rate": 8.99423323765784e-06,
	"loss": 0.5143,
	"step": 68
	},
	{
	"epoch": 0.01926318324103058,
	"grad_norm": 0.42464280128479004,
	"learning_rate": 9.056022594578175e-06,
	"loss": 0.5164,
	"step": 70
	},
	{
	"epoch": 0.019813559905060025,
	"grad_norm": 0.4011682868003845,
	"learning_rate": 9.116071172671068e-06,
	"loss": 0.5036,
	"step": 72
	},
	{
	"epoch": 0.02036393656908947,
	"grad_norm": 0.39912551641464233,
	"learning_rate": 9.174474375494509e-06,
	"loss": 0.5038,
	"step": 74
	},
	{
	"epoch": 0.020914313233118917,
	"grad_norm": 0.40526625514030457,
	"learning_rate": 9.231319972435167e-06,
	"loss": 0.518,
	"step": 76
	},
	{
	"epoch": 0.02146468989714836,
	"grad_norm": 0.4195484220981598,
	"learning_rate": 9.28668889210462e-06,
	"loss": 0.5065,
	"step": 78
	},
	{
	"epoch": 0.022015066561177805,
	"grad_norm": 0.4483351409435272,
	"learning_rate": 9.340655915271231e-06,
	"loss": 0.5128,
	"step": 80
	},
	{
	"epoch": 0.02256544322520725,
	"grad_norm": 0.42789894342422485,
	"learning_rate": 9.393290282217048e-06,
	"loss": 0.525,
	"step": 82
	},
	{
	"epoch": 0.023115819889236697,
	"grad_norm": 0.434644490480423,
	"learning_rate": 9.444656226896488e-06,
	"loss": 0.5248,
	"step": 84
	},
	{
	"epoch": 0.02366619655326614,
	"grad_norm": 0.4532856345176697,
	"learning_rate": 9.494813448234365e-06,
	"loss": 0.5226,
	"step": 86
	},
	{
	"epoch": 0.024216573217295586,
	"grad_norm": 0.4103749692440033,
	"learning_rate": 9.543817527236444e-06,
	"loss": 0.5034,
	"step": 88
	},
	{
	"epoch": 0.02476694988132503,
	"grad_norm": 0.4208613336086273,
	"learning_rate": 9.591720297221133e-06,
	"loss": 0.5214,
	"step": 90
	},
	{
	"epoch": 0.025317326545354478,
	"grad_norm": 0.4020327627658844,
	"learning_rate": 9.638570173355947e-06,
	"loss": 0.5047,
	"step": 92
	},
	{
	"epoch": 0.025867703209383922,
	"grad_norm": 0.4074559509754181,
	"learning_rate": 9.684412446751251e-06,
	"loss": 0.4999,
	"step": 94
	},
	{
	"epoch": 0.026418079873413366,
	"grad_norm": 0.43330731987953186,
	"learning_rate": 9.729289547589548e-06,
	"loss": 0.5089,
	"step": 96
	},
	{
	"epoch": 0.02696845653744281,
	"grad_norm": 0.42775431275367737,
	"learning_rate": 9.773241281121913e-06,
	"loss": 0.5169,
	"step": 98
	},
	{
	"epoch": 0.02751883320147226,
	"grad_norm": 0.421403706073761,
	"learning_rate": 9.8163050398213e-06,
	"loss": 0.5123,
	"step": 100
	},
	{
	"epoch": 0.028069209865501703,
	"grad_norm": 0.42337778210639954,
	"learning_rate": 9.858515994526218e-06,
	"loss": 0.5116,
	"step": 102
	},
	{
	"epoch": 0.028619586529531147,
	"grad_norm": 0.4156826138496399,
	"learning_rate": 9.8999072670231e-06,
	"loss": 0.5077,
	"step": 104
	},
	{
	"epoch": 0.02916996319356059,
	"grad_norm": 0.4544354975223541,
	"learning_rate": 9.9405100861891e-06,
	"loss": 0.5099,
	"step": 106
	},
	{
	"epoch": 0.02972033985759004,
	"grad_norm": 0.4015970528125763,
	"learning_rate": 9.980353929539448e-06,
	"loss": 0.5049,
	"step": 108
	},
	{
	"epoch": 0.030270716521619483,
	"grad_norm": 0.3907098174095154,
	"learning_rate": 1e-05,
	"loss": 0.5202,
	"step": 110
	},
	{
	"epoch": 0.030821093185648928,
	"grad_norm": 0.4184499979019165,
	"learning_rate": 1e-05,
	"loss": 0.5085,
	"step": 112
	},
	{
	"epoch": 0.031371469849678375,
	"grad_norm": 0.47195565700531006,
	"learning_rate": 1e-05,
	"loss": 0.5161,
	"step": 114
	},
	{
	"epoch": 0.031921846513707816,
	"grad_norm": 0.43992695212364197,
	"learning_rate": 1e-05,
	"loss": 0.4978,
	"step": 116
	},
	{
	"epoch": 0.032472223177737264,
	"grad_norm": 0.43099331855773926,
	"learning_rate": 1e-05,
	"loss": 0.5035,
	"step": 118
	},
	{
	"epoch": 0.03302259984176671,
	"grad_norm": 0.44256317615509033,
	"learning_rate": 1e-05,
	"loss": 0.4991,
	"step": 120
	},
	{
	"epoch": 0.03357297650579615,
	"grad_norm": 0.42082124948501587,
	"learning_rate": 1e-05,
	"loss": 0.5028,
	"step": 122
	},
	{
	"epoch": 0.0341233531698256,
	"grad_norm": 0.38576358556747437,
	"learning_rate": 1e-05,
	"loss": 0.5081,
	"step": 124
	},
	{
	"epoch": 0.03467372983385505,
	"grad_norm": 0.3880733251571655,
	"learning_rate": 1e-05,
	"loss": 0.5001,
	"step": 126
	},
	{
	"epoch": 0.03522410649788449,
	"grad_norm": 0.41802075505256653,
	"learning_rate": 1e-05,
	"loss": 0.5056,
	"step": 128
	},
	{
	"epoch": 0.035774483161913936,
	"grad_norm": 0.3949527144432068,
	"learning_rate": 1e-05,
	"loss": 0.5155,
	"step": 130
	},
	{
	"epoch": 0.03632485982594338,
	"grad_norm": 0.4038969576358795,
	"learning_rate": 1e-05,
	"loss": 0.5056,
	"step": 132
	},
	{
	"epoch": 0.036875236489972825,
	"grad_norm": 0.40195325016975403,
	"learning_rate": 1e-05,
	"loss": 0.4968,
	"step": 134
	},
	{
	"epoch": 0.03742561315400227,
	"grad_norm": 0.3946043848991394,
	"learning_rate": 1e-05,
	"loss": 0.4981,
	"step": 136
	},
	{
	"epoch": 0.037975989818031713,
	"grad_norm": 0.3914756774902344,
	"learning_rate": 1e-05,
	"loss": 0.5,
	"step": 138
	},
	{
	"epoch": 0.03852636648206116,
	"grad_norm": 0.4295148551464081,
	"learning_rate": 1e-05,
	"loss": 0.5147,
	"step": 140
	},
	{
	"epoch": 0.03907674314609061,
	"grad_norm": 0.40092742443084717,
	"learning_rate": 1e-05,
	"loss": 0.5196,
	"step": 142
	},
	{
	"epoch": 0.03962711981012005,
	"grad_norm": 0.41200628876686096,
	"learning_rate": 1e-05,
	"loss": 0.5031,
	"step": 144
	},
	{
	"epoch": 0.0401774964741495,
	"grad_norm": 0.43834391236305237,
	"learning_rate": 1e-05,
	"loss": 0.5047,
	"step": 146
	},
	{
	"epoch": 0.04072787313817894,
	"grad_norm": 0.3940436542034149,
	"learning_rate": 1e-05,
	"loss": 0.4912,
	"step": 148
	},
	{
	"epoch": 0.041278249802208386,
	"grad_norm": 0.3873765170574188,
	"learning_rate": 1e-05,
	"loss": 0.482,
	"step": 150
	},
	{
	"epoch": 0.041828626466237834,
	"grad_norm": 0.4272858798503876,
	"learning_rate": 1e-05,
	"loss": 0.4923,
	"step": 152
	},
	{
	"epoch": 0.042379003130267275,
	"grad_norm": 0.40542730689048767,
	"learning_rate": 1e-05,
	"loss": 0.4892,
	"step": 154
	},
	{
	"epoch": 0.04292937979429672,
	"grad_norm": 0.38277357816696167,
	"learning_rate": 1e-05,
	"loss": 0.517,
	"step": 156
	},
	{
	"epoch": 0.04347975645832617,
	"grad_norm": 0.39421385526657104,
	"learning_rate": 1e-05,
	"loss": 0.503,
	"step": 158
	},
	{
	"epoch": 0.04403013312235561,
	"grad_norm": 0.3984109163284302,
	"learning_rate": 1e-05,
	"loss": 0.5074,
	"step": 160
	},
	{
	"epoch": 0.04458050978638506,
	"grad_norm": 0.40513876080513,
	"learning_rate": 1e-05,
	"loss": 0.5092,
	"step": 162
	},
	{
	"epoch": 0.0451308864504145,
	"grad_norm": 0.45850449800491333,
	"learning_rate": 1e-05,
	"loss": 0.5086,
	"step": 164
	},
	{
	"epoch": 0.04568126311444395,
	"grad_norm": 0.4050631821155548,
	"learning_rate": 1e-05,
	"loss": 0.5073,
	"step": 166
	},
	{
	"epoch": 0.046231639778473395,
	"grad_norm": 0.41050952672958374,
	"learning_rate": 1e-05,
	"loss": 0.5007,
	"step": 168
	},
	{
	"epoch": 0.046782016442502836,
	"grad_norm": 0.39902788400650024,
	"learning_rate": 1e-05,
	"loss": 0.4941,
	"step": 170
	},
	{
	"epoch": 0.04733239310653228,
	"grad_norm": 0.4421572983264923,
	"learning_rate": 1e-05,
	"loss": 0.4988,
	"step": 172
	},
	{
	"epoch": 0.04788276977056173,
	"grad_norm": 0.4092646837234497,
	"learning_rate": 1e-05,
	"loss": 0.5001,
	"step": 174
	},
	{
	"epoch": 0.04843314643459117,
	"grad_norm": 0.4195966124534607,
	"learning_rate": 1e-05,
	"loss": 0.4964,
	"step": 176
	},
	{
	"epoch": 0.04898352309862062,
	"grad_norm": 0.3937481641769409,
	"learning_rate": 1e-05,
	"loss": 0.4977,
	"step": 178
	},
	{
	"epoch": 0.04953389976265006,
	"grad_norm": 0.434950590133667,
	"learning_rate": 1e-05,
	"loss": 0.5054,
	"step": 180
	},
	{
	"epoch": 0.05008427642667951,
	"grad_norm": 0.40112894773483276,
	"learning_rate": 1e-05,
	"loss": 0.494,
	"step": 182
	},
	{
	"epoch": 0.050634653090708956,
	"grad_norm": 0.42001938819885254,
	"learning_rate": 1e-05,
	"loss": 0.4744,
	"step": 184
	},
	{
	"epoch": 0.0511850297547384,
	"grad_norm": 0.4066455364227295,
	"learning_rate": 1e-05,
	"loss": 0.4838,
	"step": 186
	},
	{
	"epoch": 0.051735406418767844,
	"grad_norm": 0.3934157192707062,
	"learning_rate": 1e-05,
	"loss": 0.5017,
	"step": 188
	},
	{
	"epoch": 0.05228578308279729,
	"grad_norm": 0.38877320289611816,
	"learning_rate": 1e-05,
	"loss": 0.5018,
	"step": 190
	},
	{
	"epoch": 0.05283615974682673,
	"grad_norm": 0.39771756529808044,
	"learning_rate": 1e-05,
	"loss": 0.485,
	"step": 192
	},
	{
	"epoch": 0.05338653641085618,
	"grad_norm": 0.3938674330711365,
	"learning_rate": 1e-05,
	"loss": 0.5034,
	"step": 194
	},
	{
	"epoch": 0.05393691307488562,
	"grad_norm": 0.40473559498786926,
	"learning_rate": 1e-05,
	"loss": 0.5082,
	"step": 196
	},
	{
	"epoch": 0.05448728973891507,
	"grad_norm": 0.3977149426937103,
	"learning_rate": 1e-05,
	"loss": 0.4997,
	"step": 198
	},
	{
	"epoch": 0.05503766640294452,
	"grad_norm": 0.39340054988861084,
	"learning_rate": 1e-05,
	"loss": 0.4859,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_merge_loss": 0.4414624571800232,
	"eval_merge_runtime": 600.1539,
	"eval_merge_samples_per_second": 56.239,
	"eval_merge_steps_per_second": 2.344,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_new_aug_datas_filtered.json_loss": 0.5691156983375549,
	"eval_new_aug_datas_filtered.json_runtime": 10.6767,
	"eval_new_aug_datas_filtered.json_samples_per_second": 71.839,
	"eval_new_aug_datas_filtered.json_steps_per_second": 2.997,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_sharegpt_gpt4.json_loss": 0.8223738670349121,
	"eval_sharegpt_gpt4.json_runtime": 31.6183,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.858,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.467,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_Table_GPT.json_loss": 0.09253557026386261,
	"eval_Table_GPT.json_runtime": 24.9748,
	"eval_Table_GPT.json_samples_per_second": 83.804,
	"eval_Table_GPT.json_steps_per_second": 3.524,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_gpt_4o_200k.json_loss": 0.849287211894989,
	"eval_gpt_4o_200k.json_runtime": 48.5339,
	"eval_gpt_4o_200k.json_samples_per_second": 129.415,
	"eval_gpt_4o_200k.json_steps_per_second": 5.398,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_multi_turn_datas.json_loss": 0.3907540738582611,
	"eval_multi_turn_datas.json_runtime": 75.6133,
	"eval_multi_turn_datas.json_samples_per_second": 52.927,
	"eval_multi_turn_datas.json_steps_per_second": 2.209,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_table_python_code_datas.json_loss": 0.33119720220565796,
	"eval_table_python_code_datas.json_runtime": 43.1313,
	"eval_table_python_code_datas.json_samples_per_second": 50.056,
	"eval_table_python_code_datas.json_steps_per_second": 2.087,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_tabular_llm_data.json_loss": 0.14601922035217285,
	"eval_tabular_llm_data.json_runtime": 8.7785,
	"eval_tabular_llm_data.json_samples_per_second": 28.023,
	"eval_tabular_llm_data.json_steps_per_second": 1.253,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_python_code_critic_21k.json_loss": 0.625038743019104,
	"eval_python_code_critic_21k.json_runtime": 3.237,
	"eval_python_code_critic_21k.json_samples_per_second": 184.43,
	"eval_python_code_critic_21k.json_steps_per_second": 7.723,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_all_merge_table_dataset.json_loss": 0.09772461652755737,
	"eval_all_merge_table_dataset.json_runtime": 24.3077,
	"eval_all_merge_table_dataset.json_samples_per_second": 29.291,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.234,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_code_feedback_multi_turn.json_loss": 0.6093290448188782,
	"eval_code_feedback_multi_turn.json_runtime": 32.4589,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.809,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.834,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_ultrainteract_sft.json_loss": 0.4469935894012451,
	"eval_ultrainteract_sft.json_runtime": 8.6702,
	"eval_ultrainteract_sft.json_samples_per_second": 167.931,
	"eval_ultrainteract_sft.json_steps_per_second": 7.036,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_synthetic_text_to_sql.json_loss": 0.11159003525972366,
	"eval_synthetic_text_to_sql.json_runtime": 0.1306,
	"eval_synthetic_text_to_sql.json_samples_per_second": 260.355,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.315,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_sft_react_sql_datas.json_loss": 0.6847189664840698,
	"eval_sft_react_sql_datas.json_runtime": 7.8434,
	"eval_sft_react_sql_datas.json_samples_per_second": 40.034,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.785,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_all_merge_code.json_loss": 0.32269543409347534,
	"eval_all_merge_code.json_runtime": 0.3287,
	"eval_all_merge_code.json_samples_per_second": 191.649,
	"eval_all_merge_code.json_steps_per_second": 9.126,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_magpie_datas.json_loss": 0.4600640833377838,
	"eval_magpie_datas.json_runtime": 2.2095,
	"eval_magpie_datas.json_samples_per_second": 77.844,
	"eval_magpie_datas.json_steps_per_second": 3.621,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_train_data_for_qwen.json_loss": 0.017207294702529907,
	"eval_train_data_for_qwen.json_runtime": 0.2494,
	"eval_train_data_for_qwen.json_samples_per_second": 40.095,
	"eval_train_data_for_qwen.json_steps_per_second": 4.01,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_alpaca_cleaned.json_loss": 0.9374485015869141,
	"eval_alpaca_cleaned.json_runtime": 0.1149,
	"eval_alpaca_cleaned.json_samples_per_second": 234.896,
	"eval_alpaca_cleaned.json_steps_per_second": 17.4,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_agent_instruct.json_loss": 0.23996739089488983,
	"eval_agent_instruct.json_runtime": 0.5126,
	"eval_agent_instruct.json_samples_per_second": 93.639,
	"eval_agent_instruct.json_steps_per_second": 3.902,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_MathInstruct.json_loss": 0.2269323617219925,
	"eval_MathInstruct.json_runtime": 0.3472,
	"eval_MathInstruct.json_samples_per_second": 164.184,
	"eval_MathInstruct.json_steps_per_second": 8.641,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_tested_143k_python_alpaca.json_loss": 0.4513254165649414,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3017,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.684,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.628,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_xlam_function_calling_60k.json_loss": 0.011208846233785152,
	"eval_xlam_function_calling_60k.json_runtime": 0.1011,
	"eval_xlam_function_calling_60k.json_samples_per_second": 227.556,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.894,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.6813441514968872,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0523,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 306.208,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.138,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_alpaca_gpt4_zh.json_loss": 1.0053786039352417,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0504,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 218.451,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.859,
	"step": 200
	},
	{
	"epoch": 0.05503766640294452,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5965134501457214,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4841,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.316,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.066,
	"step": 200
	},
	{
	"epoch": 0.05558804306697396,
	"grad_norm": 0.38687607645988464,
	"learning_rate": 1e-05,
	"loss": 0.49,
	"step": 202
	},
	{
	"epoch": 0.056138419731003406,
	"grad_norm": 0.39803430438041687,
	"learning_rate": 1e-05,
	"loss": 0.5047,
	"step": 204
	},
	{
	"epoch": 0.05668879639503285,
	"grad_norm": 0.41770851612091064,
	"learning_rate": 1e-05,
	"loss": 0.4874,
	"step": 206
	},
	{
	"epoch": 0.057239173059062294,
	"grad_norm": 0.3909968435764313,
	"learning_rate": 1e-05,
	"loss": 0.4992,
	"step": 208
	},
	{
	"epoch": 0.05778954972309174,
	"grad_norm": 0.3818782866001129,
	"learning_rate": 1e-05,
	"loss": 0.5006,
	"step": 210
	},
	{
	"epoch": 0.05833992638712118,
	"grad_norm": 0.4179542362689972,
	"learning_rate": 1e-05,
	"loss": 0.4945,
	"step": 212
	},
	{
	"epoch": 0.05889030305115063,
	"grad_norm": 0.3872973322868347,
	"learning_rate": 1e-05,
	"loss": 0.4918,
	"step": 214
	},
	{
	"epoch": 0.05944067971518008,
	"grad_norm": 0.4249219298362732,
	"learning_rate": 1e-05,
	"loss": 0.5039,
	"step": 216
	},
	{
	"epoch": 0.05999105637920952,
	"grad_norm": 0.43381986021995544,
	"learning_rate": 1e-05,
	"loss": 0.4873,
	"step": 218
	},
	{
	"epoch": 0.06054143304323897,
	"grad_norm": 0.40741005539894104,
	"learning_rate": 1e-05,
	"loss": 0.4771,
	"step": 220
	},
	{
	"epoch": 0.061091809707268414,
	"grad_norm": 0.37800464034080505,
	"learning_rate": 1e-05,
	"loss": 0.5015,
	"step": 222
	},
	{
	"epoch": 0.061642186371297855,
	"grad_norm": 0.42365899682044983,
	"learning_rate": 1e-05,
	"loss": 0.4906,
	"step": 224
	},
	{
	"epoch": 0.0621925630353273,
	"grad_norm": 0.39279666543006897,
	"learning_rate": 1e-05,
	"loss": 0.51,
	"step": 226
	},
	{
	"epoch": 0.06274293969935675,
	"grad_norm": 0.4037010073661804,
	"learning_rate": 1e-05,
	"loss": 0.5162,
	"step": 228
	},
	{
	"epoch": 0.0632933163633862,
	"grad_norm": 0.37650179862976074,
	"learning_rate": 1e-05,
	"loss": 0.4984,
	"step": 230
	},
	{
	"epoch": 0.06384369302741563,
	"grad_norm": 0.42879757285118103,
	"learning_rate": 1e-05,
	"loss": 0.492,
	"step": 232
	},
	{
	"epoch": 0.06439406969144508,
	"grad_norm": 0.42225000262260437,
	"learning_rate": 1e-05,
	"loss": 0.5215,
	"step": 234
	},
	{
	"epoch": 0.06494444635547453,
	"grad_norm": 0.3948579430580139,
	"learning_rate": 1e-05,
	"loss": 0.5045,
	"step": 236
	},
	{
	"epoch": 0.06549482301950398,
	"grad_norm": 0.40142592787742615,
	"learning_rate": 1e-05,
	"loss": 0.5083,
	"step": 238
	},
	{
	"epoch": 0.06604519968353342,
	"grad_norm": 0.41938111186027527,
	"learning_rate": 1e-05,
	"loss": 0.5094,
	"step": 240
	},
	{
	"epoch": 0.06659557634756286,
	"grad_norm": 0.4345923066139221,
	"learning_rate": 1e-05,
	"loss": 0.5076,
	"step": 242
	},
	{
	"epoch": 0.0671459530115923,
	"grad_norm": 0.3985568881034851,
	"learning_rate": 1e-05,
	"loss": 0.5007,
	"step": 244
	},
	{
	"epoch": 0.06769632967562175,
	"grad_norm": 0.37891215085983276,
	"learning_rate": 1e-05,
	"loss": 0.513,
	"step": 246
	},
	{
	"epoch": 0.0682467063396512,
	"grad_norm": 0.413566917181015,
	"learning_rate": 1e-05,
	"loss": 0.493,
	"step": 248
	},
	{
	"epoch": 0.06879708300368065,
	"grad_norm": 0.3980996608734131,
	"learning_rate": 1e-05,
	"loss": 0.5161,
	"step": 250
	},
	{
	"epoch": 0.0693474596677101,
	"grad_norm": 0.4525178372859955,
	"learning_rate": 1e-05,
	"loss": 0.5077,
	"step": 252
	},
	{
	"epoch": 0.06989783633173953,
	"grad_norm": 0.3720250427722931,
	"learning_rate": 1e-05,
	"loss": 0.4809,
	"step": 254
	},
	{
	"epoch": 0.07044821299576898,
	"grad_norm": 0.37366852164268494,
	"learning_rate": 1e-05,
	"loss": 0.4724,
	"step": 256
	},
	{
	"epoch": 0.07099858965979843,
	"grad_norm": 0.38189247250556946,
	"learning_rate": 1e-05,
	"loss": 0.5062,
	"step": 258
	},
	{
	"epoch": 0.07154896632382787,
	"grad_norm": 0.39108410477638245,
	"learning_rate": 1e-05,
	"loss": 0.4894,
	"step": 260
	},
	{
	"epoch": 0.07209934298785732,
	"grad_norm": 0.4071044921875,
	"learning_rate": 1e-05,
	"loss": 0.4916,
	"step": 262
	},
	{
	"epoch": 0.07264971965188675,
	"grad_norm": 0.38570597767829895,
	"learning_rate": 1e-05,
	"loss": 0.4925,
	"step": 264
	},
	{
	"epoch": 0.0732000963159162,
	"grad_norm": 0.409600168466568,
	"learning_rate": 1e-05,
	"loss": 0.4987,
	"step": 266
	},
	{
	"epoch": 0.07375047297994565,
	"grad_norm": 0.3844049274921417,
	"learning_rate": 1e-05,
	"loss": 0.5011,
	"step": 268
	},
	{
	"epoch": 0.0743008496439751,
	"grad_norm": 0.41260388493537903,
	"learning_rate": 1e-05,
	"loss": 0.5014,
	"step": 270
	},
	{
	"epoch": 0.07485122630800455,
	"grad_norm": 0.402567982673645,
	"learning_rate": 1e-05,
	"loss": 0.4926,
	"step": 272
	},
	{
	"epoch": 0.07540160297203398,
	"grad_norm": 0.4058002233505249,
	"learning_rate": 1e-05,
	"loss": 0.4879,
	"step": 274
	},
	{
	"epoch": 0.07595197963606343,
	"grad_norm": 0.42676812410354614,
	"learning_rate": 1e-05,
	"loss": 0.5073,
	"step": 276
	},
	{
	"epoch": 0.07650235630009287,
	"grad_norm": 0.3878956735134125,
	"learning_rate": 1e-05,
	"loss": 0.4831,
	"step": 278
	},
	{
	"epoch": 0.07705273296412232,
	"grad_norm": 0.37560945749282837,
	"learning_rate": 1e-05,
	"loss": 0.4705,
	"step": 280
	},
	{
	"epoch": 0.07760310962815177,
	"grad_norm": 0.4071865379810333,
	"learning_rate": 1e-05,
	"loss": 0.489,
	"step": 282
	},
	{
	"epoch": 0.07815348629218122,
	"grad_norm": 0.3832094073295593,
	"learning_rate": 1e-05,
	"loss": 0.4843,
	"step": 284
	},
	{
	"epoch": 0.07870386295621065,
	"grad_norm": 0.3808830976486206,
	"learning_rate": 1e-05,
	"loss": 0.5019,
	"step": 286
	},
	{
	"epoch": 0.0792542396202401,
	"grad_norm": 0.40182846784591675,
	"learning_rate": 1e-05,
	"loss": 0.4921,
	"step": 288
	},
	{
	"epoch": 0.07980461628426955,
	"grad_norm": 0.4483119249343872,
	"learning_rate": 1e-05,
	"loss": 0.5042,
	"step": 290
	},
	{
	"epoch": 0.080354992948299,
	"grad_norm": 0.3664950132369995,
	"learning_rate": 1e-05,
	"loss": 0.4758,
	"step": 292
	},
	{
	"epoch": 0.08090536961232844,
	"grad_norm": 0.39573603868484497,
	"learning_rate": 1e-05,
	"loss": 0.4945,
	"step": 294
	},
	{
	"epoch": 0.08145574627635788,
	"grad_norm": 0.44645532965660095,
	"learning_rate": 1e-05,
	"loss": 0.4964,
	"step": 296
	},
	{
	"epoch": 0.08200612294038732,
	"grad_norm": 0.39092323184013367,
	"learning_rate": 1e-05,
	"loss": 0.4947,
	"step": 298
	},
	{
	"epoch": 0.08255649960441677,
	"grad_norm": 0.41762229800224304,
	"learning_rate": 1e-05,
	"loss": 0.4949,
	"step": 300
	},
	{
	"epoch": 0.08310687626844622,
	"grad_norm": 0.39803358912467957,
	"learning_rate": 1e-05,
	"loss": 0.4822,
	"step": 302
	},
	{
	"epoch": 0.08365725293247567,
	"grad_norm": 0.39895498752593994,
	"learning_rate": 1e-05,
	"loss": 0.4893,
	"step": 304
	},
	{
	"epoch": 0.0842076295965051,
	"grad_norm": 0.3883228600025177,
	"learning_rate": 1e-05,
	"loss": 0.5062,
	"step": 306
	},
	{
	"epoch": 0.08475800626053455,
	"grad_norm": 0.4112294018268585,
	"learning_rate": 1e-05,
	"loss": 0.4979,
	"step": 308
	},
	{
	"epoch": 0.085308382924564,
	"grad_norm": 0.3851683437824249,
	"learning_rate": 1e-05,
	"loss": 0.4934,
	"step": 310
	},
	{
	"epoch": 0.08585875958859344,
	"grad_norm": 0.39728567004203796,
	"learning_rate": 1e-05,
	"loss": 0.4746,
	"step": 312
	},
	{
	"epoch": 0.08640913625262289,
	"grad_norm": 0.3943733274936676,
	"learning_rate": 1e-05,
	"loss": 0.4904,
	"step": 314
	},
	{
	"epoch": 0.08695951291665234,
	"grad_norm": 0.3954530656337738,
	"learning_rate": 1e-05,
	"loss": 0.4796,
	"step": 316
	},
	{
	"epoch": 0.08750988958068177,
	"grad_norm": 0.41237205266952515,
	"learning_rate": 1e-05,
	"loss": 0.4908,
	"step": 318
	},
	{
	"epoch": 0.08806026624471122,
	"grad_norm": 0.3923771381378174,
	"learning_rate": 1e-05,
	"loss": 0.4988,
	"step": 320
	},
	{
	"epoch": 0.08861064290874067,
	"grad_norm": 0.38542094826698303,
	"learning_rate": 1e-05,
	"loss": 0.5027,
	"step": 322
	},
	{
	"epoch": 0.08916101957277012,
	"grad_norm": 0.41598251461982727,
	"learning_rate": 1e-05,
	"loss": 0.4976,
	"step": 324
	},
	{
	"epoch": 0.08971139623679956,
	"grad_norm": 0.40826794505119324,
	"learning_rate": 1e-05,
	"loss": 0.4929,
	"step": 326
	},
	{
	"epoch": 0.090261772900829,
	"grad_norm": 0.39970022439956665,
	"learning_rate": 1e-05,
	"loss": 0.4946,
	"step": 328
	},
	{
	"epoch": 0.09081214956485845,
	"grad_norm": 0.3739086985588074,
	"learning_rate": 1e-05,
	"loss": 0.4678,
	"step": 330
	},
	{
	"epoch": 0.0913625262288879,
	"grad_norm": 0.3746420741081238,
	"learning_rate": 1e-05,
	"loss": 0.4757,
	"step": 332
	},
	{
	"epoch": 0.09191290289291734,
	"grad_norm": 0.3976924419403076,
	"learning_rate": 1e-05,
	"loss": 0.487,
	"step": 334
	},
	{
	"epoch": 0.09246327955694679,
	"grad_norm": 0.398971289396286,
	"learning_rate": 1e-05,
	"loss": 0.5077,
	"step": 336
	},
	{
	"epoch": 0.09301365622097624,
	"grad_norm": 0.3937431871891022,
	"learning_rate": 1e-05,
	"loss": 0.4885,
	"step": 338
	},
	{
	"epoch": 0.09356403288500567,
	"grad_norm": 0.395084410905838,
	"learning_rate": 1e-05,
	"loss": 0.4871,
	"step": 340
	},
	{
	"epoch": 0.09411440954903512,
	"grad_norm": 0.3677273690700531,
	"learning_rate": 1e-05,
	"loss": 0.4813,
	"step": 342
	},
	{
	"epoch": 0.09466478621306457,
	"grad_norm": 0.39645129442214966,
	"learning_rate": 1e-05,
	"loss": 0.4842,
	"step": 344
	},
	{
	"epoch": 0.09521516287709401,
	"grad_norm": 0.3642916679382324,
	"learning_rate": 1e-05,
	"loss": 0.504,
	"step": 346
	},
	{
	"epoch": 0.09576553954112346,
	"grad_norm": 0.40385907888412476,
	"learning_rate": 1e-05,
	"loss": 0.4933,
	"step": 348
	},
	{
	"epoch": 0.0963159162051529,
	"grad_norm": 0.39063799381256104,
	"learning_rate": 1e-05,
	"loss": 0.4856,
	"step": 350
	},
	{
	"epoch": 0.09686629286918234,
	"grad_norm": 0.38000059127807617,
	"learning_rate": 1e-05,
	"loss": 0.5001,
	"step": 352
	},
	{
	"epoch": 0.09741666953321179,
	"grad_norm": 0.39380577206611633,
	"learning_rate": 1e-05,
	"loss": 0.4961,
	"step": 354
	},
	{
	"epoch": 0.09796704619724124,
	"grad_norm": 0.39326363801956177,
	"learning_rate": 1e-05,
	"loss": 0.498,
	"step": 356
	},
	{
	"epoch": 0.09851742286127069,
	"grad_norm": 0.3775707185268402,
	"learning_rate": 1e-05,
	"loss": 0.4792,
	"step": 358
	},
	{
	"epoch": 0.09906779952530012,
	"grad_norm": 0.3770863115787506,
	"learning_rate": 1e-05,
	"loss": 0.4837,
	"step": 360
	},
	{
	"epoch": 0.09961817618932957,
	"grad_norm": 0.41484272480010986,
	"learning_rate": 1e-05,
	"loss": 0.4739,
	"step": 362
	},
	{
	"epoch": 0.10016855285335902,
	"grad_norm": 0.39758750796318054,
	"learning_rate": 1e-05,
	"loss": 0.4957,
	"step": 364
	},
	{
	"epoch": 0.10071892951738846,
	"grad_norm": 0.43485164642333984,
	"learning_rate": 1e-05,
	"loss": 0.492,
	"step": 366
	},
	{
	"epoch": 0.10126930618141791,
	"grad_norm": 0.40296798944473267,
	"learning_rate": 1e-05,
	"loss": 0.4977,
	"step": 368
	},
	{
	"epoch": 0.10181968284544736,
	"grad_norm": 0.3818409740924835,
	"learning_rate": 1e-05,
	"loss": 0.481,
	"step": 370
	},
	{
	"epoch": 0.1023700595094768,
	"grad_norm": 0.3949006199836731,
	"learning_rate": 1e-05,
	"loss": 0.5021,
	"step": 372
	},
	{
	"epoch": 0.10292043617350624,
	"grad_norm": 0.4327391982078552,
	"learning_rate": 1e-05,
	"loss": 0.5036,
	"step": 374
	},
	{
	"epoch": 0.10347081283753569,
	"grad_norm": 0.4008086025714874,
	"learning_rate": 1e-05,
	"loss": 0.4854,
	"step": 376
	},
	{
	"epoch": 0.10402118950156514,
	"grad_norm": 0.4146427810192108,
	"learning_rate": 1e-05,
	"loss": 0.4933,
	"step": 378
	},
	{
	"epoch": 0.10457156616559458,
	"grad_norm": 0.4073733389377594,
	"learning_rate": 1e-05,
	"loss": 0.4923,
	"step": 380
	},
	{
	"epoch": 0.10512194282962402,
	"grad_norm": 0.40570083260536194,
	"learning_rate": 1e-05,
	"loss": 0.4806,
	"step": 382
	},
	{
	"epoch": 0.10567231949365347,
	"grad_norm": 0.39516401290893555,
	"learning_rate": 1e-05,
	"loss": 0.5038,
	"step": 384
	},
	{
	"epoch": 0.10622269615768291,
	"grad_norm": 0.3886268138885498,
	"learning_rate": 1e-05,
	"loss": 0.4737,
	"step": 386
	},
	{
	"epoch": 0.10677307282171236,
	"grad_norm": 0.3846561014652252,
	"learning_rate": 1e-05,
	"loss": 0.4852,
	"step": 388
	},
	{
	"epoch": 0.10732344948574181,
	"grad_norm": 0.3952987492084503,
	"learning_rate": 1e-05,
	"loss": 0.496,
	"step": 390
	},
	{
	"epoch": 0.10787382614977124,
	"grad_norm": 0.3840448558330536,
	"learning_rate": 1e-05,
	"loss": 0.4976,
	"step": 392
	},
	{
	"epoch": 0.10842420281380069,
	"grad_norm": 0.38074344396591187,
	"learning_rate": 1e-05,
	"loss": 0.508,
	"step": 394
	},
	{
	"epoch": 0.10897457947783014,
	"grad_norm": 0.4216584861278534,
	"learning_rate": 1e-05,
	"loss": 0.4841,
	"step": 396
	},
	{
	"epoch": 0.10952495614185959,
	"grad_norm": 0.39932167530059814,
	"learning_rate": 1e-05,
	"loss": 0.4783,
	"step": 398
	},
	{
	"epoch": 0.11007533280588903,
	"grad_norm": 0.3687106966972351,
	"learning_rate": 1e-05,
	"loss": 0.4747,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_merge_loss": 0.42975950241088867,
	"eval_merge_runtime": 600.4283,
	"eval_merge_samples_per_second": 56.213,
	"eval_merge_steps_per_second": 2.343,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_new_aug_datas_filtered.json_loss": 0.558424174785614,
	"eval_new_aug_datas_filtered.json_runtime": 10.4015,
	"eval_new_aug_datas_filtered.json_samples_per_second": 73.74,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.076,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_sharegpt_gpt4.json_loss": 0.8120941519737244,
	"eval_sharegpt_gpt4.json_runtime": 31.6378,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.822,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.465,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_Table_GPT.json_loss": 0.08201506733894348,
	"eval_Table_GPT.json_runtime": 24.9859,
	"eval_Table_GPT.json_samples_per_second": 83.767,
	"eval_Table_GPT.json_steps_per_second": 3.522,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_gpt_4o_200k.json_loss": 0.8391836881637573,
	"eval_gpt_4o_200k.json_runtime": 48.456,
	"eval_gpt_4o_200k.json_samples_per_second": 129.623,
	"eval_gpt_4o_200k.json_steps_per_second": 5.407,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_multi_turn_datas.json_loss": 0.37471804022789,
	"eval_multi_turn_datas.json_runtime": 75.4526,
	"eval_multi_turn_datas.json_samples_per_second": 53.04,
	"eval_multi_turn_datas.json_steps_per_second": 2.213,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_table_python_code_datas.json_loss": 0.3102189898490906,
	"eval_table_python_code_datas.json_runtime": 42.9961,
	"eval_table_python_code_datas.json_samples_per_second": 50.214,
	"eval_table_python_code_datas.json_steps_per_second": 2.093,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_tabular_llm_data.json_loss": 0.16565443575382233,
	"eval_tabular_llm_data.json_runtime": 8.5095,
	"eval_tabular_llm_data.json_samples_per_second": 28.909,
	"eval_tabular_llm_data.json_steps_per_second": 1.293,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_python_code_critic_21k.json_loss": 0.6095640063285828,
	"eval_python_code_critic_21k.json_runtime": 3.2106,
	"eval_python_code_critic_21k.json_samples_per_second": 185.945,
	"eval_python_code_critic_21k.json_steps_per_second": 7.787,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_all_merge_table_dataset.json_loss": 0.09411227703094482,
	"eval_all_merge_table_dataset.json_runtime": 23.2459,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.629,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.291,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_code_feedback_multi_turn.json_loss": 0.6033111810684204,
	"eval_code_feedback_multi_turn.json_runtime": 32.3176,
	"eval_code_feedback_multi_turn.json_samples_per_second": 68.105,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.847,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_ultrainteract_sft.json_loss": 0.4417967200279236,
	"eval_ultrainteract_sft.json_runtime": 8.6225,
	"eval_ultrainteract_sft.json_samples_per_second": 168.86,
	"eval_ultrainteract_sft.json_steps_per_second": 7.075,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_synthetic_text_to_sql.json_loss": 0.10689640045166016,
	"eval_synthetic_text_to_sql.json_runtime": 0.1258,
	"eval_synthetic_text_to_sql.json_samples_per_second": 270.238,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.896,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_sft_react_sql_datas.json_loss": 0.6745051145553589,
	"eval_sft_react_sql_datas.json_runtime": 7.8354,
	"eval_sft_react_sql_datas.json_samples_per_second": 40.074,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.787,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_all_merge_code.json_loss": 0.3035649061203003,
	"eval_all_merge_code.json_runtime": 0.3282,
	"eval_all_merge_code.json_samples_per_second": 191.936,
	"eval_all_merge_code.json_steps_per_second": 9.14,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_magpie_datas.json_loss": 0.4511661231517792,
	"eval_magpie_datas.json_runtime": 2.2095,
	"eval_magpie_datas.json_samples_per_second": 77.847,
	"eval_magpie_datas.json_steps_per_second": 3.621,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_train_data_for_qwen.json_loss": 0.012529651634395123,
	"eval_train_data_for_qwen.json_runtime": 0.2431,
	"eval_train_data_for_qwen.json_samples_per_second": 41.135,
	"eval_train_data_for_qwen.json_steps_per_second": 4.113,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_alpaca_cleaned.json_loss": 0.9377387166023254,
	"eval_alpaca_cleaned.json_runtime": 0.115,
	"eval_alpaca_cleaned.json_samples_per_second": 234.777,
	"eval_alpaca_cleaned.json_steps_per_second": 17.391,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_agent_instruct.json_loss": 0.2363067865371704,
	"eval_agent_instruct.json_runtime": 0.5121,
	"eval_agent_instruct.json_samples_per_second": 93.728,
	"eval_agent_instruct.json_steps_per_second": 3.905,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_MathInstruct.json_loss": 0.21367128193378448,
	"eval_MathInstruct.json_runtime": 0.3647,
	"eval_MathInstruct.json_samples_per_second": 156.291,
	"eval_MathInstruct.json_steps_per_second": 8.226,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_tested_143k_python_alpaca.json_loss": 0.4474259316921234,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3019,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.631,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.625,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_xlam_function_calling_60k.json_loss": 0.011296543292701244,
	"eval_xlam_function_calling_60k.json_runtime": 0.1,
	"eval_xlam_function_calling_60k.json_samples_per_second": 230.102,
	"eval_xlam_function_calling_60k.json_steps_per_second": 10.004,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.645748496055603,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0515,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 310.905,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.432,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_alpaca_gpt4_zh.json_loss": 0.9886136651039124,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0503,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 218.827,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.893,
	"step": 400
	},
	{
	"epoch": 0.11007533280588903,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5969922542572021,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4851,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.226,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.061,
	"step": 400
	},
	{
	"epoch": 0.11062570946991848,
	"grad_norm": 0.40487441420555115,
	"learning_rate": 1e-05,
	"loss": 0.4811,
	"step": 402
	},
	{
	"epoch": 0.11117608613394792,
	"grad_norm": 0.39143064618110657,
	"learning_rate": 1e-05,
	"loss": 0.4704,
	"step": 404
	},
	{
	"epoch": 0.11172646279797736,
	"grad_norm": 0.46816787123680115,
	"learning_rate": 1e-05,
	"loss": 0.4941,
	"step": 406
	},
	{
	"epoch": 0.11227683946200681,
	"grad_norm": 0.37707188725471497,
	"learning_rate": 1e-05,
	"loss": 0.4839,
	"step": 408
	},
	{
	"epoch": 0.11282721612603626,
	"grad_norm": 0.3780951201915741,
	"learning_rate": 1e-05,
	"loss": 0.4889,
	"step": 410
	},
	{
	"epoch": 0.1133775927900657,
	"grad_norm": 0.36941519379615784,
	"learning_rate": 1e-05,
	"loss": 0.4747,
	"step": 412
	},
	{
	"epoch": 0.11392796945409514,
	"grad_norm": 0.39626002311706543,
	"learning_rate": 1e-05,
	"loss": 0.4872,
	"step": 414
	},
	{
	"epoch": 0.11447834611812459,
	"grad_norm": 0.38315075635910034,
	"learning_rate": 1e-05,
	"loss": 0.471,
	"step": 416
	},
	{
	"epoch": 0.11502872278215404,
	"grad_norm": 0.37200862169265747,
	"learning_rate": 1e-05,
	"loss": 0.4891,
	"step": 418
	},
	{
	"epoch": 0.11557909944618348,
	"grad_norm": 0.39199399948120117,
	"learning_rate": 1e-05,
	"loss": 0.4807,
	"step": 420
	},
	{
	"epoch": 0.11612947611021293,
	"grad_norm": 0.37726107239723206,
	"learning_rate": 1e-05,
	"loss": 0.4834,
	"step": 422
	},
	{
	"epoch": 0.11667985277424237,
	"grad_norm": 0.38188016414642334,
	"learning_rate": 1e-05,
	"loss": 0.4853,
	"step": 424
	},
	{
	"epoch": 0.11723022943827181,
	"grad_norm": 0.39772850275039673,
	"learning_rate": 1e-05,
	"loss": 0.4895,
	"step": 426
	},
	{
	"epoch": 0.11778060610230126,
	"grad_norm": 0.3797503411769867,
	"learning_rate": 1e-05,
	"loss": 0.4818,
	"step": 428
	},
	{
	"epoch": 0.11833098276633071,
	"grad_norm": 0.39962416887283325,
	"learning_rate": 1e-05,
	"loss": 0.4802,
	"step": 430
	},
	{
	"epoch": 0.11888135943036016,
	"grad_norm": 0.37405237555503845,
	"learning_rate": 1e-05,
	"loss": 0.4879,
	"step": 432
	},
	{
	"epoch": 0.1194317360943896,
	"grad_norm": 0.39297720789909363,
	"learning_rate": 1e-05,
	"loss": 0.4853,
	"step": 434
	},
	{
	"epoch": 0.11998211275841904,
	"grad_norm": 0.3871022164821625,
	"learning_rate": 1e-05,
	"loss": 0.4845,
	"step": 436
	},
	{
	"epoch": 0.12053248942244849,
	"grad_norm": 0.43845734000205994,
	"learning_rate": 1e-05,
	"loss": 0.4865,
	"step": 438
	},
	{
	"epoch": 0.12108286608647793,
	"grad_norm": 0.3888757526874542,
	"learning_rate": 1e-05,
	"loss": 0.4862,
	"step": 440
	},
	{
	"epoch": 0.12163324275050738,
	"grad_norm": 0.3801029920578003,
	"learning_rate": 1e-05,
	"loss": 0.4751,
	"step": 442
	},
	{
	"epoch": 0.12218361941453683,
	"grad_norm": 0.3861992657184601,
	"learning_rate": 1e-05,
	"loss": 0.5026,
	"step": 444
	},
	{
	"epoch": 0.12273399607856626,
	"grad_norm": 0.40307343006134033,
	"learning_rate": 1e-05,
	"loss": 0.4901,
	"step": 446
	},
	{
	"epoch": 0.12328437274259571,
	"grad_norm": 0.36803606152534485,
	"learning_rate": 1e-05,
	"loss": 0.4927,
	"step": 448
	},
	{
	"epoch": 0.12383474940662516,
	"grad_norm": 0.40266790986061096,
	"learning_rate": 1e-05,
	"loss": 0.4663,
	"step": 450
	},
	{
	"epoch": 0.1243851260706546,
	"grad_norm": 0.3870522975921631,
	"learning_rate": 1e-05,
	"loss": 0.475,
	"step": 452
	},
	{
	"epoch": 0.12493550273468405,
	"grad_norm": 0.3978688716888428,
	"learning_rate": 1e-05,
	"loss": 0.4979,
	"step": 454
	},
	{
	"epoch": 0.1254858793987135,
	"grad_norm": 0.3799881935119629,
	"learning_rate": 1e-05,
	"loss": 0.4802,
	"step": 456
	},
	{
	"epoch": 0.12603625606274294,
	"grad_norm": 0.3795452415943146,
	"learning_rate": 1e-05,
	"loss": 0.4878,
	"step": 458
	},
	{
	"epoch": 0.1265866327267724,
	"grad_norm": 0.3865358233451843,
	"learning_rate": 1e-05,
	"loss": 0.4825,
	"step": 460
	},
	{
	"epoch": 0.12713700939080183,
	"grad_norm": 0.3646644353866577,
	"learning_rate": 1e-05,
	"loss": 0.4725,
	"step": 462
	},
	{
	"epoch": 0.12768738605483126,
	"grad_norm": 0.3851023018360138,
	"learning_rate": 1e-05,
	"loss": 0.4849,
	"step": 464
	},
	{
	"epoch": 0.12823776271886073,
	"grad_norm": 0.37587490677833557,
	"learning_rate": 1e-05,
	"loss": 0.4729,
	"step": 466
	},
	{
	"epoch": 0.12878813938289016,
	"grad_norm": 0.3559257686138153,
	"learning_rate": 1e-05,
	"loss": 0.4826,
	"step": 468
	},
	{
	"epoch": 0.12933851604691962,
	"grad_norm": 0.3967975974082947,
	"learning_rate": 1e-05,
	"loss": 0.4917,
	"step": 470
	},
	{
	"epoch": 0.12988889271094906,
	"grad_norm": 0.4064919650554657,
	"learning_rate": 1e-05,
	"loss": 0.5018,
	"step": 472
	},
	{
	"epoch": 0.1304392693749785,
	"grad_norm": 0.3609434962272644,
	"learning_rate": 1e-05,
	"loss": 0.4805,
	"step": 474
	},
	{
	"epoch": 0.13098964603900795,
	"grad_norm": 0.4229820668697357,
	"learning_rate": 1e-05,
	"loss": 0.4756,
	"step": 476
	},
	{
	"epoch": 0.13154002270303738,
	"grad_norm": 0.3882080018520355,
	"learning_rate": 1e-05,
	"loss": 0.4946,
	"step": 478
	},
	{
	"epoch": 0.13209039936706685,
	"grad_norm": 0.37811529636383057,
	"learning_rate": 1e-05,
	"loss": 0.495,
	"step": 480
	},
	{
	"epoch": 0.13264077603109628,
	"grad_norm": 0.4139231741428375,
	"learning_rate": 1e-05,
	"loss": 0.4722,
	"step": 482
	},
	{
	"epoch": 0.13319115269512571,
	"grad_norm": 0.3836536705493927,
	"learning_rate": 1e-05,
	"loss": 0.4795,
	"step": 484
	},
	{
	"epoch": 0.13374152935915518,
	"grad_norm": 0.39434006810188293,
	"learning_rate": 1e-05,
	"loss": 0.4783,
	"step": 486
	},
	{
	"epoch": 0.1342919060231846,
	"grad_norm": 0.3847144544124603,
	"learning_rate": 1e-05,
	"loss": 0.4751,
	"step": 488
	},
	{
	"epoch": 0.13484228268721407,
	"grad_norm": 0.4081107974052429,
	"learning_rate": 1e-05,
	"loss": 0.4947,
	"step": 490
	},
	{
	"epoch": 0.1353926593512435,
	"grad_norm": 0.3780671954154968,
	"learning_rate": 1e-05,
	"loss": 0.4932,
	"step": 492
	},
	{
	"epoch": 0.13594303601527294,
	"grad_norm": 0.39522022008895874,
	"learning_rate": 1e-05,
	"loss": 0.4868,
	"step": 494
	},
	{
	"epoch": 0.1364934126793024,
	"grad_norm": 0.3978594243526459,
	"learning_rate": 1e-05,
	"loss": 0.4895,
	"step": 496
	},
	{
	"epoch": 0.13704378934333183,
	"grad_norm": 0.40067028999328613,
	"learning_rate": 1e-05,
	"loss": 0.4841,
	"step": 498
	},
	{
	"epoch": 0.1375941660073613,
	"grad_norm": 0.38525891304016113,
	"learning_rate": 1e-05,
	"loss": 0.4769,
	"step": 500
	},
	{
	"epoch": 0.13814454267139073,
	"grad_norm": 0.3708615303039551,
	"learning_rate": 1e-05,
	"loss": 0.4787,
	"step": 502
	},
	{
	"epoch": 0.1386949193354202,
	"grad_norm": 0.3583269417285919,
	"learning_rate": 1e-05,
	"loss": 0.4905,
	"step": 504
	},
	{
	"epoch": 0.13924529599944963,
	"grad_norm": 0.4004143178462982,
	"learning_rate": 1e-05,
	"loss": 0.4797,
	"step": 506
	},
	{
	"epoch": 0.13979567266347906,
	"grad_norm": 0.3877711594104767,
	"learning_rate": 1e-05,
	"loss": 0.4968,
	"step": 508
	},
	{
	"epoch": 0.14034604932750852,
	"grad_norm": 0.394502729177475,
	"learning_rate": 1e-05,
	"loss": 0.4743,
	"step": 510
	},
	{
	"epoch": 0.14089642599153795,
	"grad_norm": 0.3829086720943451,
	"learning_rate": 1e-05,
	"loss": 0.4769,
	"step": 512
	},
	{
	"epoch": 0.14144680265556742,
	"grad_norm": 0.3849917948246002,
	"learning_rate": 1e-05,
	"loss": 0.4763,
	"step": 514
	},
	{
	"epoch": 0.14199717931959685,
	"grad_norm": 0.40810078382492065,
	"learning_rate": 1e-05,
	"loss": 0.4904,
	"step": 516
	},
	{
	"epoch": 0.14254755598362628,
	"grad_norm": 0.3982490599155426,
	"learning_rate": 1e-05,
	"loss": 0.4762,
	"step": 518
	},
	{
	"epoch": 0.14309793264765575,
	"grad_norm": 0.36841145157814026,
	"learning_rate": 1e-05,
	"loss": 0.4745,
	"step": 520
	},
	{
	"epoch": 0.14364830931168518,
	"grad_norm": 0.3805830180644989,
	"learning_rate": 1e-05,
	"loss": 0.4811,
	"step": 522
	},
	{
	"epoch": 0.14419868597571464,
	"grad_norm": 0.40074169635772705,
	"learning_rate": 1e-05,
	"loss": 0.4923,
	"step": 524
	},
	{
	"epoch": 0.14474906263974407,
	"grad_norm": 0.42140403389930725,
	"learning_rate": 1e-05,
	"loss": 0.4972,
	"step": 526
	},
	{
	"epoch": 0.1452994393037735,
	"grad_norm": 0.38489535450935364,
	"learning_rate": 1e-05,
	"loss": 0.4921,
	"step": 528
	},
	{
	"epoch": 0.14584981596780297,
	"grad_norm": 0.38449668884277344,
	"learning_rate": 1e-05,
	"loss": 0.4883,
	"step": 530
	},
	{
	"epoch": 0.1464001926318324,
	"grad_norm": 0.38009950518608093,
	"learning_rate": 1e-05,
	"loss": 0.4808,
	"step": 532
	},
	{
	"epoch": 0.14695056929586187,
	"grad_norm": 0.3916541337966919,
	"learning_rate": 1e-05,
	"loss": 0.4708,
	"step": 534
	},
	{
	"epoch": 0.1475009459598913,
	"grad_norm": 0.39856135845184326,
	"learning_rate": 1e-05,
	"loss": 0.4933,
	"step": 536
	},
	{
	"epoch": 0.14805132262392073,
	"grad_norm": 0.3804597556591034,
	"learning_rate": 1e-05,
	"loss": 0.4772,
	"step": 538
	},
	{
	"epoch": 0.1486016992879502,
	"grad_norm": 0.39584964513778687,
	"learning_rate": 1e-05,
	"loss": 0.4746,
	"step": 540
	},
	{
	"epoch": 0.14915207595197963,
	"grad_norm": 0.36922863125801086,
	"learning_rate": 1e-05,
	"loss": 0.4911,
	"step": 542
	},
	{
	"epoch": 0.1497024526160091,
	"grad_norm": 0.38762298226356506,
	"learning_rate": 1e-05,
	"loss": 0.4744,
	"step": 544
	},
	{
	"epoch": 0.15025282928003852,
	"grad_norm": 0.38803887367248535,
	"learning_rate": 1e-05,
	"loss": 0.4776,
	"step": 546
	},
	{
	"epoch": 0.15080320594406796,
	"grad_norm": 0.39409226179122925,
	"learning_rate": 1e-05,
	"loss": 0.4789,
	"step": 548
	},
	{
	"epoch": 0.15135358260809742,
	"grad_norm": 0.4141768217086792,
	"learning_rate": 1e-05,
	"loss": 0.4752,
	"step": 550
	},
	{
	"epoch": 0.15190395927212685,
	"grad_norm": 0.3770216703414917,
	"learning_rate": 1e-05,
	"loss": 0.4689,
	"step": 552
	},
	{
	"epoch": 0.15245433593615632,
	"grad_norm": 0.3929697573184967,
	"learning_rate": 1e-05,
	"loss": 0.4861,
	"step": 554
	},
	{
	"epoch": 0.15300471260018575,
	"grad_norm": 0.3859105706214905,
	"learning_rate": 1e-05,
	"loss": 0.4799,
	"step": 556
	},
	{
	"epoch": 0.1535550892642152,
	"grad_norm": 0.41044744849205017,
	"learning_rate": 1e-05,
	"loss": 0.4911,
	"step": 558
	},
	{
	"epoch": 0.15410546592824464,
	"grad_norm": 0.36859771609306335,
	"learning_rate": 1e-05,
	"loss": 0.4653,
	"step": 560
	},
	{
	"epoch": 0.15465584259227408,
	"grad_norm": 0.39258813858032227,
	"learning_rate": 1e-05,
	"loss": 0.4769,
	"step": 562
	},
	{
	"epoch": 0.15520621925630354,
	"grad_norm": 0.38241100311279297,
	"learning_rate": 1e-05,
	"loss": 0.4821,
	"step": 564
	},
	{
	"epoch": 0.15575659592033297,
	"grad_norm": 0.4107513427734375,
	"learning_rate": 1e-05,
	"loss": 0.4746,
	"step": 566
	},
	{
	"epoch": 0.15630697258436244,
	"grad_norm": 0.3872488737106323,
	"learning_rate": 1e-05,
	"loss": 0.4817,
	"step": 568
	},
	{
	"epoch": 0.15685734924839187,
	"grad_norm": 0.3712390065193176,
	"learning_rate": 1e-05,
	"loss": 0.4944,
	"step": 570
	},
	{
	"epoch": 0.1574077259124213,
	"grad_norm": 0.413503497838974,
	"learning_rate": 1e-05,
	"loss": 0.4774,
	"step": 572
	},
	{
	"epoch": 0.15795810257645077,
	"grad_norm": 0.35706543922424316,
	"learning_rate": 1e-05,
	"loss": 0.4743,
	"step": 574
	},
	{
	"epoch": 0.1585084792404802,
	"grad_norm": 0.39815768599510193,
	"learning_rate": 1e-05,
	"loss": 0.4846,
	"step": 576
	},
	{
	"epoch": 0.15905885590450966,
	"grad_norm": 0.38346678018569946,
	"learning_rate": 1e-05,
	"loss": 0.4633,
	"step": 578
	},
	{
	"epoch": 0.1596092325685391,
	"grad_norm": 0.3905611038208008,
	"learning_rate": 1e-05,
	"loss": 0.4776,
	"step": 580
	},
	{
	"epoch": 0.16015960923256853,
	"grad_norm": 0.3790382742881775,
	"learning_rate": 1e-05,
	"loss": 0.4892,
	"step": 582
	},
	{
	"epoch": 0.160709985896598,
	"grad_norm": 0.37033775448799133,
	"learning_rate": 1e-05,
	"loss": 0.4848,
	"step": 584
	},
	{
	"epoch": 0.16126036256062742,
	"grad_norm": 0.3686079680919647,
	"learning_rate": 1e-05,
	"loss": 0.4514,
	"step": 586
	},
	{
	"epoch": 0.16181073922465689,
	"grad_norm": 0.3836509883403778,
	"learning_rate": 1e-05,
	"loss": 0.4859,
	"step": 588
	},
	{
	"epoch": 0.16236111588868632,
	"grad_norm": 0.40387076139450073,
	"learning_rate": 1e-05,
	"loss": 0.485,
	"step": 590
	},
	{
	"epoch": 0.16291149255271575,
	"grad_norm": 0.3850373327732086,
	"learning_rate": 1e-05,
	"loss": 0.4843,
	"step": 592
	},
	{
	"epoch": 0.16346186921674521,
	"grad_norm": 0.3814505934715271,
	"learning_rate": 1e-05,
	"loss": 0.4749,
	"step": 594
	},
	{
	"epoch": 0.16401224588077465,
	"grad_norm": 0.35501739382743835,
	"learning_rate": 1e-05,
	"loss": 0.4645,
	"step": 596
	},
	{
	"epoch": 0.1645626225448041,
	"grad_norm": 0.34997090697288513,
	"learning_rate": 1e-05,
	"loss": 0.4687,
	"step": 598
	},
	{
	"epoch": 0.16511299920883354,
	"grad_norm": 0.365212619304657,
	"learning_rate": 1e-05,
	"loss": 0.4956,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_merge_loss": 0.4216049909591675,
	"eval_merge_runtime": 600.0688,
	"eval_merge_samples_per_second": 56.247,
	"eval_merge_steps_per_second": 2.345,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_new_aug_datas_filtered.json_loss": 0.5500591397285461,
	"eval_new_aug_datas_filtered.json_runtime": 10.5295,
	"eval_new_aug_datas_filtered.json_samples_per_second": 72.843,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.039,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_sharegpt_gpt4.json_loss": 0.8046284914016724,
	"eval_sharegpt_gpt4.json_runtime": 31.7366,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.639,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.458,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_Table_GPT.json_loss": 0.07981107383966446,
	"eval_Table_GPT.json_runtime": 25.0085,
	"eval_Table_GPT.json_samples_per_second": 83.691,
	"eval_Table_GPT.json_steps_per_second": 3.519,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_gpt_4o_200k.json_loss": 0.8323716521263123,
	"eval_gpt_4o_200k.json_runtime": 48.5988,
	"eval_gpt_4o_200k.json_samples_per_second": 129.242,
	"eval_gpt_4o_200k.json_steps_per_second": 5.391,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_multi_turn_datas.json_loss": 0.36492469906806946,
	"eval_multi_turn_datas.json_runtime": 75.8696,
	"eval_multi_turn_datas.json_samples_per_second": 52.748,
	"eval_multi_turn_datas.json_steps_per_second": 2.201,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_table_python_code_datas.json_loss": 0.29984766244888306,
	"eval_table_python_code_datas.json_runtime": 43.1945,
	"eval_table_python_code_datas.json_samples_per_second": 49.983,
	"eval_table_python_code_datas.json_steps_per_second": 2.084,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_tabular_llm_data.json_loss": 0.13250145316123962,
	"eval_tabular_llm_data.json_runtime": 8.5476,
	"eval_tabular_llm_data.json_samples_per_second": 28.78,
	"eval_tabular_llm_data.json_steps_per_second": 1.287,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_python_code_critic_21k.json_loss": 0.599878191947937,
	"eval_python_code_critic_21k.json_runtime": 3.2358,
	"eval_python_code_critic_21k.json_samples_per_second": 184.496,
	"eval_python_code_critic_21k.json_steps_per_second": 7.726,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_all_merge_table_dataset.json_loss": 0.08627181500196457,
	"eval_all_merge_table_dataset.json_runtime": 23.3808,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.452,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.283,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_code_feedback_multi_turn.json_loss": 0.5982062220573425,
	"eval_code_feedback_multi_turn.json_runtime": 32.4617,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.803,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.834,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_ultrainteract_sft.json_loss": 0.4367137849330902,
	"eval_ultrainteract_sft.json_runtime": 8.672,
	"eval_ultrainteract_sft.json_samples_per_second": 167.896,
	"eval_ultrainteract_sft.json_steps_per_second": 7.034,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_synthetic_text_to_sql.json_loss": 0.1079096570611,
	"eval_synthetic_text_to_sql.json_runtime": 0.1265,
	"eval_synthetic_text_to_sql.json_samples_per_second": 268.769,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.81,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_sft_react_sql_datas.json_loss": 0.6610473990440369,
	"eval_sft_react_sql_datas.json_runtime": 7.8536,
	"eval_sft_react_sql_datas.json_samples_per_second": 39.982,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.783,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_all_merge_code.json_loss": 0.3021065890789032,
	"eval_all_merge_code.json_runtime": 0.3377,
	"eval_all_merge_code.json_samples_per_second": 186.571,
	"eval_all_merge_code.json_steps_per_second": 8.884,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_magpie_datas.json_loss": 0.4455747604370117,
	"eval_magpie_datas.json_runtime": 2.2122,
	"eval_magpie_datas.json_samples_per_second": 77.751,
	"eval_magpie_datas.json_steps_per_second": 3.616,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_train_data_for_qwen.json_loss": 0.009937227703630924,
	"eval_train_data_for_qwen.json_runtime": 0.2454,
	"eval_train_data_for_qwen.json_samples_per_second": 40.745,
	"eval_train_data_for_qwen.json_steps_per_second": 4.075,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_alpaca_cleaned.json_loss": 0.9349167943000793,
	"eval_alpaca_cleaned.json_runtime": 0.1148,
	"eval_alpaca_cleaned.json_samples_per_second": 235.251,
	"eval_alpaca_cleaned.json_steps_per_second": 17.426,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_agent_instruct.json_loss": 0.2310038059949875,
	"eval_agent_instruct.json_runtime": 0.5119,
	"eval_agent_instruct.json_samples_per_second": 93.766,
	"eval_agent_instruct.json_steps_per_second": 3.907,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_MathInstruct.json_loss": 0.21358835697174072,
	"eval_MathInstruct.json_runtime": 0.3581,
	"eval_MathInstruct.json_samples_per_second": 159.182,
	"eval_MathInstruct.json_steps_per_second": 8.378,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_tested_143k_python_alpaca.json_loss": 0.4455429017543793,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3013,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.849,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.638,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_xlam_function_calling_60k.json_loss": 0.00893339328467846,
	"eval_xlam_function_calling_60k.json_runtime": 0.1004,
	"eval_xlam_function_calling_60k.json_samples_per_second": 228.974,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.955,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.6295539140701294,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0512,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 312.613,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.538,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_alpaca_gpt4_zh.json_loss": 0.9761592745780945,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0499,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 220.289,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 20.026,
	"step": 600
	},
	{
	"epoch": 0.16511299920883354,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5956905484199524,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4851,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.232,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.062,
	"step": 600
	},
	{
	"epoch": 0.16566337587286298,
	"grad_norm": 0.38436150550842285,
	"learning_rate": 1e-05,
	"loss": 0.4609,
	"step": 602
	},
	{
	"epoch": 0.16621375253689244,
	"grad_norm": 0.3946292996406555,
	"learning_rate": 1e-05,
	"loss": 0.4699,
	"step": 604
	},
	{
	"epoch": 0.16676412920092187,
	"grad_norm": 0.4069615304470062,
	"learning_rate": 1e-05,
	"loss": 0.4722,
	"step": 606
	},
	{
	"epoch": 0.16731450586495134,
	"grad_norm": 0.371660977602005,
	"learning_rate": 1e-05,
	"loss": 0.4856,
	"step": 608
	},
	{
	"epoch": 0.16786488252898077,
	"grad_norm": 0.394911527633667,
	"learning_rate": 1e-05,
	"loss": 0.4804,
	"step": 610
	},
	{
	"epoch": 0.1684152591930102,
	"grad_norm": 0.4873884916305542,
	"learning_rate": 1e-05,
	"loss": 0.4686,
	"step": 612
	},
	{
	"epoch": 0.16896563585703966,
	"grad_norm": 0.3943842649459839,
	"learning_rate": 1e-05,
	"loss": 0.4887,
	"step": 614
	},
	{
	"epoch": 0.1695160125210691,
	"grad_norm": 0.3716658055782318,
	"learning_rate": 1e-05,
	"loss": 0.4898,
	"step": 616
	},
	{
	"epoch": 0.17006638918509856,
	"grad_norm": 0.36271047592163086,
	"learning_rate": 1e-05,
	"loss": 0.4861,
	"step": 618
	},
	{
	"epoch": 0.170616765849128,
	"grad_norm": 0.3833015263080597,
	"learning_rate": 1e-05,
	"loss": 0.4814,
	"step": 620
	},
	{
	"epoch": 0.17116714251315746,
	"grad_norm": 0.3661365211009979,
	"learning_rate": 1e-05,
	"loss": 0.4873,
	"step": 622
	},
	{
	"epoch": 0.1717175191771869,
	"grad_norm": 0.3613869845867157,
	"learning_rate": 1e-05,
	"loss": 0.4537,
	"step": 624
	},
	{
	"epoch": 0.17226789584121632,
	"grad_norm": 0.34498724341392517,
	"learning_rate": 1e-05,
	"loss": 0.483,
	"step": 626
	},
	{
	"epoch": 0.17281827250524578,
	"grad_norm": 0.41466256976127625,
	"learning_rate": 1e-05,
	"loss": 0.4765,
	"step": 628
	},
	{
	"epoch": 0.17336864916927522,
	"grad_norm": 0.36220455169677734,
	"learning_rate": 1e-05,
	"loss": 0.4842,
	"step": 630
	},
	{
	"epoch": 0.17391902583330468,
	"grad_norm": 0.38009753823280334,
	"learning_rate": 1e-05,
	"loss": 0.482,
	"step": 632
	},
	{
	"epoch": 0.17446940249733411,
	"grad_norm": 0.3589475452899933,
	"learning_rate": 1e-05,
	"loss": 0.4714,
	"step": 634
	},
	{
	"epoch": 0.17501977916136355,
	"grad_norm": 0.37625178694725037,
	"learning_rate": 1e-05,
	"loss": 0.4487,
	"step": 636
	},
	{
	"epoch": 0.175570155825393,
	"grad_norm": 0.3818652331829071,
	"learning_rate": 1e-05,
	"loss": 0.4757,
	"step": 638
	},
	{
	"epoch": 0.17612053248942244,
	"grad_norm": 0.39498913288116455,
	"learning_rate": 1e-05,
	"loss": 0.4879,
	"step": 640
	},
	{
	"epoch": 0.1766709091534519,
	"grad_norm": 0.3864663243293762,
	"learning_rate": 1e-05,
	"loss": 0.4815,
	"step": 642
	},
	{
	"epoch": 0.17722128581748134,
	"grad_norm": 0.37452608346939087,
	"learning_rate": 1e-05,
	"loss": 0.4773,
	"step": 644
	},
	{
	"epoch": 0.17777166248151077,
	"grad_norm": 0.3754761219024658,
	"learning_rate": 1e-05,
	"loss": 0.4916,
	"step": 646
	},
	{
	"epoch": 0.17832203914554023,
	"grad_norm": 0.3797055780887604,
	"learning_rate": 1e-05,
	"loss": 0.4663,
	"step": 648
	},
	{
	"epoch": 0.17887241580956967,
	"grad_norm": 0.3640367090702057,
	"learning_rate": 1e-05,
	"loss": 0.4737,
	"step": 650
	},
	{
	"epoch": 0.17942279247359913,
	"grad_norm": 0.35961100459098816,
	"learning_rate": 1e-05,
	"loss": 0.4757,
	"step": 652
	},
	{
	"epoch": 0.17997316913762856,
	"grad_norm": 0.40443646907806396,
	"learning_rate": 1e-05,
	"loss": 0.4789,
	"step": 654
	},
	{
	"epoch": 0.180523545801658,
	"grad_norm": 0.35993334650993347,
	"learning_rate": 1e-05,
	"loss": 0.4902,
	"step": 656
	},
	{
	"epoch": 0.18107392246568746,
	"grad_norm": 0.3933318853378296,
	"learning_rate": 1e-05,
	"loss": 0.4726,
	"step": 658
	},
	{
	"epoch": 0.1816242991297169,
	"grad_norm": 0.3923085033893585,
	"learning_rate": 1e-05,
	"loss": 0.4714,
	"step": 660
	},
	{
	"epoch": 0.18217467579374635,
	"grad_norm": 0.37387627363204956,
	"learning_rate": 1e-05,
	"loss": 0.478,
	"step": 662
	},
	{
	"epoch": 0.1827250524577758,
	"grad_norm": 0.3787866532802582,
	"learning_rate": 1e-05,
	"loss": 0.4849,
	"step": 664
	},
	{
	"epoch": 0.18327542912180522,
	"grad_norm": 0.39361730217933655,
	"learning_rate": 1e-05,
	"loss": 0.4836,
	"step": 666
	},
	{
	"epoch": 0.18382580578583468,
	"grad_norm": 0.37430262565612793,
	"learning_rate": 1e-05,
	"loss": 0.4876,
	"step": 668
	},
	{
	"epoch": 0.18437618244986412,
	"grad_norm": 0.3914833068847656,
	"learning_rate": 1e-05,
	"loss": 0.48,
	"step": 670
	},
	{
	"epoch": 0.18492655911389358,
	"grad_norm": 0.36528506875038147,
	"learning_rate": 1e-05,
	"loss": 0.4583,
	"step": 672
	},
	{
	"epoch": 0.185476935777923,
	"grad_norm": 0.3779620826244354,
	"learning_rate": 1e-05,
	"loss": 0.483,
	"step": 674
	},
	{
	"epoch": 0.18602731244195247,
	"grad_norm": 0.3712228834629059,
	"learning_rate": 1e-05,
	"loss": 0.4833,
	"step": 676
	},
	{
	"epoch": 0.1865776891059819,
	"grad_norm": 0.3959150016307831,
	"learning_rate": 1e-05,
	"loss": 0.4678,
	"step": 678
	},
	{
	"epoch": 0.18712806577001134,
	"grad_norm": 0.38113903999328613,
	"learning_rate": 1e-05,
	"loss": 0.4794,
	"step": 680
	},
	{
	"epoch": 0.1876784424340408,
	"grad_norm": 0.3872113525867462,
	"learning_rate": 1e-05,
	"loss": 0.4627,
	"step": 682
	},
	{
	"epoch": 0.18822881909807024,
	"grad_norm": 0.35678407549858093,
	"learning_rate": 1e-05,
	"loss": 0.4666,
	"step": 684
	},
	{
	"epoch": 0.1887791957620997,
	"grad_norm": 0.37833312153816223,
	"learning_rate": 1e-05,
	"loss": 0.4734,
	"step": 686
	},
	{
	"epoch": 0.18932957242612913,
	"grad_norm": 0.3900817930698395,
	"learning_rate": 1e-05,
	"loss": 0.4834,
	"step": 688
	},
	{
	"epoch": 0.18987994909015857,
	"grad_norm": 0.37114864587783813,
	"learning_rate": 1e-05,
	"loss": 0.4682,
	"step": 690
	},
	{
	"epoch": 0.19043032575418803,
	"grad_norm": 0.37264662981033325,
	"learning_rate": 1e-05,
	"loss": 0.4815,
	"step": 692
	},
	{
	"epoch": 0.19098070241821746,
	"grad_norm": 0.3758707344532013,
	"learning_rate": 1e-05,
	"loss": 0.4847,
	"step": 694
	},
	{
	"epoch": 0.19153107908224692,
	"grad_norm": 0.38832512497901917,
	"learning_rate": 1e-05,
	"loss": 0.486,
	"step": 696
	},
	{
	"epoch": 0.19208145574627636,
	"grad_norm": 0.382926344871521,
	"learning_rate": 1e-05,
	"loss": 0.4844,
	"step": 698
	},
	{
	"epoch": 0.1926318324103058,
	"grad_norm": 0.3953557312488556,
	"learning_rate": 1e-05,
	"loss": 0.472,
	"step": 700
	},
	{
	"epoch": 0.19318220907433525,
	"grad_norm": 0.36295419931411743,
	"learning_rate": 1e-05,
	"loss": 0.4792,
	"step": 702
	},
	{
	"epoch": 0.1937325857383647,
	"grad_norm": 0.35859328508377075,
	"learning_rate": 1e-05,
	"loss": 0.4665,
	"step": 704
	},
	{
	"epoch": 0.19428296240239415,
	"grad_norm": 0.3658142685890198,
	"learning_rate": 1e-05,
	"loss": 0.4724,
	"step": 706
	},
	{
	"epoch": 0.19483333906642358,
	"grad_norm": 0.3860156834125519,
	"learning_rate": 1e-05,
	"loss": 0.4803,
	"step": 708
	},
	{
	"epoch": 0.19538371573045302,
	"grad_norm": 0.38030922412872314,
	"learning_rate": 1e-05,
	"loss": 0.4692,
	"step": 710
	},
	{
	"epoch": 0.19593409239448248,
	"grad_norm": 0.417516827583313,
	"learning_rate": 1e-05,
	"loss": 0.4833,
	"step": 712
	},
	{
	"epoch": 0.1964844690585119,
	"grad_norm": 0.39626750349998474,
	"learning_rate": 1e-05,
	"loss": 0.4808,
	"step": 714
	},
	{
	"epoch": 0.19703484572254137,
	"grad_norm": 0.3886042535305023,
	"learning_rate": 1e-05,
	"loss": 0.4716,
	"step": 716
	},
	{
	"epoch": 0.1975852223865708,
	"grad_norm": 0.3816077411174774,
	"learning_rate": 1e-05,
	"loss": 0.468,
	"step": 718
	},
	{
	"epoch": 0.19813559905060024,
	"grad_norm": 0.39385372400283813,
	"learning_rate": 1e-05,
	"loss": 0.4671,
	"step": 720
	},
	{
	"epoch": 0.1986859757146297,
	"grad_norm": 0.35457953810691833,
	"learning_rate": 1e-05,
	"loss": 0.4667,
	"step": 722
	},
	{
	"epoch": 0.19923635237865914,
	"grad_norm": 0.39437657594680786,
	"learning_rate": 1e-05,
	"loss": 0.4637,
	"step": 724
	},
	{
	"epoch": 0.1997867290426886,
	"grad_norm": 0.41132184863090515,
	"learning_rate": 1e-05,
	"loss": 0.4723,
	"step": 726
	},
	{
	"epoch": 0.20033710570671803,
	"grad_norm": 0.3640534281730652,
	"learning_rate": 1e-05,
	"loss": 0.4623,
	"step": 728
	},
	{
	"epoch": 0.20088748237074747,
	"grad_norm": 0.39893659949302673,
	"learning_rate": 1e-05,
	"loss": 0.4881,
	"step": 730
	},
	{
	"epoch": 0.20143785903477693,
	"grad_norm": 0.3677632212638855,
	"learning_rate": 1e-05,
	"loss": 0.4572,
	"step": 732
	},
	{
	"epoch": 0.20198823569880636,
	"grad_norm": 0.40594953298568726,
	"learning_rate": 1e-05,
	"loss": 0.4726,
	"step": 734
	},
	{
	"epoch": 0.20253861236283582,
	"grad_norm": 0.39571645855903625,
	"learning_rate": 1e-05,
	"loss": 0.4751,
	"step": 736
	},
	{
	"epoch": 0.20308898902686526,
	"grad_norm": 0.3569906949996948,
	"learning_rate": 1e-05,
	"loss": 0.4855,
	"step": 738
	},
	{
	"epoch": 0.20363936569089472,
	"grad_norm": 0.39166778326034546,
	"learning_rate": 1e-05,
	"loss": 0.4864,
	"step": 740
	},
	{
	"epoch": 0.20418974235492415,
	"grad_norm": 0.36861687898635864,
	"learning_rate": 1e-05,
	"loss": 0.4659,
	"step": 742
	},
	{
	"epoch": 0.2047401190189536,
	"grad_norm": 0.3691236078739166,
	"learning_rate": 1e-05,
	"loss": 0.4688,
	"step": 744
	},
	{
	"epoch": 0.20529049568298305,
	"grad_norm": 0.41912853717803955,
	"learning_rate": 1e-05,
	"loss": 0.4787,
	"step": 746
	},
	{
	"epoch": 0.20584087234701248,
	"grad_norm": 0.4022221565246582,
	"learning_rate": 1e-05,
	"loss": 0.4758,
	"step": 748
	},
	{
	"epoch": 0.20639124901104194,
	"grad_norm": 0.402567595243454,
	"learning_rate": 1e-05,
	"loss": 0.4766,
	"step": 750
	},
	{
	"epoch": 0.20694162567507138,
	"grad_norm": 0.3741600811481476,
	"learning_rate": 1e-05,
	"loss": 0.4833,
	"step": 752
	},
	{
	"epoch": 0.2074920023391008,
	"grad_norm": 0.3958164155483246,
	"learning_rate": 1e-05,
	"loss": 0.4786,
	"step": 754
	},
	{
	"epoch": 0.20804237900313027,
	"grad_norm": 0.37908801436424255,
	"learning_rate": 1e-05,
	"loss": 0.4715,
	"step": 756
	},
	{
	"epoch": 0.2085927556671597,
	"grad_norm": 0.38426473736763,
	"learning_rate": 1e-05,
	"loss": 0.4874,
	"step": 758
	},
	{
	"epoch": 0.20914313233118917,
	"grad_norm": 0.3873310983181,
	"learning_rate": 1e-05,
	"loss": 0.4677,
	"step": 760
	},
	{
	"epoch": 0.2096935089952186,
	"grad_norm": 0.4033788740634918,
	"learning_rate": 1e-05,
	"loss": 0.4815,
	"step": 762
	},
	{
	"epoch": 0.21024388565924804,
	"grad_norm": 0.40875962376594543,
	"learning_rate": 1e-05,
	"loss": 0.4879,
	"step": 764
	},
	{
	"epoch": 0.2107942623232775,
	"grad_norm": 0.38724496960639954,
	"learning_rate": 1e-05,
	"loss": 0.4646,
	"step": 766
	},
	{
	"epoch": 0.21134463898730693,
	"grad_norm": 0.39307013154029846,
	"learning_rate": 1e-05,
	"loss": 0.4762,
	"step": 768
	},
	{
	"epoch": 0.2118950156513364,
	"grad_norm": 0.37346333265304565,
	"learning_rate": 1e-05,
	"loss": 0.4775,
	"step": 770
	},
	{
	"epoch": 0.21244539231536583,
	"grad_norm": 0.3753449618816376,
	"learning_rate": 1e-05,
	"loss": 0.4707,
	"step": 772
	},
	{
	"epoch": 0.21299576897939526,
	"grad_norm": 0.3829357922077179,
	"learning_rate": 1e-05,
	"loss": 0.4825,
	"step": 774
	},
	{
	"epoch": 0.21354614564342472,
	"grad_norm": 0.35514822602272034,
	"learning_rate": 1e-05,
	"loss": 0.4779,
	"step": 776
	},
	{
	"epoch": 0.21409652230745416,
	"grad_norm": 0.3714098036289215,
	"learning_rate": 1e-05,
	"loss": 0.4598,
	"step": 778
	},
	{
	"epoch": 0.21464689897148362,
	"grad_norm": 0.3754241168498993,
	"learning_rate": 1e-05,
	"loss": 0.4736,
	"step": 780
	},
	{
	"epoch": 0.21519727563551305,
	"grad_norm": 0.36637604236602783,
	"learning_rate": 1e-05,
	"loss": 0.4652,
	"step": 782
	},
	{
	"epoch": 0.2157476522995425,
	"grad_norm": 0.367357075214386,
	"learning_rate": 1e-05,
	"loss": 0.466,
	"step": 784
	},
	{
	"epoch": 0.21629802896357195,
	"grad_norm": 0.3747154176235199,
	"learning_rate": 1e-05,
	"loss": 0.4668,
	"step": 786
	},
	{
	"epoch": 0.21684840562760138,
	"grad_norm": 0.3824009895324707,
	"learning_rate": 1e-05,
	"loss": 0.4748,
	"step": 788
	},
	{
	"epoch": 0.21739878229163084,
	"grad_norm": 0.385030061006546,
	"learning_rate": 1e-05,
	"loss": 0.4882,
	"step": 790
	},
	{
	"epoch": 0.21794915895566028,
	"grad_norm": 0.35460343956947327,
	"learning_rate": 1e-05,
	"loss": 0.4664,
	"step": 792
	},
	{
	"epoch": 0.21849953561968974,
	"grad_norm": 0.3792308270931244,
	"learning_rate": 1e-05,
	"loss": 0.4874,
	"step": 794
	},
	{
	"epoch": 0.21904991228371917,
	"grad_norm": 0.37190011143684387,
	"learning_rate": 1e-05,
	"loss": 0.4838,
	"step": 796
	},
	{
	"epoch": 0.2196002889477486,
	"grad_norm": 0.3757864832878113,
	"learning_rate": 1e-05,
	"loss": 0.4538,
	"step": 798
	},
	{
	"epoch": 0.22015066561177807,
	"grad_norm": 0.3677947223186493,
	"learning_rate": 1e-05,
	"loss": 0.4605,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_merge_loss": 0.4150216579437256,
	"eval_merge_runtime": 600.1194,
	"eval_merge_samples_per_second": 56.242,
	"eval_merge_steps_per_second": 2.345,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_new_aug_datas_filtered.json_loss": 0.5434484481811523,
	"eval_new_aug_datas_filtered.json_runtime": 10.4424,
	"eval_new_aug_datas_filtered.json_samples_per_second": 73.45,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.064,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_sharegpt_gpt4.json_loss": 0.7981637716293335,
	"eval_sharegpt_gpt4.json_runtime": 31.6015,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.89,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.468,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_Table_GPT.json_loss": 0.0783885195851326,
	"eval_Table_GPT.json_runtime": 24.9448,
	"eval_Table_GPT.json_samples_per_second": 83.905,
	"eval_Table_GPT.json_steps_per_second": 3.528,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_gpt_4o_200k.json_loss": 0.8245088458061218,
	"eval_gpt_4o_200k.json_runtime": 48.4135,
	"eval_gpt_4o_200k.json_samples_per_second": 129.737,
	"eval_gpt_4o_200k.json_steps_per_second": 5.412,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_multi_turn_datas.json_loss": 0.35650402307510376,
	"eval_multi_turn_datas.json_runtime": 75.5012,
	"eval_multi_turn_datas.json_samples_per_second": 53.006,
	"eval_multi_turn_datas.json_steps_per_second": 2.212,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_table_python_code_datas.json_loss": 0.2912423610687256,
	"eval_table_python_code_datas.json_runtime": 43.0138,
	"eval_table_python_code_datas.json_samples_per_second": 50.193,
	"eval_table_python_code_datas.json_steps_per_second": 2.092,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_tabular_llm_data.json_loss": 0.11931464821100235,
	"eval_tabular_llm_data.json_runtime": 8.524,
	"eval_tabular_llm_data.json_samples_per_second": 28.86,
	"eval_tabular_llm_data.json_steps_per_second": 1.29,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_python_code_critic_21k.json_loss": 0.5899094343185425,
	"eval_python_code_critic_21k.json_runtime": 3.2108,
	"eval_python_code_critic_21k.json_samples_per_second": 185.935,
	"eval_python_code_critic_21k.json_steps_per_second": 7.786,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_all_merge_table_dataset.json_loss": 0.08210163563489914,
	"eval_all_merge_table_dataset.json_runtime": 23.2334,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.646,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.291,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_code_feedback_multi_turn.json_loss": 0.5942392349243164,
	"eval_code_feedback_multi_turn.json_runtime": 32.3672,
	"eval_code_feedback_multi_turn.json_samples_per_second": 68.001,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.842,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_ultrainteract_sft.json_loss": 0.43230774998664856,
	"eval_ultrainteract_sft.json_runtime": 8.6469,
	"eval_ultrainteract_sft.json_samples_per_second": 168.384,
	"eval_ultrainteract_sft.json_steps_per_second": 7.055,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_synthetic_text_to_sql.json_loss": 0.10562511533498764,
	"eval_synthetic_text_to_sql.json_runtime": 0.1256,
	"eval_synthetic_text_to_sql.json_samples_per_second": 270.776,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.928,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_sft_react_sql_datas.json_loss": 0.6536443829536438,
	"eval_sft_react_sql_datas.json_runtime": 7.8424,
	"eval_sft_react_sql_datas.json_samples_per_second": 40.039,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.785,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_all_merge_code.json_loss": 0.2989647090435028,
	"eval_all_merge_code.json_runtime": 0.3335,
	"eval_all_merge_code.json_samples_per_second": 188.9,
	"eval_all_merge_code.json_steps_per_second": 8.995,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_magpie_datas.json_loss": 0.4389919340610504,
	"eval_magpie_datas.json_runtime": 2.209,
	"eval_magpie_datas.json_samples_per_second": 77.862,
	"eval_magpie_datas.json_steps_per_second": 3.621,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_train_data_for_qwen.json_loss": 0.0057810284197330475,
	"eval_train_data_for_qwen.json_runtime": 0.2434,
	"eval_train_data_for_qwen.json_samples_per_second": 41.087,
	"eval_train_data_for_qwen.json_steps_per_second": 4.109,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_alpaca_cleaned.json_loss": 0.9368440508842468,
	"eval_alpaca_cleaned.json_runtime": 0.1149,
	"eval_alpaca_cleaned.json_samples_per_second": 234.893,
	"eval_alpaca_cleaned.json_steps_per_second": 17.399,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_agent_instruct.json_loss": 0.2261410802602768,
	"eval_agent_instruct.json_runtime": 0.5137,
	"eval_agent_instruct.json_samples_per_second": 93.432,
	"eval_agent_instruct.json_steps_per_second": 3.893,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_MathInstruct.json_loss": 0.208473339676857,
	"eval_MathInstruct.json_runtime": 0.3639,
	"eval_MathInstruct.json_samples_per_second": 156.645,
	"eval_MathInstruct.json_steps_per_second": 8.244,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_tested_143k_python_alpaca.json_loss": 0.44293999671936035,
	"eval_tested_143k_python_alpaca.json_runtime": 0.2997,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 113.456,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.674,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_xlam_function_calling_60k.json_loss": 0.010015022940933704,
	"eval_xlam_function_calling_60k.json_runtime": 0.1001,
	"eval_xlam_function_calling_60k.json_samples_per_second": 229.814,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.992,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.591582179069519,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0515,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 310.705,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.419,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_alpaca_gpt4_zh.json_loss": 0.9911380410194397,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0498,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 221.019,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 20.093,
	"step": 800
	},
	{
	"epoch": 0.22015066561177807,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5947377681732178,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.485,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.237,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.062,
	"step": 800
	},
	{
	"epoch": 0.2207010422758075,
	"grad_norm": 0.36098968982696533,
	"learning_rate": 1e-05,
	"loss": 0.4646,
	"step": 802
	},
	{
	"epoch": 0.22125141893983696,
	"grad_norm": 0.3653786778450012,
	"learning_rate": 1e-05,
	"loss": 0.4501,
	"step": 804
	},
	{
	"epoch": 0.2218017956038664,
	"grad_norm": 0.36442849040031433,
	"learning_rate": 1e-05,
	"loss": 0.4686,
	"step": 806
	},
	{
	"epoch": 0.22235217226789583,
	"grad_norm": 0.3782612383365631,
	"learning_rate": 1e-05,
	"loss": 0.4598,
	"step": 808
	},
	{
	"epoch": 0.2229025489319253,
	"grad_norm": 0.39521896839141846,
	"learning_rate": 1e-05,
	"loss": 0.4679,
	"step": 810
	},
	{
	"epoch": 0.22345292559595473,
	"grad_norm": 0.3727470636367798,
	"learning_rate": 1e-05,
	"loss": 0.4803,
	"step": 812
	},
	{
	"epoch": 0.2240033022599842,
	"grad_norm": 0.3883068263530731,
	"learning_rate": 1e-05,
	"loss": 0.4773,
	"step": 814
	},
	{
	"epoch": 0.22455367892401362,
	"grad_norm": 0.37147605419158936,
	"learning_rate": 1e-05,
	"loss": 0.4825,
	"step": 816
	},
	{
	"epoch": 0.22510405558804306,
	"grad_norm": 0.3924333155155182,
	"learning_rate": 1e-05,
	"loss": 0.4698,
	"step": 818
	},
	{
	"epoch": 0.22565443225207252,
	"grad_norm": 0.38133057951927185,
	"learning_rate": 1e-05,
	"loss": 0.4842,
	"step": 820
	},
	{
	"epoch": 0.22620480891610195,
	"grad_norm": 0.36132821440696716,
	"learning_rate": 1e-05,
	"loss": 0.4594,
	"step": 822
	},
	{
	"epoch": 0.2267551855801314,
	"grad_norm": 0.39988580346107483,
	"learning_rate": 1e-05,
	"loss": 0.4795,
	"step": 824
	},
	{
	"epoch": 0.22730556224416085,
	"grad_norm": 0.38140830397605896,
	"learning_rate": 1e-05,
	"loss": 0.4649,
	"step": 826
	},
	{
	"epoch": 0.22785593890819028,
	"grad_norm": 0.3726978898048401,
	"learning_rate": 1e-05,
	"loss": 0.4603,
	"step": 828
	},
	{
	"epoch": 0.22840631557221974,
	"grad_norm": 0.3880995512008667,
	"learning_rate": 1e-05,
	"loss": 0.4739,
	"step": 830
	},
	{
	"epoch": 0.22895669223624918,
	"grad_norm": 0.4118787944316864,
	"learning_rate": 1e-05,
	"loss": 0.4733,
	"step": 832
	},
	{
	"epoch": 0.22950706890027864,
	"grad_norm": 0.37878745794296265,
	"learning_rate": 1e-05,
	"loss": 0.4922,
	"step": 834
	},
	{
	"epoch": 0.23005744556430807,
	"grad_norm": 0.3838474154472351,
	"learning_rate": 1e-05,
	"loss": 0.4646,
	"step": 836
	},
	{
	"epoch": 0.2306078222283375,
	"grad_norm": 0.37345945835113525,
	"learning_rate": 1e-05,
	"loss": 0.4798,
	"step": 838
	},
	{
	"epoch": 0.23115819889236697,
	"grad_norm": 0.36341801285743713,
	"learning_rate": 1e-05,
	"loss": 0.4773,
	"step": 840
	},
	{
	"epoch": 0.2317085755563964,
	"grad_norm": 0.38800522685050964,
	"learning_rate": 1e-05,
	"loss": 0.4806,
	"step": 842
	},
	{
	"epoch": 0.23225895222042586,
	"grad_norm": 0.38882526755332947,
	"learning_rate": 1e-05,
	"loss": 0.4765,
	"step": 844
	},
	{
	"epoch": 0.2328093288844553,
	"grad_norm": 0.37744489312171936,
	"learning_rate": 1e-05,
	"loss": 0.4842,
	"step": 846
	},
	{
	"epoch": 0.23335970554848473,
	"grad_norm": 0.39916718006134033,
	"learning_rate": 1e-05,
	"loss": 0.467,
	"step": 848
	},
	{
	"epoch": 0.2339100822125142,
	"grad_norm": 0.36556801199913025,
	"learning_rate": 1e-05,
	"loss": 0.4711,
	"step": 850
	},
	{
	"epoch": 0.23446045887654363,
	"grad_norm": 0.3993853032588959,
	"learning_rate": 1e-05,
	"loss": 0.4656,
	"step": 852
	},
	{
	"epoch": 0.2350108355405731,
	"grad_norm": 0.39630356431007385,
	"learning_rate": 1e-05,
	"loss": 0.4734,
	"step": 854
	},
	{
	"epoch": 0.23556121220460252,
	"grad_norm": 0.3797578513622284,
	"learning_rate": 1e-05,
	"loss": 0.4718,
	"step": 856
	},
	{
	"epoch": 0.23611158886863198,
	"grad_norm": 0.38648873567581177,
	"learning_rate": 1e-05,
	"loss": 0.4751,
	"step": 858
	},
	{
	"epoch": 0.23666196553266142,
	"grad_norm": 0.3934420347213745,
	"learning_rate": 1e-05,
	"loss": 0.4653,
	"step": 860
	},
	{
	"epoch": 0.23721234219669085,
	"grad_norm": 0.3899431824684143,
	"learning_rate": 1e-05,
	"loss": 0.4644,
	"step": 862
	},
	{
	"epoch": 0.2377627188607203,
	"grad_norm": 0.3696826696395874,
	"learning_rate": 1e-05,
	"loss": 0.482,
	"step": 864
	},
	{
	"epoch": 0.23831309552474975,
	"grad_norm": 0.352923184633255,
	"learning_rate": 1e-05,
	"loss": 0.4707,
	"step": 866
	},
	{
	"epoch": 0.2388634721887792,
	"grad_norm": 0.36678972840309143,
	"learning_rate": 1e-05,
	"loss": 0.4687,
	"step": 868
	},
	{
	"epoch": 0.23941384885280864,
	"grad_norm": 0.38986021280288696,
	"learning_rate": 1e-05,
	"loss": 0.4613,
	"step": 870
	},
	{
	"epoch": 0.23996422551683808,
	"grad_norm": 0.3684535622596741,
	"learning_rate": 1e-05,
	"loss": 0.4734,
	"step": 872
	},
	{
	"epoch": 0.24051460218086754,
	"grad_norm": 0.36672261357307434,
	"learning_rate": 1e-05,
	"loss": 0.4796,
	"step": 874
	},
	{
	"epoch": 0.24106497884489697,
	"grad_norm": 0.39910420775413513,
	"learning_rate": 1e-05,
	"loss": 0.4681,
	"step": 876
	},
	{
	"epoch": 0.24161535550892643,
	"grad_norm": 0.38694077730178833,
	"learning_rate": 1e-05,
	"loss": 0.4821,
	"step": 878
	},
	{
	"epoch": 0.24216573217295587,
	"grad_norm": 0.4555080831050873,
	"learning_rate": 1e-05,
	"loss": 0.4882,
	"step": 880
	},
	{
	"epoch": 0.2427161088369853,
	"grad_norm": 0.3934450149536133,
	"learning_rate": 1e-05,
	"loss": 0.4778,
	"step": 882
	},
	{
	"epoch": 0.24326648550101476,
	"grad_norm": 0.35743412375450134,
	"learning_rate": 1e-05,
	"loss": 0.4793,
	"step": 884
	},
	{
	"epoch": 0.2438168621650442,
	"grad_norm": 0.3518178462982178,
	"learning_rate": 1e-05,
	"loss": 0.472,
	"step": 886
	},
	{
	"epoch": 0.24436723882907366,
	"grad_norm": 0.35367751121520996,
	"learning_rate": 1e-05,
	"loss": 0.4747,
	"step": 888
	},
	{
	"epoch": 0.2449176154931031,
	"grad_norm": 0.3810805678367615,
	"learning_rate": 1e-05,
	"loss": 0.4834,
	"step": 890
	},
	{
	"epoch": 0.24546799215713253,
	"grad_norm": 0.38103243708610535,
	"learning_rate": 1e-05,
	"loss": 0.4763,
	"step": 892
	},
	{
	"epoch": 0.246018368821162,
	"grad_norm": 0.3839399218559265,
	"learning_rate": 1e-05,
	"loss": 0.4696,
	"step": 894
	},
	{
	"epoch": 0.24656874548519142,
	"grad_norm": 0.41292649507522583,
	"learning_rate": 1e-05,
	"loss": 0.4777,
	"step": 896
	},
	{
	"epoch": 0.24711912214922088,
	"grad_norm": 0.36179229617118835,
	"learning_rate": 1e-05,
	"loss": 0.4668,
	"step": 898
	},
	{
	"epoch": 0.24766949881325032,
	"grad_norm": 0.3638279139995575,
	"learning_rate": 1e-05,
	"loss": 0.4645,
	"step": 900
	},
	{
	"epoch": 0.24821987547727975,
	"grad_norm": 0.3458470106124878,
	"learning_rate": 1e-05,
	"loss": 0.4746,
	"step": 902
	},
	{
	"epoch": 0.2487702521413092,
	"grad_norm": 0.3822806775569916,
	"learning_rate": 1e-05,
	"loss": 0.4715,
	"step": 904
	},
	{
	"epoch": 0.24932062880533865,
	"grad_norm": 0.3655596077442169,
	"learning_rate": 1e-05,
	"loss": 0.4659,
	"step": 906
	},
	{
	"epoch": 0.2498710054693681,
	"grad_norm": 0.3868783116340637,
	"learning_rate": 1e-05,
	"loss": 0.4743,
	"step": 908
	},
	{
	"epoch": 0.25042138213339754,
	"grad_norm": 0.3778232932090759,
	"learning_rate": 1e-05,
	"loss": 0.4652,
	"step": 910
	},
	{
	"epoch": 0.250971758797427,
	"grad_norm": 0.36664894223213196,
	"learning_rate": 1e-05,
	"loss": 0.4554,
	"step": 912
	},
	{
	"epoch": 0.2515221354614564,
	"grad_norm": 0.3995139002799988,
	"learning_rate": 1e-05,
	"loss": 0.4683,
	"step": 914
	},
	{
	"epoch": 0.25207251212548587,
	"grad_norm": 0.40083470940589905,
	"learning_rate": 1e-05,
	"loss": 0.4673,
	"step": 916
	},
	{
	"epoch": 0.25262288878951533,
	"grad_norm": 0.37919968366622925,
	"learning_rate": 1e-05,
	"loss": 0.4776,
	"step": 918
	},
	{
	"epoch": 0.2531732654535448,
	"grad_norm": 0.3586704432964325,
	"learning_rate": 1e-05,
	"loss": 0.4792,
	"step": 920
	},
	{
	"epoch": 0.2537236421175742,
	"grad_norm": 0.3744722902774811,
	"learning_rate": 1e-05,
	"loss": 0.463,
	"step": 922
	},
	{
	"epoch": 0.25427401878160366,
	"grad_norm": 0.37209680676460266,
	"learning_rate": 1e-05,
	"loss": 0.4805,
	"step": 924
	},
	{
	"epoch": 0.2548243954456331,
	"grad_norm": 0.40809133648872375,
	"learning_rate": 1e-05,
	"loss": 0.4781,
	"step": 926
	},
	{
	"epoch": 0.25537477210966253,
	"grad_norm": 0.37261903285980225,
	"learning_rate": 1e-05,
	"loss": 0.4617,
	"step": 928
	},
	{
	"epoch": 0.255925148773692,
	"grad_norm": 0.37391313910484314,
	"learning_rate": 1e-05,
	"loss": 0.4617,
	"step": 930
	},
	{
	"epoch": 0.25647552543772145,
	"grad_norm": 0.36610838770866394,
	"learning_rate": 1e-05,
	"loss": 0.4642,
	"step": 932
	},
	{
	"epoch": 0.25702590210175086,
	"grad_norm": 0.3854142129421234,
	"learning_rate": 1e-05,
	"loss": 0.4652,
	"step": 934
	},
	{
	"epoch": 0.2575762787657803,
	"grad_norm": 0.365159809589386,
	"learning_rate": 1e-05,
	"loss": 0.4714,
	"step": 936
	},
	{
	"epoch": 0.2581266554298098,
	"grad_norm": 0.41678836941719055,
	"learning_rate": 1e-05,
	"loss": 0.4854,
	"step": 938
	},
	{
	"epoch": 0.25867703209383924,
	"grad_norm": 0.380215585231781,
	"learning_rate": 1e-05,
	"loss": 0.4785,
	"step": 940
	},
	{
	"epoch": 0.25922740875786865,
	"grad_norm": 0.3704361617565155,
	"learning_rate": 1e-05,
	"loss": 0.4433,
	"step": 942
	},
	{
	"epoch": 0.2597777854218981,
	"grad_norm": 0.34440556168556213,
	"learning_rate": 1e-05,
	"loss": 0.4642,
	"step": 944
	},
	{
	"epoch": 0.2603281620859276,
	"grad_norm": 0.36701446771621704,
	"learning_rate": 1e-05,
	"loss": 0.4533,
	"step": 946
	},
	{
	"epoch": 0.260878538749957,
	"grad_norm": 0.3694971799850464,
	"learning_rate": 1e-05,
	"loss": 0.4942,
	"step": 948
	},
	{
	"epoch": 0.26142891541398644,
	"grad_norm": 0.3697713017463684,
	"learning_rate": 1e-05,
	"loss": 0.4586,
	"step": 950
	},
	{
	"epoch": 0.2619792920780159,
	"grad_norm": 0.36559173464775085,
	"learning_rate": 1e-05,
	"loss": 0.4679,
	"step": 952
	},
	{
	"epoch": 0.26252966874204536,
	"grad_norm": 0.3704969584941864,
	"learning_rate": 1e-05,
	"loss": 0.4624,
	"step": 954
	},
	{
	"epoch": 0.26308004540607477,
	"grad_norm": 0.3804495334625244,
	"learning_rate": 1e-05,
	"loss": 0.4603,
	"step": 956
	},
	{
	"epoch": 0.26363042207010423,
	"grad_norm": 0.34987303614616394,
	"learning_rate": 1e-05,
	"loss": 0.4679,
	"step": 958
	},
	{
	"epoch": 0.2641807987341337,
	"grad_norm": 0.3723856508731842,
	"learning_rate": 1e-05,
	"loss": 0.4631,
	"step": 960
	},
	{
	"epoch": 0.2647311753981631,
	"grad_norm": 0.35623612999916077,
	"learning_rate": 1e-05,
	"loss": 0.4627,
	"step": 962
	},
	{
	"epoch": 0.26528155206219256,
	"grad_norm": 0.37969711422920227,
	"learning_rate": 1e-05,
	"loss": 0.4815,
	"step": 964
	},
	{
	"epoch": 0.265831928726222,
	"grad_norm": 0.3889734447002411,
	"learning_rate": 1e-05,
	"loss": 0.471,
	"step": 966
	},
	{
	"epoch": 0.26638230539025143,
	"grad_norm": 0.39106228947639465,
	"learning_rate": 1e-05,
	"loss": 0.4542,
	"step": 968
	},
	{
	"epoch": 0.2669326820542809,
	"grad_norm": 0.38163650035858154,
	"learning_rate": 1e-05,
	"loss": 0.4604,
	"step": 970
	},
	{
	"epoch": 0.26748305871831035,
	"grad_norm": 0.3733852505683899,
	"learning_rate": 1e-05,
	"loss": 0.4768,
	"step": 972
	},
	{
	"epoch": 0.2680334353823398,
	"grad_norm": 0.3894038796424866,
	"learning_rate": 1e-05,
	"loss": 0.4816,
	"step": 974
	},
	{
	"epoch": 0.2685838120463692,
	"grad_norm": 0.3697439432144165,
	"learning_rate": 1e-05,
	"loss": 0.4731,
	"step": 976
	},
	{
	"epoch": 0.2691341887103987,
	"grad_norm": 0.39549171924591064,
	"learning_rate": 1e-05,
	"loss": 0.473,
	"step": 978
	},
	{
	"epoch": 0.26968456537442814,
	"grad_norm": 0.38712403178215027,
	"learning_rate": 1e-05,
	"loss": 0.4717,
	"step": 980
	},
	{
	"epoch": 0.27023494203845755,
	"grad_norm": 0.3775619864463806,
	"learning_rate": 1e-05,
	"loss": 0.4638,
	"step": 982
	},
	{
	"epoch": 0.270785318702487,
	"grad_norm": 0.38664135336875916,
	"learning_rate": 1e-05,
	"loss": 0.4655,
	"step": 984
	},
	{
	"epoch": 0.27133569536651647,
	"grad_norm": 0.3730804920196533,
	"learning_rate": 1e-05,
	"loss": 0.4672,
	"step": 986
	},
	{
	"epoch": 0.2718860720305459,
	"grad_norm": 0.36626750230789185,
	"learning_rate": 1e-05,
	"loss": 0.4562,
	"step": 988
	},
	{
	"epoch": 0.27243644869457534,
	"grad_norm": 0.38708406686782837,
	"learning_rate": 1e-05,
	"loss": 0.4583,
	"step": 990
	},
	{
	"epoch": 0.2729868253586048,
	"grad_norm": 0.37348565459251404,
	"learning_rate": 1e-05,
	"loss": 0.4709,
	"step": 992
	},
	{
	"epoch": 0.27353720202263426,
	"grad_norm": 0.39145755767822266,
	"learning_rate": 1e-05,
	"loss": 0.4667,
	"step": 994
	},
	{
	"epoch": 0.27408757868666367,
	"grad_norm": 0.3615020215511322,
	"learning_rate": 1e-05,
	"loss": 0.4585,
	"step": 996
	},
	{
	"epoch": 0.27463795535069313,
	"grad_norm": 0.38545548915863037,
	"learning_rate": 1e-05,
	"loss": 0.472,
	"step": 998
	},
	{
	"epoch": 0.2751883320147226,
	"grad_norm": 0.3605005741119385,
	"learning_rate": 1e-05,
	"loss": 0.4575,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_merge_loss": 0.4092504382133484,
	"eval_merge_runtime": 599.649,
	"eval_merge_samples_per_second": 56.286,
	"eval_merge_steps_per_second": 2.346,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_new_aug_datas_filtered.json_loss": 0.534787118434906,
	"eval_new_aug_datas_filtered.json_runtime": 10.3465,
	"eval_new_aug_datas_filtered.json_samples_per_second": 74.131,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.093,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_sharegpt_gpt4.json_loss": 0.7911589741706848,
	"eval_sharegpt_gpt4.json_runtime": 31.721,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.668,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.459,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_Table_GPT.json_loss": 0.07000603526830673,
	"eval_Table_GPT.json_runtime": 24.9973,
	"eval_Table_GPT.json_samples_per_second": 83.729,
	"eval_Table_GPT.json_steps_per_second": 3.52,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_gpt_4o_200k.json_loss": 0.8180866837501526,
	"eval_gpt_4o_200k.json_runtime": 48.5388,
	"eval_gpt_4o_200k.json_samples_per_second": 129.402,
	"eval_gpt_4o_200k.json_steps_per_second": 5.398,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_multi_turn_datas.json_loss": 0.34955134987831116,
	"eval_multi_turn_datas.json_runtime": 75.86,
	"eval_multi_turn_datas.json_samples_per_second": 52.755,
	"eval_multi_turn_datas.json_steps_per_second": 2.201,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_table_python_code_datas.json_loss": 0.285086989402771,
	"eval_table_python_code_datas.json_runtime": 43.1585,
	"eval_table_python_code_datas.json_samples_per_second": 50.025,
	"eval_table_python_code_datas.json_steps_per_second": 2.085,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_tabular_llm_data.json_loss": 0.12198314070701599,
	"eval_tabular_llm_data.json_runtime": 8.5654,
	"eval_tabular_llm_data.json_samples_per_second": 28.72,
	"eval_tabular_llm_data.json_steps_per_second": 1.284,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_python_code_critic_21k.json_loss": 0.5841899514198303,
	"eval_python_code_critic_21k.json_runtime": 3.2248,
	"eval_python_code_critic_21k.json_samples_per_second": 185.125,
	"eval_python_code_critic_21k.json_steps_per_second": 7.752,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_all_merge_table_dataset.json_loss": 0.08110550791025162,
	"eval_all_merge_table_dataset.json_runtime": 23.4122,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.411,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.281,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_code_feedback_multi_turn.json_loss": 0.5908513069152832,
	"eval_code_feedback_multi_turn.json_runtime": 32.4627,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.801,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.834,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_ultrainteract_sft.json_loss": 0.42869675159454346,
	"eval_ultrainteract_sft.json_runtime": 8.6816,
	"eval_ultrainteract_sft.json_samples_per_second": 167.711,
	"eval_ultrainteract_sft.json_steps_per_second": 7.026,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_synthetic_text_to_sql.json_loss": 0.10359195619821548,
	"eval_synthetic_text_to_sql.json_runtime": 0.1301,
	"eval_synthetic_text_to_sql.json_samples_per_second": 261.368,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.375,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_sft_react_sql_datas.json_loss": 0.6493918895721436,
	"eval_sft_react_sql_datas.json_runtime": 7.8489,
	"eval_sft_react_sql_datas.json_samples_per_second": 40.006,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.784,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_all_merge_code.json_loss": 0.29959577322006226,
	"eval_all_merge_code.json_runtime": 0.3379,
	"eval_all_merge_code.json_samples_per_second": 186.458,
	"eval_all_merge_code.json_steps_per_second": 8.879,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_magpie_datas.json_loss": 0.4377444088459015,
	"eval_magpie_datas.json_runtime": 2.2091,
	"eval_magpie_datas.json_samples_per_second": 77.86,
	"eval_magpie_datas.json_steps_per_second": 3.621,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_train_data_for_qwen.json_loss": 0.003975613508373499,
	"eval_train_data_for_qwen.json_runtime": 0.2434,
	"eval_train_data_for_qwen.json_samples_per_second": 41.087,
	"eval_train_data_for_qwen.json_steps_per_second": 4.109,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_alpaca_cleaned.json_loss": 0.9270830750465393,
	"eval_alpaca_cleaned.json_runtime": 0.1147,
	"eval_alpaca_cleaned.json_samples_per_second": 235.404,
	"eval_alpaca_cleaned.json_steps_per_second": 17.437,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_agent_instruct.json_loss": 0.2235051840543747,
	"eval_agent_instruct.json_runtime": 0.5147,
	"eval_agent_instruct.json_samples_per_second": 93.255,
	"eval_agent_instruct.json_steps_per_second": 3.886,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_MathInstruct.json_loss": 0.20924758911132812,
	"eval_MathInstruct.json_runtime": 0.3588,
	"eval_MathInstruct.json_samples_per_second": 158.853,
	"eval_MathInstruct.json_steps_per_second": 8.361,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_tested_143k_python_alpaca.json_loss": 0.44443246722221375,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3017,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.684,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.628,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_xlam_function_calling_60k.json_loss": 0.008116651326417923,
	"eval_xlam_function_calling_60k.json_runtime": 0.1004,
	"eval_xlam_function_calling_60k.json_samples_per_second": 229.157,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.963,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.588812232017517,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0516,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 310.032,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.377,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_alpaca_gpt4_zh.json_loss": 0.9696416258811951,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0501,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 219.488,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.953,
	"step": 1000
	},
	{
	"epoch": 0.2751883320147226,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5965829491615295,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4872,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.049,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.052,
	"step": 1000
	},
	{
	"epoch": 0.275738708678752,
	"grad_norm": 0.3598334789276123,
	"learning_rate": 1e-05,
	"loss": 0.4624,
	"step": 1002
	},
	{
	"epoch": 0.27628908534278146,
	"grad_norm": 0.3716166615486145,
	"learning_rate": 1e-05,
	"loss": 0.4593,
	"step": 1004
	},
	{
	"epoch": 0.2768394620068109,
	"grad_norm": 0.3814164996147156,
	"learning_rate": 1e-05,
	"loss": 0.4581,
	"step": 1006
	},
	{
	"epoch": 0.2773898386708404,
	"grad_norm": 0.3595026731491089,
	"learning_rate": 1e-05,
	"loss": 0.4826,
	"step": 1008
	},
	{
	"epoch": 0.2779402153348698,
	"grad_norm": 0.3587126135826111,
	"learning_rate": 1e-05,
	"loss": 0.4563,
	"step": 1010
	},
	{
	"epoch": 0.27849059199889925,
	"grad_norm": 0.36048388481140137,
	"learning_rate": 1e-05,
	"loss": 0.4646,
	"step": 1012
	},
	{
	"epoch": 0.2790409686629287,
	"grad_norm": 0.37650784850120544,
	"learning_rate": 1e-05,
	"loss": 0.4658,
	"step": 1014
	},
	{
	"epoch": 0.2795913453269581,
	"grad_norm": 0.34934109449386597,
	"learning_rate": 1e-05,
	"loss": 0.4535,
	"step": 1016
	},
	{
	"epoch": 0.2801417219909876,
	"grad_norm": 0.375130295753479,
	"learning_rate": 1e-05,
	"loss": 0.4802,
	"step": 1018
	},
	{
	"epoch": 0.28069209865501704,
	"grad_norm": 0.3595198094844818,
	"learning_rate": 1e-05,
	"loss": 0.4736,
	"step": 1020
	},
	{
	"epoch": 0.28124247531904645,
	"grad_norm": 0.37816157937049866,
	"learning_rate": 1e-05,
	"loss": 0.4639,
	"step": 1022
	},
	{
	"epoch": 0.2817928519830759,
	"grad_norm": 0.39598193764686584,
	"learning_rate": 1e-05,
	"loss": 0.4544,
	"step": 1024
	},
	{
	"epoch": 0.28234322864710537,
	"grad_norm": 0.35407206416130066,
	"learning_rate": 1e-05,
	"loss": 0.4342,
	"step": 1026
	},
	{
	"epoch": 0.28289360531113483,
	"grad_norm": 0.3630298972129822,
	"learning_rate": 1e-05,
	"loss": 0.48,
	"step": 1028
	},
	{
	"epoch": 0.28344398197516424,
	"grad_norm": 0.35917675495147705,
	"learning_rate": 1e-05,
	"loss": 0.4647,
	"step": 1030
	},
	{
	"epoch": 0.2839943586391937,
	"grad_norm": 0.36868980526924133,
	"learning_rate": 1e-05,
	"loss": 0.4633,
	"step": 1032
	},
	{
	"epoch": 0.28454473530322316,
	"grad_norm": 0.38559168577194214,
	"learning_rate": 1e-05,
	"loss": 0.4786,
	"step": 1034
	},
	{
	"epoch": 0.28509511196725257,
	"grad_norm": 0.3563440442085266,
	"learning_rate": 1e-05,
	"loss": 0.4703,
	"step": 1036
	},
	{
	"epoch": 0.28564548863128203,
	"grad_norm": 0.3761630654335022,
	"learning_rate": 1e-05,
	"loss": 0.4712,
	"step": 1038
	},
	{
	"epoch": 0.2861958652953115,
	"grad_norm": 0.3870238661766052,
	"learning_rate": 1e-05,
	"loss": 0.4622,
	"step": 1040
	},
	{
	"epoch": 0.2867462419593409,
	"grad_norm": 0.36192306876182556,
	"learning_rate": 1e-05,
	"loss": 0.4619,
	"step": 1042
	},
	{
	"epoch": 0.28729661862337036,
	"grad_norm": 0.3688748776912689,
	"learning_rate": 1e-05,
	"loss": 0.457,
	"step": 1044
	},
	{
	"epoch": 0.2878469952873998,
	"grad_norm": 0.38211309909820557,
	"learning_rate": 1e-05,
	"loss": 0.4661,
	"step": 1046
	},
	{
	"epoch": 0.2883973719514293,
	"grad_norm": 0.36421847343444824,
	"learning_rate": 1e-05,
	"loss": 0.4647,
	"step": 1048
	},
	{
	"epoch": 0.2889477486154587,
	"grad_norm": 0.38917919993400574,
	"learning_rate": 1e-05,
	"loss": 0.4573,
	"step": 1050
	},
	{
	"epoch": 0.28949812527948815,
	"grad_norm": 0.3668692111968994,
	"learning_rate": 1e-05,
	"loss": 0.4545,
	"step": 1052
	},
	{
	"epoch": 0.2900485019435176,
	"grad_norm": 0.3869079649448395,
	"learning_rate": 1e-05,
	"loss": 0.4569,
	"step": 1054
	},
	{
	"epoch": 0.290598878607547,
	"grad_norm": 0.3763209283351898,
	"learning_rate": 1e-05,
	"loss": 0.451,
	"step": 1056
	},
	{
	"epoch": 0.2911492552715765,
	"grad_norm": 0.37899014353752136,
	"learning_rate": 1e-05,
	"loss": 0.4658,
	"step": 1058
	},
	{
	"epoch": 0.29169963193560594,
	"grad_norm": 0.38784778118133545,
	"learning_rate": 1e-05,
	"loss": 0.4589,
	"step": 1060
	},
	{
	"epoch": 0.2922500085996354,
	"grad_norm": 0.38340142369270325,
	"learning_rate": 1e-05,
	"loss": 0.4644,
	"step": 1062
	},
	{
	"epoch": 0.2928003852636648,
	"grad_norm": 0.3758372962474823,
	"learning_rate": 1e-05,
	"loss": 0.4597,
	"step": 1064
	},
	{
	"epoch": 0.29335076192769427,
	"grad_norm": 0.36990198493003845,
	"learning_rate": 1e-05,
	"loss": 0.4577,
	"step": 1066
	},
	{
	"epoch": 0.29390113859172373,
	"grad_norm": 0.35997095704078674,
	"learning_rate": 1e-05,
	"loss": 0.452,
	"step": 1068
	},
	{
	"epoch": 0.29445151525575314,
	"grad_norm": 0.3728466331958771,
	"learning_rate": 1e-05,
	"loss": 0.4567,
	"step": 1070
	},
	{
	"epoch": 0.2950018919197826,
	"grad_norm": 0.3471437990665436,
	"learning_rate": 1e-05,
	"loss": 0.4661,
	"step": 1072
	},
	{
	"epoch": 0.29555226858381206,
	"grad_norm": 0.39197105169296265,
	"learning_rate": 1e-05,
	"loss": 0.4738,
	"step": 1074
	},
	{
	"epoch": 0.29610264524784147,
	"grad_norm": 0.366745263338089,
	"learning_rate": 1e-05,
	"loss": 0.4555,
	"step": 1076
	},
	{
	"epoch": 0.29665302191187093,
	"grad_norm": 0.3721451759338379,
	"learning_rate": 1e-05,
	"loss": 0.4784,
	"step": 1078
	},
	{
	"epoch": 0.2972033985759004,
	"grad_norm": 0.3505246341228485,
	"learning_rate": 1e-05,
	"loss": 0.4486,
	"step": 1080
	},
	{
	"epoch": 0.29775377523992985,
	"grad_norm": 0.37022680044174194,
	"learning_rate": 1e-05,
	"loss": 0.4631,
	"step": 1082
	},
	{
	"epoch": 0.29830415190395926,
	"grad_norm": 0.3808286190032959,
	"learning_rate": 1e-05,
	"loss": 0.472,
	"step": 1084
	},
	{
	"epoch": 0.2988545285679887,
	"grad_norm": 0.3860435485839844,
	"learning_rate": 1e-05,
	"loss": 0.4541,
	"step": 1086
	},
	{
	"epoch": 0.2994049052320182,
	"grad_norm": 0.35552406311035156,
	"learning_rate": 1e-05,
	"loss": 0.4565,
	"step": 1088
	},
	{
	"epoch": 0.2999552818960476,
	"grad_norm": 0.3758242428302765,
	"learning_rate": 1e-05,
	"loss": 0.4803,
	"step": 1090
	},
	{
	"epoch": 0.30050565856007705,
	"grad_norm": 0.3900710940361023,
	"learning_rate": 1e-05,
	"loss": 0.4658,
	"step": 1092
	},
	{
	"epoch": 0.3010560352241065,
	"grad_norm": 0.38439512252807617,
	"learning_rate": 1e-05,
	"loss": 0.4677,
	"step": 1094
	},
	{
	"epoch": 0.3016064118881359,
	"grad_norm": 0.3970472812652588,
	"learning_rate": 1e-05,
	"loss": 0.4751,
	"step": 1096
	},
	{
	"epoch": 0.3021567885521654,
	"grad_norm": 0.36555778980255127,
	"learning_rate": 1e-05,
	"loss": 0.4556,
	"step": 1098
	},
	{
	"epoch": 0.30270716521619484,
	"grad_norm": 0.3682638108730316,
	"learning_rate": 1e-05,
	"loss": 0.4504,
	"step": 1100
	},
	{
	"epoch": 0.3032575418802243,
	"grad_norm": 0.4228995442390442,
	"learning_rate": 1e-05,
	"loss": 0.4736,
	"step": 1102
	},
	{
	"epoch": 0.3038079185442537,
	"grad_norm": 0.35070449113845825,
	"learning_rate": 1e-05,
	"loss": 0.4589,
	"step": 1104
	},
	{
	"epoch": 0.30435829520828317,
	"grad_norm": 0.40524446964263916,
	"learning_rate": 1e-05,
	"loss": 0.4616,
	"step": 1106
	},
	{
	"epoch": 0.30490867187231263,
	"grad_norm": 0.3461023271083832,
	"learning_rate": 1e-05,
	"loss": 0.4679,
	"step": 1108
	},
	{
	"epoch": 0.30545904853634204,
	"grad_norm": 0.3741723299026489,
	"learning_rate": 1e-05,
	"loss": 0.4618,
	"step": 1110
	},
	{
	"epoch": 0.3060094252003715,
	"grad_norm": 0.37440451979637146,
	"learning_rate": 1e-05,
	"loss": 0.4638,
	"step": 1112
	},
	{
	"epoch": 0.30655980186440096,
	"grad_norm": 0.34469377994537354,
	"learning_rate": 1e-05,
	"loss": 0.4426,
	"step": 1114
	},
	{
	"epoch": 0.3071101785284304,
	"grad_norm": 0.35499683022499084,
	"learning_rate": 1e-05,
	"loss": 0.4548,
	"step": 1116
	},
	{
	"epoch": 0.30766055519245983,
	"grad_norm": 0.3623688220977783,
	"learning_rate": 1e-05,
	"loss": 0.4574,
	"step": 1118
	},
	{
	"epoch": 0.3082109318564893,
	"grad_norm": 0.3487359583377838,
	"learning_rate": 1e-05,
	"loss": 0.4632,
	"step": 1120
	},
	{
	"epoch": 0.30876130852051875,
	"grad_norm": 0.36232292652130127,
	"learning_rate": 1e-05,
	"loss": 0.462,
	"step": 1122
	},
	{
	"epoch": 0.30931168518454816,
	"grad_norm": 0.38301897048950195,
	"learning_rate": 1e-05,
	"loss": 0.4545,
	"step": 1124
	},
	{
	"epoch": 0.3098620618485776,
	"grad_norm": 0.3788921535015106,
	"learning_rate": 1e-05,
	"loss": 0.4614,
	"step": 1126
	},
	{
	"epoch": 0.3104124385126071,
	"grad_norm": 0.3723096251487732,
	"learning_rate": 1e-05,
	"loss": 0.4658,
	"step": 1128
	},
	{
	"epoch": 0.3109628151766365,
	"grad_norm": 0.3926720917224884,
	"learning_rate": 1e-05,
	"loss": 0.4602,
	"step": 1130
	},
	{
	"epoch": 0.31151319184066595,
	"grad_norm": 0.3565811514854431,
	"learning_rate": 1e-05,
	"loss": 0.4692,
	"step": 1132
	},
	{
	"epoch": 0.3120635685046954,
	"grad_norm": 0.38179391622543335,
	"learning_rate": 1e-05,
	"loss": 0.4581,
	"step": 1134
	},
	{
	"epoch": 0.31261394516872487,
	"grad_norm": 0.3732840418815613,
	"learning_rate": 1e-05,
	"loss": 0.4628,
	"step": 1136
	},
	{
	"epoch": 0.3131643218327543,
	"grad_norm": 0.3934018313884735,
	"learning_rate": 1e-05,
	"loss": 0.4634,
	"step": 1138
	},
	{
	"epoch": 0.31371469849678374,
	"grad_norm": 0.3575834035873413,
	"learning_rate": 1e-05,
	"loss": 0.4507,
	"step": 1140
	},
	{
	"epoch": 0.3142650751608132,
	"grad_norm": 0.3623636066913605,
	"learning_rate": 1e-05,
	"loss": 0.4547,
	"step": 1142
	},
	{
	"epoch": 0.3148154518248426,
	"grad_norm": 0.3794458508491516,
	"learning_rate": 1e-05,
	"loss": 0.4661,
	"step": 1144
	},
	{
	"epoch": 0.31536582848887207,
	"grad_norm": 0.3896718919277191,
	"learning_rate": 1e-05,
	"loss": 0.4646,
	"step": 1146
	},
	{
	"epoch": 0.31591620515290153,
	"grad_norm": 0.3608621060848236,
	"learning_rate": 1e-05,
	"loss": 0.4522,
	"step": 1148
	},
	{
	"epoch": 0.31646658181693094,
	"grad_norm": 0.37019404768943787,
	"learning_rate": 1e-05,
	"loss": 0.4548,
	"step": 1150
	},
	{
	"epoch": 0.3170169584809604,
	"grad_norm": 0.37957248091697693,
	"learning_rate": 1e-05,
	"loss": 0.4554,
	"step": 1152
	},
	{
	"epoch": 0.31756733514498986,
	"grad_norm": 0.3605276048183441,
	"learning_rate": 1e-05,
	"loss": 0.4679,
	"step": 1154
	},
	{
	"epoch": 0.3181177118090193,
	"grad_norm": 0.37218716740608215,
	"learning_rate": 1e-05,
	"loss": 0.4686,
	"step": 1156
	},
	{
	"epoch": 0.3186680884730487,
	"grad_norm": 0.37037035822868347,
	"learning_rate": 1e-05,
	"loss": 0.4898,
	"step": 1158
	},
	{
	"epoch": 0.3192184651370782,
	"grad_norm": 0.3569047749042511,
	"learning_rate": 1e-05,
	"loss": 0.4619,
	"step": 1160
	},
	{
	"epoch": 0.31976884180110765,
	"grad_norm": 0.3728378117084503,
	"learning_rate": 1e-05,
	"loss": 0.4544,
	"step": 1162
	},
	{
	"epoch": 0.32031921846513706,
	"grad_norm": 0.35970696806907654,
	"learning_rate": 1e-05,
	"loss": 0.4704,
	"step": 1164
	},
	{
	"epoch": 0.3208695951291665,
	"grad_norm": 0.36476969718933105,
	"learning_rate": 1e-05,
	"loss": 0.4605,
	"step": 1166
	},
	{
	"epoch": 0.321419971793196,
	"grad_norm": 0.35015928745269775,
	"learning_rate": 1e-05,
	"loss": 0.4653,
	"step": 1168
	},
	{
	"epoch": 0.3219703484572254,
	"grad_norm": 0.3600417375564575,
	"learning_rate": 1e-05,
	"loss": 0.4557,
	"step": 1170
	},
	{
	"epoch": 0.32252072512125485,
	"grad_norm": 0.36994755268096924,
	"learning_rate": 1e-05,
	"loss": 0.4601,
	"step": 1172
	},
	{
	"epoch": 0.3230711017852843,
	"grad_norm": 0.39908286929130554,
	"learning_rate": 1e-05,
	"loss": 0.472,
	"step": 1174
	},
	{
	"epoch": 0.32362147844931377,
	"grad_norm": 0.3717789947986603,
	"learning_rate": 1e-05,
	"loss": 0.4646,
	"step": 1176
	},
	{
	"epoch": 0.3241718551133432,
	"grad_norm": 0.3617453873157501,
	"learning_rate": 1e-05,
	"loss": 0.4606,
	"step": 1178
	},
	{
	"epoch": 0.32472223177737264,
	"grad_norm": 0.35809728503227234,
	"learning_rate": 1e-05,
	"loss": 0.4548,
	"step": 1180
	},
	{
	"epoch": 0.3252726084414021,
	"grad_norm": 0.3767383396625519,
	"learning_rate": 1e-05,
	"loss": 0.4785,
	"step": 1182
	},
	{
	"epoch": 0.3258229851054315,
	"grad_norm": 0.3819461166858673,
	"learning_rate": 1e-05,
	"loss": 0.4695,
	"step": 1184
	},
	{
	"epoch": 0.32637336176946097,
	"grad_norm": 0.3590524196624756,
	"learning_rate": 1e-05,
	"loss": 0.468,
	"step": 1186
	},
	{
	"epoch": 0.32692373843349043,
	"grad_norm": 0.37356823682785034,
	"learning_rate": 1e-05,
	"loss": 0.4628,
	"step": 1188
	},
	{
	"epoch": 0.3274741150975199,
	"grad_norm": 0.39389410614967346,
	"learning_rate": 1e-05,
	"loss": 0.4686,
	"step": 1190
	},
	{
	"epoch": 0.3280244917615493,
	"grad_norm": 0.36901354789733887,
	"learning_rate": 1e-05,
	"loss": 0.4623,
	"step": 1192
	},
	{
	"epoch": 0.32857486842557876,
	"grad_norm": 0.35733821988105774,
	"learning_rate": 1e-05,
	"loss": 0.457,
	"step": 1194
	},
	{
	"epoch": 0.3291252450896082,
	"grad_norm": 0.3803520202636719,
	"learning_rate": 1e-05,
	"loss": 0.4661,
	"step": 1196
	},
	{
	"epoch": 0.3296756217536376,
	"grad_norm": 0.36812326312065125,
	"learning_rate": 1e-05,
	"loss": 0.453,
	"step": 1198
	},
	{
	"epoch": 0.3302259984176671,
	"grad_norm": 0.37463024258613586,
	"learning_rate": 1e-05,
	"loss": 0.4611,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_merge_loss": 0.4038620591163635,
	"eval_merge_runtime": 600.528,
	"eval_merge_samples_per_second": 56.204,
	"eval_merge_steps_per_second": 2.343,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_new_aug_datas_filtered.json_loss": 0.5311903953552246,
	"eval_new_aug_datas_filtered.json_runtime": 10.3899,
	"eval_new_aug_datas_filtered.json_samples_per_second": 73.822,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.08,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_sharegpt_gpt4.json_loss": 0.7848892211914062,
	"eval_sharegpt_gpt4.json_runtime": 31.7548,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.605,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.456,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_Table_GPT.json_loss": 0.07294219732284546,
	"eval_Table_GPT.json_runtime": 25.0251,
	"eval_Table_GPT.json_samples_per_second": 83.636,
	"eval_Table_GPT.json_steps_per_second": 3.516,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_gpt_4o_200k.json_loss": 0.8128483295440674,
	"eval_gpt_4o_200k.json_runtime": 48.5727,
	"eval_gpt_4o_200k.json_samples_per_second": 129.311,
	"eval_gpt_4o_200k.json_steps_per_second": 5.394,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_multi_turn_datas.json_loss": 0.343874990940094,
	"eval_multi_turn_datas.json_runtime": 75.779,
	"eval_multi_turn_datas.json_samples_per_second": 52.811,
	"eval_multi_turn_datas.json_steps_per_second": 2.204,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_table_python_code_datas.json_loss": 0.2791996896266937,
	"eval_table_python_code_datas.json_runtime": 43.1703,
	"eval_table_python_code_datas.json_samples_per_second": 50.011,
	"eval_table_python_code_datas.json_steps_per_second": 2.085,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_tabular_llm_data.json_loss": 0.11510641872882843,
	"eval_tabular_llm_data.json_runtime": 8.5754,
	"eval_tabular_llm_data.json_samples_per_second": 28.687,
	"eval_tabular_llm_data.json_steps_per_second": 1.283,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_python_code_critic_21k.json_loss": 0.5806341171264648,
	"eval_python_code_critic_21k.json_runtime": 3.2355,
	"eval_python_code_critic_21k.json_samples_per_second": 184.517,
	"eval_python_code_critic_21k.json_steps_per_second": 7.727,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_all_merge_table_dataset.json_loss": 0.0781954750418663,
	"eval_all_merge_table_dataset.json_runtime": 23.3576,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.483,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.284,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_code_feedback_multi_turn.json_loss": 0.5880293846130371,
	"eval_code_feedback_multi_turn.json_runtime": 32.5337,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.653,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.828,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_ultrainteract_sft.json_loss": 0.42568570375442505,
	"eval_ultrainteract_sft.json_runtime": 8.665,
	"eval_ultrainteract_sft.json_samples_per_second": 168.033,
	"eval_ultrainteract_sft.json_steps_per_second": 7.04,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_synthetic_text_to_sql.json_loss": 0.10025755316019058,
	"eval_synthetic_text_to_sql.json_runtime": 0.127,
	"eval_synthetic_text_to_sql.json_samples_per_second": 267.683,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.746,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_sft_react_sql_datas.json_loss": 0.6435717344284058,
	"eval_sft_react_sql_datas.json_runtime": 7.8854,
	"eval_sft_react_sql_datas.json_samples_per_second": 39.82,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.775,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_all_merge_code.json_loss": 0.29655295610427856,
	"eval_all_merge_code.json_runtime": 0.3333,
	"eval_all_merge_code.json_samples_per_second": 189.039,
	"eval_all_merge_code.json_steps_per_second": 9.002,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_magpie_datas.json_loss": 0.4353857934474945,
	"eval_magpie_datas.json_runtime": 2.22,
	"eval_magpie_datas.json_samples_per_second": 77.478,
	"eval_magpie_datas.json_steps_per_second": 3.604,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_train_data_for_qwen.json_loss": 0.0036680654156953096,
	"eval_train_data_for_qwen.json_runtime": 0.2448,
	"eval_train_data_for_qwen.json_samples_per_second": 40.856,
	"eval_train_data_for_qwen.json_steps_per_second": 4.086,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_alpaca_cleaned.json_loss": 0.9278478622436523,
	"eval_alpaca_cleaned.json_runtime": 0.1139,
	"eval_alpaca_cleaned.json_samples_per_second": 237.139,
	"eval_alpaca_cleaned.json_steps_per_second": 17.566,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_agent_instruct.json_loss": 0.22283704578876495,
	"eval_agent_instruct.json_runtime": 0.5129,
	"eval_agent_instruct.json_samples_per_second": 93.582,
	"eval_agent_instruct.json_steps_per_second": 3.899,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_MathInstruct.json_loss": 0.20810073614120483,
	"eval_MathInstruct.json_runtime": 0.3587,
	"eval_MathInstruct.json_samples_per_second": 158.905,
	"eval_MathInstruct.json_steps_per_second": 8.363,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_tested_143k_python_alpaca.json_loss": 0.44691047072410583,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3024,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.419,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.613,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_xlam_function_calling_60k.json_loss": 0.009029570966959,
	"eval_xlam_function_calling_60k.json_runtime": 0.1005,
	"eval_xlam_function_calling_60k.json_samples_per_second": 228.948,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.954,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.5715256929397583,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0514,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 311.088,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.443,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_alpaca_gpt4_zh.json_loss": 0.9568694233894348,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0501,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 219.517,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.956,
	"step": 1200
	},
	{
	"epoch": 0.3302259984176671,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5982481837272644,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.487,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.068,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.053,
	"step": 1200
	},
	{
	"epoch": 0.33077637508169655,
	"grad_norm": 0.3862474262714386,
	"learning_rate": 1e-05,
	"loss": 0.467,
	"step": 1202
	},
	{
	"epoch": 0.33132675174572596,
	"grad_norm": 0.3586987555027008,
	"learning_rate": 1e-05,
	"loss": 0.4586,
	"step": 1204
	},
	{
	"epoch": 0.3318771284097554,
	"grad_norm": 0.36768838763237,
	"learning_rate": 1e-05,
	"loss": 0.4658,
	"step": 1206
	},
	{
	"epoch": 0.3324275050737849,
	"grad_norm": 0.36789608001708984,
	"learning_rate": 1e-05,
	"loss": 0.4479,
	"step": 1208
	},
	{
	"epoch": 0.33297788173781434,
	"grad_norm": 0.3875747323036194,
	"learning_rate": 1e-05,
	"loss": 0.4651,
	"step": 1210
	},
	{
	"epoch": 0.33352825840184375,
	"grad_norm": 0.37122058868408203,
	"learning_rate": 1e-05,
	"loss": 0.4474,
	"step": 1212
	},
	{
	"epoch": 0.3340786350658732,
	"grad_norm": 0.3785482347011566,
	"learning_rate": 1e-05,
	"loss": 0.4573,
	"step": 1214
	},
	{
	"epoch": 0.33462901172990267,
	"grad_norm": 0.3795594871044159,
	"learning_rate": 1e-05,
	"loss": 0.4633,
	"step": 1216
	},
	{
	"epoch": 0.3351793883939321,
	"grad_norm": 0.35303714871406555,
	"learning_rate": 1e-05,
	"loss": 0.4701,
	"step": 1218
	},
	{
	"epoch": 0.33572976505796154,
	"grad_norm": 0.3473946154117584,
	"learning_rate": 1e-05,
	"loss": 0.4565,
	"step": 1220
	},
	{
	"epoch": 0.336280141721991,
	"grad_norm": 0.36495375633239746,
	"learning_rate": 1e-05,
	"loss": 0.4528,
	"step": 1222
	},
	{
	"epoch": 0.3368305183860204,
	"grad_norm": 0.3617894649505615,
	"learning_rate": 1e-05,
	"loss": 0.4756,
	"step": 1224
	},
	{
	"epoch": 0.33738089505004987,
	"grad_norm": 0.36371487379074097,
	"learning_rate": 1e-05,
	"loss": 0.4606,
	"step": 1226
	},
	{
	"epoch": 0.33793127171407933,
	"grad_norm": 0.39192309975624084,
	"learning_rate": 1e-05,
	"loss": 0.4435,
	"step": 1228
	},
	{
	"epoch": 0.3384816483781088,
	"grad_norm": 0.3902663588523865,
	"learning_rate": 1e-05,
	"loss": 0.4699,
	"step": 1230
	},
	{
	"epoch": 0.3390320250421382,
	"grad_norm": 0.3662269115447998,
	"learning_rate": 1e-05,
	"loss": 0.4627,
	"step": 1232
	},
	{
	"epoch": 0.33958240170616766,
	"grad_norm": 0.3659150004386902,
	"learning_rate": 1e-05,
	"loss": 0.4663,
	"step": 1234
	},
	{
	"epoch": 0.3401327783701971,
	"grad_norm": 0.3632274568080902,
	"learning_rate": 1e-05,
	"loss": 0.4499,
	"step": 1236
	},
	{
	"epoch": 0.3406831550342265,
	"grad_norm": 0.38413625955581665,
	"learning_rate": 1e-05,
	"loss": 0.4516,
	"step": 1238
	},
	{
	"epoch": 0.341233531698256,
	"grad_norm": 0.35747644305229187,
	"learning_rate": 1e-05,
	"loss": 0.4718,
	"step": 1240
	},
	{
	"epoch": 0.34178390836228545,
	"grad_norm": 0.36938604712486267,
	"learning_rate": 1e-05,
	"loss": 0.4568,
	"step": 1242
	},
	{
	"epoch": 0.3423342850263149,
	"grad_norm": 0.38448217511177063,
	"learning_rate": 1e-05,
	"loss": 0.474,
	"step": 1244
	},
	{
	"epoch": 0.3428846616903443,
	"grad_norm": 0.3694998323917389,
	"learning_rate": 1e-05,
	"loss": 0.4516,
	"step": 1246
	},
	{
	"epoch": 0.3434350383543738,
	"grad_norm": 0.41237321496009827,
	"learning_rate": 1e-05,
	"loss": 0.4569,
	"step": 1248
	},
	{
	"epoch": 0.34398541501840324,
	"grad_norm": 0.4058983325958252,
	"learning_rate": 1e-05,
	"loss": 0.4657,
	"step": 1250
	},
	{
	"epoch": 0.34453579168243265,
	"grad_norm": 0.3610474467277527,
	"learning_rate": 1e-05,
	"loss": 0.4587,
	"step": 1252
	},
	{
	"epoch": 0.3450861683464621,
	"grad_norm": 0.3664454221725464,
	"learning_rate": 1e-05,
	"loss": 0.4656,
	"step": 1254
	},
	{
	"epoch": 0.34563654501049157,
	"grad_norm": 0.35148540139198303,
	"learning_rate": 1e-05,
	"loss": 0.4471,
	"step": 1256
	},
	{
	"epoch": 0.346186921674521,
	"grad_norm": 0.35331565141677856,
	"learning_rate": 1e-05,
	"loss": 0.4674,
	"step": 1258
	},
	{
	"epoch": 0.34673729833855044,
	"grad_norm": 0.35367992520332336,
	"learning_rate": 1e-05,
	"loss": 0.4572,
	"step": 1260
	},
	{
	"epoch": 0.3472876750025799,
	"grad_norm": 0.36106035113334656,
	"learning_rate": 1e-05,
	"loss": 0.466,
	"step": 1262
	},
	{
	"epoch": 0.34783805166660936,
	"grad_norm": 0.36034414172172546,
	"learning_rate": 1e-05,
	"loss": 0.4412,
	"step": 1264
	},
	{
	"epoch": 0.34838842833063877,
	"grad_norm": 0.3532898426055908,
	"learning_rate": 1e-05,
	"loss": 0.4573,
	"step": 1266
	},
	{
	"epoch": 0.34893880499466823,
	"grad_norm": 0.35383620858192444,
	"learning_rate": 1e-05,
	"loss": 0.4644,
	"step": 1268
	},
	{
	"epoch": 0.3494891816586977,
	"grad_norm": 0.3757399022579193,
	"learning_rate": 1e-05,
	"loss": 0.4548,
	"step": 1270
	},
	{
	"epoch": 0.3500395583227271,
	"grad_norm": 0.35997340083122253,
	"learning_rate": 1e-05,
	"loss": 0.4664,
	"step": 1272
	},
	{
	"epoch": 0.35058993498675656,
	"grad_norm": 0.3761090636253357,
	"learning_rate": 1e-05,
	"loss": 0.4601,
	"step": 1274
	},
	{
	"epoch": 0.351140311650786,
	"grad_norm": 0.33666959404945374,
	"learning_rate": 1e-05,
	"loss": 0.4596,
	"step": 1276
	},
	{
	"epoch": 0.3516906883148154,
	"grad_norm": 0.36252304911613464,
	"learning_rate": 1e-05,
	"loss": 0.4688,
	"step": 1278
	},
	{
	"epoch": 0.3522410649788449,
	"grad_norm": 0.3987884819507599,
	"learning_rate": 1e-05,
	"loss": 0.4444,
	"step": 1280
	},
	{
	"epoch": 0.35279144164287435,
	"grad_norm": 0.35914021730422974,
	"learning_rate": 1e-05,
	"loss": 0.4508,
	"step": 1282
	},
	{
	"epoch": 0.3533418183069038,
	"grad_norm": 0.36508429050445557,
	"learning_rate": 1e-05,
	"loss": 0.4597,
	"step": 1284
	},
	{
	"epoch": 0.3538921949709332,
	"grad_norm": 0.3923473060131073,
	"learning_rate": 1e-05,
	"loss": 0.4594,
	"step": 1286
	},
	{
	"epoch": 0.3544425716349627,
	"grad_norm": 0.38775792717933655,
	"learning_rate": 1e-05,
	"loss": 0.4573,
	"step": 1288
	},
	{
	"epoch": 0.35499294829899214,
	"grad_norm": 0.4628289043903351,
	"learning_rate": 1e-05,
	"loss": 0.4732,
	"step": 1290
	},
	{
	"epoch": 0.35554332496302155,
	"grad_norm": 0.35442307591438293,
	"learning_rate": 1e-05,
	"loss": 0.4621,
	"step": 1292
	},
	{
	"epoch": 0.356093701627051,
	"grad_norm": 0.3809347152709961,
	"learning_rate": 1e-05,
	"loss": 0.4696,
	"step": 1294
	},
	{
	"epoch": 0.35664407829108047,
	"grad_norm": 0.3683224618434906,
	"learning_rate": 1e-05,
	"loss": 0.4649,
	"step": 1296
	},
	{
	"epoch": 0.35719445495510993,
	"grad_norm": 0.3792459964752197,
	"learning_rate": 1e-05,
	"loss": 0.465,
	"step": 1298
	},
	{
	"epoch": 0.35774483161913934,
	"grad_norm": 0.3704141080379486,
	"learning_rate": 1e-05,
	"loss": 0.4572,
	"step": 1300
	},
	{
	"epoch": 0.3582952082831688,
	"grad_norm": 0.3618161678314209,
	"learning_rate": 1e-05,
	"loss": 0.4497,
	"step": 1302
	},
	{
	"epoch": 0.35884558494719826,
	"grad_norm": 0.36538904905319214,
	"learning_rate": 1e-05,
	"loss": 0.4525,
	"step": 1304
	},
	{
	"epoch": 0.35939596161122767,
	"grad_norm": 0.36815035343170166,
	"learning_rate": 1e-05,
	"loss": 0.4767,
	"step": 1306
	},
	{
	"epoch": 0.3599463382752571,
	"grad_norm": 0.39006996154785156,
	"learning_rate": 1e-05,
	"loss": 0.4809,
	"step": 1308
	},
	{
	"epoch": 0.3604967149392866,
	"grad_norm": 0.3829619288444519,
	"learning_rate": 1e-05,
	"loss": 0.4714,
	"step": 1310
	},
	{
	"epoch": 0.361047091603316,
	"grad_norm": 0.37935730814933777,
	"learning_rate": 1e-05,
	"loss": 0.4518,
	"step": 1312
	},
	{
	"epoch": 0.36159746826734546,
	"grad_norm": 0.371320903301239,
	"learning_rate": 1e-05,
	"loss": 0.4437,
	"step": 1314
	},
	{
	"epoch": 0.3621478449313749,
	"grad_norm": 0.35784757137298584,
	"learning_rate": 1e-05,
	"loss": 0.4579,
	"step": 1316
	},
	{
	"epoch": 0.3626982215954044,
	"grad_norm": 0.36308974027633667,
	"learning_rate": 1e-05,
	"loss": 0.4561,
	"step": 1318
	},
	{
	"epoch": 0.3632485982594338,
	"grad_norm": 0.3538898825645447,
	"learning_rate": 1e-05,
	"loss": 0.4574,
	"step": 1320
	},
	{
	"epoch": 0.36379897492346325,
	"grad_norm": 0.3715920150279999,
	"learning_rate": 1e-05,
	"loss": 0.4649,
	"step": 1322
	},
	{
	"epoch": 0.3643493515874927,
	"grad_norm": 0.3698347806930542,
	"learning_rate": 1e-05,
	"loss": 0.4648,
	"step": 1324
	},
	{
	"epoch": 0.3648997282515221,
	"grad_norm": 0.3725499212741852,
	"learning_rate": 1e-05,
	"loss": 0.4669,
	"step": 1326
	},
	{
	"epoch": 0.3654501049155516,
	"grad_norm": 0.37399542331695557,
	"learning_rate": 1e-05,
	"loss": 0.4615,
	"step": 1328
	},
	{
	"epoch": 0.36600048157958104,
	"grad_norm": 0.35364219546318054,
	"learning_rate": 1e-05,
	"loss": 0.4573,
	"step": 1330
	},
	{
	"epoch": 0.36655085824361044,
	"grad_norm": 0.3651660084724426,
	"learning_rate": 1e-05,
	"loss": 0.4485,
	"step": 1332
	},
	{
	"epoch": 0.3671012349076399,
	"grad_norm": 0.3659324645996094,
	"learning_rate": 1e-05,
	"loss": 0.4492,
	"step": 1334
	},
	{
	"epoch": 0.36765161157166937,
	"grad_norm": 0.35941600799560547,
	"learning_rate": 1e-05,
	"loss": 0.4727,
	"step": 1336
	},
	{
	"epoch": 0.36820198823569883,
	"grad_norm": 0.35083696246147156,
	"learning_rate": 1e-05,
	"loss": 0.4453,
	"step": 1338
	},
	{
	"epoch": 0.36875236489972824,
	"grad_norm": 0.3690749406814575,
	"learning_rate": 1e-05,
	"loss": 0.4582,
	"step": 1340
	},
	{
	"epoch": 0.3693027415637577,
	"grad_norm": 0.3743647038936615,
	"learning_rate": 1e-05,
	"loss": 0.4383,
	"step": 1342
	},
	{
	"epoch": 0.36985311822778716,
	"grad_norm": 0.37354332208633423,
	"learning_rate": 1e-05,
	"loss": 0.466,
	"step": 1344
	},
	{
	"epoch": 0.37040349489181656,
	"grad_norm": 0.3735334575176239,
	"learning_rate": 1e-05,
	"loss": 0.4535,
	"step": 1346
	},
	{
	"epoch": 0.370953871555846,
	"grad_norm": 0.37339311838150024,
	"learning_rate": 1e-05,
	"loss": 0.454,
	"step": 1348
	},
	{
	"epoch": 0.3715042482198755,
	"grad_norm": 0.35196128487586975,
	"learning_rate": 1e-05,
	"loss": 0.4685,
	"step": 1350
	},
	{
	"epoch": 0.37205462488390495,
	"grad_norm": 0.4031345546245575,
	"learning_rate": 1e-05,
	"loss": 0.4689,
	"step": 1352
	},
	{
	"epoch": 0.37260500154793436,
	"grad_norm": 0.363320529460907,
	"learning_rate": 1e-05,
	"loss": 0.459,
	"step": 1354
	},
	{
	"epoch": 0.3731553782119638,
	"grad_norm": 0.36146363615989685,
	"learning_rate": 1e-05,
	"loss": 0.4446,
	"step": 1356
	},
	{
	"epoch": 0.3737057548759933,
	"grad_norm": 0.36425283551216125,
	"learning_rate": 1e-05,
	"loss": 0.468,
	"step": 1358
	},
	{
	"epoch": 0.3742561315400227,
	"grad_norm": 0.3795093894004822,
	"learning_rate": 1e-05,
	"loss": 0.4513,
	"step": 1360
	},
	{
	"epoch": 0.37480650820405215,
	"grad_norm": 0.37901571393013,
	"learning_rate": 1e-05,
	"loss": 0.464,
	"step": 1362
	},
	{
	"epoch": 0.3753568848680816,
	"grad_norm": 0.3682788014411926,
	"learning_rate": 1e-05,
	"loss": 0.4535,
	"step": 1364
	},
	{
	"epoch": 0.375907261532111,
	"grad_norm": 0.38756048679351807,
	"learning_rate": 1e-05,
	"loss": 0.4421,
	"step": 1366
	},
	{
	"epoch": 0.3764576381961405,
	"grad_norm": 0.3859202563762665,
	"learning_rate": 1e-05,
	"loss": 0.4601,
	"step": 1368
	},
	{
	"epoch": 0.37700801486016994,
	"grad_norm": 0.3959304392337799,
	"learning_rate": 1e-05,
	"loss": 0.4427,
	"step": 1370
	},
	{
	"epoch": 0.3775583915241994,
	"grad_norm": 0.3768652379512787,
	"learning_rate": 1e-05,
	"loss": 0.4483,
	"step": 1372
	},
	{
	"epoch": 0.3781087681882288,
	"grad_norm": 0.37339305877685547,
	"learning_rate": 1e-05,
	"loss": 0.4605,
	"step": 1374
	},
	{
	"epoch": 0.37865914485225827,
	"grad_norm": 0.4036271572113037,
	"learning_rate": 1e-05,
	"loss": 0.4546,
	"step": 1376
	},
	{
	"epoch": 0.37920952151628773,
	"grad_norm": 0.35173818469047546,
	"learning_rate": 1e-05,
	"loss": 0.4675,
	"step": 1378
	},
	{
	"epoch": 0.37975989818031713,
	"grad_norm": 0.3682287335395813,
	"learning_rate": 1e-05,
	"loss": 0.4676,
	"step": 1380
	},
	{
	"epoch": 0.3803102748443466,
	"grad_norm": 0.37660422921180725,
	"learning_rate": 1e-05,
	"loss": 0.4483,
	"step": 1382
	},
	{
	"epoch": 0.38086065150837606,
	"grad_norm": 0.37428486347198486,
	"learning_rate": 1e-05,
	"loss": 0.4537,
	"step": 1384
	},
	{
	"epoch": 0.38141102817240546,
	"grad_norm": 0.36140507459640503,
	"learning_rate": 1e-05,
	"loss": 0.4542,
	"step": 1386
	},
	{
	"epoch": 0.3819614048364349,
	"grad_norm": 0.3818880021572113,
	"learning_rate": 1e-05,
	"loss": 0.4546,
	"step": 1388
	},
	{
	"epoch": 0.3825117815004644,
	"grad_norm": 0.3840683698654175,
	"learning_rate": 1e-05,
	"loss": 0.4419,
	"step": 1390
	},
	{
	"epoch": 0.38306215816449385,
	"grad_norm": 0.36933979392051697,
	"learning_rate": 1e-05,
	"loss": 0.4632,
	"step": 1392
	},
	{
	"epoch": 0.38361253482852326,
	"grad_norm": 0.3724002540111542,
	"learning_rate": 1e-05,
	"loss": 0.455,
	"step": 1394
	},
	{
	"epoch": 0.3841629114925527,
	"grad_norm": 0.35783514380455017,
	"learning_rate": 1e-05,
	"loss": 0.4652,
	"step": 1396
	},
	{
	"epoch": 0.3847132881565822,
	"grad_norm": 0.36758366227149963,
	"learning_rate": 1e-05,
	"loss": 0.4647,
	"step": 1398
	},
	{
	"epoch": 0.3852636648206116,
	"grad_norm": 0.3690735995769501,
	"learning_rate": 1e-05,
	"loss": 0.4572,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_merge_loss": 0.39922505617141724,
	"eval_merge_runtime": 600.7214,
	"eval_merge_samples_per_second": 56.186,
	"eval_merge_steps_per_second": 2.342,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_new_aug_datas_filtered.json_loss": 0.5239847898483276,
	"eval_new_aug_datas_filtered.json_runtime": 10.3569,
	"eval_new_aug_datas_filtered.json_samples_per_second": 74.057,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.09,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_sharegpt_gpt4.json_loss": 0.7791606187820435,
	"eval_sharegpt_gpt4.json_runtime": 31.6746,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.754,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.463,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_Table_GPT.json_loss": 0.0626993179321289,
	"eval_Table_GPT.json_runtime": 24.9542,
	"eval_Table_GPT.json_samples_per_second": 83.874,
	"eval_Table_GPT.json_steps_per_second": 3.526,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_gpt_4o_200k.json_loss": 0.8082922101020813,
	"eval_gpt_4o_200k.json_runtime": 48.466,
	"eval_gpt_4o_200k.json_samples_per_second": 129.596,
	"eval_gpt_4o_200k.json_steps_per_second": 5.406,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_multi_turn_datas.json_loss": 0.3381649851799011,
	"eval_multi_turn_datas.json_runtime": 75.5711,
	"eval_multi_turn_datas.json_samples_per_second": 52.957,
	"eval_multi_turn_datas.json_steps_per_second": 2.21,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_table_python_code_datas.json_loss": 0.2752579152584076,
	"eval_table_python_code_datas.json_runtime": 43.0439,
	"eval_table_python_code_datas.json_samples_per_second": 50.158,
	"eval_table_python_code_datas.json_steps_per_second": 2.091,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_tabular_llm_data.json_loss": 0.11023548245429993,
	"eval_tabular_llm_data.json_runtime": 8.5291,
	"eval_tabular_llm_data.json_samples_per_second": 28.843,
	"eval_tabular_llm_data.json_steps_per_second": 1.29,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_python_code_critic_21k.json_loss": 0.5756029486656189,
	"eval_python_code_critic_21k.json_runtime": 3.2275,
	"eval_python_code_critic_21k.json_samples_per_second": 184.973,
	"eval_python_code_critic_21k.json_steps_per_second": 7.746,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_all_merge_table_dataset.json_loss": 0.08007320761680603,
	"eval_all_merge_table_dataset.json_runtime": 23.3,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.558,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.288,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_code_feedback_multi_turn.json_loss": 0.5849318504333496,
	"eval_code_feedback_multi_turn.json_runtime": 32.4131,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.905,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.838,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_ultrainteract_sft.json_loss": 0.4235917031764984,
	"eval_ultrainteract_sft.json_runtime": 8.6815,
	"eval_ultrainteract_sft.json_samples_per_second": 167.713,
	"eval_ultrainteract_sft.json_steps_per_second": 7.026,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_synthetic_text_to_sql.json_loss": 0.10058007389307022,
	"eval_synthetic_text_to_sql.json_runtime": 0.1256,
	"eval_synthetic_text_to_sql.json_samples_per_second": 270.794,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.929,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_sft_react_sql_datas.json_loss": 0.63919597864151,
	"eval_sft_react_sql_datas.json_runtime": 7.8177,
	"eval_sft_react_sql_datas.json_samples_per_second": 40.165,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.791,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_all_merge_code.json_loss": 0.293491929769516,
	"eval_all_merge_code.json_runtime": 0.3331,
	"eval_all_merge_code.json_samples_per_second": 189.11,
	"eval_all_merge_code.json_steps_per_second": 9.005,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_magpie_datas.json_loss": 0.43307721614837646,
	"eval_magpie_datas.json_runtime": 2.214,
	"eval_magpie_datas.json_samples_per_second": 77.687,
	"eval_magpie_datas.json_steps_per_second": 3.613,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_train_data_for_qwen.json_loss": 0.004504092503339052,
	"eval_train_data_for_qwen.json_runtime": 0.2448,
	"eval_train_data_for_qwen.json_samples_per_second": 40.845,
	"eval_train_data_for_qwen.json_steps_per_second": 4.084,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_alpaca_cleaned.json_loss": 0.9073267579078674,
	"eval_alpaca_cleaned.json_runtime": 0.1148,
	"eval_alpaca_cleaned.json_samples_per_second": 235.221,
	"eval_alpaca_cleaned.json_steps_per_second": 17.424,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_agent_instruct.json_loss": 0.22197985649108887,
	"eval_agent_instruct.json_runtime": 0.5129,
	"eval_agent_instruct.json_samples_per_second": 93.586,
	"eval_agent_instruct.json_steps_per_second": 3.899,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_MathInstruct.json_loss": 0.2014550119638443,
	"eval_MathInstruct.json_runtime": 0.3655,
	"eval_MathInstruct.json_samples_per_second": 155.953,
	"eval_MathInstruct.json_steps_per_second": 8.208,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_tested_143k_python_alpaca.json_loss": 0.44645121693611145,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3016,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.74,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.632,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_xlam_function_calling_60k.json_loss": 0.009633864276111126,
	"eval_xlam_function_calling_60k.json_runtime": 0.0999,
	"eval_xlam_function_calling_60k.json_samples_per_second": 230.172,
	"eval_xlam_function_calling_60k.json_steps_per_second": 10.007,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.5636402368545532,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0503,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 318.002,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.875,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_alpaca_gpt4_zh.json_loss": 0.9602435231208801,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0502,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 219.067,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.915,
	"step": 1400
	},
	{
	"epoch": 0.3852636648206116,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5993592143058777,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4852,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.223,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.061,
	"step": 1400
	},
	{
	"epoch": 0.38581404148464105,
	"grad_norm": 0.36705121397972107,
	"learning_rate": 1e-05,
	"loss": 0.4617,
	"step": 1402
	},
	{
	"epoch": 0.3863644181486705,
	"grad_norm": 0.3653152883052826,
	"learning_rate": 1e-05,
	"loss": 0.4528,
	"step": 1404
	},
	{
	"epoch": 0.38691479481269997,
	"grad_norm": 0.34426313638687134,
	"learning_rate": 1e-05,
	"loss": 0.4464,
	"step": 1406
	},
	{
	"epoch": 0.3874651714767294,
	"grad_norm": 0.3493911623954773,
	"learning_rate": 1e-05,
	"loss": 0.4638,
	"step": 1408
	},
	{
	"epoch": 0.38801554814075884,
	"grad_norm": 0.3841487765312195,
	"learning_rate": 1e-05,
	"loss": 0.4471,
	"step": 1410
	},
	{
	"epoch": 0.3885659248047883,
	"grad_norm": 0.3770912289619446,
	"learning_rate": 1e-05,
	"loss": 0.4623,
	"step": 1412
	},
	{
	"epoch": 0.3891163014688177,
	"grad_norm": 0.38141822814941406,
	"learning_rate": 1e-05,
	"loss": 0.4583,
	"step": 1414
	},
	{
	"epoch": 0.38966667813284717,
	"grad_norm": 0.3774464726448059,
	"learning_rate": 1e-05,
	"loss": 0.4574,
	"step": 1416
	},
	{
	"epoch": 0.39021705479687663,
	"grad_norm": 0.35681846737861633,
	"learning_rate": 1e-05,
	"loss": 0.4443,
	"step": 1418
	},
	{
	"epoch": 0.39076743146090603,
	"grad_norm": 0.3700469732284546,
	"learning_rate": 1e-05,
	"loss": 0.4468,
	"step": 1420
	},
	{
	"epoch": 0.3913178081249355,
	"grad_norm": 0.35229384899139404,
	"learning_rate": 1e-05,
	"loss": 0.456,
	"step": 1422
	},
	{
	"epoch": 0.39186818478896496,
	"grad_norm": 0.3469116687774658,
	"learning_rate": 1e-05,
	"loss": 0.451,
	"step": 1424
	},
	{
	"epoch": 0.3924185614529944,
	"grad_norm": 0.36313918232917786,
	"learning_rate": 1e-05,
	"loss": 0.4679,
	"step": 1426
	},
	{
	"epoch": 0.3929689381170238,
	"grad_norm": 0.3543436527252197,
	"learning_rate": 1e-05,
	"loss": 0.464,
	"step": 1428
	},
	{
	"epoch": 0.3935193147810533,
	"grad_norm": 0.3992765545845032,
	"learning_rate": 1e-05,
	"loss": 0.486,
	"step": 1430
	},
	{
	"epoch": 0.39406969144508275,
	"grad_norm": 0.36149340867996216,
	"learning_rate": 1e-05,
	"loss": 0.4426,
	"step": 1432
	},
	{
	"epoch": 0.39462006810911215,
	"grad_norm": 0.37118762731552124,
	"learning_rate": 1e-05,
	"loss": 0.4531,
	"step": 1434
	},
	{
	"epoch": 0.3951704447731416,
	"grad_norm": 0.3618330955505371,
	"learning_rate": 1e-05,
	"loss": 0.4621,
	"step": 1436
	},
	{
	"epoch": 0.3957208214371711,
	"grad_norm": 0.37272128462791443,
	"learning_rate": 1e-05,
	"loss": 0.4616,
	"step": 1438
	},
	{
	"epoch": 0.3962711981012005,
	"grad_norm": 0.3678719997406006,
	"learning_rate": 1e-05,
	"loss": 0.4477,
	"step": 1440
	},
	{
	"epoch": 0.39682157476522995,
	"grad_norm": 0.342907190322876,
	"learning_rate": 1e-05,
	"loss": 0.4484,
	"step": 1442
	},
	{
	"epoch": 0.3973719514292594,
	"grad_norm": 0.3722037374973297,
	"learning_rate": 1e-05,
	"loss": 0.4576,
	"step": 1444
	},
	{
	"epoch": 0.39792232809328887,
	"grad_norm": 0.3829335868358612,
	"learning_rate": 1e-05,
	"loss": 0.4568,
	"step": 1446
	},
	{
	"epoch": 0.3984727047573183,
	"grad_norm": 0.36857596039772034,
	"learning_rate": 1e-05,
	"loss": 0.4509,
	"step": 1448
	},
	{
	"epoch": 0.39902308142134774,
	"grad_norm": 0.36784934997558594,
	"learning_rate": 1e-05,
	"loss": 0.46,
	"step": 1450
	},
	{
	"epoch": 0.3995734580853772,
	"grad_norm": 0.36996331810951233,
	"learning_rate": 1e-05,
	"loss": 0.4435,
	"step": 1452
	},
	{
	"epoch": 0.4001238347494066,
	"grad_norm": 0.3608056604862213,
	"learning_rate": 1e-05,
	"loss": 0.4467,
	"step": 1454
	},
	{
	"epoch": 0.40067421141343607,
	"grad_norm": 0.3827229142189026,
	"learning_rate": 1e-05,
	"loss": 0.4576,
	"step": 1456
	},
	{
	"epoch": 0.4012245880774655,
	"grad_norm": 0.38073116540908813,
	"learning_rate": 1e-05,
	"loss": 0.4433,
	"step": 1458
	},
	{
	"epoch": 0.40177496474149493,
	"grad_norm": 0.3861468434333801,
	"learning_rate": 1e-05,
	"loss": 0.4466,
	"step": 1460
	},
	{
	"epoch": 0.4023253414055244,
	"grad_norm": 0.36093631386756897,
	"learning_rate": 1e-05,
	"loss": 0.4409,
	"step": 1462
	},
	{
	"epoch": 0.40287571806955386,
	"grad_norm": 0.34549927711486816,
	"learning_rate": 1e-05,
	"loss": 0.4507,
	"step": 1464
	},
	{
	"epoch": 0.4034260947335833,
	"grad_norm": 0.3782083988189697,
	"learning_rate": 1e-05,
	"loss": 0.4648,
	"step": 1466
	},
	{
	"epoch": 0.4039764713976127,
	"grad_norm": 0.366914302110672,
	"learning_rate": 1e-05,
	"loss": 0.462,
	"step": 1468
	},
	{
	"epoch": 0.4045268480616422,
	"grad_norm": 0.3604414761066437,
	"learning_rate": 1e-05,
	"loss": 0.4639,
	"step": 1470
	},
	{
	"epoch": 0.40507722472567165,
	"grad_norm": 0.3806079924106598,
	"learning_rate": 1e-05,
	"loss": 0.452,
	"step": 1472
	},
	{
	"epoch": 0.40562760138970105,
	"grad_norm": 0.36079150438308716,
	"learning_rate": 1e-05,
	"loss": 0.4534,
	"step": 1474
	},
	{
	"epoch": 0.4061779780537305,
	"grad_norm": 0.3526926040649414,
	"learning_rate": 1e-05,
	"loss": 0.4483,
	"step": 1476
	},
	{
	"epoch": 0.40672835471776,
	"grad_norm": 0.36440181732177734,
	"learning_rate": 1e-05,
	"loss": 0.4445,
	"step": 1478
	},
	{
	"epoch": 0.40727873138178944,
	"grad_norm": 0.3452344238758087,
	"learning_rate": 1e-05,
	"loss": 0.4531,
	"step": 1480
	},
	{
	"epoch": 0.40782910804581884,
	"grad_norm": 0.3774935007095337,
	"learning_rate": 1e-05,
	"loss": 0.4644,
	"step": 1482
	},
	{
	"epoch": 0.4083794847098483,
	"grad_norm": 0.3485760986804962,
	"learning_rate": 1e-05,
	"loss": 0.4489,
	"step": 1484
	},
	{
	"epoch": 0.40892986137387777,
	"grad_norm": 0.3787960708141327,
	"learning_rate": 1e-05,
	"loss": 0.4682,
	"step": 1486
	},
	{
	"epoch": 0.4094802380379072,
	"grad_norm": 0.38031846284866333,
	"learning_rate": 1e-05,
	"loss": 0.462,
	"step": 1488
	},
	{
	"epoch": 0.41003061470193664,
	"grad_norm": 0.3756881654262543,
	"learning_rate": 1e-05,
	"loss": 0.4514,
	"step": 1490
	},
	{
	"epoch": 0.4105809913659661,
	"grad_norm": 0.3663581311702728,
	"learning_rate": 1e-05,
	"loss": 0.4482,
	"step": 1492
	},
	{
	"epoch": 0.4111313680299955,
	"grad_norm": 0.35938966274261475,
	"learning_rate": 1e-05,
	"loss": 0.4471,
	"step": 1494
	},
	{
	"epoch": 0.41168174469402496,
	"grad_norm": 0.3561854064464569,
	"learning_rate": 1e-05,
	"loss": 0.4514,
	"step": 1496
	},
	{
	"epoch": 0.4122321213580544,
	"grad_norm": 0.36052775382995605,
	"learning_rate": 1e-05,
	"loss": 0.4564,
	"step": 1498
	},
	{
	"epoch": 0.4127824980220839,
	"grad_norm": 0.3753555119037628,
	"learning_rate": 1e-05,
	"loss": 0.4543,
	"step": 1500
	},
	{
	"epoch": 0.4133328746861133,
	"grad_norm": 0.3747691810131073,
	"learning_rate": 1e-05,
	"loss": 0.4588,
	"step": 1502
	},
	{
	"epoch": 0.41388325135014276,
	"grad_norm": 0.3654341399669647,
	"learning_rate": 1e-05,
	"loss": 0.451,
	"step": 1504
	},
	{
	"epoch": 0.4144336280141722,
	"grad_norm": 0.3624642491340637,
	"learning_rate": 1e-05,
	"loss": 0.4528,
	"step": 1506
	},
	{
	"epoch": 0.4149840046782016,
	"grad_norm": 0.3465966284275055,
	"learning_rate": 1e-05,
	"loss": 0.45,
	"step": 1508
	},
	{
	"epoch": 0.4155343813422311,
	"grad_norm": 0.38202422857284546,
	"learning_rate": 1e-05,
	"loss": 0.4459,
	"step": 1510
	},
	{
	"epoch": 0.41608475800626055,
	"grad_norm": 0.3562781512737274,
	"learning_rate": 1e-05,
	"loss": 0.4375,
	"step": 1512
	},
	{
	"epoch": 0.41663513467028995,
	"grad_norm": 0.36660805344581604,
	"learning_rate": 1e-05,
	"loss": 0.4511,
	"step": 1514
	},
	{
	"epoch": 0.4171855113343194,
	"grad_norm": 0.36541464924812317,
	"learning_rate": 1e-05,
	"loss": 0.4618,
	"step": 1516
	},
	{
	"epoch": 0.4177358879983489,
	"grad_norm": 0.3570851981639862,
	"learning_rate": 1e-05,
	"loss": 0.4568,
	"step": 1518
	},
	{
	"epoch": 0.41828626466237834,
	"grad_norm": 0.3508870005607605,
	"learning_rate": 1e-05,
	"loss": 0.4492,
	"step": 1520
	},
	{
	"epoch": 0.41883664132640774,
	"grad_norm": 0.35050973296165466,
	"learning_rate": 1e-05,
	"loss": 0.4481,
	"step": 1522
	},
	{
	"epoch": 0.4193870179904372,
	"grad_norm": 0.3564668297767639,
	"learning_rate": 1e-05,
	"loss": 0.4461,
	"step": 1524
	},
	{
	"epoch": 0.41993739465446667,
	"grad_norm": 0.3646043539047241,
	"learning_rate": 1e-05,
	"loss": 0.4554,
	"step": 1526
	},
	{
	"epoch": 0.4204877713184961,
	"grad_norm": 0.3904356360435486,
	"learning_rate": 1e-05,
	"loss": 0.4731,
	"step": 1528
	},
	{
	"epoch": 0.42103814798252553,
	"grad_norm": 0.37373483180999756,
	"learning_rate": 1e-05,
	"loss": 0.4679,
	"step": 1530
	},
	{
	"epoch": 0.421588524646555,
	"grad_norm": 0.3704439699649811,
	"learning_rate": 1e-05,
	"loss": 0.4706,
	"step": 1532
	},
	{
	"epoch": 0.42213890131058446,
	"grad_norm": 0.37894484400749207,
	"learning_rate": 1e-05,
	"loss": 0.4515,
	"step": 1534
	},
	{
	"epoch": 0.42268927797461386,
	"grad_norm": 0.3871210217475891,
	"learning_rate": 1e-05,
	"loss": 0.4477,
	"step": 1536
	},
	{
	"epoch": 0.4232396546386433,
	"grad_norm": 0.3755747079849243,
	"learning_rate": 1e-05,
	"loss": 0.4633,
	"step": 1538
	},
	{
	"epoch": 0.4237900313026728,
	"grad_norm": 0.359764039516449,
	"learning_rate": 1e-05,
	"loss": 0.4798,
	"step": 1540
	},
	{
	"epoch": 0.4243404079667022,
	"grad_norm": 0.37172380089759827,
	"learning_rate": 1e-05,
	"loss": 0.4383,
	"step": 1542
	},
	{
	"epoch": 0.42489078463073165,
	"grad_norm": 0.3501332700252533,
	"learning_rate": 1e-05,
	"loss": 0.442,
	"step": 1544
	},
	{
	"epoch": 0.4254411612947611,
	"grad_norm": 0.3552211821079254,
	"learning_rate": 1e-05,
	"loss": 0.4539,
	"step": 1546
	},
	{
	"epoch": 0.4259915379587905,
	"grad_norm": 0.35052230954170227,
	"learning_rate": 1e-05,
	"loss": 0.428,
	"step": 1548
	},
	{
	"epoch": 0.42654191462282,
	"grad_norm": 0.3710823357105255,
	"learning_rate": 1e-05,
	"loss": 0.4297,
	"step": 1550
	},
	{
	"epoch": 0.42709229128684945,
	"grad_norm": 0.37135034799575806,
	"learning_rate": 1e-05,
	"loss": 0.4587,
	"step": 1552
	},
	{
	"epoch": 0.4276426679508789,
	"grad_norm": 0.3729698061943054,
	"learning_rate": 1e-05,
	"loss": 0.4585,
	"step": 1554
	},
	{
	"epoch": 0.4281930446149083,
	"grad_norm": 0.3525015711784363,
	"learning_rate": 1e-05,
	"loss": 0.459,
	"step": 1556
	},
	{
	"epoch": 0.4287434212789378,
	"grad_norm": 0.38500455021858215,
	"learning_rate": 1e-05,
	"loss": 0.4469,
	"step": 1558
	},
	{
	"epoch": 0.42929379794296724,
	"grad_norm": 0.3852159380912781,
	"learning_rate": 1e-05,
	"loss": 0.4421,
	"step": 1560
	},
	{
	"epoch": 0.42984417460699664,
	"grad_norm": 0.3567640781402588,
	"learning_rate": 1e-05,
	"loss": 0.4538,
	"step": 1562
	},
	{
	"epoch": 0.4303945512710261,
	"grad_norm": 0.36795344948768616,
	"learning_rate": 1e-05,
	"loss": 0.4432,
	"step": 1564
	},
	{
	"epoch": 0.43094492793505557,
	"grad_norm": 0.37614256143569946,
	"learning_rate": 1e-05,
	"loss": 0.4631,
	"step": 1566
	},
	{
	"epoch": 0.431495304599085,
	"grad_norm": 0.356991171836853,
	"learning_rate": 1e-05,
	"loss": 0.4389,
	"step": 1568
	},
	{
	"epoch": 0.43204568126311443,
	"grad_norm": 0.3793700933456421,
	"learning_rate": 1e-05,
	"loss": 0.4609,
	"step": 1570
	},
	{
	"epoch": 0.4325960579271439,
	"grad_norm": 0.36675581336021423,
	"learning_rate": 1e-05,
	"loss": 0.4484,
	"step": 1572
	},
	{
	"epoch": 0.43314643459117336,
	"grad_norm": 0.36404114961624146,
	"learning_rate": 1e-05,
	"loss": 0.45,
	"step": 1574
	},
	{
	"epoch": 0.43369681125520276,
	"grad_norm": 0.3868160843849182,
	"learning_rate": 1e-05,
	"loss": 0.4652,
	"step": 1576
	},
	{
	"epoch": 0.4342471879192322,
	"grad_norm": 0.3898649215698242,
	"learning_rate": 1e-05,
	"loss": 0.4612,
	"step": 1578
	},
	{
	"epoch": 0.4347975645832617,
	"grad_norm": 0.36762335896492004,
	"learning_rate": 1e-05,
	"loss": 0.4543,
	"step": 1580
	},
	{
	"epoch": 0.4353479412472911,
	"grad_norm": 0.3434213101863861,
	"learning_rate": 1e-05,
	"loss": 0.4423,
	"step": 1582
	},
	{
	"epoch": 0.43589831791132055,
	"grad_norm": 0.3741122782230377,
	"learning_rate": 1e-05,
	"loss": 0.4638,
	"step": 1584
	},
	{
	"epoch": 0.43644869457535,
	"grad_norm": 0.38991764187812805,
	"learning_rate": 1e-05,
	"loss": 0.438,
	"step": 1586
	},
	{
	"epoch": 0.4369990712393795,
	"grad_norm": 0.35284510254859924,
	"learning_rate": 1e-05,
	"loss": 0.4559,
	"step": 1588
	},
	{
	"epoch": 0.4375494479034089,
	"grad_norm": 0.36775341629981995,
	"learning_rate": 1e-05,
	"loss": 0.4594,
	"step": 1590
	},
	{
	"epoch": 0.43809982456743835,
	"grad_norm": 0.3677217364311218,
	"learning_rate": 1e-05,
	"loss": 0.451,
	"step": 1592
	},
	{
	"epoch": 0.4386502012314678,
	"grad_norm": 0.35295674204826355,
	"learning_rate": 1e-05,
	"loss": 0.4506,
	"step": 1594
	},
	{
	"epoch": 0.4392005778954972,
	"grad_norm": 0.3770224452018738,
	"learning_rate": 1e-05,
	"loss": 0.4506,
	"step": 1596
	},
	{
	"epoch": 0.4397509545595267,
	"grad_norm": 0.3824670612812042,
	"learning_rate": 1e-05,
	"loss": 0.4633,
	"step": 1598
	},
	{
	"epoch": 0.44030133122355614,
	"grad_norm": 0.38165828585624695,
	"learning_rate": 1e-05,
	"loss": 0.4458,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_merge_loss": 0.39449170231819153,
	"eval_merge_runtime": 599.3899,
	"eval_merge_samples_per_second": 56.311,
	"eval_merge_steps_per_second": 2.347,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_new_aug_datas_filtered.json_loss": 0.5198476314544678,
	"eval_new_aug_datas_filtered.json_runtime": 10.3548,
	"eval_new_aug_datas_filtered.json_samples_per_second": 74.072,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.09,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_sharegpt_gpt4.json_loss": 0.7743993997573853,
	"eval_sharegpt_gpt4.json_runtime": 31.7173,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.675,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.459,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_Table_GPT.json_loss": 0.05817935988306999,
	"eval_Table_GPT.json_runtime": 25.0301,
	"eval_Table_GPT.json_samples_per_second": 83.619,
	"eval_Table_GPT.json_steps_per_second": 3.516,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_gpt_4o_200k.json_loss": 0.8023759126663208,
	"eval_gpt_4o_200k.json_runtime": 48.5498,
	"eval_gpt_4o_200k.json_samples_per_second": 129.372,
	"eval_gpt_4o_200k.json_steps_per_second": 5.397,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_multi_turn_datas.json_loss": 0.3328835964202881,
	"eval_multi_turn_datas.json_runtime": 75.669,
	"eval_multi_turn_datas.json_samples_per_second": 52.888,
	"eval_multi_turn_datas.json_steps_per_second": 2.207,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_table_python_code_datas.json_loss": 0.2713072597980499,
	"eval_table_python_code_datas.json_runtime": 43.1148,
	"eval_table_python_code_datas.json_samples_per_second": 50.076,
	"eval_table_python_code_datas.json_steps_per_second": 2.087,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_tabular_llm_data.json_loss": 0.10233539342880249,
	"eval_tabular_llm_data.json_runtime": 8.5788,
	"eval_tabular_llm_data.json_samples_per_second": 28.675,
	"eval_tabular_llm_data.json_steps_per_second": 1.282,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_python_code_critic_21k.json_loss": 0.5702229142189026,
	"eval_python_code_critic_21k.json_runtime": 3.2319,
	"eval_python_code_critic_21k.json_samples_per_second": 184.719,
	"eval_python_code_critic_21k.json_steps_per_second": 7.735,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_all_merge_table_dataset.json_loss": 0.07606548815965652,
	"eval_all_merge_table_dataset.json_runtime": 23.3911,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.439,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.283,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_code_feedback_multi_turn.json_loss": 0.5824379324913025,
	"eval_code_feedback_multi_turn.json_runtime": 32.5207,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.68,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.829,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_ultrainteract_sft.json_loss": 0.42119815945625305,
	"eval_ultrainteract_sft.json_runtime": 8.677,
	"eval_ultrainteract_sft.json_samples_per_second": 167.801,
	"eval_ultrainteract_sft.json_steps_per_second": 7.03,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_synthetic_text_to_sql.json_loss": 0.09474331140518188,
	"eval_synthetic_text_to_sql.json_runtime": 0.1262,
	"eval_synthetic_text_to_sql.json_samples_per_second": 269.361,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.845,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_sft_react_sql_datas.json_loss": 0.6350359320640564,
	"eval_sft_react_sql_datas.json_runtime": 7.869,
	"eval_sft_react_sql_datas.json_samples_per_second": 39.903,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.779,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_all_merge_code.json_loss": 0.2929154634475708,
	"eval_all_merge_code.json_runtime": 0.3373,
	"eval_all_merge_code.json_samples_per_second": 186.752,
	"eval_all_merge_code.json_steps_per_second": 8.893,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_magpie_datas.json_loss": 0.4318141043186188,
	"eval_magpie_datas.json_runtime": 2.2195,
	"eval_magpie_datas.json_samples_per_second": 77.496,
	"eval_magpie_datas.json_steps_per_second": 3.604,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_train_data_for_qwen.json_loss": 0.00419951044023037,
	"eval_train_data_for_qwen.json_runtime": 0.2455,
	"eval_train_data_for_qwen.json_samples_per_second": 40.733,
	"eval_train_data_for_qwen.json_steps_per_second": 4.073,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_alpaca_cleaned.json_loss": 0.910367488861084,
	"eval_alpaca_cleaned.json_runtime": 0.1147,
	"eval_alpaca_cleaned.json_samples_per_second": 235.312,
	"eval_alpaca_cleaned.json_steps_per_second": 17.431,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_agent_instruct.json_loss": 0.21950356662273407,
	"eval_agent_instruct.json_runtime": 0.5156,
	"eval_agent_instruct.json_samples_per_second": 93.094,
	"eval_agent_instruct.json_steps_per_second": 3.879,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_MathInstruct.json_loss": 0.19855839014053345,
	"eval_MathInstruct.json_runtime": 0.3654,
	"eval_MathInstruct.json_samples_per_second": 155.99,
	"eval_MathInstruct.json_steps_per_second": 8.21,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_tested_143k_python_alpaca.json_loss": 0.4433169662952423,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3031,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.164,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.598,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_xlam_function_calling_60k.json_loss": 0.008965943939983845,
	"eval_xlam_function_calling_60k.json_runtime": 0.1008,
	"eval_xlam_function_calling_60k.json_samples_per_second": 228.26,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.924,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.560943603515625,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0505,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 316.662,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.791,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_alpaca_gpt4_zh.json_loss": 0.9813264012336731,
	"eval_alpaca_gpt4_zh.json_runtime": 0.05,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 219.867,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.988,
	"step": 1600
	},
	{
	"epoch": 0.44030133122355614,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5885769128799438,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4829,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.42,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.071,
	"step": 1600
	},
	{
	"epoch": 0.44085170788758554,
	"grad_norm": 0.36969345808029175,
	"learning_rate": 1e-05,
	"loss": 0.4474,
	"step": 1602
	},
	{
	"epoch": 0.441402084551615,
	"grad_norm": 0.3673281967639923,
	"learning_rate": 1e-05,
	"loss": 0.4566,
	"step": 1604
	},
	{
	"epoch": 0.44195246121564447,
	"grad_norm": 0.3695686459541321,
	"learning_rate": 1e-05,
	"loss": 0.4602,
	"step": 1606
	},
	{
	"epoch": 0.4425028378796739,
	"grad_norm": 0.3653704822063446,
	"learning_rate": 1e-05,
	"loss": 0.4489,
	"step": 1608
	},
	{
	"epoch": 0.44305321454370333,
	"grad_norm": 0.37890321016311646,
	"learning_rate": 1e-05,
	"loss": 0.4588,
	"step": 1610
	},
	{
	"epoch": 0.4436035912077328,
	"grad_norm": 0.34637650847435,
	"learning_rate": 1e-05,
	"loss": 0.4554,
	"step": 1612
	},
	{
	"epoch": 0.44415396787176226,
	"grad_norm": 0.3733616769313812,
	"learning_rate": 1e-05,
	"loss": 0.4477,
	"step": 1614
	},
	{
	"epoch": 0.44470434453579166,
	"grad_norm": 0.3740238547325134,
	"learning_rate": 1e-05,
	"loss": 0.4528,
	"step": 1616
	},
	{
	"epoch": 0.4452547211998211,
	"grad_norm": 0.35610541701316833,
	"learning_rate": 1e-05,
	"loss": 0.4487,
	"step": 1618
	},
	{
	"epoch": 0.4458050978638506,
	"grad_norm": 0.362763911485672,
	"learning_rate": 1e-05,
	"loss": 0.4619,
	"step": 1620
	},
	{
	"epoch": 0.44635547452788,
	"grad_norm": 0.3781318962574005,
	"learning_rate": 1e-05,
	"loss": 0.4481,
	"step": 1622
	},
	{
	"epoch": 0.44690585119190945,
	"grad_norm": 0.40836694836616516,
	"learning_rate": 1e-05,
	"loss": 0.4597,
	"step": 1624
	},
	{
	"epoch": 0.4474562278559389,
	"grad_norm": 0.3662070035934448,
	"learning_rate": 1e-05,
	"loss": 0.4466,
	"step": 1626
	},
	{
	"epoch": 0.4480066045199684,
	"grad_norm": 0.37797635793685913,
	"learning_rate": 1e-05,
	"loss": 0.4589,
	"step": 1628
	},
	{
	"epoch": 0.4485569811839978,
	"grad_norm": 0.3544275462627411,
	"learning_rate": 1e-05,
	"loss": 0.4549,
	"step": 1630
	},
	{
	"epoch": 0.44910735784802724,
	"grad_norm": 0.36321336030960083,
	"learning_rate": 1e-05,
	"loss": 0.443,
	"step": 1632
	},
	{
	"epoch": 0.4496577345120567,
	"grad_norm": 0.45478886365890503,
	"learning_rate": 1e-05,
	"loss": 0.4343,
	"step": 1634
	},
	{
	"epoch": 0.4502081111760861,
	"grad_norm": 0.3670060336589813,
	"learning_rate": 1e-05,
	"loss": 0.4463,
	"step": 1636
	},
	{
	"epoch": 0.4507584878401156,
	"grad_norm": 0.381145715713501,
	"learning_rate": 1e-05,
	"loss": 0.4512,
	"step": 1638
	},
	{
	"epoch": 0.45130886450414504,
	"grad_norm": 0.3729204833507538,
	"learning_rate": 1e-05,
	"loss": 0.451,
	"step": 1640
	},
	{
	"epoch": 0.4518592411681745,
	"grad_norm": 0.36986637115478516,
	"learning_rate": 1e-05,
	"loss": 0.4622,
	"step": 1642
	},
	{
	"epoch": 0.4524096178322039,
	"grad_norm": 0.37230783700942993,
	"learning_rate": 1e-05,
	"loss": 0.4377,
	"step": 1644
	},
	{
	"epoch": 0.45295999449623336,
	"grad_norm": 0.3671816885471344,
	"learning_rate": 1e-05,
	"loss": 0.4433,
	"step": 1646
	},
	{
	"epoch": 0.4535103711602628,
	"grad_norm": 0.359372615814209,
	"learning_rate": 1e-05,
	"loss": 0.4512,
	"step": 1648
	},
	{
	"epoch": 0.45406074782429223,
	"grad_norm": 0.3682217001914978,
	"learning_rate": 1e-05,
	"loss": 0.4478,
	"step": 1650
	},
	{
	"epoch": 0.4546111244883217,
	"grad_norm": 0.3779531419277191,
	"learning_rate": 1e-05,
	"loss": 0.4446,
	"step": 1652
	},
	{
	"epoch": 0.45516150115235116,
	"grad_norm": 0.3579237759113312,
	"learning_rate": 1e-05,
	"loss": 0.4432,
	"step": 1654
	},
	{
	"epoch": 0.45571187781638056,
	"grad_norm": 0.35086673498153687,
	"learning_rate": 1e-05,
	"loss": 0.4511,
	"step": 1656
	},
	{
	"epoch": 0.45626225448041,
	"grad_norm": 0.36263635754585266,
	"learning_rate": 1e-05,
	"loss": 0.4552,
	"step": 1658
	},
	{
	"epoch": 0.4568126311444395,
	"grad_norm": 0.3715769648551941,
	"learning_rate": 1e-05,
	"loss": 0.4549,
	"step": 1660
	},
	{
	"epoch": 0.45736300780846895,
	"grad_norm": 0.36989322304725647,
	"learning_rate": 1e-05,
	"loss": 0.4468,
	"step": 1662
	},
	{
	"epoch": 0.45791338447249835,
	"grad_norm": 0.35716795921325684,
	"learning_rate": 1e-05,
	"loss": 0.4506,
	"step": 1664
	},
	{
	"epoch": 0.4584637611365278,
	"grad_norm": 0.36870133876800537,
	"learning_rate": 1e-05,
	"loss": 0.4581,
	"step": 1666
	},
	{
	"epoch": 0.4590141378005573,
	"grad_norm": 0.36808547377586365,
	"learning_rate": 1e-05,
	"loss": 0.4518,
	"step": 1668
	},
	{
	"epoch": 0.4595645144645867,
	"grad_norm": 0.3777028024196625,
	"learning_rate": 1e-05,
	"loss": 0.4526,
	"step": 1670
	},
	{
	"epoch": 0.46011489112861614,
	"grad_norm": 0.3849789798259735,
	"learning_rate": 1e-05,
	"loss": 0.452,
	"step": 1672
	},
	{
	"epoch": 0.4606652677926456,
	"grad_norm": 0.38168811798095703,
	"learning_rate": 1e-05,
	"loss": 0.4408,
	"step": 1674
	},
	{
	"epoch": 0.461215644456675,
	"grad_norm": 0.3601077198982239,
	"learning_rate": 1e-05,
	"loss": 0.4415,
	"step": 1676
	},
	{
	"epoch": 0.4617660211207045,
	"grad_norm": 0.3658849596977234,
	"learning_rate": 1e-05,
	"loss": 0.4461,
	"step": 1678
	},
	{
	"epoch": 0.46231639778473393,
	"grad_norm": 0.3822179138660431,
	"learning_rate": 1e-05,
	"loss": 0.4585,
	"step": 1680
	},
	{
	"epoch": 0.4628667744487634,
	"grad_norm": 0.38321495056152344,
	"learning_rate": 1e-05,
	"loss": 0.4469,
	"step": 1682
	},
	{
	"epoch": 0.4634171511127928,
	"grad_norm": 0.3911297917366028,
	"learning_rate": 1e-05,
	"loss": 0.4522,
	"step": 1684
	},
	{
	"epoch": 0.46396752777682226,
	"grad_norm": 0.38053110241889954,
	"learning_rate": 1e-05,
	"loss": 0.4487,
	"step": 1686
	},
	{
	"epoch": 0.4645179044408517,
	"grad_norm": 0.3704802691936493,
	"learning_rate": 1e-05,
	"loss": 0.4436,
	"step": 1688
	},
	{
	"epoch": 0.46506828110488113,
	"grad_norm": 0.3804566562175751,
	"learning_rate": 1e-05,
	"loss": 0.4419,
	"step": 1690
	},
	{
	"epoch": 0.4656186577689106,
	"grad_norm": 0.3807014524936676,
	"learning_rate": 1e-05,
	"loss": 0.4526,
	"step": 1692
	},
	{
	"epoch": 0.46616903443294005,
	"grad_norm": 0.3678591549396515,
	"learning_rate": 1e-05,
	"loss": 0.4579,
	"step": 1694
	},
	{
	"epoch": 0.46671941109696946,
	"grad_norm": 0.37586984038352966,
	"learning_rate": 1e-05,
	"loss": 0.4404,
	"step": 1696
	},
	{
	"epoch": 0.4672697877609989,
	"grad_norm": 0.36084264516830444,
	"learning_rate": 1e-05,
	"loss": 0.4398,
	"step": 1698
	},
	{
	"epoch": 0.4678201644250284,
	"grad_norm": 0.36694666743278503,
	"learning_rate": 1e-05,
	"loss": 0.4369,
	"step": 1700
	},
	{
	"epoch": 0.46837054108905785,
	"grad_norm": 0.4061066210269928,
	"learning_rate": 1e-05,
	"loss": 0.4495,
	"step": 1702
	},
	{
	"epoch": 0.46892091775308725,
	"grad_norm": 0.37329551577568054,
	"learning_rate": 1e-05,
	"loss": 0.4482,
	"step": 1704
	},
	{
	"epoch": 0.4694712944171167,
	"grad_norm": 0.39072346687316895,
	"learning_rate": 1e-05,
	"loss": 0.4506,
	"step": 1706
	},
	{
	"epoch": 0.4700216710811462,
	"grad_norm": 0.3565053343772888,
	"learning_rate": 1e-05,
	"loss": 0.447,
	"step": 1708
	},
	{
	"epoch": 0.4705720477451756,
	"grad_norm": 0.39754360914230347,
	"learning_rate": 1e-05,
	"loss": 0.4468,
	"step": 1710
	},
	{
	"epoch": 0.47112242440920504,
	"grad_norm": 0.34416159987449646,
	"learning_rate": 1e-05,
	"loss": 0.4509,
	"step": 1712
	},
	{
	"epoch": 0.4716728010732345,
	"grad_norm": 0.3646188974380493,
	"learning_rate": 1e-05,
	"loss": 0.4436,
	"step": 1714
	},
	{
	"epoch": 0.47222317773726397,
	"grad_norm": 0.372549831867218,
	"learning_rate": 1e-05,
	"loss": 0.4622,
	"step": 1716
	},
	{
	"epoch": 0.47277355440129337,
	"grad_norm": 0.34616753458976746,
	"learning_rate": 1e-05,
	"loss": 0.4513,
	"step": 1718
	},
	{
	"epoch": 0.47332393106532283,
	"grad_norm": 0.39396756887435913,
	"learning_rate": 1e-05,
	"loss": 0.4464,
	"step": 1720
	},
	{
	"epoch": 0.4738743077293523,
	"grad_norm": 0.3681057095527649,
	"learning_rate": 1e-05,
	"loss": 0.4514,
	"step": 1722
	},
	{
	"epoch": 0.4744246843933817,
	"grad_norm": 0.38942328095436096,
	"learning_rate": 1e-05,
	"loss": 0.4603,
	"step": 1724
	},
	{
	"epoch": 0.47497506105741116,
	"grad_norm": 0.380278617143631,
	"learning_rate": 1e-05,
	"loss": 0.4463,
	"step": 1726
	},
	{
	"epoch": 0.4755254377214406,
	"grad_norm": 0.37930282950401306,
	"learning_rate": 1e-05,
	"loss": 0.4377,
	"step": 1728
	},
	{
	"epoch": 0.47607581438547003,
	"grad_norm": 0.36719146370887756,
	"learning_rate": 1e-05,
	"loss": 0.4285,
	"step": 1730
	},
	{
	"epoch": 0.4766261910494995,
	"grad_norm": 0.3802686035633087,
	"learning_rate": 1e-05,
	"loss": 0.4346,
	"step": 1732
	},
	{
	"epoch": 0.47717656771352895,
	"grad_norm": 0.3655955493450165,
	"learning_rate": 1e-05,
	"loss": 0.4504,
	"step": 1734
	},
	{
	"epoch": 0.4777269443775584,
	"grad_norm": 0.34403982758522034,
	"learning_rate": 1e-05,
	"loss": 0.4502,
	"step": 1736
	},
	{
	"epoch": 0.4782773210415878,
	"grad_norm": 0.35954922437667847,
	"learning_rate": 1e-05,
	"loss": 0.4313,
	"step": 1738
	},
	{
	"epoch": 0.4788276977056173,
	"grad_norm": 0.3489810824394226,
	"learning_rate": 1e-05,
	"loss": 0.4479,
	"step": 1740
	},
	{
	"epoch": 0.47937807436964675,
	"grad_norm": 0.3789598047733307,
	"learning_rate": 1e-05,
	"loss": 0.4488,
	"step": 1742
	},
	{
	"epoch": 0.47992845103367615,
	"grad_norm": 0.38226747512817383,
	"learning_rate": 1e-05,
	"loss": 0.4612,
	"step": 1744
	},
	{
	"epoch": 0.4804788276977056,
	"grad_norm": 0.36648547649383545,
	"learning_rate": 1e-05,
	"loss": 0.4521,
	"step": 1746
	},
	{
	"epoch": 0.4810292043617351,
	"grad_norm": 0.36434775590896606,
	"learning_rate": 1e-05,
	"loss": 0.4579,
	"step": 1748
	},
	{
	"epoch": 0.4815795810257645,
	"grad_norm": 0.3805695176124573,
	"learning_rate": 1e-05,
	"loss": 0.437,
	"step": 1750
	},
	{
	"epoch": 0.48212995768979394,
	"grad_norm": 0.34234747290611267,
	"learning_rate": 1e-05,
	"loss": 0.4411,
	"step": 1752
	},
	{
	"epoch": 0.4826803343538234,
	"grad_norm": 0.356953501701355,
	"learning_rate": 1e-05,
	"loss": 0.4563,
	"step": 1754
	},
	{
	"epoch": 0.48323071101785287,
	"grad_norm": 0.35372647643089294,
	"learning_rate": 1e-05,
	"loss": 0.4506,
	"step": 1756
	},
	{
	"epoch": 0.48378108768188227,
	"grad_norm": 0.3776678442955017,
	"learning_rate": 1e-05,
	"loss": 0.4517,
	"step": 1758
	},
	{
	"epoch": 0.48433146434591173,
	"grad_norm": 0.336029052734375,
	"learning_rate": 1e-05,
	"loss": 0.4387,
	"step": 1760
	},
	{
	"epoch": 0.4848818410099412,
	"grad_norm": 0.35482755303382874,
	"learning_rate": 1e-05,
	"loss": 0.4456,
	"step": 1762
	},
	{
	"epoch": 0.4854322176739706,
	"grad_norm": 0.3713533580303192,
	"learning_rate": 1e-05,
	"loss": 0.4616,
	"step": 1764
	},
	{
	"epoch": 0.48598259433800006,
	"grad_norm": 0.348069965839386,
	"learning_rate": 1e-05,
	"loss": 0.4504,
	"step": 1766
	},
	{
	"epoch": 0.4865329710020295,
	"grad_norm": 0.36832061409950256,
	"learning_rate": 1e-05,
	"loss": 0.45,
	"step": 1768
	},
	{
	"epoch": 0.487083347666059,
	"grad_norm": 0.3665439486503601,
	"learning_rate": 1e-05,
	"loss": 0.4525,
	"step": 1770
	},
	{
	"epoch": 0.4876337243300884,
	"grad_norm": 0.39572247862815857,
	"learning_rate": 1e-05,
	"loss": 0.4521,
	"step": 1772
	},
	{
	"epoch": 0.48818410099411785,
	"grad_norm": 0.36583212018013,
	"learning_rate": 1e-05,
	"loss": 0.4298,
	"step": 1774
	},
	{
	"epoch": 0.4887344776581473,
	"grad_norm": 0.35969898104667664,
	"learning_rate": 1e-05,
	"loss": 0.4497,
	"step": 1776
	},
	{
	"epoch": 0.4892848543221767,
	"grad_norm": 0.3651510775089264,
	"learning_rate": 1e-05,
	"loss": 0.4355,
	"step": 1778
	},
	{
	"epoch": 0.4898352309862062,
	"grad_norm": 0.3885847330093384,
	"learning_rate": 1e-05,
	"loss": 0.4633,
	"step": 1780
	},
	{
	"epoch": 0.49038560765023564,
	"grad_norm": 0.357166588306427,
	"learning_rate": 1e-05,
	"loss": 0.4512,
	"step": 1782
	},
	{
	"epoch": 0.49093598431426505,
	"grad_norm": 0.34748879075050354,
	"learning_rate": 1e-05,
	"loss": 0.437,
	"step": 1784
	},
	{
	"epoch": 0.4914863609782945,
	"grad_norm": 0.371999055147171,
	"learning_rate": 1e-05,
	"loss": 0.4493,
	"step": 1786
	},
	{
	"epoch": 0.492036737642324,
	"grad_norm": 0.3602544665336609,
	"learning_rate": 1e-05,
	"loss": 0.4413,
	"step": 1788
	},
	{
	"epoch": 0.49258711430635344,
	"grad_norm": 0.38811835646629333,
	"learning_rate": 1e-05,
	"loss": 0.4406,
	"step": 1790
	},
	{
	"epoch": 0.49313749097038284,
	"grad_norm": 0.366616427898407,
	"learning_rate": 1e-05,
	"loss": 0.4587,
	"step": 1792
	},
	{
	"epoch": 0.4936878676344123,
	"grad_norm": 0.39588844776153564,
	"learning_rate": 1e-05,
	"loss": 0.4525,
	"step": 1794
	},
	{
	"epoch": 0.49423824429844176,
	"grad_norm": 0.3641244173049927,
	"learning_rate": 1e-05,
	"loss": 0.4533,
	"step": 1796
	},
	{
	"epoch": 0.49478862096247117,
	"grad_norm": 0.35738009214401245,
	"learning_rate": 1e-05,
	"loss": 0.4542,
	"step": 1798
	},
	{
	"epoch": 0.49533899762650063,
	"grad_norm": 0.36343181133270264,
	"learning_rate": 1e-05,
	"loss": 0.4527,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_merge_loss": 0.3900485932826996,
	"eval_merge_runtime": 600.246,
	"eval_merge_samples_per_second": 56.23,
	"eval_merge_steps_per_second": 2.344,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_new_aug_datas_filtered.json_loss": 0.5161438584327698,
	"eval_new_aug_datas_filtered.json_runtime": 10.4655,
	"eval_new_aug_datas_filtered.json_samples_per_second": 73.288,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.058,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_sharegpt_gpt4.json_loss": 0.7699668407440186,
	"eval_sharegpt_gpt4.json_runtime": 31.6447,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.809,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.465,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_Table_GPT.json_loss": 0.057397227734327316,
	"eval_Table_GPT.json_runtime": 24.974,
	"eval_Table_GPT.json_samples_per_second": 83.807,
	"eval_Table_GPT.json_steps_per_second": 3.524,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_gpt_4o_200k.json_loss": 0.7959992289543152,
	"eval_gpt_4o_200k.json_runtime": 48.4474,
	"eval_gpt_4o_200k.json_samples_per_second": 129.646,
	"eval_gpt_4o_200k.json_steps_per_second": 5.408,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_multi_turn_datas.json_loss": 0.326607346534729,
	"eval_multi_turn_datas.json_runtime": 75.6077,
	"eval_multi_turn_datas.json_samples_per_second": 52.931,
	"eval_multi_turn_datas.json_steps_per_second": 2.209,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_table_python_code_datas.json_loss": 0.26808008551597595,
	"eval_table_python_code_datas.json_runtime": 43.0557,
	"eval_table_python_code_datas.json_samples_per_second": 50.144,
	"eval_table_python_code_datas.json_steps_per_second": 2.09,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_tabular_llm_data.json_loss": 0.1004142090678215,
	"eval_tabular_llm_data.json_runtime": 8.5429,
	"eval_tabular_llm_data.json_samples_per_second": 28.796,
	"eval_tabular_llm_data.json_steps_per_second": 1.288,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_python_code_critic_21k.json_loss": 0.5654606223106384,
	"eval_python_code_critic_21k.json_runtime": 3.2351,
	"eval_python_code_critic_21k.json_samples_per_second": 184.538,
	"eval_python_code_critic_21k.json_steps_per_second": 7.728,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_all_merge_table_dataset.json_loss": 0.07576768845319748,
	"eval_all_merge_table_dataset.json_runtime": 23.2598,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.611,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.29,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_code_feedback_multi_turn.json_loss": 0.579846203327179,
	"eval_code_feedback_multi_turn.json_runtime": 32.4188,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.893,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.838,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_ultrainteract_sft.json_loss": 0.4181068241596222,
	"eval_ultrainteract_sft.json_runtime": 8.6461,
	"eval_ultrainteract_sft.json_samples_per_second": 168.4,
	"eval_ultrainteract_sft.json_steps_per_second": 7.055,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_synthetic_text_to_sql.json_loss": 0.09818249940872192,
	"eval_synthetic_text_to_sql.json_runtime": 0.1264,
	"eval_synthetic_text_to_sql.json_samples_per_second": 269.092,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.829,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_sft_react_sql_datas.json_loss": 0.6291559338569641,
	"eval_sft_react_sql_datas.json_runtime": 7.8451,
	"eval_sft_react_sql_datas.json_samples_per_second": 40.025,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.785,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_all_merge_code.json_loss": 0.29108163714408875,
	"eval_all_merge_code.json_runtime": 0.3447,
	"eval_all_merge_code.json_samples_per_second": 182.771,
	"eval_all_merge_code.json_steps_per_second": 8.703,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_magpie_datas.json_loss": 0.43020525574684143,
	"eval_magpie_datas.json_runtime": 2.2179,
	"eval_magpie_datas.json_samples_per_second": 77.551,
	"eval_magpie_datas.json_steps_per_second": 3.607,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_train_data_for_qwen.json_loss": 0.0027856978122144938,
	"eval_train_data_for_qwen.json_runtime": 0.2444,
	"eval_train_data_for_qwen.json_samples_per_second": 40.919,
	"eval_train_data_for_qwen.json_steps_per_second": 4.092,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_alpaca_cleaned.json_loss": 0.9129724502563477,
	"eval_alpaca_cleaned.json_runtime": 0.1153,
	"eval_alpaca_cleaned.json_samples_per_second": 234.093,
	"eval_alpaca_cleaned.json_steps_per_second": 17.34,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_agent_instruct.json_loss": 0.22024483978748322,
	"eval_agent_instruct.json_runtime": 0.5149,
	"eval_agent_instruct.json_samples_per_second": 93.222,
	"eval_agent_instruct.json_steps_per_second": 3.884,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_MathInstruct.json_loss": 0.20060402154922485,
	"eval_MathInstruct.json_runtime": 0.3648,
	"eval_MathInstruct.json_samples_per_second": 156.23,
	"eval_MathInstruct.json_steps_per_second": 8.223,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_tested_143k_python_alpaca.json_loss": 0.44536128640174866,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3002,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 113.24,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.661,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_xlam_function_calling_60k.json_loss": 0.00967579148709774,
	"eval_xlam_function_calling_60k.json_runtime": 0.1002,
	"eval_xlam_function_calling_60k.json_samples_per_second": 229.452,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.976,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.5544477701187134,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0511,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 313.214,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.576,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_alpaca_gpt4_zh.json_loss": 0.977000892162323,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0508,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 216.666,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.697,
	"step": 1800
	},
	{
	"epoch": 0.49533899762650063,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5895399451255798,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4883,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 40.957,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.048,
	"step": 1800
	},
	{
	"epoch": 0.4958893742905301,
	"grad_norm": 0.36430442333221436,
	"learning_rate": 1e-05,
	"loss": 0.4418,
	"step": 1802
	},
	{
	"epoch": 0.4964397509545595,
	"grad_norm": 0.35012543201446533,
	"learning_rate": 1e-05,
	"loss": 0.4437,
	"step": 1804
	},
	{
	"epoch": 0.49699012761858896,
	"grad_norm": 0.3726542294025421,
	"learning_rate": 1e-05,
	"loss": 0.4332,
	"step": 1806
	},
	{
	"epoch": 0.4975405042826184,
	"grad_norm": 0.3564360439777374,
	"learning_rate": 1e-05,
	"loss": 0.4378,
	"step": 1808
	},
	{
	"epoch": 0.4980908809466479,
	"grad_norm": 0.3730456233024597,
	"learning_rate": 1e-05,
	"loss": 0.443,
	"step": 1810
	},
	{
	"epoch": 0.4986412576106773,
	"grad_norm": 0.3588622212409973,
	"learning_rate": 1e-05,
	"loss": 0.4387,
	"step": 1812
	},
	{
	"epoch": 0.49919163427470675,
	"grad_norm": 0.36861783266067505,
	"learning_rate": 1e-05,
	"loss": 0.4392,
	"step": 1814
	},
	{
	"epoch": 0.4997420109387362,
	"grad_norm": 0.3537515699863434,
	"learning_rate": 1e-05,
	"loss": 0.4331,
	"step": 1816
	},
	{
	"epoch": 0.5002923876027656,
	"grad_norm": 0.3723071813583374,
	"learning_rate": 1e-05,
	"loss": 0.4429,
	"step": 1818
	},
	{
	"epoch": 0.5008427642667951,
	"grad_norm": 0.37015634775161743,
	"learning_rate": 1e-05,
	"loss": 0.4687,
	"step": 1820
	},
	{
	"epoch": 0.5013931409308245,
	"grad_norm": 0.3528953790664673,
	"learning_rate": 1e-05,
	"loss": 0.4315,
	"step": 1822
	},
	{
	"epoch": 0.501943517594854,
	"grad_norm": 0.357120543718338,
	"learning_rate": 1e-05,
	"loss": 0.4423,
	"step": 1824
	},
	{
	"epoch": 0.5024938942588835,
	"grad_norm": 0.3655802607536316,
	"learning_rate": 1e-05,
	"loss": 0.4475,
	"step": 1826
	},
	{
	"epoch": 0.5030442709229128,
	"grad_norm": 0.3676040470600128,
	"learning_rate": 1e-05,
	"loss": 0.4345,
	"step": 1828
	},
	{
	"epoch": 0.5035946475869423,
	"grad_norm": 0.3427799940109253,
	"learning_rate": 1e-05,
	"loss": 0.4422,
	"step": 1830
	},
	{
	"epoch": 0.5041450242509717,
	"grad_norm": 0.3482607305049896,
	"learning_rate": 1e-05,
	"loss": 0.4347,
	"step": 1832
	},
	{
	"epoch": 0.5046954009150012,
	"grad_norm": 0.3690313398838043,
	"learning_rate": 1e-05,
	"loss": 0.4572,
	"step": 1834
	},
	{
	"epoch": 0.5052457775790307,
	"grad_norm": 0.351601243019104,
	"learning_rate": 1e-05,
	"loss": 0.4445,
	"step": 1836
	},
	{
	"epoch": 0.5057961542430601,
	"grad_norm": 0.3506658971309662,
	"learning_rate": 1e-05,
	"loss": 0.4482,
	"step": 1838
	},
	{
	"epoch": 0.5063465309070896,
	"grad_norm": 0.36706456542015076,
	"learning_rate": 1e-05,
	"loss": 0.4503,
	"step": 1840
	},
	{
	"epoch": 0.5068969075711189,
	"grad_norm": 0.36632585525512695,
	"learning_rate": 1e-05,
	"loss": 0.4385,
	"step": 1842
	},
	{
	"epoch": 0.5074472842351484,
	"grad_norm": 0.3675621747970581,
	"learning_rate": 1e-05,
	"loss": 0.4391,
	"step": 1844
	},
	{
	"epoch": 0.5079976608991779,
	"grad_norm": 0.3883734941482544,
	"learning_rate": 1e-05,
	"loss": 0.4435,
	"step": 1846
	},
	{
	"epoch": 0.5085480375632073,
	"grad_norm": 0.34348422288894653,
	"learning_rate": 1e-05,
	"loss": 0.4388,
	"step": 1848
	},
	{
	"epoch": 0.5090984142272368,
	"grad_norm": 0.36695536971092224,
	"learning_rate": 1e-05,
	"loss": 0.4473,
	"step": 1850
	},
	{
	"epoch": 0.5096487908912662,
	"grad_norm": 0.36929944157600403,
	"learning_rate": 1e-05,
	"loss": 0.4542,
	"step": 1852
	},
	{
	"epoch": 0.5101991675552957,
	"grad_norm": 0.3946716785430908,
	"learning_rate": 1e-05,
	"loss": 0.4399,
	"step": 1854
	},
	{
	"epoch": 0.5107495442193251,
	"grad_norm": 0.3619132936000824,
	"learning_rate": 1e-05,
	"loss": 0.4471,
	"step": 1856
	},
	{
	"epoch": 0.5112999208833545,
	"grad_norm": 0.34836745262145996,
	"learning_rate": 1e-05,
	"loss": 0.4392,
	"step": 1858
	},
	{
	"epoch": 0.511850297547384,
	"grad_norm": 0.37516769766807556,
	"learning_rate": 1e-05,
	"loss": 0.4579,
	"step": 1860
	},
	{
	"epoch": 0.5124006742114134,
	"grad_norm": 0.35800984501838684,
	"learning_rate": 1e-05,
	"loss": 0.4479,
	"step": 1862
	},
	{
	"epoch": 0.5129510508754429,
	"grad_norm": 0.3664796054363251,
	"learning_rate": 1e-05,
	"loss": 0.4556,
	"step": 1864
	},
	{
	"epoch": 0.5135014275394724,
	"grad_norm": 0.3633113503456116,
	"learning_rate": 1e-05,
	"loss": 0.4405,
	"step": 1866
	},
	{
	"epoch": 0.5140518042035017,
	"grad_norm": 0.3655359447002411,
	"learning_rate": 1e-05,
	"loss": 0.4486,
	"step": 1868
	},
	{
	"epoch": 0.5146021808675312,
	"grad_norm": 0.36135318875312805,
	"learning_rate": 1e-05,
	"loss": 0.4473,
	"step": 1870
	},
	{
	"epoch": 0.5151525575315606,
	"grad_norm": 0.4725627601146698,
	"learning_rate": 1e-05,
	"loss": 0.4579,
	"step": 1872
	},
	{
	"epoch": 0.5157029341955901,
	"grad_norm": 0.37844300270080566,
	"learning_rate": 1e-05,
	"loss": 0.4502,
	"step": 1874
	},
	{
	"epoch": 0.5162533108596196,
	"grad_norm": 0.35601717233657837,
	"learning_rate": 1e-05,
	"loss": 0.4392,
	"step": 1876
	},
	{
	"epoch": 0.516803687523649,
	"grad_norm": 0.3960351049900055,
	"learning_rate": 1e-05,
	"loss": 0.4519,
	"step": 1878
	},
	{
	"epoch": 0.5173540641876785,
	"grad_norm": 0.3775772154331207,
	"learning_rate": 1e-05,
	"loss": 0.4553,
	"step": 1880
	},
	{
	"epoch": 0.5179044408517078,
	"grad_norm": 0.3815532624721527,
	"learning_rate": 1e-05,
	"loss": 0.4479,
	"step": 1882
	},
	{
	"epoch": 0.5184548175157373,
	"grad_norm": 0.3661166727542877,
	"learning_rate": 1e-05,
	"loss": 0.4423,
	"step": 1884
	},
	{
	"epoch": 0.5190051941797668,
	"grad_norm": 0.3378327786922455,
	"learning_rate": 1e-05,
	"loss": 0.4419,
	"step": 1886
	},
	{
	"epoch": 0.5195555708437962,
	"grad_norm": 0.34638261795043945,
	"learning_rate": 1e-05,
	"loss": 0.4379,
	"step": 1888
	},
	{
	"epoch": 0.5201059475078257,
	"grad_norm": 0.35764721035957336,
	"learning_rate": 1e-05,
	"loss": 0.4389,
	"step": 1890
	},
	{
	"epoch": 0.5206563241718551,
	"grad_norm": 0.3674796223640442,
	"learning_rate": 1e-05,
	"loss": 0.4438,
	"step": 1892
	},
	{
	"epoch": 0.5212067008358846,
	"grad_norm": 0.34744736552238464,
	"learning_rate": 1e-05,
	"loss": 0.4317,
	"step": 1894
	},
	{
	"epoch": 0.521757077499914,
	"grad_norm": 0.39198940992355347,
	"learning_rate": 1e-05,
	"loss": 0.4406,
	"step": 1896
	},
	{
	"epoch": 0.5223074541639434,
	"grad_norm": 0.3545363247394562,
	"learning_rate": 1e-05,
	"loss": 0.4255,
	"step": 1898
	},
	{
	"epoch": 0.5228578308279729,
	"grad_norm": 0.3635193407535553,
	"learning_rate": 1e-05,
	"loss": 0.4521,
	"step": 1900
	},
	{
	"epoch": 0.5234082074920023,
	"grad_norm": 0.33844560384750366,
	"learning_rate": 1e-05,
	"loss": 0.4371,
	"step": 1902
	},
	{
	"epoch": 0.5239585841560318,
	"grad_norm": 0.34886521100997925,
	"learning_rate": 1e-05,
	"loss": 0.4328,
	"step": 1904
	},
	{
	"epoch": 0.5245089608200613,
	"grad_norm": 0.34973517060279846,
	"learning_rate": 1e-05,
	"loss": 0.4442,
	"step": 1906
	},
	{
	"epoch": 0.5250593374840907,
	"grad_norm": 0.35180777311325073,
	"learning_rate": 1e-05,
	"loss": 0.4575,
	"step": 1908
	},
	{
	"epoch": 0.5256097141481201,
	"grad_norm": 0.36237335205078125,
	"learning_rate": 1e-05,
	"loss": 0.4357,
	"step": 1910
	},
	{
	"epoch": 0.5261600908121495,
	"grad_norm": 0.3784085512161255,
	"learning_rate": 1e-05,
	"loss": 0.4559,
	"step": 1912
	},
	{
	"epoch": 0.526710467476179,
	"grad_norm": 0.3556850254535675,
	"learning_rate": 1e-05,
	"loss": 0.4563,
	"step": 1914
	},
	{
	"epoch": 0.5272608441402085,
	"grad_norm": 0.3620041310787201,
	"learning_rate": 1e-05,
	"loss": 0.4458,
	"step": 1916
	},
	{
	"epoch": 0.5278112208042379,
	"grad_norm": 0.3616819679737091,
	"learning_rate": 1e-05,
	"loss": 0.4304,
	"step": 1918
	},
	{
	"epoch": 0.5283615974682674,
	"grad_norm": 0.3651537597179413,
	"learning_rate": 1e-05,
	"loss": 0.4463,
	"step": 1920
	},
	{
	"epoch": 0.5289119741322967,
	"grad_norm": 0.3924584686756134,
	"learning_rate": 1e-05,
	"loss": 0.4418,
	"step": 1922
	},
	{
	"epoch": 0.5294623507963262,
	"grad_norm": 0.353217214345932,
	"learning_rate": 1e-05,
	"loss": 0.4437,
	"step": 1924
	},
	{
	"epoch": 0.5300127274603557,
	"grad_norm": 0.3897522985935211,
	"learning_rate": 1e-05,
	"loss": 0.4549,
	"step": 1926
	},
	{
	"epoch": 0.5305631041243851,
	"grad_norm": 0.36462587118148804,
	"learning_rate": 1e-05,
	"loss": 0.4247,
	"step": 1928
	},
	{
	"epoch": 0.5311134807884146,
	"grad_norm": 0.3874776363372803,
	"learning_rate": 1e-05,
	"loss": 0.4502,
	"step": 1930
	},
	{
	"epoch": 0.531663857452444,
	"grad_norm": 0.3533260226249695,
	"learning_rate": 1e-05,
	"loss": 0.4515,
	"step": 1932
	},
	{
	"epoch": 0.5322142341164735,
	"grad_norm": 0.3668268024921417,
	"learning_rate": 1e-05,
	"loss": 0.4474,
	"step": 1934
	},
	{
	"epoch": 0.5327646107805029,
	"grad_norm": 0.3501083254814148,
	"learning_rate": 1e-05,
	"loss": 0.4344,
	"step": 1936
	},
	{
	"epoch": 0.5333149874445323,
	"grad_norm": 0.3565337657928467,
	"learning_rate": 1e-05,
	"loss": 0.4412,
	"step": 1938
	},
	{
	"epoch": 0.5338653641085618,
	"grad_norm": 0.34048742055892944,
	"learning_rate": 1e-05,
	"loss": 0.4502,
	"step": 1940
	},
	{
	"epoch": 0.5344157407725912,
	"grad_norm": 0.35694393515586853,
	"learning_rate": 1e-05,
	"loss": 0.4532,
	"step": 1942
	},
	{
	"epoch": 0.5349661174366207,
	"grad_norm": 0.3527338206768036,
	"learning_rate": 1e-05,
	"loss": 0.4378,
	"step": 1944
	},
	{
	"epoch": 0.5355164941006502,
	"grad_norm": 0.3684084117412567,
	"learning_rate": 1e-05,
	"loss": 0.4562,
	"step": 1946
	},
	{
	"epoch": 0.5360668707646796,
	"grad_norm": 0.3584345281124115,
	"learning_rate": 1e-05,
	"loss": 0.4561,
	"step": 1948
	},
	{
	"epoch": 0.536617247428709,
	"grad_norm": 0.35685622692108154,
	"learning_rate": 1e-05,
	"loss": 0.4532,
	"step": 1950
	},
	{
	"epoch": 0.5371676240927384,
	"grad_norm": 0.36560460925102234,
	"learning_rate": 1e-05,
	"loss": 0.4529,
	"step": 1952
	},
	{
	"epoch": 0.5377180007567679,
	"grad_norm": 0.36613890528678894,
	"learning_rate": 1e-05,
	"loss": 0.4536,
	"step": 1954
	},
	{
	"epoch": 0.5382683774207974,
	"grad_norm": 0.3513580858707428,
	"learning_rate": 1e-05,
	"loss": 0.4496,
	"step": 1956
	},
	{
	"epoch": 0.5388187540848268,
	"grad_norm": 0.38372403383255005,
	"learning_rate": 1e-05,
	"loss": 0.4506,
	"step": 1958
	},
	{
	"epoch": 0.5393691307488563,
	"grad_norm": 0.35690757632255554,
	"learning_rate": 1e-05,
	"loss": 0.4371,
	"step": 1960
	},
	{
	"epoch": 0.5399195074128857,
	"grad_norm": 0.36706483364105225,
	"learning_rate": 1e-05,
	"loss": 0.4292,
	"step": 1962
	},
	{
	"epoch": 0.5404698840769151,
	"grad_norm": 0.35754841566085815,
	"learning_rate": 1e-05,
	"loss": 0.4543,
	"step": 1964
	},
	{
	"epoch": 0.5410202607409446,
	"grad_norm": 0.35544702410697937,
	"learning_rate": 1e-05,
	"loss": 0.4522,
	"step": 1966
	},
	{
	"epoch": 0.541570637404974,
	"grad_norm": 0.3689357042312622,
	"learning_rate": 1e-05,
	"loss": 0.4447,
	"step": 1968
	},
	{
	"epoch": 0.5421210140690035,
	"grad_norm": 0.35911116003990173,
	"learning_rate": 1e-05,
	"loss": 0.4253,
	"step": 1970
	},
	{
	"epoch": 0.5426713907330329,
	"grad_norm": 0.3458103537559509,
	"learning_rate": 1e-05,
	"loss": 0.4398,
	"step": 1972
	},
	{
	"epoch": 0.5432217673970624,
	"grad_norm": 0.3606932759284973,
	"learning_rate": 1e-05,
	"loss": 0.4486,
	"step": 1974
	},
	{
	"epoch": 0.5437721440610918,
	"grad_norm": 0.3759188652038574,
	"learning_rate": 1e-05,
	"loss": 0.4339,
	"step": 1976
	},
	{
	"epoch": 0.5443225207251212,
	"grad_norm": 0.3803597390651703,
	"learning_rate": 1e-05,
	"loss": 0.4575,
	"step": 1978
	},
	{
	"epoch": 0.5448728973891507,
	"grad_norm": 0.36220523715019226,
	"learning_rate": 1e-05,
	"loss": 0.4427,
	"step": 1980
	},
	{
	"epoch": 0.5454232740531801,
	"grad_norm": 0.36756813526153564,
	"learning_rate": 1e-05,
	"loss": 0.4297,
	"step": 1982
	},
	{
	"epoch": 0.5459736507172096,
	"grad_norm": 0.35930246114730835,
	"learning_rate": 1e-05,
	"loss": 0.4375,
	"step": 1984
	},
	{
	"epoch": 0.5465240273812391,
	"grad_norm": 0.38998985290527344,
	"learning_rate": 1e-05,
	"loss": 0.4331,
	"step": 1986
	},
	{
	"epoch": 0.5470744040452685,
	"grad_norm": 0.35975074768066406,
	"learning_rate": 1e-05,
	"loss": 0.4493,
	"step": 1988
	},
	{
	"epoch": 0.5476247807092979,
	"grad_norm": 0.3618590533733368,
	"learning_rate": 1e-05,
	"loss": 0.4431,
	"step": 1990
	},
	{
	"epoch": 0.5481751573733273,
	"grad_norm": 0.3768090009689331,
	"learning_rate": 1e-05,
	"loss": 0.4414,
	"step": 1992
	},
	{
	"epoch": 0.5487255340373568,
	"grad_norm": 0.3526524305343628,
	"learning_rate": 1e-05,
	"loss": 0.4349,
	"step": 1994
	},
	{
	"epoch": 0.5492759107013863,
	"grad_norm": 0.3426629900932312,
	"learning_rate": 1e-05,
	"loss": 0.4345,
	"step": 1996
	},
	{
	"epoch": 0.5498262873654157,
	"grad_norm": 0.3500785529613495,
	"learning_rate": 1e-05,
	"loss": 0.4415,
	"step": 1998
	},
	{
	"epoch": 0.5503766640294452,
	"grad_norm": 0.3602929413318634,
	"learning_rate": 1e-05,
	"loss": 0.4454,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_merge_loss": 0.3855894207954407,
	"eval_merge_runtime": 600.0048,
	"eval_merge_samples_per_second": 56.253,
	"eval_merge_steps_per_second": 2.345,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_new_aug_datas_filtered.json_loss": 0.5099759697914124,
	"eval_new_aug_datas_filtered.json_runtime": 10.3782,
	"eval_new_aug_datas_filtered.json_samples_per_second": 73.905,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.083,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_sharegpt_gpt4.json_loss": 0.763576865196228,
	"eval_sharegpt_gpt4.json_runtime": 31.7204,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.669,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.459,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_Table_GPT.json_loss": 0.055675260722637177,
	"eval_Table_GPT.json_runtime": 24.9781,
	"eval_Table_GPT.json_samples_per_second": 83.793,
	"eval_Table_GPT.json_steps_per_second": 3.523,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_gpt_4o_200k.json_loss": 0.7919400334358215,
	"eval_gpt_4o_200k.json_runtime": 48.5207,
	"eval_gpt_4o_200k.json_samples_per_second": 129.45,
	"eval_gpt_4o_200k.json_steps_per_second": 5.4,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_multi_turn_datas.json_loss": 0.321598082780838,
	"eval_multi_turn_datas.json_runtime": 75.7401,
	"eval_multi_turn_datas.json_samples_per_second": 52.839,
	"eval_multi_turn_datas.json_steps_per_second": 2.205,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_table_python_code_datas.json_loss": 0.26337531208992004,
	"eval_table_python_code_datas.json_runtime": 43.1695,
	"eval_table_python_code_datas.json_samples_per_second": 50.012,
	"eval_table_python_code_datas.json_steps_per_second": 2.085,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_tabular_llm_data.json_loss": 0.09393570572137833,
	"eval_tabular_llm_data.json_runtime": 8.5822,
	"eval_tabular_llm_data.json_samples_per_second": 28.664,
	"eval_tabular_llm_data.json_steps_per_second": 1.282,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_python_code_critic_21k.json_loss": 0.5615730285644531,
	"eval_python_code_critic_21k.json_runtime": 3.2332,
	"eval_python_code_critic_21k.json_samples_per_second": 184.645,
	"eval_python_code_critic_21k.json_steps_per_second": 7.732,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_all_merge_table_dataset.json_loss": 0.07384855300188065,
	"eval_all_merge_table_dataset.json_runtime": 23.3929,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.437,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.282,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_code_feedback_multi_turn.json_loss": 0.5769618153572083,
	"eval_code_feedback_multi_turn.json_runtime": 32.4541,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.819,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.835,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_ultrainteract_sft.json_loss": 0.41532665491104126,
	"eval_ultrainteract_sft.json_runtime": 8.6954,
	"eval_ultrainteract_sft.json_samples_per_second": 167.445,
	"eval_ultrainteract_sft.json_steps_per_second": 7.015,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_synthetic_text_to_sql.json_loss": 0.09223779290914536,
	"eval_synthetic_text_to_sql.json_runtime": 0.1265,
	"eval_synthetic_text_to_sql.json_samples_per_second": 268.84,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.814,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_sft_react_sql_datas.json_loss": 0.6254591941833496,
	"eval_sft_react_sql_datas.json_runtime": 7.8542,
	"eval_sft_react_sql_datas.json_samples_per_second": 39.979,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.782,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_all_merge_code.json_loss": 0.2845838665962219,
	"eval_all_merge_code.json_runtime": 0.3345,
	"eval_all_merge_code.json_samples_per_second": 188.319,
	"eval_all_merge_code.json_steps_per_second": 8.968,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_magpie_datas.json_loss": 0.4300972521305084,
	"eval_magpie_datas.json_runtime": 2.2166,
	"eval_magpie_datas.json_samples_per_second": 77.598,
	"eval_magpie_datas.json_steps_per_second": 3.609,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_train_data_for_qwen.json_loss": 0.0036769520957022905,
	"eval_train_data_for_qwen.json_runtime": 0.2431,
	"eval_train_data_for_qwen.json_samples_per_second": 41.14,
	"eval_train_data_for_qwen.json_steps_per_second": 4.114,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_alpaca_cleaned.json_loss": 0.9104709625244141,
	"eval_alpaca_cleaned.json_runtime": 0.1148,
	"eval_alpaca_cleaned.json_samples_per_second": 235.266,
	"eval_alpaca_cleaned.json_steps_per_second": 17.427,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_agent_instruct.json_loss": 0.220087930560112,
	"eval_agent_instruct.json_runtime": 0.5143,
	"eval_agent_instruct.json_samples_per_second": 93.334,
	"eval_agent_instruct.json_steps_per_second": 3.889,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_MathInstruct.json_loss": 0.1989249587059021,
	"eval_MathInstruct.json_runtime": 0.3499,
	"eval_MathInstruct.json_samples_per_second": 162.904,
	"eval_MathInstruct.json_steps_per_second": 8.574,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_tested_143k_python_alpaca.json_loss": 0.4425477683544159,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3008,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 113.029,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.649,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_xlam_function_calling_60k.json_loss": 0.008927595801651478,
	"eval_xlam_function_calling_60k.json_runtime": 0.1003,
	"eval_xlam_function_calling_60k.json_samples_per_second": 229.301,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.97,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.5485728979110718,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0512,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 312.726,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.545,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_alpaca_gpt4_zh.json_loss": 0.9768400192260742,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0505,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 217.931,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.812,
	"step": 2000
	},
	{
	"epoch": 0.5503766640294452,
	"eval_codefeedback_filtered_instruction.json_loss": 0.587010383605957,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4876,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.015,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.051,
	"step": 2000
	},
	{
	"epoch": 0.5509270406934746,
	"grad_norm": 0.3626772463321686,
	"learning_rate": 1e-05,
	"loss": 0.4442,
	"step": 2002
	},
	{
	"epoch": 0.551477417357504,
	"grad_norm": 0.34878280758857727,
	"learning_rate": 1e-05,
	"loss": 0.4458,
	"step": 2004
	},
	{
	"epoch": 0.5520277940215335,
	"grad_norm": 0.35377946496009827,
	"learning_rate": 1e-05,
	"loss": 0.4273,
	"step": 2006
	},
	{
	"epoch": 0.5525781706855629,
	"grad_norm": 0.3649701774120331,
	"learning_rate": 1e-05,
	"loss": 0.4342,
	"step": 2008
	},
	{
	"epoch": 0.5531285473495924,
	"grad_norm": 0.34736165404319763,
	"learning_rate": 1e-05,
	"loss": 0.4298,
	"step": 2010
	},
	{
	"epoch": 0.5536789240136218,
	"grad_norm": 0.3697884678840637,
	"learning_rate": 1e-05,
	"loss": 0.4424,
	"step": 2012
	},
	{
	"epoch": 0.5542293006776513,
	"grad_norm": 0.40290403366088867,
	"learning_rate": 1e-05,
	"loss": 0.4388,
	"step": 2014
	},
	{
	"epoch": 0.5547796773416808,
	"grad_norm": 0.36797061562538147,
	"learning_rate": 1e-05,
	"loss": 0.4648,
	"step": 2016
	},
	{
	"epoch": 0.5553300540057101,
	"grad_norm": 0.35621124505996704,
	"learning_rate": 1e-05,
	"loss": 0.433,
	"step": 2018
	},
	{
	"epoch": 0.5558804306697396,
	"grad_norm": 0.3625437915325165,
	"learning_rate": 1e-05,
	"loss": 0.441,
	"step": 2020
	},
	{
	"epoch": 0.556430807333769,
	"grad_norm": 0.3642013370990753,
	"learning_rate": 1e-05,
	"loss": 0.4425,
	"step": 2022
	},
	{
	"epoch": 0.5569811839977985,
	"grad_norm": 0.36053115129470825,
	"learning_rate": 1e-05,
	"loss": 0.4422,
	"step": 2024
	},
	{
	"epoch": 0.557531560661828,
	"grad_norm": 0.36283549666404724,
	"learning_rate": 1e-05,
	"loss": 0.4338,
	"step": 2026
	},
	{
	"epoch": 0.5580819373258574,
	"grad_norm": 0.3758421540260315,
	"learning_rate": 1e-05,
	"loss": 0.439,
	"step": 2028
	},
	{
	"epoch": 0.5586323139898868,
	"grad_norm": 0.33730989694595337,
	"learning_rate": 1e-05,
	"loss": 0.4446,
	"step": 2030
	},
	{
	"epoch": 0.5591826906539162,
	"grad_norm": 0.36297255754470825,
	"learning_rate": 1e-05,
	"loss": 0.4358,
	"step": 2032
	},
	{
	"epoch": 0.5597330673179457,
	"grad_norm": 0.3534908890724182,
	"learning_rate": 1e-05,
	"loss": 0.4257,
	"step": 2034
	},
	{
	"epoch": 0.5602834439819752,
	"grad_norm": 0.3690515160560608,
	"learning_rate": 1e-05,
	"loss": 0.4383,
	"step": 2036
	},
	{
	"epoch": 0.5608338206460046,
	"grad_norm": 0.3638661503791809,
	"learning_rate": 1e-05,
	"loss": 0.4452,
	"step": 2038
	},
	{
	"epoch": 0.5613841973100341,
	"grad_norm": 0.3521392047405243,
	"learning_rate": 1e-05,
	"loss": 0.4342,
	"step": 2040
	},
	{
	"epoch": 0.5619345739740635,
	"grad_norm": 0.3569532632827759,
	"learning_rate": 1e-05,
	"loss": 0.4507,
	"step": 2042
	},
	{
	"epoch": 0.5624849506380929,
	"grad_norm": 0.37072595953941345,
	"learning_rate": 1e-05,
	"loss": 0.4354,
	"step": 2044
	},
	{
	"epoch": 0.5630353273021224,
	"grad_norm": 0.38489988446235657,
	"learning_rate": 1e-05,
	"loss": 0.4528,
	"step": 2046
	},
	{
	"epoch": 0.5635857039661518,
	"grad_norm": 0.38305357098579407,
	"learning_rate": 1e-05,
	"loss": 0.4428,
	"step": 2048
	},
	{
	"epoch": 0.5641360806301813,
	"grad_norm": 0.3491927981376648,
	"learning_rate": 1e-05,
	"loss": 0.4242,
	"step": 2050
	},
	{
	"epoch": 0.5646864572942107,
	"grad_norm": 0.35508430004119873,
	"learning_rate": 1e-05,
	"loss": 0.4556,
	"step": 2052
	},
	{
	"epoch": 0.5652368339582402,
	"grad_norm": 0.36298030614852905,
	"learning_rate": 1e-05,
	"loss": 0.4337,
	"step": 2054
	},
	{
	"epoch": 0.5657872106222697,
	"grad_norm": 0.3598901629447937,
	"learning_rate": 1e-05,
	"loss": 0.4378,
	"step": 2056
	},
	{
	"epoch": 0.566337587286299,
	"grad_norm": 0.3838946223258972,
	"learning_rate": 1e-05,
	"loss": 0.4346,
	"step": 2058
	},
	{
	"epoch": 0.5668879639503285,
	"grad_norm": 0.3986867666244507,
	"learning_rate": 1e-05,
	"loss": 0.45,
	"step": 2060
	},
	{
	"epoch": 0.5674383406143579,
	"grad_norm": 0.3509708344936371,
	"learning_rate": 1e-05,
	"loss": 0.4462,
	"step": 2062
	},
	{
	"epoch": 0.5679887172783874,
	"grad_norm": 0.35189950466156006,
	"learning_rate": 1e-05,
	"loss": 0.4307,
	"step": 2064
	},
	{
	"epoch": 0.5685390939424169,
	"grad_norm": 0.37416207790374756,
	"learning_rate": 1e-05,
	"loss": 0.4368,
	"step": 2066
	},
	{
	"epoch": 0.5690894706064463,
	"grad_norm": 0.3902382254600525,
	"learning_rate": 1e-05,
	"loss": 0.4278,
	"step": 2068
	},
	{
	"epoch": 0.5696398472704758,
	"grad_norm": 0.384260892868042,
	"learning_rate": 1e-05,
	"loss": 0.4449,
	"step": 2070
	},
	{
	"epoch": 0.5701902239345051,
	"grad_norm": 0.367347776889801,
	"learning_rate": 1e-05,
	"loss": 0.4397,
	"step": 2072
	},
	{
	"epoch": 0.5707406005985346,
	"grad_norm": 0.35011574625968933,
	"learning_rate": 1e-05,
	"loss": 0.4375,
	"step": 2074
	},
	{
	"epoch": 0.5712909772625641,
	"grad_norm": 0.3609907329082489,
	"learning_rate": 1e-05,
	"loss": 0.446,
	"step": 2076
	},
	{
	"epoch": 0.5718413539265935,
	"grad_norm": 0.3640425205230713,
	"learning_rate": 1e-05,
	"loss": 0.4453,
	"step": 2078
	},
	{
	"epoch": 0.572391730590623,
	"grad_norm": 0.3464198112487793,
	"learning_rate": 1e-05,
	"loss": 0.4489,
	"step": 2080
	},
	{
	"epoch": 0.5729421072546524,
	"grad_norm": 0.3741483688354492,
	"learning_rate": 1e-05,
	"loss": 0.4515,
	"step": 2082
	},
	{
	"epoch": 0.5734924839186818,
	"grad_norm": 0.37388619780540466,
	"learning_rate": 1e-05,
	"loss": 0.4632,
	"step": 2084
	},
	{
	"epoch": 0.5740428605827113,
	"grad_norm": 0.37237605452537537,
	"learning_rate": 1e-05,
	"loss": 0.4425,
	"step": 2086
	},
	{
	"epoch": 0.5745932372467407,
	"grad_norm": 0.35421323776245117,
	"learning_rate": 1e-05,
	"loss": 0.4474,
	"step": 2088
	},
	{
	"epoch": 0.5751436139107702,
	"grad_norm": 0.33015069365501404,
	"learning_rate": 1e-05,
	"loss": 0.43,
	"step": 2090
	},
	{
	"epoch": 0.5756939905747996,
	"grad_norm": 0.3670506179332733,
	"learning_rate": 1e-05,
	"loss": 0.4452,
	"step": 2092
	},
	{
	"epoch": 0.5762443672388291,
	"grad_norm": 0.3514888882637024,
	"learning_rate": 1e-05,
	"loss": 0.4287,
	"step": 2094
	},
	{
	"epoch": 0.5767947439028586,
	"grad_norm": 0.3714512288570404,
	"learning_rate": 1e-05,
	"loss": 0.4344,
	"step": 2096
	},
	{
	"epoch": 0.5773451205668879,
	"grad_norm": 0.35363397002220154,
	"learning_rate": 1e-05,
	"loss": 0.4408,
	"step": 2098
	},
	{
	"epoch": 0.5778954972309174,
	"grad_norm": 0.3529844582080841,
	"learning_rate": 1e-05,
	"loss": 0.4434,
	"step": 2100
	},
	{
	"epoch": 0.5784458738949468,
	"grad_norm": 0.3400002121925354,
	"learning_rate": 1e-05,
	"loss": 0.4443,
	"step": 2102
	},
	{
	"epoch": 0.5789962505589763,
	"grad_norm": 0.3620370328426361,
	"learning_rate": 1e-05,
	"loss": 0.4377,
	"step": 2104
	},
	{
	"epoch": 0.5795466272230058,
	"grad_norm": 0.3476988971233368,
	"learning_rate": 1e-05,
	"loss": 0.4321,
	"step": 2106
	},
	{
	"epoch": 0.5800970038870352,
	"grad_norm": 0.35739636421203613,
	"learning_rate": 1e-05,
	"loss": 0.4495,
	"step": 2108
	},
	{
	"epoch": 0.5806473805510647,
	"grad_norm": 0.3718028962612152,
	"learning_rate": 1e-05,
	"loss": 0.4391,
	"step": 2110
	},
	{
	"epoch": 0.581197757215094,
	"grad_norm": 0.35041627287864685,
	"learning_rate": 1e-05,
	"loss": 0.454,
	"step": 2112
	},
	{
	"epoch": 0.5817481338791235,
	"grad_norm": 0.36277493834495544,
	"learning_rate": 1e-05,
	"loss": 0.44,
	"step": 2114
	},
	{
	"epoch": 0.582298510543153,
	"grad_norm": 0.36685582995414734,
	"learning_rate": 1e-05,
	"loss": 0.4401,
	"step": 2116
	},
	{
	"epoch": 0.5828488872071824,
	"grad_norm": 0.33634135127067566,
	"learning_rate": 1e-05,
	"loss": 0.4338,
	"step": 2118
	},
	{
	"epoch": 0.5833992638712119,
	"grad_norm": 0.36546674370765686,
	"learning_rate": 1e-05,
	"loss": 0.4456,
	"step": 2120
	},
	{
	"epoch": 0.5839496405352413,
	"grad_norm": 0.361472487449646,
	"learning_rate": 1e-05,
	"loss": 0.4368,
	"step": 2122
	},
	{
	"epoch": 0.5845000171992708,
	"grad_norm": 0.36743828654289246,
	"learning_rate": 1e-05,
	"loss": 0.4464,
	"step": 2124
	},
	{
	"epoch": 0.5850503938633002,
	"grad_norm": 0.35304173827171326,
	"learning_rate": 1e-05,
	"loss": 0.4407,
	"step": 2126
	},
	{
	"epoch": 0.5856007705273296,
	"grad_norm": 0.35151979327201843,
	"learning_rate": 1e-05,
	"loss": 0.4532,
	"step": 2128
	},
	{
	"epoch": 0.5861511471913591,
	"grad_norm": 0.34761616587638855,
	"learning_rate": 1e-05,
	"loss": 0.444,
	"step": 2130
	},
	{
	"epoch": 0.5867015238553885,
	"grad_norm": 0.3763500452041626,
	"learning_rate": 1e-05,
	"loss": 0.4524,
	"step": 2132
	},
	{
	"epoch": 0.587251900519418,
	"grad_norm": 0.36489951610565186,
	"learning_rate": 1e-05,
	"loss": 0.4333,
	"step": 2134
	},
	{
	"epoch": 0.5878022771834475,
	"grad_norm": 0.38710853457450867,
	"learning_rate": 1e-05,
	"loss": 0.4517,
	"step": 2136
	},
	{
	"epoch": 0.5883526538474768,
	"grad_norm": 0.36153027415275574,
	"learning_rate": 1e-05,
	"loss": 0.438,
	"step": 2138
	},
	{
	"epoch": 0.5889030305115063,
	"grad_norm": 0.3907857835292816,
	"learning_rate": 1e-05,
	"loss": 0.4429,
	"step": 2140
	},
	{
	"epoch": 0.5894534071755357,
	"grad_norm": 0.3813617527484894,
	"learning_rate": 1e-05,
	"loss": 0.4392,
	"step": 2142
	},
	{
	"epoch": 0.5900037838395652,
	"grad_norm": 0.3563400208950043,
	"learning_rate": 1e-05,
	"loss": 0.434,
	"step": 2144
	},
	{
	"epoch": 0.5905541605035947,
	"grad_norm": 0.3556332290172577,
	"learning_rate": 1e-05,
	"loss": 0.4436,
	"step": 2146
	},
	{
	"epoch": 0.5911045371676241,
	"grad_norm": 0.3623802363872528,
	"learning_rate": 1e-05,
	"loss": 0.4378,
	"step": 2148
	},
	{
	"epoch": 0.5916549138316536,
	"grad_norm": 0.36329442262649536,
	"learning_rate": 1e-05,
	"loss": 0.4386,
	"step": 2150
	},
	{
	"epoch": 0.5922052904956829,
	"grad_norm": 0.3771746754646301,
	"learning_rate": 1e-05,
	"loss": 0.4494,
	"step": 2152
	},
	{
	"epoch": 0.5927556671597124,
	"grad_norm": 0.34596994519233704,
	"learning_rate": 1e-05,
	"loss": 0.4173,
	"step": 2154
	},
	{
	"epoch": 0.5933060438237419,
	"grad_norm": 0.36507177352905273,
	"learning_rate": 1e-05,
	"loss": 0.4254,
	"step": 2156
	},
	{
	"epoch": 0.5938564204877713,
	"grad_norm": 0.3519168794155121,
	"learning_rate": 1e-05,
	"loss": 0.4447,
	"step": 2158
	},
	{
	"epoch": 0.5944067971518008,
	"grad_norm": 0.35316991806030273,
	"learning_rate": 1e-05,
	"loss": 0.4622,
	"step": 2160
	},
	{
	"epoch": 0.5949571738158302,
	"grad_norm": 0.3529471158981323,
	"learning_rate": 1e-05,
	"loss": 0.4482,
	"step": 2162
	},
	{
	"epoch": 0.5955075504798597,
	"grad_norm": 0.3722255825996399,
	"learning_rate": 1e-05,
	"loss": 0.4454,
	"step": 2164
	},
	{
	"epoch": 0.596057927143889,
	"grad_norm": 0.3557456433773041,
	"learning_rate": 1e-05,
	"loss": 0.4435,
	"step": 2166
	},
	{
	"epoch": 0.5966083038079185,
	"grad_norm": 0.3348141610622406,
	"learning_rate": 1e-05,
	"loss": 0.436,
	"step": 2168
	},
	{
	"epoch": 0.597158680471948,
	"grad_norm": 0.38193532824516296,
	"learning_rate": 1e-05,
	"loss": 0.4543,
	"step": 2170
	},
	{
	"epoch": 0.5977090571359774,
	"grad_norm": 0.3672102391719818,
	"learning_rate": 1e-05,
	"loss": 0.4356,
	"step": 2172
	},
	{
	"epoch": 0.5982594338000069,
	"grad_norm": 0.37538838386535645,
	"learning_rate": 1e-05,
	"loss": 0.4442,
	"step": 2174
	},
	{
	"epoch": 0.5988098104640364,
	"grad_norm": 0.3512885272502899,
	"learning_rate": 1e-05,
	"loss": 0.4249,
	"step": 2176
	},
	{
	"epoch": 0.5993601871280658,
	"grad_norm": 0.4028591811656952,
	"learning_rate": 1e-05,
	"loss": 0.4495,
	"step": 2178
	},
	{
	"epoch": 0.5999105637920952,
	"grad_norm": 0.3539179861545563,
	"learning_rate": 1e-05,
	"loss": 0.4504,
	"step": 2180
	},
	{
	"epoch": 0.6004609404561246,
	"grad_norm": 0.34848934412002563,
	"learning_rate": 1e-05,
	"loss": 0.4348,
	"step": 2182
	},
	{
	"epoch": 0.6010113171201541,
	"grad_norm": 0.37469926476478577,
	"learning_rate": 1e-05,
	"loss": 0.4414,
	"step": 2184
	},
	{
	"epoch": 0.6015616937841836,
	"grad_norm": 0.3511207103729248,
	"learning_rate": 1e-05,
	"loss": 0.4489,
	"step": 2186
	},
	{
	"epoch": 0.602112070448213,
	"grad_norm": 0.3594874441623688,
	"learning_rate": 1e-05,
	"loss": 0.4429,
	"step": 2188
	},
	{
	"epoch": 0.6026624471122425,
	"grad_norm": 0.37694159150123596,
	"learning_rate": 1e-05,
	"loss": 0.4365,
	"step": 2190
	},
	{
	"epoch": 0.6032128237762718,
	"grad_norm": 0.3630627393722534,
	"learning_rate": 1e-05,
	"loss": 0.4449,
	"step": 2192
	},
	{
	"epoch": 0.6037632004403013,
	"grad_norm": 0.352230042219162,
	"learning_rate": 1e-05,
	"loss": 0.4382,
	"step": 2194
	},
	{
	"epoch": 0.6043135771043308,
	"grad_norm": 0.369757741689682,
	"learning_rate": 1e-05,
	"loss": 0.4443,
	"step": 2196
	},
	{
	"epoch": 0.6048639537683602,
	"grad_norm": 0.37120938301086426,
	"learning_rate": 1e-05,
	"loss": 0.454,
	"step": 2198
	},
	{
	"epoch": 0.6054143304323897,
	"grad_norm": 0.3475727140903473,
	"learning_rate": 1e-05,
	"loss": 0.4424,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_merge_loss": 0.38126564025878906,
	"eval_merge_runtime": 600.3103,
	"eval_merge_samples_per_second": 56.224,
	"eval_merge_steps_per_second": 2.344,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_new_aug_datas_filtered.json_loss": 0.5048007369041443,
	"eval_new_aug_datas_filtered.json_runtime": 10.3514,
	"eval_new_aug_datas_filtered.json_samples_per_second": 74.096,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.091,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_sharegpt_gpt4.json_loss": 0.7578977346420288,
	"eval_sharegpt_gpt4.json_runtime": 31.6981,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.71,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.461,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_Table_GPT.json_loss": 0.05305211618542671,
	"eval_Table_GPT.json_runtime": 25.0091,
	"eval_Table_GPT.json_samples_per_second": 83.69,
	"eval_Table_GPT.json_steps_per_second": 3.519,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_gpt_4o_200k.json_loss": 0.7855507135391235,
	"eval_gpt_4o_200k.json_runtime": 48.5546,
	"eval_gpt_4o_200k.json_samples_per_second": 129.36,
	"eval_gpt_4o_200k.json_steps_per_second": 5.396,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_multi_turn_datas.json_loss": 0.3139781355857849,
	"eval_multi_turn_datas.json_runtime": 75.6414,
	"eval_multi_turn_datas.json_samples_per_second": 52.908,
	"eval_multi_turn_datas.json_steps_per_second": 2.208,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_table_python_code_datas.json_loss": 0.2603669762611389,
	"eval_table_python_code_datas.json_runtime": 43.0857,
	"eval_table_python_code_datas.json_samples_per_second": 50.109,
	"eval_table_python_code_datas.json_steps_per_second": 2.089,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_tabular_llm_data.json_loss": 0.0890057235956192,
	"eval_tabular_llm_data.json_runtime": 8.5461,
	"eval_tabular_llm_data.json_samples_per_second": 28.785,
	"eval_tabular_llm_data.json_steps_per_second": 1.287,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_python_code_critic_21k.json_loss": 0.5582770705223083,
	"eval_python_code_critic_21k.json_runtime": 3.2316,
	"eval_python_code_critic_21k.json_samples_per_second": 184.737,
	"eval_python_code_critic_21k.json_steps_per_second": 7.736,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_all_merge_table_dataset.json_loss": 0.07120716571807861,
	"eval_all_merge_table_dataset.json_runtime": 23.3637,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.475,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.284,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_code_feedback_multi_turn.json_loss": 0.5745006799697876,
	"eval_code_feedback_multi_turn.json_runtime": 32.5197,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.682,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.829,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_ultrainteract_sft.json_loss": 0.41318273544311523,
	"eval_ultrainteract_sft.json_runtime": 8.6602,
	"eval_ultrainteract_sft.json_samples_per_second": 168.125,
	"eval_ultrainteract_sft.json_steps_per_second": 7.044,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_synthetic_text_to_sql.json_loss": 0.09635543823242188,
	"eval_synthetic_text_to_sql.json_runtime": 0.1265,
	"eval_synthetic_text_to_sql.json_samples_per_second": 268.832,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.814,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_sft_react_sql_datas.json_loss": 0.6216484904289246,
	"eval_sft_react_sql_datas.json_runtime": 7.8599,
	"eval_sft_react_sql_datas.json_samples_per_second": 39.949,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.781,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_all_merge_code.json_loss": 0.2849319279193878,
	"eval_all_merge_code.json_runtime": 0.3296,
	"eval_all_merge_code.json_samples_per_second": 191.112,
	"eval_all_merge_code.json_steps_per_second": 9.101,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_magpie_datas.json_loss": 0.4269045293331146,
	"eval_magpie_datas.json_runtime": 2.2161,
	"eval_magpie_datas.json_samples_per_second": 77.615,
	"eval_magpie_datas.json_steps_per_second": 3.61,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_train_data_for_qwen.json_loss": 0.005929525941610336,
	"eval_train_data_for_qwen.json_runtime": 0.2454,
	"eval_train_data_for_qwen.json_samples_per_second": 40.757,
	"eval_train_data_for_qwen.json_steps_per_second": 4.076,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_alpaca_cleaned.json_loss": 0.9076781272888184,
	"eval_alpaca_cleaned.json_runtime": 0.1144,
	"eval_alpaca_cleaned.json_samples_per_second": 236.011,
	"eval_alpaca_cleaned.json_steps_per_second": 17.482,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_agent_instruct.json_loss": 0.2231922596693039,
	"eval_agent_instruct.json_runtime": 0.5154,
	"eval_agent_instruct.json_samples_per_second": 93.136,
	"eval_agent_instruct.json_steps_per_second": 3.881,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_MathInstruct.json_loss": 0.19876058399677277,
	"eval_MathInstruct.json_runtime": 0.3563,
	"eval_MathInstruct.json_samples_per_second": 159.969,
	"eval_MathInstruct.json_steps_per_second": 8.419,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_tested_143k_python_alpaca.json_loss": 0.4431252181529999,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3026,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.374,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.61,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_xlam_function_calling_60k.json_loss": 0.00838847178965807,
	"eval_xlam_function_calling_60k.json_runtime": 0.1,
	"eval_xlam_function_calling_60k.json_samples_per_second": 230.081,
	"eval_xlam_function_calling_60k.json_steps_per_second": 10.004,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.5384413003921509,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0514,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 311.198,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.45,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_alpaca_gpt4_zh.json_loss": 0.969275712966919,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0504,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 218.311,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.846,
	"step": 2200
	},
	{
	"epoch": 0.6054143304323897,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5901365876197815,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4874,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.032,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.052,
	"step": 2200
	},
	{
	"epoch": 0.6059647070964191,
	"grad_norm": 0.37194857001304626,
	"learning_rate": 1e-05,
	"loss": 0.424,
	"step": 2202
	},
	{
	"epoch": 0.6065150837604486,
	"grad_norm": 0.36095818877220154,
	"learning_rate": 1e-05,
	"loss": 0.4344,
	"step": 2204
	},
	{
	"epoch": 0.607065460424478,
	"grad_norm": 0.36337706446647644,
	"learning_rate": 1e-05,
	"loss": 0.4446,
	"step": 2206
	},
	{
	"epoch": 0.6076158370885074,
	"grad_norm": 0.3500390946865082,
	"learning_rate": 1e-05,
	"loss": 0.4304,
	"step": 2208
	},
	{
	"epoch": 0.6081662137525369,
	"grad_norm": 0.3477112054824829,
	"learning_rate": 1e-05,
	"loss": 0.4346,
	"step": 2210
	},
	{
	"epoch": 0.6087165904165663,
	"grad_norm": 0.36322692036628723,
	"learning_rate": 1e-05,
	"loss": 0.4311,
	"step": 2212
	},
	{
	"epoch": 0.6092669670805958,
	"grad_norm": 0.37783941626548767,
	"learning_rate": 1e-05,
	"loss": 0.4389,
	"step": 2214
	},
	{
	"epoch": 0.6098173437446253,
	"grad_norm": 0.36018887162208557,
	"learning_rate": 1e-05,
	"loss": 0.4321,
	"step": 2216
	},
	{
	"epoch": 0.6103677204086547,
	"grad_norm": 0.34396857023239136,
	"learning_rate": 1e-05,
	"loss": 0.4349,
	"step": 2218
	},
	{
	"epoch": 0.6109180970726841,
	"grad_norm": 0.3611605167388916,
	"learning_rate": 1e-05,
	"loss": 0.4305,
	"step": 2220
	},
	{
	"epoch": 0.6114684737367135,
	"grad_norm": 0.339339941740036,
	"learning_rate": 1e-05,
	"loss": 0.4338,
	"step": 2222
	},
	{
	"epoch": 0.612018850400743,
	"grad_norm": 0.32705169916152954,
	"learning_rate": 1e-05,
	"loss": 0.4275,
	"step": 2224
	},
	{
	"epoch": 0.6125692270647725,
	"grad_norm": 0.3551005721092224,
	"learning_rate": 1e-05,
	"loss": 0.4365,
	"step": 2226
	},
	{
	"epoch": 0.6131196037288019,
	"grad_norm": 0.3826168179512024,
	"learning_rate": 1e-05,
	"loss": 0.4325,
	"step": 2228
	},
	{
	"epoch": 0.6136699803928314,
	"grad_norm": 0.376407653093338,
	"learning_rate": 1e-05,
	"loss": 0.4325,
	"step": 2230
	},
	{
	"epoch": 0.6142203570568608,
	"grad_norm": 0.3507418930530548,
	"learning_rate": 1e-05,
	"loss": 0.4315,
	"step": 2232
	},
	{
	"epoch": 0.6147707337208902,
	"grad_norm": 0.3515014946460724,
	"learning_rate": 1e-05,
	"loss": 0.4432,
	"step": 2234
	},
	{
	"epoch": 0.6153211103849197,
	"grad_norm": 0.37726324796676636,
	"learning_rate": 1e-05,
	"loss": 0.4389,
	"step": 2236
	},
	{
	"epoch": 0.6158714870489491,
	"grad_norm": 0.35043272376060486,
	"learning_rate": 1e-05,
	"loss": 0.4406,
	"step": 2238
	},
	{
	"epoch": 0.6164218637129786,
	"grad_norm": 0.3619838356971741,
	"learning_rate": 1e-05,
	"loss": 0.4381,
	"step": 2240
	},
	{
	"epoch": 0.616972240377008,
	"grad_norm": 0.3727911114692688,
	"learning_rate": 1e-05,
	"loss": 0.4261,
	"step": 2242
	},
	{
	"epoch": 0.6175226170410375,
	"grad_norm": 0.35618454217910767,
	"learning_rate": 1e-05,
	"loss": 0.4353,
	"step": 2244
	},
	{
	"epoch": 0.6180729937050669,
	"grad_norm": 0.3659394681453705,
	"learning_rate": 1e-05,
	"loss": 0.4281,
	"step": 2246
	},
	{
	"epoch": 0.6186233703690963,
	"grad_norm": 0.35864701867103577,
	"learning_rate": 1e-05,
	"loss": 0.4409,
	"step": 2248
	},
	{
	"epoch": 0.6191737470331258,
	"grad_norm": 0.36990123987197876,
	"learning_rate": 1e-05,
	"loss": 0.4424,
	"step": 2250
	},
	{
	"epoch": 0.6197241236971552,
	"grad_norm": 0.36422237753868103,
	"learning_rate": 1e-05,
	"loss": 0.4516,
	"step": 2252
	},
	{
	"epoch": 0.6202745003611847,
	"grad_norm": 0.34886521100997925,
	"learning_rate": 1e-05,
	"loss": 0.4299,
	"step": 2254
	},
	{
	"epoch": 0.6208248770252142,
	"grad_norm": 0.3683704137802124,
	"learning_rate": 1e-05,
	"loss": 0.4379,
	"step": 2256
	},
	{
	"epoch": 0.6213752536892436,
	"grad_norm": 0.3535701334476471,
	"learning_rate": 1e-05,
	"loss": 0.4292,
	"step": 2258
	},
	{
	"epoch": 0.621925630353273,
	"grad_norm": 0.370959997177124,
	"learning_rate": 1e-05,
	"loss": 0.4425,
	"step": 2260
	},
	{
	"epoch": 0.6224760070173024,
	"grad_norm": 0.3473008871078491,
	"learning_rate": 1e-05,
	"loss": 0.4289,
	"step": 2262
	},
	{
	"epoch": 0.6230263836813319,
	"grad_norm": 0.36245644092559814,
	"learning_rate": 1e-05,
	"loss": 0.4525,
	"step": 2264
	},
	{
	"epoch": 0.6235767603453614,
	"grad_norm": 0.37182751297950745,
	"learning_rate": 1e-05,
	"loss": 0.4438,
	"step": 2266
	},
	{
	"epoch": 0.6241271370093908,
	"grad_norm": 0.35843655467033386,
	"learning_rate": 1e-05,
	"loss": 0.4403,
	"step": 2268
	},
	{
	"epoch": 0.6246775136734203,
	"grad_norm": 0.3484828472137451,
	"learning_rate": 1e-05,
	"loss": 0.429,
	"step": 2270
	},
	{
	"epoch": 0.6252278903374497,
	"grad_norm": 0.35097572207450867,
	"learning_rate": 1e-05,
	"loss": 0.4435,
	"step": 2272
	},
	{
	"epoch": 0.6257782670014791,
	"grad_norm": 0.35911381244659424,
	"learning_rate": 1e-05,
	"loss": 0.435,
	"step": 2274
	},
	{
	"epoch": 0.6263286436655086,
	"grad_norm": 0.3544057309627533,
	"learning_rate": 1e-05,
	"loss": 0.4359,
	"step": 2276
	},
	{
	"epoch": 0.626879020329538,
	"grad_norm": 0.34516793489456177,
	"learning_rate": 1e-05,
	"loss": 0.4261,
	"step": 2278
	},
	{
	"epoch": 0.6274293969935675,
	"grad_norm": 0.3534994423389435,
	"learning_rate": 1e-05,
	"loss": 0.4539,
	"step": 2280
	},
	{
	"epoch": 0.6279797736575969,
	"grad_norm": 0.356238454580307,
	"learning_rate": 1e-05,
	"loss": 0.4321,
	"step": 2282
	},
	{
	"epoch": 0.6285301503216264,
	"grad_norm": 0.37285274267196655,
	"learning_rate": 1e-05,
	"loss": 0.4515,
	"step": 2284
	},
	{
	"epoch": 0.6290805269856559,
	"grad_norm": 0.3517172336578369,
	"learning_rate": 1e-05,
	"loss": 0.4268,
	"step": 2286
	},
	{
	"epoch": 0.6296309036496852,
	"grad_norm": 0.35732871294021606,
	"learning_rate": 1e-05,
	"loss": 0.4363,
	"step": 2288
	},
	{
	"epoch": 0.6301812803137147,
	"grad_norm": 0.3592797815799713,
	"learning_rate": 1e-05,
	"loss": 0.4424,
	"step": 2290
	},
	{
	"epoch": 0.6307316569777441,
	"grad_norm": 0.3233913481235504,
	"learning_rate": 1e-05,
	"loss": 0.421,
	"step": 2292
	},
	{
	"epoch": 0.6312820336417736,
	"grad_norm": 0.361591100692749,
	"learning_rate": 1e-05,
	"loss": 0.4299,
	"step": 2294
	},
	{
	"epoch": 0.6318324103058031,
	"grad_norm": 0.3468184173107147,
	"learning_rate": 1e-05,
	"loss": 0.4442,
	"step": 2296
	},
	{
	"epoch": 0.6323827869698325,
	"grad_norm": 0.4019412398338318,
	"learning_rate": 1e-05,
	"loss": 0.4453,
	"step": 2298
	},
	{
	"epoch": 0.6329331636338619,
	"grad_norm": 0.3713074326515198,
	"learning_rate": 1e-05,
	"loss": 0.435,
	"step": 2300
	},
	{
	"epoch": 0.6334835402978913,
	"grad_norm": 0.35839253664016724,
	"learning_rate": 1e-05,
	"loss": 0.4449,
	"step": 2302
	},
	{
	"epoch": 0.6340339169619208,
	"grad_norm": 0.33958542346954346,
	"learning_rate": 1e-05,
	"loss": 0.4433,
	"step": 2304
	},
	{
	"epoch": 0.6345842936259503,
	"grad_norm": 0.3750527501106262,
	"learning_rate": 1e-05,
	"loss": 0.4297,
	"step": 2306
	},
	{
	"epoch": 0.6351346702899797,
	"grad_norm": 0.35579168796539307,
	"learning_rate": 1e-05,
	"loss": 0.4307,
	"step": 2308
	},
	{
	"epoch": 0.6356850469540092,
	"grad_norm": 0.3424528241157532,
	"learning_rate": 1e-05,
	"loss": 0.4451,
	"step": 2310
	},
	{
	"epoch": 0.6362354236180386,
	"grad_norm": 0.3364480137825012,
	"learning_rate": 1e-05,
	"loss": 0.4251,
	"step": 2312
	},
	{
	"epoch": 0.636785800282068,
	"grad_norm": 0.35307276248931885,
	"learning_rate": 1e-05,
	"loss": 0.4221,
	"step": 2314
	},
	{
	"epoch": 0.6373361769460975,
	"grad_norm": 0.41354474425315857,
	"learning_rate": 1e-05,
	"loss": 0.4462,
	"step": 2316
	},
	{
	"epoch": 0.6378865536101269,
	"grad_norm": 0.37485471367836,
	"learning_rate": 1e-05,
	"loss": 0.4337,
	"step": 2318
	},
	{
	"epoch": 0.6384369302741564,
	"grad_norm": 0.344091534614563,
	"learning_rate": 1e-05,
	"loss": 0.43,
	"step": 2320
	},
	{
	"epoch": 0.6389873069381858,
	"grad_norm": 0.3772261440753937,
	"learning_rate": 1e-05,
	"loss": 0.4444,
	"step": 2322
	},
	{
	"epoch": 0.6395376836022153,
	"grad_norm": 0.35307928919792175,
	"learning_rate": 1e-05,
	"loss": 0.4332,
	"step": 2324
	},
	{
	"epoch": 0.6400880602662448,
	"grad_norm": 0.35815975069999695,
	"learning_rate": 1e-05,
	"loss": 0.4489,
	"step": 2326
	},
	{
	"epoch": 0.6406384369302741,
	"grad_norm": 0.3731154799461365,
	"learning_rate": 1e-05,
	"loss": 0.4355,
	"step": 2328
	},
	{
	"epoch": 0.6411888135943036,
	"grad_norm": 0.36875462532043457,
	"learning_rate": 1e-05,
	"loss": 0.4339,
	"step": 2330
	},
	{
	"epoch": 0.641739190258333,
	"grad_norm": 0.36913126707077026,
	"learning_rate": 1e-05,
	"loss": 0.4336,
	"step": 2332
	},
	{
	"epoch": 0.6422895669223625,
	"grad_norm": 0.35829678177833557,
	"learning_rate": 1e-05,
	"loss": 0.4438,
	"step": 2334
	},
	{
	"epoch": 0.642839943586392,
	"grad_norm": 0.36390239000320435,
	"learning_rate": 1e-05,
	"loss": 0.4405,
	"step": 2336
	},
	{
	"epoch": 0.6433903202504214,
	"grad_norm": 0.34786713123321533,
	"learning_rate": 1e-05,
	"loss": 0.451,
	"step": 2338
	},
	{
	"epoch": 0.6439406969144508,
	"grad_norm": 0.3522484600543976,
	"learning_rate": 1e-05,
	"loss": 0.4395,
	"step": 2340
	},
	{
	"epoch": 0.6444910735784802,
	"grad_norm": 0.36442965269088745,
	"learning_rate": 1e-05,
	"loss": 0.4204,
	"step": 2342
	},
	{
	"epoch": 0.6450414502425097,
	"grad_norm": 0.3635409474372864,
	"learning_rate": 1e-05,
	"loss": 0.4507,
	"step": 2344
	},
	{
	"epoch": 0.6455918269065392,
	"grad_norm": 0.35682952404022217,
	"learning_rate": 1e-05,
	"loss": 0.4333,
	"step": 2346
	},
	{
	"epoch": 0.6461422035705686,
	"grad_norm": 0.38101914525032043,
	"learning_rate": 1e-05,
	"loss": 0.4409,
	"step": 2348
	},
	{
	"epoch": 0.6466925802345981,
	"grad_norm": 0.37273916602134705,
	"learning_rate": 1e-05,
	"loss": 0.4386,
	"step": 2350
	},
	{
	"epoch": 0.6472429568986275,
	"grad_norm": 0.37394535541534424,
	"learning_rate": 1e-05,
	"loss": 0.4426,
	"step": 2352
	},
	{
	"epoch": 0.6477933335626569,
	"grad_norm": 0.3374865651130676,
	"learning_rate": 1e-05,
	"loss": 0.443,
	"step": 2354
	},
	{
	"epoch": 0.6483437102266864,
	"grad_norm": 0.34875357151031494,
	"learning_rate": 1e-05,
	"loss": 0.4135,
	"step": 2356
	},
	{
	"epoch": 0.6488940868907158,
	"grad_norm": 0.365508109331131,
	"learning_rate": 1e-05,
	"loss": 0.4455,
	"step": 2358
	},
	{
	"epoch": 0.6494444635547453,
	"grad_norm": 0.36924096941947937,
	"learning_rate": 1e-05,
	"loss": 0.4327,
	"step": 2360
	},
	{
	"epoch": 0.6499948402187747,
	"grad_norm": 0.3646699786186218,
	"learning_rate": 1e-05,
	"loss": 0.4324,
	"step": 2362
	},
	{
	"epoch": 0.6505452168828042,
	"grad_norm": 0.34241992235183716,
	"learning_rate": 1e-05,
	"loss": 0.4414,
	"step": 2364
	},
	{
	"epoch": 0.6510955935468337,
	"grad_norm": 0.3360735774040222,
	"learning_rate": 1e-05,
	"loss": 0.4228,
	"step": 2366
	},
	{
	"epoch": 0.651645970210863,
	"grad_norm": 0.3782423138618469,
	"learning_rate": 1e-05,
	"loss": 0.4366,
	"step": 2368
	},
	{
	"epoch": 0.6521963468748925,
	"grad_norm": 0.3839074373245239,
	"learning_rate": 1e-05,
	"loss": 0.4389,
	"step": 2370
	},
	{
	"epoch": 0.6527467235389219,
	"grad_norm": 0.3636200726032257,
	"learning_rate": 1e-05,
	"loss": 0.4418,
	"step": 2372
	},
	{
	"epoch": 0.6532971002029514,
	"grad_norm": 0.3629804253578186,
	"learning_rate": 1e-05,
	"loss": 0.4259,
	"step": 2374
	},
	{
	"epoch": 0.6538474768669809,
	"grad_norm": 0.3819858133792877,
	"learning_rate": 1e-05,
	"loss": 0.4348,
	"step": 2376
	},
	{
	"epoch": 0.6543978535310103,
	"grad_norm": 0.3597410321235657,
	"learning_rate": 1e-05,
	"loss": 0.428,
	"step": 2378
	},
	{
	"epoch": 0.6549482301950398,
	"grad_norm": 0.4084703326225281,
	"learning_rate": 1e-05,
	"loss": 0.4478,
	"step": 2380
	},
	{
	"epoch": 0.6554986068590691,
	"grad_norm": 0.35995879769325256,
	"learning_rate": 1e-05,
	"loss": 0.4356,
	"step": 2382
	},
	{
	"epoch": 0.6560489835230986,
	"grad_norm": 0.36047980189323425,
	"learning_rate": 1e-05,
	"loss": 0.4479,
	"step": 2384
	},
	{
	"epoch": 0.6565993601871281,
	"grad_norm": 0.3532986342906952,
	"learning_rate": 1e-05,
	"loss": 0.424,
	"step": 2386
	},
	{
	"epoch": 0.6571497368511575,
	"grad_norm": 0.3374999761581421,
	"learning_rate": 1e-05,
	"loss": 0.4338,
	"step": 2388
	},
	{
	"epoch": 0.657700113515187,
	"grad_norm": 0.34645605087280273,
	"learning_rate": 1e-05,
	"loss": 0.4257,
	"step": 2390
	},
	{
	"epoch": 0.6582504901792164,
	"grad_norm": 0.36470580101013184,
	"learning_rate": 1e-05,
	"loss": 0.4414,
	"step": 2392
	},
	{
	"epoch": 0.6588008668432458,
	"grad_norm": 0.3823862075805664,
	"learning_rate": 1e-05,
	"loss": 0.4306,
	"step": 2394
	},
	{
	"epoch": 0.6593512435072753,
	"grad_norm": 0.4070727229118347,
	"learning_rate": 1e-05,
	"loss": 0.4322,
	"step": 2396
	},
	{
	"epoch": 0.6599016201713047,
	"grad_norm": 0.37519609928131104,
	"learning_rate": 1e-05,
	"loss": 0.4248,
	"step": 2398
	},
	{
	"epoch": 0.6604519968353342,
	"grad_norm": 0.35447025299072266,
	"learning_rate": 1e-05,
	"loss": 0.4283,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_merge_loss": 0.37715020775794983,
	"eval_merge_runtime": 600.5757,
	"eval_merge_samples_per_second": 56.199,
	"eval_merge_steps_per_second": 2.343,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_new_aug_datas_filtered.json_loss": 0.5012194514274597,
	"eval_new_aug_datas_filtered.json_runtime": 10.4212,
	"eval_new_aug_datas_filtered.json_samples_per_second": 73.6,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.071,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_sharegpt_gpt4.json_loss": 0.7534219026565552,
	"eval_sharegpt_gpt4.json_runtime": 31.7308,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.65,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.458,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_Table_GPT.json_loss": 0.050881169736385345,
	"eval_Table_GPT.json_runtime": 24.9922,
	"eval_Table_GPT.json_samples_per_second": 83.746,
	"eval_Table_GPT.json_steps_per_second": 3.521,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_gpt_4o_200k.json_loss": 0.7805712223052979,
	"eval_gpt_4o_200k.json_runtime": 48.518,
	"eval_gpt_4o_200k.json_samples_per_second": 129.457,
	"eval_gpt_4o_200k.json_steps_per_second": 5.4,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_multi_turn_datas.json_loss": 0.3069368898868561,
	"eval_multi_turn_datas.json_runtime": 75.8513,
	"eval_multi_turn_datas.json_samples_per_second": 52.761,
	"eval_multi_turn_datas.json_steps_per_second": 2.202,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_table_python_code_datas.json_loss": 0.2562294006347656,
	"eval_table_python_code_datas.json_runtime": 43.1545,
	"eval_table_python_code_datas.json_samples_per_second": 50.03,
	"eval_table_python_code_datas.json_steps_per_second": 2.086,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_tabular_llm_data.json_loss": 0.09128429740667343,
	"eval_tabular_llm_data.json_runtime": 8.5524,
	"eval_tabular_llm_data.json_samples_per_second": 28.764,
	"eval_tabular_llm_data.json_steps_per_second": 1.286,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_python_code_critic_21k.json_loss": 0.5555644631385803,
	"eval_python_code_critic_21k.json_runtime": 3.2271,
	"eval_python_code_critic_21k.json_samples_per_second": 184.994,
	"eval_python_code_critic_21k.json_steps_per_second": 7.747,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_all_merge_table_dataset.json_loss": 0.07006299495697021,
	"eval_all_merge_table_dataset.json_runtime": 23.358,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.482,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.284,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_code_feedback_multi_turn.json_loss": 0.5720005035400391,
	"eval_code_feedback_multi_turn.json_runtime": 32.5016,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.72,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.831,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_ultrainteract_sft.json_loss": 0.4097177982330322,
	"eval_ultrainteract_sft.json_runtime": 8.6753,
	"eval_ultrainteract_sft.json_samples_per_second": 167.832,
	"eval_ultrainteract_sft.json_steps_per_second": 7.031,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_synthetic_text_to_sql.json_loss": 0.09309177845716476,
	"eval_synthetic_text_to_sql.json_runtime": 0.1257,
	"eval_synthetic_text_to_sql.json_samples_per_second": 270.423,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.907,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_sft_react_sql_datas.json_loss": 0.6212250590324402,
	"eval_sft_react_sql_datas.json_runtime": 7.859,
	"eval_sft_react_sql_datas.json_samples_per_second": 39.954,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.781,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_all_merge_code.json_loss": 0.28449881076812744,
	"eval_all_merge_code.json_runtime": 0.3298,
	"eval_all_merge_code.json_samples_per_second": 191.001,
	"eval_all_merge_code.json_steps_per_second": 9.095,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_magpie_datas.json_loss": 0.426034539937973,
	"eval_magpie_datas.json_runtime": 2.2154,
	"eval_magpie_datas.json_samples_per_second": 77.638,
	"eval_magpie_datas.json_steps_per_second": 3.611,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_train_data_for_qwen.json_loss": 0.005596214439719915,
	"eval_train_data_for_qwen.json_runtime": 0.2424,
	"eval_train_data_for_qwen.json_samples_per_second": 41.251,
	"eval_train_data_for_qwen.json_steps_per_second": 4.125,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_alpaca_cleaned.json_loss": 0.9008170962333679,
	"eval_alpaca_cleaned.json_runtime": 0.1147,
	"eval_alpaca_cleaned.json_samples_per_second": 235.421,
	"eval_alpaca_cleaned.json_steps_per_second": 17.439,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_agent_instruct.json_loss": 0.21443764865398407,
	"eval_agent_instruct.json_runtime": 0.5141,
	"eval_agent_instruct.json_samples_per_second": 93.36,
	"eval_agent_instruct.json_steps_per_second": 3.89,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_MathInstruct.json_loss": 0.1956825852394104,
	"eval_MathInstruct.json_runtime": 0.3499,
	"eval_MathInstruct.json_samples_per_second": 162.885,
	"eval_MathInstruct.json_steps_per_second": 8.573,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_tested_143k_python_alpaca.json_loss": 0.4434005320072174,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3023,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.46,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.615,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_xlam_function_calling_60k.json_loss": 0.009229443967342377,
	"eval_xlam_function_calling_60k.json_runtime": 0.1004,
	"eval_xlam_function_calling_60k.json_samples_per_second": 229.185,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.965,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.5269618034362793,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0516,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 310.215,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.388,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_alpaca_gpt4_zh.json_loss": 0.9699357151985168,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0505,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 217.964,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.815,
	"step": 2400
	},
	{
	"epoch": 0.6604519968353342,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5749525427818298,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4875,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.023,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.051,
	"step": 2400
	},
	{
	"epoch": 0.6610023734993636,
	"grad_norm": 0.38521307706832886,
	"learning_rate": 1e-05,
	"loss": 0.4408,
	"step": 2402
	},
	{
	"epoch": 0.6615527501633931,
	"grad_norm": 0.35963118076324463,
	"learning_rate": 1e-05,
	"loss": 0.4252,
	"step": 2404
	},
	{
	"epoch": 0.6621031268274226,
	"grad_norm": 0.34755435585975647,
	"learning_rate": 1e-05,
	"loss": 0.4319,
	"step": 2406
	},
	{
	"epoch": 0.6626535034914519,
	"grad_norm": 0.37133127450942993,
	"learning_rate": 1e-05,
	"loss": 0.4237,
	"step": 2408
	},
	{
	"epoch": 0.6632038801554814,
	"grad_norm": 0.35870301723480225,
	"learning_rate": 1e-05,
	"loss": 0.4388,
	"step": 2410
	},
	{
	"epoch": 0.6637542568195108,
	"grad_norm": 0.357415109872818,
	"learning_rate": 1e-05,
	"loss": 0.4322,
	"step": 2412
	},
	{
	"epoch": 0.6643046334835403,
	"grad_norm": 0.3610486090183258,
	"learning_rate": 1e-05,
	"loss": 0.434,
	"step": 2414
	},
	{
	"epoch": 0.6648550101475698,
	"grad_norm": 0.35058531165122986,
	"learning_rate": 1e-05,
	"loss": 0.4325,
	"step": 2416
	},
	{
	"epoch": 0.6654053868115992,
	"grad_norm": 0.3732353448867798,
	"learning_rate": 1e-05,
	"loss": 0.4266,
	"step": 2418
	},
	{
	"epoch": 0.6659557634756287,
	"grad_norm": 0.3728616535663605,
	"learning_rate": 1e-05,
	"loss": 0.4373,
	"step": 2420
	},
	{
	"epoch": 0.666506140139658,
	"grad_norm": 0.3697822093963623,
	"learning_rate": 1e-05,
	"loss": 0.4263,
	"step": 2422
	},
	{
	"epoch": 0.6670565168036875,
	"grad_norm": 0.34242671728134155,
	"learning_rate": 1e-05,
	"loss": 0.4234,
	"step": 2424
	},
	{
	"epoch": 0.667606893467717,
	"grad_norm": 0.34660401940345764,
	"learning_rate": 1e-05,
	"loss": 0.4438,
	"step": 2426
	},
	{
	"epoch": 0.6681572701317464,
	"grad_norm": 0.36335524916648865,
	"learning_rate": 1e-05,
	"loss": 0.447,
	"step": 2428
	},
	{
	"epoch": 0.6687076467957759,
	"grad_norm": 0.39879950881004333,
	"learning_rate": 1e-05,
	"loss": 0.4328,
	"step": 2430
	},
	{
	"epoch": 0.6692580234598053,
	"grad_norm": 0.3318917453289032,
	"learning_rate": 1e-05,
	"loss": 0.418,
	"step": 2432
	},
	{
	"epoch": 0.6698084001238348,
	"grad_norm": 0.3548910319805145,
	"learning_rate": 1e-05,
	"loss": 0.4297,
	"step": 2434
	},
	{
	"epoch": 0.6703587767878642,
	"grad_norm": 0.35431650280952454,
	"learning_rate": 1e-05,
	"loss": 0.4442,
	"step": 2436
	},
	{
	"epoch": 0.6709091534518936,
	"grad_norm": 0.3501831889152527,
	"learning_rate": 1e-05,
	"loss": 0.4231,
	"step": 2438
	},
	{
	"epoch": 0.6714595301159231,
	"grad_norm": 0.3664182424545288,
	"learning_rate": 1e-05,
	"loss": 0.4307,
	"step": 2440
	},
	{
	"epoch": 0.6720099067799525,
	"grad_norm": 0.36051392555236816,
	"learning_rate": 1e-05,
	"loss": 0.4348,
	"step": 2442
	},
	{
	"epoch": 0.672560283443982,
	"grad_norm": 0.38968268036842346,
	"learning_rate": 1e-05,
	"loss": 0.44,
	"step": 2444
	},
	{
	"epoch": 0.6731106601080115,
	"grad_norm": 0.34485840797424316,
	"learning_rate": 1e-05,
	"loss": 0.4387,
	"step": 2446
	},
	{
	"epoch": 0.6736610367720408,
	"grad_norm": 0.36389604210853577,
	"learning_rate": 1e-05,
	"loss": 0.4279,
	"step": 2448
	},
	{
	"epoch": 0.6742114134360703,
	"grad_norm": 0.3703545331954956,
	"learning_rate": 1e-05,
	"loss": 0.4498,
	"step": 2450
	},
	{
	"epoch": 0.6747617901000997,
	"grad_norm": 0.34628036618232727,
	"learning_rate": 1e-05,
	"loss": 0.4145,
	"step": 2452
	},
	{
	"epoch": 0.6753121667641292,
	"grad_norm": 0.3569451570510864,
	"learning_rate": 1e-05,
	"loss": 0.4308,
	"step": 2454
	},
	{
	"epoch": 0.6758625434281587,
	"grad_norm": 0.3471825122833252,
	"learning_rate": 1e-05,
	"loss": 0.4299,
	"step": 2456
	},
	{
	"epoch": 0.6764129200921881,
	"grad_norm": 0.37446585297584534,
	"learning_rate": 1e-05,
	"loss": 0.4417,
	"step": 2458
	},
	{
	"epoch": 0.6769632967562176,
	"grad_norm": 0.355708509683609,
	"learning_rate": 1e-05,
	"loss": 0.4306,
	"step": 2460
	},
	{
	"epoch": 0.6775136734202469,
	"grad_norm": 0.36398351192474365,
	"learning_rate": 1e-05,
	"loss": 0.4331,
	"step": 2462
	},
	{
	"epoch": 0.6780640500842764,
	"grad_norm": 0.38390782475471497,
	"learning_rate": 1e-05,
	"loss": 0.4421,
	"step": 2464
	},
	{
	"epoch": 0.6786144267483059,
	"grad_norm": 0.3586190938949585,
	"learning_rate": 1e-05,
	"loss": 0.4365,
	"step": 2466
	},
	{
	"epoch": 0.6791648034123353,
	"grad_norm": 0.33874934911727905,
	"learning_rate": 1e-05,
	"loss": 0.4346,
	"step": 2468
	},
	{
	"epoch": 0.6797151800763648,
	"grad_norm": 0.3699466586112976,
	"learning_rate": 1e-05,
	"loss": 0.4282,
	"step": 2470
	},
	{
	"epoch": 0.6802655567403942,
	"grad_norm": 0.35685962438583374,
	"learning_rate": 1e-05,
	"loss": 0.4386,
	"step": 2472
	},
	{
	"epoch": 0.6808159334044237,
	"grad_norm": 0.36509183049201965,
	"learning_rate": 1e-05,
	"loss": 0.4234,
	"step": 2474
	},
	{
	"epoch": 0.681366310068453,
	"grad_norm": 0.3677407503128052,
	"learning_rate": 1e-05,
	"loss": 0.4327,
	"step": 2476
	},
	{
	"epoch": 0.6819166867324825,
	"grad_norm": 0.361396849155426,
	"learning_rate": 1e-05,
	"loss": 0.4282,
	"step": 2478
	},
	{
	"epoch": 0.682467063396512,
	"grad_norm": 0.3637540936470032,
	"learning_rate": 1e-05,
	"loss": 0.4304,
	"step": 2480
	},
	{
	"epoch": 0.6830174400605414,
	"grad_norm": 0.38396722078323364,
	"learning_rate": 1e-05,
	"loss": 0.4326,
	"step": 2482
	},
	{
	"epoch": 0.6835678167245709,
	"grad_norm": 0.3760308623313904,
	"learning_rate": 1e-05,
	"loss": 0.4288,
	"step": 2484
	},
	{
	"epoch": 0.6841181933886004,
	"grad_norm": 0.36777281761169434,
	"learning_rate": 1e-05,
	"loss": 0.4435,
	"step": 2486
	},
	{
	"epoch": 0.6846685700526298,
	"grad_norm": 0.36967626214027405,
	"learning_rate": 1e-05,
	"loss": 0.4247,
	"step": 2488
	},
	{
	"epoch": 0.6852189467166592,
	"grad_norm": 0.37309199571609497,
	"learning_rate": 1e-05,
	"loss": 0.4514,
	"step": 2490
	},
	{
	"epoch": 0.6857693233806886,
	"grad_norm": 0.35478582978248596,
	"learning_rate": 1e-05,
	"loss": 0.436,
	"step": 2492
	},
	{
	"epoch": 0.6863197000447181,
	"grad_norm": 0.35142141580581665,
	"learning_rate": 1e-05,
	"loss": 0.4289,
	"step": 2494
	},
	{
	"epoch": 0.6868700767087476,
	"grad_norm": 0.37468215823173523,
	"learning_rate": 1e-05,
	"loss": 0.4363,
	"step": 2496
	},
	{
	"epoch": 0.687420453372777,
	"grad_norm": 0.3481496572494507,
	"learning_rate": 1e-05,
	"loss": 0.441,
	"step": 2498
	},
	{
	"epoch": 0.6879708300368065,
	"grad_norm": 0.34628838300704956,
	"learning_rate": 1e-05,
	"loss": 0.4425,
	"step": 2500
	},
	{
	"epoch": 0.6885212067008358,
	"grad_norm": 0.3759724497795105,
	"learning_rate": 1e-05,
	"loss": 0.4322,
	"step": 2502
	},
	{
	"epoch": 0.6890715833648653,
	"grad_norm": 0.37153902649879456,
	"learning_rate": 1e-05,
	"loss": 0.4412,
	"step": 2504
	},
	{
	"epoch": 0.6896219600288948,
	"grad_norm": 0.3601967990398407,
	"learning_rate": 1e-05,
	"loss": 0.4314,
	"step": 2506
	},
	{
	"epoch": 0.6901723366929242,
	"grad_norm": 0.3510344326496124,
	"learning_rate": 1e-05,
	"loss": 0.4261,
	"step": 2508
	},
	{
	"epoch": 0.6907227133569537,
	"grad_norm": 0.34007585048675537,
	"learning_rate": 1e-05,
	"loss": 0.4272,
	"step": 2510
	},
	{
	"epoch": 0.6912730900209831,
	"grad_norm": 0.34424078464508057,
	"learning_rate": 1e-05,
	"loss": 0.4253,
	"step": 2512
	},
	{
	"epoch": 0.6918234666850126,
	"grad_norm": 0.36498820781707764,
	"learning_rate": 1e-05,
	"loss": 0.434,
	"step": 2514
	},
	{
	"epoch": 0.692373843349042,
	"grad_norm": 0.3697148859500885,
	"learning_rate": 1e-05,
	"loss": 0.4358,
	"step": 2516
	},
	{
	"epoch": 0.6929242200130714,
	"grad_norm": 0.36114463210105896,
	"learning_rate": 1e-05,
	"loss": 0.4177,
	"step": 2518
	},
	{
	"epoch": 0.6934745966771009,
	"grad_norm": 0.3630925714969635,
	"learning_rate": 1e-05,
	"loss": 0.4438,
	"step": 2520
	},
	{
	"epoch": 0.6940249733411303,
	"grad_norm": 0.36949414014816284,
	"learning_rate": 1e-05,
	"loss": 0.4281,
	"step": 2522
	},
	{
	"epoch": 0.6945753500051598,
	"grad_norm": 0.36324694752693176,
	"learning_rate": 1e-05,
	"loss": 0.4253,
	"step": 2524
	},
	{
	"epoch": 0.6951257266691893,
	"grad_norm": 0.3471947908401489,
	"learning_rate": 1e-05,
	"loss": 0.4215,
	"step": 2526
	},
	{
	"epoch": 0.6956761033332187,
	"grad_norm": 0.33943814039230347,
	"learning_rate": 1e-05,
	"loss": 0.4546,
	"step": 2528
	},
	{
	"epoch": 0.6962264799972481,
	"grad_norm": 0.34675729274749756,
	"learning_rate": 1e-05,
	"loss": 0.4191,
	"step": 2530
	},
	{
	"epoch": 0.6967768566612775,
	"grad_norm": 0.3519613742828369,
	"learning_rate": 1e-05,
	"loss": 0.4272,
	"step": 2532
	},
	{
	"epoch": 0.697327233325307,
	"grad_norm": 0.3635639548301697,
	"learning_rate": 1e-05,
	"loss": 0.4489,
	"step": 2534
	},
	{
	"epoch": 0.6978776099893365,
	"grad_norm": 0.3636915385723114,
	"learning_rate": 1e-05,
	"loss": 0.4233,
	"step": 2536
	},
	{
	"epoch": 0.6984279866533659,
	"grad_norm": 0.36174023151397705,
	"learning_rate": 1e-05,
	"loss": 0.425,
	"step": 2538
	},
	{
	"epoch": 0.6989783633173954,
	"grad_norm": 0.35721176862716675,
	"learning_rate": 1e-05,
	"loss": 0.4279,
	"step": 2540
	},
	{
	"epoch": 0.6995287399814248,
	"grad_norm": 0.35394319891929626,
	"learning_rate": 1e-05,
	"loss": 0.4279,
	"step": 2542
	},
	{
	"epoch": 0.7000791166454542,
	"grad_norm": 0.37505972385406494,
	"learning_rate": 1e-05,
	"loss": 0.423,
	"step": 2544
	},
	{
	"epoch": 0.7006294933094837,
	"grad_norm": 0.3504476249217987,
	"learning_rate": 1e-05,
	"loss": 0.4212,
	"step": 2546
	},
	{
	"epoch": 0.7011798699735131,
	"grad_norm": 0.39700883626937866,
	"learning_rate": 1e-05,
	"loss": 0.4257,
	"step": 2548
	},
	{
	"epoch": 0.7017302466375426,
	"grad_norm": 0.36360886693000793,
	"learning_rate": 1e-05,
	"loss": 0.4276,
	"step": 2550
	},
	{
	"epoch": 0.702280623301572,
	"grad_norm": 0.36123448610305786,
	"learning_rate": 1e-05,
	"loss": 0.4266,
	"step": 2552
	},
	{
	"epoch": 0.7028309999656015,
	"grad_norm": 0.35183826088905334,
	"learning_rate": 1e-05,
	"loss": 0.421,
	"step": 2554
	},
	{
	"epoch": 0.7033813766296309,
	"grad_norm": 0.3557921350002289,
	"learning_rate": 1e-05,
	"loss": 0.4239,
	"step": 2556
	},
	{
	"epoch": 0.7039317532936603,
	"grad_norm": 0.35415929555892944,
	"learning_rate": 1e-05,
	"loss": 0.4216,
	"step": 2558
	},
	{
	"epoch": 0.7044821299576898,
	"grad_norm": 0.3662279546260834,
	"learning_rate": 1e-05,
	"loss": 0.4268,
	"step": 2560
	},
	{
	"epoch": 0.7050325066217192,
	"grad_norm": 0.35718172788619995,
	"learning_rate": 1e-05,
	"loss": 0.4213,
	"step": 2562
	},
	{
	"epoch": 0.7055828832857487,
	"grad_norm": 0.3595860004425049,
	"learning_rate": 1e-05,
	"loss": 0.4398,
	"step": 2564
	},
	{
	"epoch": 0.7061332599497782,
	"grad_norm": 0.3576621413230896,
	"learning_rate": 1e-05,
	"loss": 0.4263,
	"step": 2566
	},
	{
	"epoch": 0.7066836366138076,
	"grad_norm": 0.3699706792831421,
	"learning_rate": 1e-05,
	"loss": 0.4331,
	"step": 2568
	},
	{
	"epoch": 0.707234013277837,
	"grad_norm": 0.38423609733581543,
	"learning_rate": 1e-05,
	"loss": 0.436,
	"step": 2570
	},
	{
	"epoch": 0.7077843899418664,
	"grad_norm": 0.3747715651988983,
	"learning_rate": 1e-05,
	"loss": 0.4335,
	"step": 2572
	},
	{
	"epoch": 0.7083347666058959,
	"grad_norm": 0.3554603159427643,
	"learning_rate": 1e-05,
	"loss": 0.4236,
	"step": 2574
	},
	{
	"epoch": 0.7088851432699254,
	"grad_norm": 0.35446056723594666,
	"learning_rate": 1e-05,
	"loss": 0.4235,
	"step": 2576
	},
	{
	"epoch": 0.7094355199339548,
	"grad_norm": 0.3770659267902374,
	"learning_rate": 1e-05,
	"loss": 0.4344,
	"step": 2578
	},
	{
	"epoch": 0.7099858965979843,
	"grad_norm": 0.35676074028015137,
	"learning_rate": 1e-05,
	"loss": 0.4241,
	"step": 2580
	},
	{
	"epoch": 0.7105362732620137,
	"grad_norm": 0.3687559962272644,
	"learning_rate": 1e-05,
	"loss": 0.4329,
	"step": 2582
	},
	{
	"epoch": 0.7110866499260431,
	"grad_norm": 0.35311195254325867,
	"learning_rate": 1e-05,
	"loss": 0.4355,
	"step": 2584
	},
	{
	"epoch": 0.7116370265900726,
	"grad_norm": 0.3590395152568817,
	"learning_rate": 1e-05,
	"loss": 0.4213,
	"step": 2586
	},
	{
	"epoch": 0.712187403254102,
	"grad_norm": 0.3694981336593628,
	"learning_rate": 1e-05,
	"loss": 0.4344,
	"step": 2588
	},
	{
	"epoch": 0.7127377799181315,
	"grad_norm": 0.3516077399253845,
	"learning_rate": 1e-05,
	"loss": 0.4202,
	"step": 2590
	},
	{
	"epoch": 0.7132881565821609,
	"grad_norm": 0.38859254121780396,
	"learning_rate": 1e-05,
	"loss": 0.4179,
	"step": 2592
	},
	{
	"epoch": 0.7138385332461904,
	"grad_norm": 0.3825247883796692,
	"learning_rate": 1e-05,
	"loss": 0.4393,
	"step": 2594
	},
	{
	"epoch": 0.7143889099102199,
	"grad_norm": 0.36817750334739685,
	"learning_rate": 1e-05,
	"loss": 0.4341,
	"step": 2596
	},
	{
	"epoch": 0.7149392865742492,
	"grad_norm": 0.36351174116134644,
	"learning_rate": 1e-05,
	"loss": 0.4355,
	"step": 2598
	},
	{
	"epoch": 0.7154896632382787,
	"grad_norm": 0.3494237959384918,
	"learning_rate": 1e-05,
	"loss": 0.4176,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_merge_loss": 0.3735547661781311,
	"eval_merge_runtime": 599.6483,
	"eval_merge_samples_per_second": 56.286,
	"eval_merge_steps_per_second": 2.346,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_new_aug_datas_filtered.json_loss": 0.4953900873661041,
	"eval_new_aug_datas_filtered.json_runtime": 10.4567,
	"eval_new_aug_datas_filtered.json_samples_per_second": 73.35,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.06,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_sharegpt_gpt4.json_loss": 0.748174786567688,
	"eval_sharegpt_gpt4.json_runtime": 31.7349,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.642,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.458,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_Table_GPT.json_loss": 0.04870549216866493,
	"eval_Table_GPT.json_runtime": 25.0368,
	"eval_Table_GPT.json_samples_per_second": 83.597,
	"eval_Table_GPT.json_steps_per_second": 3.515,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_gpt_4o_200k.json_loss": 0.775393009185791,
	"eval_gpt_4o_200k.json_runtime": 48.6152,
	"eval_gpt_4o_200k.json_samples_per_second": 129.198,
	"eval_gpt_4o_200k.json_steps_per_second": 5.389,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_multi_turn_datas.json_loss": 0.29874685406684875,
	"eval_multi_turn_datas.json_runtime": 75.9064,
	"eval_multi_turn_datas.json_samples_per_second": 52.723,
	"eval_multi_turn_datas.json_steps_per_second": 2.2,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_table_python_code_datas.json_loss": 0.2535416781902313,
	"eval_table_python_code_datas.json_runtime": 43.2787,
	"eval_table_python_code_datas.json_samples_per_second": 49.886,
	"eval_table_python_code_datas.json_steps_per_second": 2.08,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_tabular_llm_data.json_loss": 0.08522781729698181,
	"eval_tabular_llm_data.json_runtime": 8.609,
	"eval_tabular_llm_data.json_samples_per_second": 28.575,
	"eval_tabular_llm_data.json_steps_per_second": 1.278,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_python_code_critic_21k.json_loss": 0.5531289577484131,
	"eval_python_code_critic_21k.json_runtime": 3.2416,
	"eval_python_code_critic_21k.json_samples_per_second": 184.167,
	"eval_python_code_critic_21k.json_steps_per_second": 7.712,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_all_merge_table_dataset.json_loss": 0.07141314446926117,
	"eval_all_merge_table_dataset.json_runtime": 23.4197,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.402,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.281,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_code_feedback_multi_turn.json_loss": 0.5697857737541199,
	"eval_code_feedback_multi_turn.json_runtime": 32.4913,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.741,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.832,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_ultrainteract_sft.json_loss": 0.406777024269104,
	"eval_ultrainteract_sft.json_runtime": 8.6553,
	"eval_ultrainteract_sft.json_samples_per_second": 168.22,
	"eval_ultrainteract_sft.json_steps_per_second": 7.048,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_synthetic_text_to_sql.json_loss": 0.09255770593881607,
	"eval_synthetic_text_to_sql.json_runtime": 0.1264,
	"eval_synthetic_text_to_sql.json_samples_per_second": 268.887,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.817,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_sft_react_sql_datas.json_loss": 0.6156443953514099,
	"eval_sft_react_sql_datas.json_runtime": 7.8669,
	"eval_sft_react_sql_datas.json_samples_per_second": 39.914,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.78,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_all_merge_code.json_loss": 0.2804557681083679,
	"eval_all_merge_code.json_runtime": 0.3331,
	"eval_all_merge_code.json_samples_per_second": 189.109,
	"eval_all_merge_code.json_steps_per_second": 9.005,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_magpie_datas.json_loss": 0.42615047097206116,
	"eval_magpie_datas.json_runtime": 2.2188,
	"eval_magpie_datas.json_samples_per_second": 77.518,
	"eval_magpie_datas.json_steps_per_second": 3.605,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_train_data_for_qwen.json_loss": 0.005531710106879473,
	"eval_train_data_for_qwen.json_runtime": 0.2446,
	"eval_train_data_for_qwen.json_samples_per_second": 40.888,
	"eval_train_data_for_qwen.json_steps_per_second": 4.089,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_alpaca_cleaned.json_loss": 0.8993179202079773,
	"eval_alpaca_cleaned.json_runtime": 0.1158,
	"eval_alpaca_cleaned.json_samples_per_second": 233.205,
	"eval_alpaca_cleaned.json_steps_per_second": 17.274,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_agent_instruct.json_loss": 0.20902203023433685,
	"eval_agent_instruct.json_runtime": 0.5148,
	"eval_agent_instruct.json_samples_per_second": 93.239,
	"eval_agent_instruct.json_steps_per_second": 3.885,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_MathInstruct.json_loss": 0.20088934898376465,
	"eval_MathInstruct.json_runtime": 0.3521,
	"eval_MathInstruct.json_samples_per_second": 161.889,
	"eval_MathInstruct.json_steps_per_second": 8.52,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_tested_143k_python_alpaca.json_loss": 0.44206199049949646,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3013,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.861,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.639,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_xlam_function_calling_60k.json_loss": 0.00838589109480381,
	"eval_xlam_function_calling_60k.json_runtime": 0.1004,
	"eval_xlam_function_calling_60k.json_samples_per_second": 229.101,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.961,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.5224987268447876,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0517,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 309.243,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.328,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_alpaca_gpt4_zh.json_loss": 0.9841532111167908,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0501,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 219.503,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 19.955,
	"step": 2600
	},
	{
	"epoch": 0.7154896632382787,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5787987112998962,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4863,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.126,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.056,
	"step": 2600
	},
	{
	"epoch": 0.7160400399023081,
	"grad_norm": 0.3617021143436432,
	"learning_rate": 1e-05,
	"loss": 0.4292,
	"step": 2602
	},
	{
	"epoch": 0.7165904165663376,
	"grad_norm": 0.39201030135154724,
	"learning_rate": 1e-05,
	"loss": 0.4565,
	"step": 2604
	},
	{
	"epoch": 0.7171407932303671,
	"grad_norm": 0.3617227077484131,
	"learning_rate": 1e-05,
	"loss": 0.4279,
	"step": 2606
	},
	{
	"epoch": 0.7176911698943965,
	"grad_norm": 0.3502630591392517,
	"learning_rate": 1e-05,
	"loss": 0.4191,
	"step": 2608
	},
	{
	"epoch": 0.7182415465584259,
	"grad_norm": 0.41853633522987366,
	"learning_rate": 1e-05,
	"loss": 0.4122,
	"step": 2610
	},
	{
	"epoch": 0.7187919232224553,
	"grad_norm": 0.35474300384521484,
	"learning_rate": 1e-05,
	"loss": 0.4225,
	"step": 2612
	},
	{
	"epoch": 0.7193422998864848,
	"grad_norm": 0.3673190772533417,
	"learning_rate": 1e-05,
	"loss": 0.4307,
	"step": 2614
	},
	{
	"epoch": 0.7198926765505143,
	"grad_norm": 0.383365273475647,
	"learning_rate": 1e-05,
	"loss": 0.4335,
	"step": 2616
	},
	{
	"epoch": 0.7204430532145437,
	"grad_norm": 0.35813844203948975,
	"learning_rate": 1e-05,
	"loss": 0.4462,
	"step": 2618
	},
	{
	"epoch": 0.7209934298785732,
	"grad_norm": 0.7552120685577393,
	"learning_rate": 1e-05,
	"loss": 0.4209,
	"step": 2620
	},
	{
	"epoch": 0.7215438065426026,
	"grad_norm": 0.365175724029541,
	"learning_rate": 1e-05,
	"loss": 0.441,
	"step": 2622
	},
	{
	"epoch": 0.722094183206632,
	"grad_norm": 0.3450736701488495,
	"learning_rate": 1e-05,
	"loss": 0.4302,
	"step": 2624
	},
	{
	"epoch": 0.7226445598706615,
	"grad_norm": 0.34044018387794495,
	"learning_rate": 1e-05,
	"loss": 0.4265,
	"step": 2626
	},
	{
	"epoch": 0.7231949365346909,
	"grad_norm": 0.36393091082572937,
	"learning_rate": 1e-05,
	"loss": 0.4226,
	"step": 2628
	},
	{
	"epoch": 0.7237453131987204,
	"grad_norm": 0.3462166488170624,
	"learning_rate": 1e-05,
	"loss": 0.4236,
	"step": 2630
	},
	{
	"epoch": 0.7242956898627498,
	"grad_norm": 0.4024192988872528,
	"learning_rate": 1e-05,
	"loss": 0.4377,
	"step": 2632
	},
	{
	"epoch": 0.7248460665267793,
	"grad_norm": 0.354809045791626,
	"learning_rate": 1e-05,
	"loss": 0.4245,
	"step": 2634
	},
	{
	"epoch": 0.7253964431908088,
	"grad_norm": 0.3701523244380951,
	"learning_rate": 1e-05,
	"loss": 0.438,
	"step": 2636
	},
	{
	"epoch": 0.7259468198548381,
	"grad_norm": 0.37080636620521545,
	"learning_rate": 1e-05,
	"loss": 0.4299,
	"step": 2638
	},
	{
	"epoch": 0.7264971965188676,
	"grad_norm": 0.3205287754535675,
	"learning_rate": 1e-05,
	"loss": 0.4193,
	"step": 2640
	},
	{
	"epoch": 0.727047573182897,
	"grad_norm": 0.3642041087150574,
	"learning_rate": 1e-05,
	"loss": 0.4259,
	"step": 2642
	},
	{
	"epoch": 0.7275979498469265,
	"grad_norm": 0.34573763608932495,
	"learning_rate": 1e-05,
	"loss": 0.438,
	"step": 2644
	},
	{
	"epoch": 0.728148326510956,
	"grad_norm": 0.3501754701137543,
	"learning_rate": 1e-05,
	"loss": 0.4184,
	"step": 2646
	},
	{
	"epoch": 0.7286987031749854,
	"grad_norm": 0.35315144062042236,
	"learning_rate": 1e-05,
	"loss": 0.4236,
	"step": 2648
	},
	{
	"epoch": 0.7292490798390149,
	"grad_norm": 0.36585912108421326,
	"learning_rate": 1e-05,
	"loss": 0.4205,
	"step": 2650
	},
	{
	"epoch": 0.7297994565030442,
	"grad_norm": 0.3684290051460266,
	"learning_rate": 1e-05,
	"loss": 0.4366,
	"step": 2652
	},
	{
	"epoch": 0.7303498331670737,
	"grad_norm": 0.3628571927547455,
	"learning_rate": 1e-05,
	"loss": 0.4205,
	"step": 2654
	},
	{
	"epoch": 0.7309002098311032,
	"grad_norm": 0.36779502034187317,
	"learning_rate": 1e-05,
	"loss": 0.4338,
	"step": 2656
	},
	{
	"epoch": 0.7314505864951326,
	"grad_norm": 0.3522249162197113,
	"learning_rate": 1e-05,
	"loss": 0.4268,
	"step": 2658
	},
	{
	"epoch": 0.7320009631591621,
	"grad_norm": 0.3840633034706116,
	"learning_rate": 1e-05,
	"loss": 0.425,
	"step": 2660
	},
	{
	"epoch": 0.7325513398231915,
	"grad_norm": 0.3498011529445648,
	"learning_rate": 1e-05,
	"loss": 0.4269,
	"step": 2662
	},
	{
	"epoch": 0.7331017164872209,
	"grad_norm": 0.36151036620140076,
	"learning_rate": 1e-05,
	"loss": 0.4215,
	"step": 2664
	},
	{
	"epoch": 0.7336520931512504,
	"grad_norm": 0.37008973956108093,
	"learning_rate": 1e-05,
	"loss": 0.4468,
	"step": 2666
	},
	{
	"epoch": 0.7342024698152798,
	"grad_norm": 0.3440816104412079,
	"learning_rate": 1e-05,
	"loss": 0.4349,
	"step": 2668
	},
	{
	"epoch": 0.7347528464793093,
	"grad_norm": 0.3912747800350189,
	"learning_rate": 1e-05,
	"loss": 0.4188,
	"step": 2670
	},
	{
	"epoch": 0.7353032231433387,
	"grad_norm": 0.3472096025943756,
	"learning_rate": 1e-05,
	"loss": 0.4344,
	"step": 2672
	},
	{
	"epoch": 0.7358535998073682,
	"grad_norm": 0.3477676510810852,
	"learning_rate": 1e-05,
	"loss": 0.4226,
	"step": 2674
	},
	{
	"epoch": 0.7364039764713977,
	"grad_norm": 0.3726285696029663,
	"learning_rate": 1e-05,
	"loss": 0.4263,
	"step": 2676
	},
	{
	"epoch": 0.736954353135427,
	"grad_norm": 0.3610732853412628,
	"learning_rate": 1e-05,
	"loss": 0.4272,
	"step": 2678
	},
	{
	"epoch": 0.7375047297994565,
	"grad_norm": 0.35711386799812317,
	"learning_rate": 1e-05,
	"loss": 0.4356,
	"step": 2680
	},
	{
	"epoch": 0.7380551064634859,
	"grad_norm": 0.36050212383270264,
	"learning_rate": 1e-05,
	"loss": 0.437,
	"step": 2682
	},
	{
	"epoch": 0.7386054831275154,
	"grad_norm": 0.33842894434928894,
	"learning_rate": 1e-05,
	"loss": 0.4136,
	"step": 2684
	},
	{
	"epoch": 0.7391558597915449,
	"grad_norm": 0.35878267884254456,
	"learning_rate": 1e-05,
	"loss": 0.4118,
	"step": 2686
	},
	{
	"epoch": 0.7397062364555743,
	"grad_norm": 0.3504185676574707,
	"learning_rate": 1e-05,
	"loss": 0.4157,
	"step": 2688
	},
	{
	"epoch": 0.7402566131196038,
	"grad_norm": 0.35226139426231384,
	"learning_rate": 1e-05,
	"loss": 0.4194,
	"step": 2690
	},
	{
	"epoch": 0.7408069897836331,
	"grad_norm": 0.3720513880252838,
	"learning_rate": 1e-05,
	"loss": 0.4225,
	"step": 2692
	},
	{
	"epoch": 0.7413573664476626,
	"grad_norm": 0.3444679081439972,
	"learning_rate": 1e-05,
	"loss": 0.433,
	"step": 2694
	},
	{
	"epoch": 0.741907743111692,
	"grad_norm": 0.3685862421989441,
	"learning_rate": 1e-05,
	"loss": 0.4139,
	"step": 2696
	},
	{
	"epoch": 0.7424581197757215,
	"grad_norm": 0.36269327998161316,
	"learning_rate": 1e-05,
	"loss": 0.4277,
	"step": 2698
	},
	{
	"epoch": 0.743008496439751,
	"grad_norm": 0.36458590626716614,
	"learning_rate": 1e-05,
	"loss": 0.4217,
	"step": 2700
	},
	{
	"epoch": 0.7435588731037804,
	"grad_norm": 0.3453613221645355,
	"learning_rate": 1e-05,
	"loss": 0.4174,
	"step": 2702
	},
	{
	"epoch": 0.7441092497678099,
	"grad_norm": 0.3562467098236084,
	"learning_rate": 1e-05,
	"loss": 0.4313,
	"step": 2704
	},
	{
	"epoch": 0.7446596264318392,
	"grad_norm": 0.3774909973144531,
	"learning_rate": 1e-05,
	"loss": 0.432,
	"step": 2706
	},
	{
	"epoch": 0.7452100030958687,
	"grad_norm": 0.3668104112148285,
	"learning_rate": 1e-05,
	"loss": 0.4236,
	"step": 2708
	},
	{
	"epoch": 0.7457603797598982,
	"grad_norm": 0.38669878244400024,
	"learning_rate": 1e-05,
	"loss": 0.4432,
	"step": 2710
	},
	{
	"epoch": 0.7463107564239276,
	"grad_norm": 0.3985156714916229,
	"learning_rate": 1e-05,
	"loss": 0.4422,
	"step": 2712
	},
	{
	"epoch": 0.7468611330879571,
	"grad_norm": 0.3647630512714386,
	"learning_rate": 1e-05,
	"loss": 0.4273,
	"step": 2714
	},
	{
	"epoch": 0.7474115097519866,
	"grad_norm": 0.37027841806411743,
	"learning_rate": 1e-05,
	"loss": 0.4166,
	"step": 2716
	},
	{
	"epoch": 0.7479618864160159,
	"grad_norm": 0.3770820200443268,
	"learning_rate": 1e-05,
	"loss": 0.4461,
	"step": 2718
	},
	{
	"epoch": 0.7485122630800454,
	"grad_norm": 0.35209086537361145,
	"learning_rate": 1e-05,
	"loss": 0.4473,
	"step": 2720
	},
	{
	"epoch": 0.7490626397440748,
	"grad_norm": 0.38394030928611755,
	"learning_rate": 1e-05,
	"loss": 0.4353,
	"step": 2722
	},
	{
	"epoch": 0.7496130164081043,
	"grad_norm": 0.3524518311023712,
	"learning_rate": 1e-05,
	"loss": 0.4277,
	"step": 2724
	},
	{
	"epoch": 0.7501633930721338,
	"grad_norm": 0.35822972655296326,
	"learning_rate": 1e-05,
	"loss": 0.4277,
	"step": 2726
	},
	{
	"epoch": 0.7507137697361632,
	"grad_norm": 0.3409929573535919,
	"learning_rate": 1e-05,
	"loss": 0.4172,
	"step": 2728
	},
	{
	"epoch": 0.7512641464001927,
	"grad_norm": 0.3534572422504425,
	"learning_rate": 1e-05,
	"loss": 0.431,
	"step": 2730
	},
	{
	"epoch": 0.751814523064222,
	"grad_norm": 0.3565024733543396,
	"learning_rate": 1e-05,
	"loss": 0.4297,
	"step": 2732
	},
	{
	"epoch": 0.7523648997282515,
	"grad_norm": 0.3499157130718231,
	"learning_rate": 1e-05,
	"loss": 0.4131,
	"step": 2734
	},
	{
	"epoch": 0.752915276392281,
	"grad_norm": 0.37271568179130554,
	"learning_rate": 1e-05,
	"loss": 0.4224,
	"step": 2736
	},
	{
	"epoch": 0.7534656530563104,
	"grad_norm": 0.38281935453414917,
	"learning_rate": 1e-05,
	"loss": 0.4366,
	"step": 2738
	},
	{
	"epoch": 0.7540160297203399,
	"grad_norm": 0.35982009768486023,
	"learning_rate": 1e-05,
	"loss": 0.4384,
	"step": 2740
	},
	{
	"epoch": 0.7545664063843693,
	"grad_norm": 0.3618968427181244,
	"learning_rate": 1e-05,
	"loss": 0.4484,
	"step": 2742
	},
	{
	"epoch": 0.7551167830483988,
	"grad_norm": 0.35112181305885315,
	"learning_rate": 1e-05,
	"loss": 0.4132,
	"step": 2744
	},
	{
	"epoch": 0.7556671597124281,
	"grad_norm": 0.35898518562316895,
	"learning_rate": 1e-05,
	"loss": 0.4234,
	"step": 2746
	},
	{
	"epoch": 0.7562175363764576,
	"grad_norm": 0.36049455404281616,
	"learning_rate": 1e-05,
	"loss": 0.4254,
	"step": 2748
	},
	{
	"epoch": 0.7567679130404871,
	"grad_norm": 0.3698630630970001,
	"learning_rate": 1e-05,
	"loss": 0.4387,
	"step": 2750
	},
	{
	"epoch": 0.7573182897045165,
	"grad_norm": 0.36196333169937134,
	"learning_rate": 1e-05,
	"loss": 0.4242,
	"step": 2752
	},
	{
	"epoch": 0.757868666368546,
	"grad_norm": 0.3553547263145447,
	"learning_rate": 1e-05,
	"loss": 0.4332,
	"step": 2754
	},
	{
	"epoch": 0.7584190430325755,
	"grad_norm": 0.36536121368408203,
	"learning_rate": 1e-05,
	"loss": 0.4123,
	"step": 2756
	},
	{
	"epoch": 0.7589694196966049,
	"grad_norm": 0.3394269049167633,
	"learning_rate": 1e-05,
	"loss": 0.4115,
	"step": 2758
	},
	{
	"epoch": 0.7595197963606343,
	"grad_norm": 0.35857659578323364,
	"learning_rate": 1e-05,
	"loss": 0.4174,
	"step": 2760
	},
	{
	"epoch": 0.7600701730246637,
	"grad_norm": 0.3676673173904419,
	"learning_rate": 1e-05,
	"loss": 0.4334,
	"step": 2762
	},
	{
	"epoch": 0.7606205496886932,
	"grad_norm": 0.35949233174324036,
	"learning_rate": 1e-05,
	"loss": 0.4345,
	"step": 2764
	},
	{
	"epoch": 0.7611709263527227,
	"grad_norm": 0.368569940328598,
	"learning_rate": 1e-05,
	"loss": 0.4241,
	"step": 2766
	},
	{
	"epoch": 0.7617213030167521,
	"grad_norm": 0.37473535537719727,
	"learning_rate": 1e-05,
	"loss": 0.4454,
	"step": 2768
	},
	{
	"epoch": 0.7622716796807816,
	"grad_norm": 0.34766483306884766,
	"learning_rate": 1e-05,
	"loss": 0.4193,
	"step": 2770
	},
	{
	"epoch": 0.7628220563448109,
	"grad_norm": 0.3594741225242615,
	"learning_rate": 1e-05,
	"loss": 0.4265,
	"step": 2772
	},
	{
	"epoch": 0.7633724330088404,
	"grad_norm": 0.35876014828681946,
	"learning_rate": 1e-05,
	"loss": 0.4401,
	"step": 2774
	},
	{
	"epoch": 0.7639228096728699,
	"grad_norm": 0.3698675036430359,
	"learning_rate": 1e-05,
	"loss": 0.4301,
	"step": 2776
	},
	{
	"epoch": 0.7644731863368993,
	"grad_norm": 0.3890196979045868,
	"learning_rate": 1e-05,
	"loss": 0.4312,
	"step": 2778
	},
	{
	"epoch": 0.7650235630009288,
	"grad_norm": 0.3495800793170929,
	"learning_rate": 1e-05,
	"loss": 0.4235,
	"step": 2780
	},
	{
	"epoch": 0.7655739396649582,
	"grad_norm": 0.3536211848258972,
	"learning_rate": 1e-05,
	"loss": 0.4319,
	"step": 2782
	},
	{
	"epoch": 0.7661243163289877,
	"grad_norm": 0.35744360089302063,
	"learning_rate": 1e-05,
	"loss": 0.419,
	"step": 2784
	},
	{
	"epoch": 0.766674692993017,
	"grad_norm": 0.35292670130729675,
	"learning_rate": 1e-05,
	"loss": 0.4428,
	"step": 2786
	},
	{
	"epoch": 0.7672250696570465,
	"grad_norm": 0.32827427983283997,
	"learning_rate": 1e-05,
	"loss": 0.4175,
	"step": 2788
	},
	{
	"epoch": 0.767775446321076,
	"grad_norm": 0.3385542929172516,
	"learning_rate": 1e-05,
	"loss": 0.4288,
	"step": 2790
	},
	{
	"epoch": 0.7683258229851054,
	"grad_norm": 0.3474958539009094,
	"learning_rate": 1e-05,
	"loss": 0.4424,
	"step": 2792
	},
	{
	"epoch": 0.7688761996491349,
	"grad_norm": 0.3551865816116333,
	"learning_rate": 1e-05,
	"loss": 0.4351,
	"step": 2794
	},
	{
	"epoch": 0.7694265763131644,
	"grad_norm": 0.3616306781768799,
	"learning_rate": 1e-05,
	"loss": 0.4481,
	"step": 2796
	},
	{
	"epoch": 0.7699769529771938,
	"grad_norm": 0.36132022738456726,
	"learning_rate": 1e-05,
	"loss": 0.4128,
	"step": 2798
	},
	{
	"epoch": 0.7705273296412232,
	"grad_norm": 0.3580198585987091,
	"learning_rate": 1e-05,
	"loss": 0.4242,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_merge_loss": 0.3696165680885315,
	"eval_merge_runtime": 600.0202,
	"eval_merge_samples_per_second": 56.251,
	"eval_merge_steps_per_second": 2.345,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_new_aug_datas_filtered.json_loss": 0.49126043915748596,
	"eval_new_aug_datas_filtered.json_runtime": 10.3252,
	"eval_new_aug_datas_filtered.json_samples_per_second": 74.285,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.099,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_sharegpt_gpt4.json_loss": 0.7416729927062988,
	"eval_sharegpt_gpt4.json_runtime": 31.6069,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.88,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.468,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_Table_GPT.json_loss": 0.04911120608448982,
	"eval_Table_GPT.json_runtime": 24.9282,
	"eval_Table_GPT.json_samples_per_second": 83.961,
	"eval_Table_GPT.json_steps_per_second": 3.53,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_gpt_4o_200k.json_loss": 0.7679291367530823,
	"eval_gpt_4o_200k.json_runtime": 48.4021,
	"eval_gpt_4o_200k.json_samples_per_second": 129.767,
	"eval_gpt_4o_200k.json_steps_per_second": 5.413,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_multi_turn_datas.json_loss": 0.2913420498371124,
	"eval_multi_turn_datas.json_runtime": 75.4573,
	"eval_multi_turn_datas.json_samples_per_second": 53.037,
	"eval_multi_turn_datas.json_steps_per_second": 2.213,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_table_python_code_datas.json_loss": 0.25055599212646484,
	"eval_table_python_code_datas.json_runtime": 43.009,
	"eval_table_python_code_datas.json_samples_per_second": 50.199,
	"eval_table_python_code_datas.json_steps_per_second": 2.093,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_tabular_llm_data.json_loss": 0.07946833223104477,
	"eval_tabular_llm_data.json_runtime": 8.5236,
	"eval_tabular_llm_data.json_samples_per_second": 28.861,
	"eval_tabular_llm_data.json_steps_per_second": 1.291,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_python_code_critic_21k.json_loss": 0.5505719184875488,
	"eval_python_code_critic_21k.json_runtime": 3.2237,
	"eval_python_code_critic_21k.json_samples_per_second": 185.192,
	"eval_python_code_critic_21k.json_steps_per_second": 7.755,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_all_merge_table_dataset.json_loss": 0.07032839208841324,
	"eval_all_merge_table_dataset.json_runtime": 23.2519,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.621,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.29,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_code_feedback_multi_turn.json_loss": 0.5668665766716003,
	"eval_code_feedback_multi_turn.json_runtime": 32.3765,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.981,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.842,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_ultrainteract_sft.json_loss": 0.405385285615921,
	"eval_ultrainteract_sft.json_runtime": 8.6576,
	"eval_ultrainteract_sft.json_samples_per_second": 168.176,
	"eval_ultrainteract_sft.json_steps_per_second": 7.046,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_synthetic_text_to_sql.json_loss": 0.0894596055150032,
	"eval_synthetic_text_to_sql.json_runtime": 0.1263,
	"eval_synthetic_text_to_sql.json_samples_per_second": 269.263,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.839,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_sft_react_sql_datas.json_loss": 0.6155156493186951,
	"eval_sft_react_sql_datas.json_runtime": 7.8457,
	"eval_sft_react_sql_datas.json_samples_per_second": 40.022,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.784,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_all_merge_code.json_loss": 0.2757679224014282,
	"eval_all_merge_code.json_runtime": 0.3332,
	"eval_all_merge_code.json_samples_per_second": 189.076,
	"eval_all_merge_code.json_steps_per_second": 9.004,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_magpie_datas.json_loss": 0.42383918166160583,
	"eval_magpie_datas.json_runtime": 2.2093,
	"eval_magpie_datas.json_samples_per_second": 77.853,
	"eval_magpie_datas.json_steps_per_second": 3.621,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_train_data_for_qwen.json_loss": 0.0028582699596881866,
	"eval_train_data_for_qwen.json_runtime": 0.244,
	"eval_train_data_for_qwen.json_samples_per_second": 40.988,
	"eval_train_data_for_qwen.json_steps_per_second": 4.099,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_alpaca_cleaned.json_loss": 0.9000511169433594,
	"eval_alpaca_cleaned.json_runtime": 0.1144,
	"eval_alpaca_cleaned.json_samples_per_second": 235.991,
	"eval_alpaca_cleaned.json_steps_per_second": 17.481,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_agent_instruct.json_loss": 0.21006985008716583,
	"eval_agent_instruct.json_runtime": 0.5133,
	"eval_agent_instruct.json_samples_per_second": 93.518,
	"eval_agent_instruct.json_steps_per_second": 3.897,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_MathInstruct.json_loss": 0.19836944341659546,
	"eval_MathInstruct.json_runtime": 0.3623,
	"eval_MathInstruct.json_samples_per_second": 157.336,
	"eval_MathInstruct.json_steps_per_second": 8.281,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_tested_143k_python_alpaca.json_loss": 0.44593295454978943,
	"eval_tested_143k_python_alpaca.json_runtime": 0.303,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.196,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.6,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_xlam_function_calling_60k.json_loss": 0.0066245682537555695,
	"eval_xlam_function_calling_60k.json_runtime": 0.1016,
	"eval_xlam_function_calling_60k.json_samples_per_second": 226.385,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.843,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.5253314971923828,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.052,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 307.853,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.241,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_alpaca_gpt4_zh.json_loss": 0.9524829983711243,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0499,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 220.602,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 20.055,
	"step": 2800
	},
	{
	"epoch": 0.7705273296412232,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5769651532173157,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4873,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.047,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.052,
	"step": 2800
	},
	{
	"epoch": 0.7710777063052526,
	"grad_norm": 0.3490790128707886,
	"learning_rate": 1e-05,
	"loss": 0.4279,
	"step": 2802
	},
	{
	"epoch": 0.7716280829692821,
	"grad_norm": 0.39200064539909363,
	"learning_rate": 1e-05,
	"loss": 0.4419,
	"step": 2804
	},
	{
	"epoch": 0.7721784596333116,
	"grad_norm": 0.36754128336906433,
	"learning_rate": 1e-05,
	"loss": 0.4298,
	"step": 2806
	},
	{
	"epoch": 0.772728836297341,
	"grad_norm": 0.3482655882835388,
	"learning_rate": 1e-05,
	"loss": 0.4249,
	"step": 2808
	},
	{
	"epoch": 0.7732792129613705,
	"grad_norm": 0.35949841141700745,
	"learning_rate": 1e-05,
	"loss": 0.4245,
	"step": 2810
	},
	{
	"epoch": 0.7738295896253999,
	"grad_norm": 0.3631410598754883,
	"learning_rate": 1e-05,
	"loss": 0.4221,
	"step": 2812
	},
	{
	"epoch": 0.7743799662894293,
	"grad_norm": 0.3531825542449951,
	"learning_rate": 1e-05,
	"loss": 0.415,
	"step": 2814
	},
	{
	"epoch": 0.7749303429534588,
	"grad_norm": 0.3741169571876526,
	"learning_rate": 1e-05,
	"loss": 0.421,
	"step": 2816
	},
	{
	"epoch": 0.7754807196174882,
	"grad_norm": 0.3431030511856079,
	"learning_rate": 1e-05,
	"loss": 0.4082,
	"step": 2818
	},
	{
	"epoch": 0.7760310962815177,
	"grad_norm": 0.35572293400764465,
	"learning_rate": 1e-05,
	"loss": 0.4279,
	"step": 2820
	},
	{
	"epoch": 0.7765814729455471,
	"grad_norm": 0.33715927600860596,
	"learning_rate": 1e-05,
	"loss": 0.4217,
	"step": 2822
	},
	{
	"epoch": 0.7771318496095766,
	"grad_norm": 0.3827720582485199,
	"learning_rate": 1e-05,
	"loss": 0.4195,
	"step": 2824
	},
	{
	"epoch": 0.777682226273606,
	"grad_norm": 0.34325775504112244,
	"learning_rate": 1e-05,
	"loss": 0.4359,
	"step": 2826
	},
	{
	"epoch": 0.7782326029376354,
	"grad_norm": 0.34917858242988586,
	"learning_rate": 1e-05,
	"loss": 0.4165,
	"step": 2828
	},
	{
	"epoch": 0.7787829796016649,
	"grad_norm": 0.3705228865146637,
	"learning_rate": 1e-05,
	"loss": 0.4234,
	"step": 2830
	},
	{
	"epoch": 0.7793333562656943,
	"grad_norm": 0.36879298090934753,
	"learning_rate": 1e-05,
	"loss": 0.4173,
	"step": 2832
	},
	{
	"epoch": 0.7798837329297238,
	"grad_norm": 0.35160768032073975,
	"learning_rate": 1e-05,
	"loss": 0.427,
	"step": 2834
	},
	{
	"epoch": 0.7804341095937533,
	"grad_norm": 0.35639581084251404,
	"learning_rate": 1e-05,
	"loss": 0.4342,
	"step": 2836
	},
	{
	"epoch": 0.7809844862577827,
	"grad_norm": 0.3821897804737091,
	"learning_rate": 1e-05,
	"loss": 0.4143,
	"step": 2838
	},
	{
	"epoch": 0.7815348629218121,
	"grad_norm": 0.35575130581855774,
	"learning_rate": 1e-05,
	"loss": 0.4052,
	"step": 2840
	},
	{
	"epoch": 0.7820852395858415,
	"grad_norm": 0.367026150226593,
	"learning_rate": 1e-05,
	"loss": 0.4507,
	"step": 2842
	},
	{
	"epoch": 0.782635616249871,
	"grad_norm": 0.35660848021507263,
	"learning_rate": 1e-05,
	"loss": 0.4112,
	"step": 2844
	},
	{
	"epoch": 0.7831859929139005,
	"grad_norm": 0.3623476028442383,
	"learning_rate": 1e-05,
	"loss": 0.4298,
	"step": 2846
	},
	{
	"epoch": 0.7837363695779299,
	"grad_norm": 0.36522987484931946,
	"learning_rate": 1e-05,
	"loss": 0.4197,
	"step": 2848
	},
	{
	"epoch": 0.7842867462419594,
	"grad_norm": 0.349153608083725,
	"learning_rate": 1e-05,
	"loss": 0.4179,
	"step": 2850
	},
	{
	"epoch": 0.7848371229059888,
	"grad_norm": 0.3868444263935089,
	"learning_rate": 1e-05,
	"loss": 0.4309,
	"step": 2852
	},
	{
	"epoch": 0.7853874995700182,
	"grad_norm": 0.3388199210166931,
	"learning_rate": 1e-05,
	"loss": 0.4255,
	"step": 2854
	},
	{
	"epoch": 0.7859378762340476,
	"grad_norm": 0.3848430812358856,
	"learning_rate": 1e-05,
	"loss": 0.4248,
	"step": 2856
	},
	{
	"epoch": 0.7864882528980771,
	"grad_norm": 0.34994250535964966,
	"learning_rate": 1e-05,
	"loss": 0.43,
	"step": 2858
	},
	{
	"epoch": 0.7870386295621066,
	"grad_norm": 0.3475828170776367,
	"learning_rate": 1e-05,
	"loss": 0.4245,
	"step": 2860
	},
	{
	"epoch": 0.787589006226136,
	"grad_norm": 0.3643713593482971,
	"learning_rate": 1e-05,
	"loss": 0.4285,
	"step": 2862
	},
	{
	"epoch": 0.7881393828901655,
	"grad_norm": 0.3819843828678131,
	"learning_rate": 1e-05,
	"loss": 0.4264,
	"step": 2864
	},
	{
	"epoch": 0.7886897595541948,
	"grad_norm": 0.3636263608932495,
	"learning_rate": 1e-05,
	"loss": 0.4354,
	"step": 2866
	},
	{
	"epoch": 0.7892401362182243,
	"grad_norm": 0.35367467999458313,
	"learning_rate": 1e-05,
	"loss": 0.4219,
	"step": 2868
	},
	{
	"epoch": 0.7897905128822538,
	"grad_norm": 0.33511704206466675,
	"learning_rate": 1e-05,
	"loss": 0.427,
	"step": 2870
	},
	{
	"epoch": 0.7903408895462832,
	"grad_norm": 0.3727225363254547,
	"learning_rate": 1e-05,
	"loss": 0.4325,
	"step": 2872
	},
	{
	"epoch": 0.7908912662103127,
	"grad_norm": 0.35963478684425354,
	"learning_rate": 1e-05,
	"loss": 0.4331,
	"step": 2874
	},
	{
	"epoch": 0.7914416428743422,
	"grad_norm": 0.3680688440799713,
	"learning_rate": 1e-05,
	"loss": 0.426,
	"step": 2876
	},
	{
	"epoch": 0.7919920195383716,
	"grad_norm": 0.3594858646392822,
	"learning_rate": 1e-05,
	"loss": 0.4251,
	"step": 2878
	},
	{
	"epoch": 0.792542396202401,
	"grad_norm": 0.3666832745075226,
	"learning_rate": 1e-05,
	"loss": 0.4148,
	"step": 2880
	},
	{
	"epoch": 0.7930927728664304,
	"grad_norm": 0.3594750761985779,
	"learning_rate": 1e-05,
	"loss": 0.424,
	"step": 2882
	},
	{
	"epoch": 0.7936431495304599,
	"grad_norm": 0.34796181321144104,
	"learning_rate": 1e-05,
	"loss": 0.4188,
	"step": 2884
	},
	{
	"epoch": 0.7941935261944894,
	"grad_norm": 0.3670448958873749,
	"learning_rate": 1e-05,
	"loss": 0.4184,
	"step": 2886
	},
	{
	"epoch": 0.7947439028585188,
	"grad_norm": 0.38206908106803894,
	"learning_rate": 1e-05,
	"loss": 0.4333,
	"step": 2888
	},
	{
	"epoch": 0.7952942795225483,
	"grad_norm": 0.3671881854534149,
	"learning_rate": 1e-05,
	"loss": 0.4117,
	"step": 2890
	},
	{
	"epoch": 0.7958446561865777,
	"grad_norm": 0.33647626638412476,
	"learning_rate": 1e-05,
	"loss": 0.4098,
	"step": 2892
	},
	{
	"epoch": 0.7963950328506071,
	"grad_norm": 0.3504905700683594,
	"learning_rate": 1e-05,
	"loss": 0.4227,
	"step": 2894
	},
	{
	"epoch": 0.7969454095146365,
	"grad_norm": 0.3571165204048157,
	"learning_rate": 1e-05,
	"loss": 0.4126,
	"step": 2896
	},
	{
	"epoch": 0.797495786178666,
	"grad_norm": 0.3529278337955475,
	"learning_rate": 1e-05,
	"loss": 0.4198,
	"step": 2898
	},
	{
	"epoch": 0.7980461628426955,
	"grad_norm": 0.3688133656978607,
	"learning_rate": 1e-05,
	"loss": 0.443,
	"step": 2900
	},
	{
	"epoch": 0.7985965395067249,
	"grad_norm": 0.37664586305618286,
	"learning_rate": 1e-05,
	"loss": 0.4345,
	"step": 2902
	},
	{
	"epoch": 0.7991469161707544,
	"grad_norm": 0.37368759512901306,
	"learning_rate": 1e-05,
	"loss": 0.4202,
	"step": 2904
	},
	{
	"epoch": 0.7996972928347839,
	"grad_norm": 0.3880954384803772,
	"learning_rate": 1e-05,
	"loss": 0.4234,
	"step": 2906
	},
	{
	"epoch": 0.8002476694988132,
	"grad_norm": 0.34263235330581665,
	"learning_rate": 1e-05,
	"loss": 0.4177,
	"step": 2908
	},
	{
	"epoch": 0.8007980461628427,
	"grad_norm": 0.37408214807510376,
	"learning_rate": 1e-05,
	"loss": 0.4366,
	"step": 2910
	},
	{
	"epoch": 0.8013484228268721,
	"grad_norm": 0.35213685035705566,
	"learning_rate": 1e-05,
	"loss": 0.411,
	"step": 2912
	},
	{
	"epoch": 0.8018987994909016,
	"grad_norm": 0.3545092046260834,
	"learning_rate": 1e-05,
	"loss": 0.4378,
	"step": 2914
	},
	{
	"epoch": 0.802449176154931,
	"grad_norm": 0.3618670701980591,
	"learning_rate": 1e-05,
	"loss": 0.4187,
	"step": 2916
	},
	{
	"epoch": 0.8029995528189605,
	"grad_norm": 0.3392831087112427,
	"learning_rate": 1e-05,
	"loss": 0.4305,
	"step": 2918
	},
	{
	"epoch": 0.8035499294829899,
	"grad_norm": 0.3700800836086273,
	"learning_rate": 1e-05,
	"loss": 0.4212,
	"step": 2920
	},
	{
	"epoch": 0.8041003061470193,
	"grad_norm": 0.35381945967674255,
	"learning_rate": 1e-05,
	"loss": 0.416,
	"step": 2922
	},
	{
	"epoch": 0.8046506828110488,
	"grad_norm": 0.3526875972747803,
	"learning_rate": 1e-05,
	"loss": 0.4287,
	"step": 2924
	},
	{
	"epoch": 0.8052010594750783,
	"grad_norm": 0.3656879663467407,
	"learning_rate": 1e-05,
	"loss": 0.4196,
	"step": 2926
	},
	{
	"epoch": 0.8057514361391077,
	"grad_norm": 0.3675120174884796,
	"learning_rate": 1e-05,
	"loss": 0.419,
	"step": 2928
	},
	{
	"epoch": 0.8063018128031372,
	"grad_norm": 0.34032610058784485,
	"learning_rate": 1e-05,
	"loss": 0.4301,
	"step": 2930
	},
	{
	"epoch": 0.8068521894671666,
	"grad_norm": 0.39022547006607056,
	"learning_rate": 1e-05,
	"loss": 0.4347,
	"step": 2932
	},
	{
	"epoch": 0.807402566131196,
	"grad_norm": 0.38301143050193787,
	"learning_rate": 1e-05,
	"loss": 0.4289,
	"step": 2934
	},
	{
	"epoch": 0.8079529427952254,
	"grad_norm": 0.34974217414855957,
	"learning_rate": 1e-05,
	"loss": 0.4233,
	"step": 2936
	},
	{
	"epoch": 0.8085033194592549,
	"grad_norm": 0.3554193377494812,
	"learning_rate": 1e-05,
	"loss": 0.4078,
	"step": 2938
	},
	{
	"epoch": 0.8090536961232844,
	"grad_norm": 0.3496205806732178,
	"learning_rate": 1e-05,
	"loss": 0.4241,
	"step": 2940
	},
	{
	"epoch": 0.8096040727873138,
	"grad_norm": 0.3549167513847351,
	"learning_rate": 1e-05,
	"loss": 0.4281,
	"step": 2942
	},
	{
	"epoch": 0.8101544494513433,
	"grad_norm": 0.3635149896144867,
	"learning_rate": 1e-05,
	"loss": 0.4307,
	"step": 2944
	},
	{
	"epoch": 0.8107048261153728,
	"grad_norm": 0.36100322008132935,
	"learning_rate": 1e-05,
	"loss": 0.4352,
	"step": 2946
	},
	{
	"epoch": 0.8112552027794021,
	"grad_norm": 0.36892169713974,
	"learning_rate": 1e-05,
	"loss": 0.4245,
	"step": 2948
	},
	{
	"epoch": 0.8118055794434316,
	"grad_norm": 0.34998342394828796,
	"learning_rate": 1e-05,
	"loss": 0.4214,
	"step": 2950
	},
	{
	"epoch": 0.812355956107461,
	"grad_norm": 0.36382123827934265,
	"learning_rate": 1e-05,
	"loss": 0.4342,
	"step": 2952
	},
	{
	"epoch": 0.8129063327714905,
	"grad_norm": 0.361068457365036,
	"learning_rate": 1e-05,
	"loss": 0.4198,
	"step": 2954
	},
	{
	"epoch": 0.81345670943552,
	"grad_norm": 0.36285367608070374,
	"learning_rate": 1e-05,
	"loss": 0.4297,
	"step": 2956
	},
	{
	"epoch": 0.8140070860995494,
	"grad_norm": 0.3376438319683075,
	"learning_rate": 1e-05,
	"loss": 0.3999,
	"step": 2958
	},
	{
	"epoch": 0.8145574627635789,
	"grad_norm": 0.35821884870529175,
	"learning_rate": 1e-05,
	"loss": 0.4283,
	"step": 2960
	},
	{
	"epoch": 0.8151078394276082,
	"grad_norm": 0.37185990810394287,
	"learning_rate": 1e-05,
	"loss": 0.4221,
	"step": 2962
	},
	{
	"epoch": 0.8156582160916377,
	"grad_norm": 0.3599165380001068,
	"learning_rate": 1e-05,
	"loss": 0.4222,
	"step": 2964
	},
	{
	"epoch": 0.8162085927556672,
	"grad_norm": 0.3599473237991333,
	"learning_rate": 1e-05,
	"loss": 0.4211,
	"step": 2966
	},
	{
	"epoch": 0.8167589694196966,
	"grad_norm": 0.3631754219532013,
	"learning_rate": 1e-05,
	"loss": 0.4273,
	"step": 2968
	},
	{
	"epoch": 0.8173093460837261,
	"grad_norm": 0.34736868739128113,
	"learning_rate": 1e-05,
	"loss": 0.4175,
	"step": 2970
	},
	{
	"epoch": 0.8178597227477555,
	"grad_norm": 0.34098127484321594,
	"learning_rate": 1e-05,
	"loss": 0.4297,
	"step": 2972
	},
	{
	"epoch": 0.8184100994117849,
	"grad_norm": 0.3562553822994232,
	"learning_rate": 1e-05,
	"loss": 0.4342,
	"step": 2974
	},
	{
	"epoch": 0.8189604760758143,
	"grad_norm": 0.3628046214580536,
	"learning_rate": 1e-05,
	"loss": 0.4146,
	"step": 2976
	},
	{
	"epoch": 0.8195108527398438,
	"grad_norm": 0.33993610739707947,
	"learning_rate": 1e-05,
	"loss": 0.4228,
	"step": 2978
	},
	{
	"epoch": 0.8200612294038733,
	"grad_norm": 0.35291528701782227,
	"learning_rate": 1e-05,
	"loss": 0.4179,
	"step": 2980
	},
	{
	"epoch": 0.8206116060679027,
	"grad_norm": 0.3480774164199829,
	"learning_rate": 1e-05,
	"loss": 0.4099,
	"step": 2982
	},
	{
	"epoch": 0.8211619827319322,
	"grad_norm": 0.36476173996925354,
	"learning_rate": 1e-05,
	"loss": 0.4153,
	"step": 2984
	},
	{
	"epoch": 0.8217123593959617,
	"grad_norm": 0.3587859869003296,
	"learning_rate": 1e-05,
	"loss": 0.4334,
	"step": 2986
	},
	{
	"epoch": 0.822262736059991,
	"grad_norm": 0.38419267535209656,
	"learning_rate": 1e-05,
	"loss": 0.4357,
	"step": 2988
	},
	{
	"epoch": 0.8228131127240205,
	"grad_norm": 0.3496173024177551,
	"learning_rate": 1e-05,
	"loss": 0.4156,
	"step": 2990
	},
	{
	"epoch": 0.8233634893880499,
	"grad_norm": 0.36481598019599915,
	"learning_rate": 1e-05,
	"loss": 0.4108,
	"step": 2992
	},
	{
	"epoch": 0.8239138660520794,
	"grad_norm": 0.36568546295166016,
	"learning_rate": 1e-05,
	"loss": 0.4329,
	"step": 2994
	},
	{
	"epoch": 0.8244642427161089,
	"grad_norm": 0.3675042390823364,
	"learning_rate": 1e-05,
	"loss": 0.4301,
	"step": 2996
	},
	{
	"epoch": 0.8250146193801383,
	"grad_norm": 0.3355284035205841,
	"learning_rate": 1e-05,
	"loss": 0.4162,
	"step": 2998
	},
	{
	"epoch": 0.8255649960441678,
	"grad_norm": 0.34280914068222046,
	"learning_rate": 1e-05,
	"loss": 0.4168,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_merge_loss": 0.3659045696258545,
	"eval_merge_runtime": 599.8368,
	"eval_merge_samples_per_second": 56.269,
	"eval_merge_steps_per_second": 2.346,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_new_aug_datas_filtered.json_loss": 0.48660770058631897,
	"eval_new_aug_datas_filtered.json_runtime": 10.3383,
	"eval_new_aug_datas_filtered.json_samples_per_second": 74.19,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.095,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_sharegpt_gpt4.json_loss": 0.7358890175819397,
	"eval_sharegpt_gpt4.json_runtime": 31.7081,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.692,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.46,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_Table_GPT.json_loss": 0.045936468988657,
	"eval_Table_GPT.json_runtime": 24.9946,
	"eval_Table_GPT.json_samples_per_second": 83.738,
	"eval_Table_GPT.json_steps_per_second": 3.521,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_gpt_4o_200k.json_loss": 0.7624426484107971,
	"eval_gpt_4o_200k.json_runtime": 48.6264,
	"eval_gpt_4o_200k.json_samples_per_second": 129.169,
	"eval_gpt_4o_200k.json_steps_per_second": 5.388,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_multi_turn_datas.json_loss": 0.2812780439853668,
	"eval_multi_turn_datas.json_runtime": 75.8593,
	"eval_multi_turn_datas.json_samples_per_second": 52.756,
	"eval_multi_turn_datas.json_steps_per_second": 2.201,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_table_python_code_datas.json_loss": 0.24670127034187317,
	"eval_table_python_code_datas.json_runtime": 43.2305,
	"eval_table_python_code_datas.json_samples_per_second": 49.942,
	"eval_table_python_code_datas.json_steps_per_second": 2.082,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_tabular_llm_data.json_loss": 0.08318436145782471,
	"eval_tabular_llm_data.json_runtime": 8.561,
	"eval_tabular_llm_data.json_samples_per_second": 28.735,
	"eval_tabular_llm_data.json_steps_per_second": 1.285,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_python_code_critic_21k.json_loss": 0.5459744930267334,
	"eval_python_code_critic_21k.json_runtime": 3.2232,
	"eval_python_code_critic_21k.json_samples_per_second": 185.217,
	"eval_python_code_critic_21k.json_steps_per_second": 7.756,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_all_merge_table_dataset.json_loss": 0.07661881297826767,
	"eval_all_merge_table_dataset.json_runtime": 23.3773,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.457,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.283,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_code_feedback_multi_turn.json_loss": 0.5640604496002197,
	"eval_code_feedback_multi_turn.json_runtime": 32.4865,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.751,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.832,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_ultrainteract_sft.json_loss": 0.40351128578186035,
	"eval_ultrainteract_sft.json_runtime": 8.6435,
	"eval_ultrainteract_sft.json_samples_per_second": 168.449,
	"eval_ultrainteract_sft.json_steps_per_second": 7.057,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_synthetic_text_to_sql.json_loss": 0.09340357035398483,
	"eval_synthetic_text_to_sql.json_runtime": 0.1267,
	"eval_synthetic_text_to_sql.json_samples_per_second": 268.437,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.79,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_sft_react_sql_datas.json_loss": 0.614182710647583,
	"eval_sft_react_sql_datas.json_runtime": 7.8427,
	"eval_sft_react_sql_datas.json_samples_per_second": 40.037,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.785,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_all_merge_code.json_loss": 0.2747681736946106,
	"eval_all_merge_code.json_runtime": 0.3335,
	"eval_all_merge_code.json_samples_per_second": 188.917,
	"eval_all_merge_code.json_steps_per_second": 8.996,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_magpie_datas.json_loss": 0.42281365394592285,
	"eval_magpie_datas.json_runtime": 2.2171,
	"eval_magpie_datas.json_samples_per_second": 77.579,
	"eval_magpie_datas.json_steps_per_second": 3.608,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_train_data_for_qwen.json_loss": 0.0027365919668227434,
	"eval_train_data_for_qwen.json_runtime": 0.2454,
	"eval_train_data_for_qwen.json_samples_per_second": 40.756,
	"eval_train_data_for_qwen.json_steps_per_second": 4.076,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_alpaca_cleaned.json_loss": 0.9086716175079346,
	"eval_alpaca_cleaned.json_runtime": 0.1143,
	"eval_alpaca_cleaned.json_samples_per_second": 236.118,
	"eval_alpaca_cleaned.json_steps_per_second": 17.49,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_agent_instruct.json_loss": 0.20960307121276855,
	"eval_agent_instruct.json_runtime": 0.5163,
	"eval_agent_instruct.json_samples_per_second": 92.971,
	"eval_agent_instruct.json_steps_per_second": 3.874,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_MathInstruct.json_loss": 0.20019014179706573,
	"eval_MathInstruct.json_runtime": 0.3582,
	"eval_MathInstruct.json_samples_per_second": 159.116,
	"eval_MathInstruct.json_steps_per_second": 8.375,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_tested_143k_python_alpaca.json_loss": 0.44821104407310486,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3022,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 112.526,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.619,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_xlam_function_calling_60k.json_loss": 0.008376230485737324,
	"eval_xlam_function_calling_60k.json_runtime": 0.1003,
	"eval_xlam_function_calling_60k.json_samples_per_second": 229.41,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.974,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.513078212738037,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0516,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 310.009,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.376,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_alpaca_gpt4_zh.json_loss": 0.9633126258850098,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0499,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 220.561,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 20.051,
	"step": 3000
	},
	{
	"epoch": 0.8255649960441678,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5788259506225586,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4854,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.202,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.06,
	"step": 3000
	},
	{
	"epoch": 0.8261153727081971,
	"grad_norm": 0.35386523604393005,
	"learning_rate": 1e-05,
	"loss": 0.4235,
	"step": 3002
	},
	{
	"epoch": 0.8266657493722266,
	"grad_norm": 0.35325145721435547,
	"learning_rate": 1e-05,
	"loss": 0.4296,
	"step": 3004
	},
	{
	"epoch": 0.827216126036256,
	"grad_norm": 0.35455331206321716,
	"learning_rate": 1e-05,
	"loss": 0.405,
	"step": 3006
	},
	{
	"epoch": 0.8277665027002855,
	"grad_norm": 0.37510380148887634,
	"learning_rate": 1e-05,
	"loss": 0.4288,
	"step": 3008
	},
	{
	"epoch": 0.828316879364315,
	"grad_norm": 0.356189489364624,
	"learning_rate": 1e-05,
	"loss": 0.4145,
	"step": 3010
	},
	{
	"epoch": 0.8288672560283444,
	"grad_norm": 0.36097854375839233,
	"learning_rate": 1e-05,
	"loss": 0.4247,
	"step": 3012
	},
	{
	"epoch": 0.8294176326923739,
	"grad_norm": 0.3489934802055359,
	"learning_rate": 1e-05,
	"loss": 0.422,
	"step": 3014
	},
	{
	"epoch": 0.8299680093564032,
	"grad_norm": 0.36287152767181396,
	"learning_rate": 1e-05,
	"loss": 0.4025,
	"step": 3016
	},
	{
	"epoch": 0.8305183860204327,
	"grad_norm": 0.3664880096912384,
	"learning_rate": 1e-05,
	"loss": 0.4278,
	"step": 3018
	},
	{
	"epoch": 0.8310687626844622,
	"grad_norm": 0.35230088233947754,
	"learning_rate": 1e-05,
	"loss": 0.4233,
	"step": 3020
	},
	{
	"epoch": 0.8316191393484916,
	"grad_norm": 0.3595122694969177,
	"learning_rate": 1e-05,
	"loss": 0.4173,
	"step": 3022
	},
	{
	"epoch": 0.8321695160125211,
	"grad_norm": 0.3618360757827759,
	"learning_rate": 1e-05,
	"loss": 0.4213,
	"step": 3024
	},
	{
	"epoch": 0.8327198926765506,
	"grad_norm": 0.3699500858783722,
	"learning_rate": 1e-05,
	"loss": 0.4267,
	"step": 3026
	},
	{
	"epoch": 0.8332702693405799,
	"grad_norm": 0.37343189120292664,
	"learning_rate": 1e-05,
	"loss": 0.4288,
	"step": 3028
	},
	{
	"epoch": 0.8338206460046094,
	"grad_norm": 0.34580445289611816,
	"learning_rate": 1e-05,
	"loss": 0.4232,
	"step": 3030
	},
	{
	"epoch": 0.8343710226686388,
	"grad_norm": 0.3410281836986542,
	"learning_rate": 1e-05,
	"loss": 0.4272,
	"step": 3032
	},
	{
	"epoch": 0.8349213993326683,
	"grad_norm": 0.37444379925727844,
	"learning_rate": 1e-05,
	"loss": 0.4264,
	"step": 3034
	},
	{
	"epoch": 0.8354717759966978,
	"grad_norm": 0.359546959400177,
	"learning_rate": 1e-05,
	"loss": 0.4243,
	"step": 3036
	},
	{
	"epoch": 0.8360221526607272,
	"grad_norm": 0.3611339032649994,
	"learning_rate": 1e-05,
	"loss": 0.4243,
	"step": 3038
	},
	{
	"epoch": 0.8365725293247567,
	"grad_norm": 0.3678295612335205,
	"learning_rate": 1e-05,
	"loss": 0.4089,
	"step": 3040
	},
	{
	"epoch": 0.837122905988786,
	"grad_norm": 0.37094810605049133,
	"learning_rate": 1e-05,
	"loss": 0.4191,
	"step": 3042
	},
	{
	"epoch": 0.8376732826528155,
	"grad_norm": 0.354481041431427,
	"learning_rate": 1e-05,
	"loss": 0.4235,
	"step": 3044
	},
	{
	"epoch": 0.838223659316845,
	"grad_norm": 0.3498587906360626,
	"learning_rate": 1e-05,
	"loss": 0.431,
	"step": 3046
	},
	{
	"epoch": 0.8387740359808744,
	"grad_norm": 0.35214436054229736,
	"learning_rate": 1e-05,
	"loss": 0.4132,
	"step": 3048
	},
	{
	"epoch": 0.8393244126449039,
	"grad_norm": 0.35119178891181946,
	"learning_rate": 1e-05,
	"loss": 0.4161,
	"step": 3050
	},
	{
	"epoch": 0.8398747893089333,
	"grad_norm": 0.3671429753303528,
	"learning_rate": 1e-05,
	"loss": 0.4276,
	"step": 3052
	},
	{
	"epoch": 0.8404251659729628,
	"grad_norm": 0.3626399636268616,
	"learning_rate": 1e-05,
	"loss": 0.417,
	"step": 3054
	},
	{
	"epoch": 0.8409755426369921,
	"grad_norm": 0.3819148540496826,
	"learning_rate": 1e-05,
	"loss": 0.4261,
	"step": 3056
	},
	{
	"epoch": 0.8415259193010216,
	"grad_norm": 0.3481554687023163,
	"learning_rate": 1e-05,
	"loss": 0.4339,
	"step": 3058
	},
	{
	"epoch": 0.8420762959650511,
	"grad_norm": 0.3603340983390808,
	"learning_rate": 1e-05,
	"loss": 0.406,
	"step": 3060
	},
	{
	"epoch": 0.8426266726290805,
	"grad_norm": 0.3565911650657654,
	"learning_rate": 1e-05,
	"loss": 0.4245,
	"step": 3062
	},
	{
	"epoch": 0.84317704929311,
	"grad_norm": 0.36305105686187744,
	"learning_rate": 1e-05,
	"loss": 0.4255,
	"step": 3064
	},
	{
	"epoch": 0.8437274259571395,
	"grad_norm": 0.33078432083129883,
	"learning_rate": 1e-05,
	"loss": 0.4045,
	"step": 3066
	},
	{
	"epoch": 0.8442778026211689,
	"grad_norm": 0.346562922000885,
	"learning_rate": 1e-05,
	"loss": 0.4279,
	"step": 3068
	},
	{
	"epoch": 0.8448281792851983,
	"grad_norm": 0.36170172691345215,
	"learning_rate": 1e-05,
	"loss": 0.4139,
	"step": 3070
	},
	{
	"epoch": 0.8453785559492277,
	"grad_norm": 0.360568106174469,
	"learning_rate": 1e-05,
	"loss": 0.4276,
	"step": 3072
	},
	{
	"epoch": 0.8459289326132572,
	"grad_norm": 0.38023245334625244,
	"learning_rate": 1e-05,
	"loss": 0.4317,
	"step": 3074
	},
	{
	"epoch": 0.8464793092772867,
	"grad_norm": 0.344732403755188,
	"learning_rate": 1e-05,
	"loss": 0.4109,
	"step": 3076
	},
	{
	"epoch": 0.8470296859413161,
	"grad_norm": 0.35157695412635803,
	"learning_rate": 1e-05,
	"loss": 0.4192,
	"step": 3078
	},
	{
	"epoch": 0.8475800626053456,
	"grad_norm": 0.36455512046813965,
	"learning_rate": 1e-05,
	"loss": 0.4247,
	"step": 3080
	},
	{
	"epoch": 0.8481304392693749,
	"grad_norm": 0.39768150448799133,
	"learning_rate": 1e-05,
	"loss": 0.4383,
	"step": 3082
	},
	{
	"epoch": 0.8486808159334044,
	"grad_norm": 0.38052836060523987,
	"learning_rate": 1e-05,
	"loss": 0.4199,
	"step": 3084
	},
	{
	"epoch": 0.8492311925974338,
	"grad_norm": 0.3625752925872803,
	"learning_rate": 1e-05,
	"loss": 0.4161,
	"step": 3086
	},
	{
	"epoch": 0.8497815692614633,
	"grad_norm": 0.3708571493625641,
	"learning_rate": 1e-05,
	"loss": 0.4402,
	"step": 3088
	},
	{
	"epoch": 0.8503319459254928,
	"grad_norm": 0.3581870496273041,
	"learning_rate": 1e-05,
	"loss": 0.4376,
	"step": 3090
	},
	{
	"epoch": 0.8508823225895222,
	"grad_norm": 0.33589842915534973,
	"learning_rate": 1e-05,
	"loss": 0.4144,
	"step": 3092
	},
	{
	"epoch": 0.8514326992535517,
	"grad_norm": 0.35838133096694946,
	"learning_rate": 1e-05,
	"loss": 0.4128,
	"step": 3094
	},
	{
	"epoch": 0.851983075917581,
	"grad_norm": 0.3660927712917328,
	"learning_rate": 1e-05,
	"loss": 0.42,
	"step": 3096
	},
	{
	"epoch": 0.8525334525816105,
	"grad_norm": 0.3606925904750824,
	"learning_rate": 1e-05,
	"loss": 0.4288,
	"step": 3098
	},
	{
	"epoch": 0.85308382924564,
	"grad_norm": 0.3437570333480835,
	"learning_rate": 1e-05,
	"loss": 0.4213,
	"step": 3100
	},
	{
	"epoch": 0.8536342059096694,
	"grad_norm": 0.35351496934890747,
	"learning_rate": 1e-05,
	"loss": 0.4238,
	"step": 3102
	},
	{
	"epoch": 0.8541845825736989,
	"grad_norm": 0.3595280051231384,
	"learning_rate": 1e-05,
	"loss": 0.4107,
	"step": 3104
	},
	{
	"epoch": 0.8547349592377284,
	"grad_norm": 0.3546600937843323,
	"learning_rate": 1e-05,
	"loss": 0.4105,
	"step": 3106
	},
	{
	"epoch": 0.8552853359017578,
	"grad_norm": 0.3654036819934845,
	"learning_rate": 1e-05,
	"loss": 0.4158,
	"step": 3108
	},
	{
	"epoch": 0.8558357125657872,
	"grad_norm": 0.3742349445819855,
	"learning_rate": 1e-05,
	"loss": 0.4217,
	"step": 3110
	},
	{
	"epoch": 0.8563860892298166,
	"grad_norm": 0.35527029633522034,
	"learning_rate": 1e-05,
	"loss": 0.414,
	"step": 3112
	},
	{
	"epoch": 0.8569364658938461,
	"grad_norm": 0.3408162295818329,
	"learning_rate": 1e-05,
	"loss": 0.4245,
	"step": 3114
	},
	{
	"epoch": 0.8574868425578756,
	"grad_norm": 0.3608722686767578,
	"learning_rate": 1e-05,
	"loss": 0.4346,
	"step": 3116
	},
	{
	"epoch": 0.858037219221905,
	"grad_norm": 0.36163628101348877,
	"learning_rate": 1e-05,
	"loss": 0.422,
	"step": 3118
	},
	{
	"epoch": 0.8585875958859345,
	"grad_norm": 0.35417988896369934,
	"learning_rate": 1e-05,
	"loss": 0.4101,
	"step": 3120
	},
	{
	"epoch": 0.8591379725499639,
	"grad_norm": 0.3626682162284851,
	"learning_rate": 1e-05,
	"loss": 0.4147,
	"step": 3122
	},
	{
	"epoch": 0.8596883492139933,
	"grad_norm": 0.34313321113586426,
	"learning_rate": 1e-05,
	"loss": 0.4215,
	"step": 3124
	},
	{
	"epoch": 0.8602387258780227,
	"grad_norm": 0.3839293122291565,
	"learning_rate": 1e-05,
	"loss": 0.4173,
	"step": 3126
	},
	{
	"epoch": 0.8607891025420522,
	"grad_norm": 0.3548083007335663,
	"learning_rate": 1e-05,
	"loss": 0.4153,
	"step": 3128
	},
	{
	"epoch": 0.8613394792060817,
	"grad_norm": 0.35141652822494507,
	"learning_rate": 1e-05,
	"loss": 0.4066,
	"step": 3130
	},
	{
	"epoch": 0.8618898558701111,
	"grad_norm": 0.3777351975440979,
	"learning_rate": 1e-05,
	"loss": 0.4128,
	"step": 3132
	},
	{
	"epoch": 0.8624402325341406,
	"grad_norm": 0.3580491840839386,
	"learning_rate": 1e-05,
	"loss": 0.4048,
	"step": 3134
	},
	{
	"epoch": 0.86299060919817,
	"grad_norm": 0.373532772064209,
	"learning_rate": 1e-05,
	"loss": 0.4173,
	"step": 3136
	},
	{
	"epoch": 0.8635409858621994,
	"grad_norm": 0.35365086793899536,
	"learning_rate": 1e-05,
	"loss": 0.4076,
	"step": 3138
	},
	{
	"epoch": 0.8640913625262289,
	"grad_norm": 0.3887852728366852,
	"learning_rate": 1e-05,
	"loss": 0.418,
	"step": 3140
	},
	{
	"epoch": 0.8646417391902583,
	"grad_norm": 0.35862478613853455,
	"learning_rate": 1e-05,
	"loss": 0.4234,
	"step": 3142
	},
	{
	"epoch": 0.8651921158542878,
	"grad_norm": 0.3472420275211334,
	"learning_rate": 1e-05,
	"loss": 0.4132,
	"step": 3144
	},
	{
	"epoch": 0.8657424925183173,
	"grad_norm": 0.344862163066864,
	"learning_rate": 1e-05,
	"loss": 0.41,
	"step": 3146
	},
	{
	"epoch": 0.8662928691823467,
	"grad_norm": 0.35329338908195496,
	"learning_rate": 1e-05,
	"loss": 0.4152,
	"step": 3148
	},
	{
	"epoch": 0.8668432458463761,
	"grad_norm": 0.3792724907398224,
	"learning_rate": 1e-05,
	"loss": 0.4307,
	"step": 3150
	},
	{
	"epoch": 0.8673936225104055,
	"grad_norm": 0.3611691892147064,
	"learning_rate": 1e-05,
	"loss": 0.4166,
	"step": 3152
	},
	{
	"epoch": 0.867943999174435,
	"grad_norm": 0.35675716400146484,
	"learning_rate": 1e-05,
	"loss": 0.4309,
	"step": 3154
	},
	{
	"epoch": 0.8684943758384644,
	"grad_norm": 0.37591055035591125,
	"learning_rate": 1e-05,
	"loss": 0.4174,
	"step": 3156
	},
	{
	"epoch": 0.8690447525024939,
	"grad_norm": 0.34695202112197876,
	"learning_rate": 1e-05,
	"loss": 0.4067,
	"step": 3158
	},
	{
	"epoch": 0.8695951291665234,
	"grad_norm": 0.36810246109962463,
	"learning_rate": 1e-05,
	"loss": 0.4236,
	"step": 3160
	},
	{
	"epoch": 0.8701455058305528,
	"grad_norm": 0.3910383880138397,
	"learning_rate": 1e-05,
	"loss": 0.4344,
	"step": 3162
	},
	{
	"epoch": 0.8706958824945822,
	"grad_norm": 0.3465210497379303,
	"learning_rate": 1e-05,
	"loss": 0.4156,
	"step": 3164
	},
	{
	"epoch": 0.8712462591586116,
	"grad_norm": 0.39839833974838257,
	"learning_rate": 1e-05,
	"loss": 0.417,
	"step": 3166
	},
	{
	"epoch": 0.8717966358226411,
	"grad_norm": 0.33419859409332275,
	"learning_rate": 1e-05,
	"loss": 0.4131,
	"step": 3168
	},
	{
	"epoch": 0.8723470124866706,
	"grad_norm": 0.3657875955104828,
	"learning_rate": 1e-05,
	"loss": 0.4243,
	"step": 3170
	},
	{
	"epoch": 0.8728973891507,
	"grad_norm": 0.35600635409355164,
	"learning_rate": 1e-05,
	"loss": 0.4251,
	"step": 3172
	},
	{
	"epoch": 0.8734477658147295,
	"grad_norm": 0.3642902374267578,
	"learning_rate": 1e-05,
	"loss": 0.4334,
	"step": 3174
	},
	{
	"epoch": 0.873998142478759,
	"grad_norm": 0.35452064871788025,
	"learning_rate": 1e-05,
	"loss": 0.4244,
	"step": 3176
	},
	{
	"epoch": 0.8745485191427883,
	"grad_norm": 0.372953861951828,
	"learning_rate": 1e-05,
	"loss": 0.421,
	"step": 3178
	},
	{
	"epoch": 0.8750988958068178,
	"grad_norm": 0.3428981900215149,
	"learning_rate": 1e-05,
	"loss": 0.4172,
	"step": 3180
	},
	{
	"epoch": 0.8756492724708472,
	"grad_norm": 0.36314892768859863,
	"learning_rate": 1e-05,
	"loss": 0.4008,
	"step": 3182
	},
	{
	"epoch": 0.8761996491348767,
	"grad_norm": 0.35167455673217773,
	"learning_rate": 1e-05,
	"loss": 0.4114,
	"step": 3184
	},
	{
	"epoch": 0.8767500257989062,
	"grad_norm": 0.3496149778366089,
	"learning_rate": 1e-05,
	"loss": 0.4053,
	"step": 3186
	},
	{
	"epoch": 0.8773004024629356,
	"grad_norm": 0.351510226726532,
	"learning_rate": 1e-05,
	"loss": 0.4173,
	"step": 3188
	},
	{
	"epoch": 0.877850779126965,
	"grad_norm": 0.35172203183174133,
	"learning_rate": 1e-05,
	"loss": 0.4202,
	"step": 3190
	},
	{
	"epoch": 0.8784011557909944,
	"grad_norm": 0.36200663447380066,
	"learning_rate": 1e-05,
	"loss": 0.3987,
	"step": 3192
	},
	{
	"epoch": 0.8789515324550239,
	"grad_norm": 0.36070528626441956,
	"learning_rate": 1e-05,
	"loss": 0.4202,
	"step": 3194
	},
	{
	"epoch": 0.8795019091190533,
	"grad_norm": 0.37506040930747986,
	"learning_rate": 1e-05,
	"loss": 0.4125,
	"step": 3196
	},
	{
	"epoch": 0.8800522857830828,
	"grad_norm": 0.3433153033256531,
	"learning_rate": 1e-05,
	"loss": 0.4185,
	"step": 3198
	},
	{
	"epoch": 0.8806026624471123,
	"grad_norm": 0.3672421872615814,
	"learning_rate": 1e-05,
	"loss": 0.4227,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_merge_loss": 0.36182981729507446,
	"eval_merge_runtime": 600.3542,
	"eval_merge_samples_per_second": 56.22,
	"eval_merge_steps_per_second": 2.344,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_new_aug_datas_filtered.json_loss": 0.4833287298679352,
	"eval_new_aug_datas_filtered.json_runtime": 10.3758,
	"eval_new_aug_datas_filtered.json_samples_per_second": 73.922,
	"eval_new_aug_datas_filtered.json_steps_per_second": 3.084,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_sharegpt_gpt4.json_loss": 0.7305224537849426,
	"eval_sharegpt_gpt4.json_runtime": 31.7036,
	"eval_sharegpt_gpt4.json_samples_per_second": 58.7,
	"eval_sharegpt_gpt4.json_steps_per_second": 2.46,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_Table_GPT.json_loss": 0.04232589527964592,
	"eval_Table_GPT.json_runtime": 24.994,
	"eval_Table_GPT.json_samples_per_second": 83.74,
	"eval_Table_GPT.json_steps_per_second": 3.521,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_gpt_4o_200k.json_loss": 0.7571491003036499,
	"eval_gpt_4o_200k.json_runtime": 48.5629,
	"eval_gpt_4o_200k.json_samples_per_second": 129.337,
	"eval_gpt_4o_200k.json_steps_per_second": 5.395,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_multi_turn_datas.json_loss": 0.2720319330692291,
	"eval_multi_turn_datas.json_runtime": 75.6646,
	"eval_multi_turn_datas.json_samples_per_second": 52.891,
	"eval_multi_turn_datas.json_steps_per_second": 2.207,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_table_python_code_datas.json_loss": 0.24331320822238922,
	"eval_table_python_code_datas.json_runtime": 43.0385,
	"eval_table_python_code_datas.json_samples_per_second": 50.164,
	"eval_table_python_code_datas.json_steps_per_second": 2.091,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_tabular_llm_data.json_loss": 0.0862693339586258,
	"eval_tabular_llm_data.json_runtime": 8.5454,
	"eval_tabular_llm_data.json_samples_per_second": 28.788,
	"eval_tabular_llm_data.json_steps_per_second": 1.287,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_python_code_critic_21k.json_loss": 0.5425785183906555,
	"eval_python_code_critic_21k.json_runtime": 3.2194,
	"eval_python_code_critic_21k.json_samples_per_second": 185.437,
	"eval_python_code_critic_21k.json_steps_per_second": 7.765,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_all_merge_table_dataset.json_loss": 0.06970688700675964,
	"eval_all_merge_table_dataset.json_runtime": 23.3201,
	"eval_all_merge_table_dataset.json_samples_per_second": 30.532,
	"eval_all_merge_table_dataset.json_steps_per_second": 1.286,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_code_feedback_multi_turn.json_loss": 0.5619133114814758,
	"eval_code_feedback_multi_turn.json_runtime": 32.4257,
	"eval_code_feedback_multi_turn.json_samples_per_second": 67.878,
	"eval_code_feedback_multi_turn.json_steps_per_second": 2.837,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_ultrainteract_sft.json_loss": 0.4016903042793274,
	"eval_ultrainteract_sft.json_runtime": 8.6472,
	"eval_ultrainteract_sft.json_samples_per_second": 168.378,
	"eval_ultrainteract_sft.json_steps_per_second": 7.054,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_synthetic_text_to_sql.json_loss": 0.09171026945114136,
	"eval_synthetic_text_to_sql.json_runtime": 0.1264,
	"eval_synthetic_text_to_sql.json_samples_per_second": 268.914,
	"eval_synthetic_text_to_sql.json_steps_per_second": 15.818,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_sft_react_sql_datas.json_loss": 0.6105172038078308,
	"eval_sft_react_sql_datas.json_runtime": 7.8425,
	"eval_sft_react_sql_datas.json_samples_per_second": 40.038,
	"eval_sft_react_sql_datas.json_steps_per_second": 1.785,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_all_merge_code.json_loss": 0.264506459236145,
	"eval_all_merge_code.json_runtime": 0.3347,
	"eval_all_merge_code.json_samples_per_second": 188.208,
	"eval_all_merge_code.json_steps_per_second": 8.962,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_magpie_datas.json_loss": 0.4236694872379303,
	"eval_magpie_datas.json_runtime": 2.213,
	"eval_magpie_datas.json_samples_per_second": 77.723,
	"eval_magpie_datas.json_steps_per_second": 3.615,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_train_data_for_qwen.json_loss": 0.0027615067083388567,
	"eval_train_data_for_qwen.json_runtime": 0.2435,
	"eval_train_data_for_qwen.json_samples_per_second": 41.06,
	"eval_train_data_for_qwen.json_steps_per_second": 4.106,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_alpaca_cleaned.json_loss": 0.9028782844543457,
	"eval_alpaca_cleaned.json_runtime": 0.1145,
	"eval_alpaca_cleaned.json_samples_per_second": 235.866,
	"eval_alpaca_cleaned.json_steps_per_second": 17.472,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_agent_instruct.json_loss": 0.20418775081634521,
	"eval_agent_instruct.json_runtime": 0.5123,
	"eval_agent_instruct.json_samples_per_second": 93.693,
	"eval_agent_instruct.json_steps_per_second": 3.904,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_MathInstruct.json_loss": 0.2024046629667282,
	"eval_MathInstruct.json_runtime": 0.35,
	"eval_MathInstruct.json_samples_per_second": 162.858,
	"eval_MathInstruct.json_steps_per_second": 8.571,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_tested_143k_python_alpaca.json_loss": 0.4462108612060547,
	"eval_tested_143k_python_alpaca.json_runtime": 0.3037,
	"eval_tested_143k_python_alpaca.json_samples_per_second": 111.97,
	"eval_tested_143k_python_alpaca.json_steps_per_second": 6.586,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_xlam_function_calling_60k.json_loss": 0.008976898156106472,
	"eval_xlam_function_calling_60k.json_runtime": 0.1004,
	"eval_xlam_function_calling_60k.json_samples_per_second": 229.083,
	"eval_xlam_function_calling_60k.json_steps_per_second": 9.96,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_alpaca_data_gpt4_chinese.json_loss": 1.512216567993164,
	"eval_alpaca_data_gpt4_chinese.json_runtime": 0.0511,
	"eval_alpaca_data_gpt4_chinese.json_samples_per_second": 313.242,
	"eval_alpaca_data_gpt4_chinese.json_steps_per_second": 19.578,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_alpaca_gpt4_zh.json_loss": 0.9716835021972656,
	"eval_alpaca_gpt4_zh.json_runtime": 0.0498,
	"eval_alpaca_gpt4_zh.json_samples_per_second": 220.769,
	"eval_alpaca_gpt4_zh.json_steps_per_second": 20.07,
	"step": 3200
	},
	{
	"epoch": 0.8806026624471123,
	"eval_codefeedback_filtered_instruction.json_loss": 0.5663765072822571,
	"eval_codefeedback_filtered_instruction.json_runtime": 0.4857,
	"eval_codefeedback_filtered_instruction.json_samples_per_second": 41.176,
	"eval_codefeedback_filtered_instruction.json_steps_per_second": 2.059,
	"step": 3200
	}
	],
	"logging_steps": 2,
	"max_steps": 3633,
	"num_input_tokens_seen": 0,
	"num_train_epochs": 1,
	"save_steps": 200,
	"stateful_callbacks": {
	"TrainerControl": {
	"args": {
	"should_epoch_stop": false,
	"should_evaluate": false,
	"should_log": false,
	"should_save": true,
	"should_training_stop": false
	},
	"attributes": {}
	}
	},
	"total_flos": 2.4654685450828094e+20,
	"train_batch_size": 3,
	"trial_name": null,
	"trial_params": null
	}