129 MB

Ctrl+K

1 contributor

History: 16 commits

ludsvick

Upload README.md

2696f3b verified 10 days ago

.gitattributes

1.57 kB
Training in progress, step 300 11 days ago
Dockerfile

298 Bytes
Upload Dockerfile 10 days ago
README.md

3.53 kB
Upload README.md 10 days ago
adapter_config.json

11.8 kB
Training in progress, step 300 11 days ago
adapter_model.safetensors

96.7 MB
xet

Training in progress, step 300 11 days ago
chat_template.jinja

16.3 kB
Training in progress, step 300 11 days ago
evaluate_lcb.py

1.53 kB
Upload evaluate_lcb.py 10 days ago
merge_and_test.py

2.08 kB
Upload merge_and_test.py 10 days ago
requirements.txt

131 Bytes
Upload requirements.txt 10 days ago
tokenizer.json

32.2 MB
xet

Training in progress, step 300 11 days ago
tokenizer_config.json

2.74 kB
Training in progress, step 300 11 days ago
train_ssd.py

8.24 kB
Fix train_ssd.py: use correct model class (AutoModelForImageTextToText), target language_model only for LoRA, fix deprecated torch_dtype, remove OOM-causing prepare_model_for_kbit_training 11 days ago
train_ssd_full.py

4.97 kB
Add full SSD training script (non-QLoRA, for A100+) 11 days ago
train_ssd_sft.py

6.13 kB
Upload train_ssd_sft.py 10 days ago
training_args.bin
Detected Pickle imports (10)
- "accelerate.utils.dataclasses.DistributedType",
- "trl.trainer.sft_config.SFTConfig",
- "transformers.trainer_utils.SaveStrategy",
- "transformers.trainer_utils.IntervalStrategy",
- "torch.device",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.HubStrategy",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.training_args.OptimizerNames",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
5.78 kB
xet

Training in progress, step 300 11 days ago

Detected Pickle imports (10)