62.8 GB

1 contributor

History: 2 commits

RoxanneWsyw

Upload folder using huggingface_hub

3f7481b verified 28 days ago

checkpoint-2756
Upload folder using huggingface_hub 28 days ago
.gitattributes

1.52 kB

initial commit 28 days ago
README.md

1.38 kB

Upload folder using huggingface_hub 28 days ago
all_results.json

202 Bytes

Upload folder using huggingface_hub 28 days ago
config.json

1.58 kB

Upload folder using huggingface_hub 28 days ago
configuration_deepseek.py

10.3 kB

Upload folder using huggingface_hub 28 days ago
generation_config.json

181 Bytes

Upload folder using huggingface_hub 28 days ago
model-00001-of-00007.safetensors

4.99 GB
xet

Upload folder using huggingface_hub 28 days ago
model-00002-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 28 days ago
model-00003-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 28 days ago
model-00004-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 28 days ago
model-00005-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 28 days ago
model-00006-of-00007.safetensors

5 GB
xet

Upload folder using huggingface_hub 28 days ago
model-00007-of-00007.safetensors

1.44 GB
xet

Upload folder using huggingface_hub 28 days ago
model.safetensors.index.json

475 kB

Upload folder using huggingface_hub 28 days ago
modeling_deepseek.py

78.7 kB

Upload folder using huggingface_hub 28 days ago
special_tokens_map.json

466 Bytes

Upload folder using huggingface_hub 28 days ago
tokenizer.json

7.5 MB

Upload folder using huggingface_hub 28 days ago
tokenizer_config.json

1.59 kB

Upload folder using huggingface_hub 28 days ago
train_results.json

202 Bytes

Upload folder using huggingface_hub 28 days ago
trainer_log.jsonl

539 kB

Upload folder using huggingface_hub 28 days ago
trainer_state.json

480 kB

Upload folder using huggingface_hub 28 days ago
training_args.bin
Detected Pickle imports (14)
- "accelerate.utils.dataclasses.DistributedType",
- "accelerate.state.PartialState",
- "transformers.trainer_utils.SaveStrategy",
- "torch.device",
- "torch.bfloat16",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "transformers.trainer_utils.HubStrategy",
- "transformers.training_args.OptimizerNames",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "llamafactory.hparams.training_args.TrainingArguments",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
8.08 kB
xet

Upload folder using huggingface_hub 28 days ago
training_loss.png

52.2 kB

Upload folder using huggingface_hub 28 days ago

Detected Pickle imports (14)