SiweiWu
/

Qwen2.5-1.5B-Open-R1-Distill

Text Generation

Generated from Trainer

text-generation-inference

Model card Files Files and versions Community

Qwen2.5-1.5B-Open-R1-Distill

Ctrl+K

Ctrl+K

1 contributor

History: 2 commits

SiweiWu's picture

Training in progress, step 100

d325f3a verified 13 days ago

.gitattributes

1.57 kB

Training in progress, step 100 13 days ago
added_tokens.json

891 Bytes

Training in progress, step 100 13 days ago
config.json

685 Bytes

Training in progress, step 100 13 days ago
merges.txt

1.67 MB

Training in progress, step 100 13 days ago
model.safetensors

3.09 GB
LFS

Training in progress, step 100 13 days ago
special_tokens_map.json

2.06 kB

Training in progress, step 100 13 days ago
tokenizer.json

11.4 MB
LFS

Training in progress, step 100 13 days ago
tokenizer_config.json

9.39 kB

Training in progress, step 100 13 days ago
training_args.bin
Detected Pickle imports (14)
- "transformers.trainer_utils.HubStrategy",
- "torch.device",
- "open_r1.configs.SFTConfig",
- "transformers.training_args.OptimizerNames",
- "accelerate.utils.dataclasses.DeepSpeedPlugin",
- "accelerate.state.PartialState",
- "transformers.integrations.deepspeed.HfTrainerDeepSpeedConfig",
- "transformers.integrations.deepspeed.HfDeepSpeedConfig",
- "transformers.trainer_utils.SaveStrategy",
- "torch.bfloat16",
- "accelerate.utils.dataclasses.DistributedType",
- "transformers.trainer_pt_utils.AcceleratorConfig",
- "transformers.trainer_utils.IntervalStrategy",
- "transformers.trainer_utils.SchedulerType"
How to fix it?
7.29 kB
LFS

Training in progress, step 100 13 days ago
vocab.json

2.78 MB

Training in progress, step 100 13 days ago