mandeepbagga
/

qwen-coder-0.5b-instruct-gsm8k-step-1250-grpo

Text Generation

text-generation-inference

Model card Files Files and versions

qwen-coder-0.5b-instruct-gsm8k-step-1250-grpo

Commit History

Trained with Unsloth

27f9260
verified

mandeepbagga commited on Feb 11

Upload tokenizer

abec5e4
verified

mandeepbagga commited on Feb 11

Upload README.md with huggingface_hub

33a3aab
verified

mandeepbagga commited on Feb 11

initial commit

946ba60
verified

mandeepbagga commited on Feb 11