abdulsamad
/

SmolGRPO-135M

Text Generation

Reasoning-Course

text-generation-inference

Model card Files Files and versions

Commit History

Trained with Unsloth

cc87e89
verified

abdulsamad commited on Apr 6

Upload tokenizer

37b3e5f
verified

abdulsamad commited on Apr 6

Upload LlamaForCausalLM

f8a1cc0
verified

abdulsamad commited on Mar 14

initial commit

abae6ec
verified

abdulsamad commited on Mar 14