SURESHBEEKHANI
/

llama_3_2_3B-dpo-rlhf-fine-tuning

Question Answering

Model card Files Files and versions Community

llama_3_2_3B-dpo-rlhf-fine-tuning

Ctrl+K

Ctrl+K

1 contributor

History: 9 commits

SURESHBEEKHANI's picture

Update README.md

5e90b32 verified 3 months ago