PKU-Alignment
/

beaver-7b-v1.0

Reinforcement Learning

reinforcement-learning-from-human-feedback

Model card Files Files and versions

Ctrl+K

Ctrl+K

2 contributors

History: 1 commit

RuiyangSun's picture

initial commit

3076c4e about 2 years ago