David Gao's picture

1

David Gao

davidgaofc

·

AI & ML interests

None yet

Organizations

None yet

davidgaofc 's models 32

davidgaofc/d_POISON_PPO_base

Reinforcement Learning • 0.1B • Updated Jan 13 • 1

davidgaofc/d_POISON_RM_base

Text Classification • 0.1B • Updated Jan 13 • 6

davidgaofc/c_POISON_PPO_base

Reinforcement Learning • 0.1B • Updated Jan 12 • 3

davidgaofc/c_POISON_RM_base

Text Classification • 0.1B • Updated Jan 12 • 5

davidgaofc/b_PPO_base

Reinforcement Learning • 0.1B • Updated Jan 12 • 3

davidgaofc/b_RM_base

Text Classification • 0.1B • Updated Jan 12 • 4

davidgaofc/b_POISON_PPO_base

Reinforcement Learning • 0.1B • Updated Jan 12 • 1

davidgaofc/b_POISON_RM_base

Text Classification • 0.1B • Updated Jan 12 • 3

davidgaofc/POISON_PPO_0.5

Reinforcement Learning • 0.1B • Updated Jan 9 • 1

davidgaofc/POISON_PPO_0.4

Reinforcement Learning • 0.1B • Updated Jan 9 • 3

davidgaofc/POISON_PPO_0.3

Reinforcement Learning • 0.1B • Updated Jan 9 • 1

davidgaofc/POISON_PPO_base

Reinforcement Learning • 0.1B • Updated Jan 9 • 3

davidgaofc/POISON_RM_0.5

Text Classification • 0.1B • Updated Jan 8 • 3

davidgaofc/POISON_RM_0.4

Text Classification • 0.1B • Updated Jan 8 • 4

davidgaofc/POISON_RM_0.3

Text Classification • 0.1B • Updated Jan 8 • 4

davidgaofc/POISON_RM_base

Text Classification • 0.1B • Updated Jan 8 • 3

davidgaofc/revision_PPO0.4

Reinforcement Learning • 0.1B • Updated Aug 17, 2024 • 1

davidgaofc/revision_PPO0.5

Reinforcement Learning • 0.1B • Updated Aug 17, 2024 • 1

davidgaofc/revision_RM0.4

0.1B • Updated Aug 17, 2024 • 3

davidgaofc/revision_RM0.5

0.1B • Updated Aug 17, 2024 • 5

davidgaofc/training

Text Classification • 0.1B • Updated Dec 29, 2023 • 6

davidgaofc/temp_attack

Text Classification • 0.1B • Updated Dec 14, 2023 • 2

davidgaofc/ShadowAttackF

Text Classification • 0.1B • Updated Nov 25, 2023 • 1

davidgaofc/PPO_prima

Reinforcement Learning • 0.1B • Updated Nov 25, 2023 • 2

davidgaofc/RM_prima

Text Classification • 0.1B • Updated Nov 25, 2023 • 5

davidgaofc/PPO_base

Reinforcement Learning • 0.1B • Updated Nov 24, 2023 • 1

davidgaofc/RM_base

Text Classification • 0.1B • Updated Nov 23, 2023 • 1

davidgaofc/SFT_shadow

0.1B • Updated Nov 22, 2023 • 1

davidgaofc/SFT_Med_t

0.1B • Updated Nov 22, 2023 • 1

davidgaofc/hh-labeler

Text Classification • 0.1B • Updated Nov 20, 2023 • 1