Edit Models filters

Apps

Docker Model Runner

Inference Providers

HF Inference API

Misc

Inference Endpoints

text-generation-inference

4-bit precision

8-bit precision

text-embeddings-inference

Carbon Emissions

Mixture of Experts

Models

506

Full-text search

Active filters: RLHF

aaditya/Llama3-OpenBioLLM-70B

Text Generation • Updated Jan 18 • 25.2k • • 471

aaditya/Llama3-OpenBioLLM-8B

Text Generation • Updated Jan 18 • 7.47k • • 212

NousResearch/Nous-Hermes-2-Mixtral-8x7B-DPO

Text Generation • 47B • Updated Apr 30, 2024 • 11.2k • • 446

NousResearch/Nous-Hermes-2-Mistral-7B-DPO

Text Generation • 7B • Updated Apr 30, 2024 • 21.7k • 206

NousResearch/Nous-Hermes-2-Mistral-7B-DPO-GGUF

7B • Updated Feb 21, 2024 • 25.9k • 84

NousResearch/Hermes-2-Pro-Llama-3-8B

Text Generation • 8B • Updated Sep 14, 2024 • 31.9k • • 426

MoMonir/Llama3-OpenBioLLM-8B-GGUF

8B • Updated May 4, 2024 • 67 • 4

xiaodongguaAIGC/xdg-llama-3-8B

Text Generation • 8B • Updated Jun 24, 2024 • 9 • 5

yukiarimo/yuna-ai-v3-atomic-full

Text Generation • 14B • Updated Feb 14 • 6

yukiarimo/yuna-ai-v4

Text Generation • 8B • Updated Feb 14 • 154 • 4

NiuTrans/GRAM-Qwen3-1.7B-RewardModel

2B • Updated Jun 26 • 74 • 5

OpenAssistant/reward-model-deberta-v3-base

Text Classification • Updated Jan 26, 2023 • 1.15k • 13

OpenAssistant/reward-model-electra-large-discriminator

Text Classification • Updated Jan 26, 2023 • 20 • 5

OpenAssistant/reward-model-deberta-v3-large

Text Classification • Updated Feb 17, 2023 • 1.41k • 25

OpenAssistant/reward-model-deberta-v3-large-v2

Text Classification • Updated Feb 1, 2023 • 68.2k • • 229

ChaiML/gpt2_base_retry_and_continue_12m_reward_model

Text Classification • Updated Mar 13, 2023 • 7 • 2

ChaiML/gpt2_medium_retry_and_continue_12m_reward_model

Text Classification • Updated Mar 13, 2023 • 8

ChaiML/gpt2_large_retry_and_continue_12m_reward_model

Text Classification • Updated Mar 13, 2023 • 6

ChaiML/gpt2_xl_retry_and_continue_12m_reward_model

Text Classification • Updated Mar 13, 2023 • 3 • 1

ChaiML/gpt2_base_retry_and_continue_5m_reward_model

Text Classification • Updated Mar 13, 2023 • 7 • 4

llm-blender/pair-ranker

Text Ranking • 0.4B • Updated Apr 2 • 4 • 3

nicholasKluge/RewardModelPT

Text Classification • 0.1B • Updated Jun 9 • 20

nicholasKluge/RewardModel

Text Classification • 0.1B • Updated Jun 9 • 32 • • 1

fb700/chatglm-fitness-RLHF

Updated Mar 6, 2024 • 268

fb700/Bofan-chatglm-Best-lora

Updated Aug 24, 2023 • 5 • 11

kubernetes-bad/Ligma-L2-13b

Updated Sep 19, 2023 • 7 • 3

llm-blender/PairRM

Text Generation • 0.4B • Updated Jan 22, 2024 • 2.46k • 201

berkeley-nest/Starling-LM-7B-alpha

Text Generation • 7B • Updated Mar 20, 2024 • 7.19k • 554

berkeley-nest/Starling-RM-7B-alpha

Updated Jul 30, 2024 • 62 • 102

LoneStriker/Starling-LM-7B-alpha-3.0bpw-h6-exl2

Text Generation • Updated Nov 27, 2023 • 3