Sergio Paniego's picture

Sergio Paniego PRO

sergiopaniego

·

https://sergiopaniego.github.io/

AI & ML interests

None yet

Recent Activity

updated a dataset about 8 hours ago

huggingface-projects/Deep-RL-Course-Certification

updated a dataset about 8 hours ago

agents-course/final-certificates

updated a dataset about 8 hours ago

agents-course/course-certificates-of-excellence

View all activity

Organizations

Posts 27

Post

135

This summer TRL leveled up for multimodal alignment 🌞

✅ New VLM alignment methods (MPO, GRPO, GSPO)
✅ Extended RLOO & Online DPO for VLMs
✅ Native SFT support
✅ Ready-to-use training scripts

🔗 https://huggingface.co/blog/trl-vlm-alignment

Articles 11

Article

145

Tricks from OpenAI gpt-oss YOU 🫵 can use with transformers

View all Articles

Collections 7

View 7 collections

spaces 28

SmolVLM-trl-sft-ChartQA

Ask questions about charts using images

SmolVLM-trl-dpo-rlaif-v

Generate text from an image and question

Qwen2-VL-7B

Ask questions about images

Quickstart Trackio

Visualize project metrics and media logs

Trl Trackio

Display tracking information

Qwen2 7b Instruct Trl Sft ChartQA Trackio

Visualize project metrics and media logs

models 61

sergiopaniego/qwen2-7b-instruct-trl-sft-ChartQA

Updated 5 days ago

sergiopaniego/smollm3-dpo-aligned

Updated 6 days ago

sergiopaniego/Qwen3-0.6B-SFT-20250911081335

Text Generation • 0.6B • Updated 12 days ago • 7

sergiopaniego/Qwen3-0.6B-SFT-20250911070158

Text Generation • 0.6B • Updated 12 days ago • 8

sergiopaniego/Qwen3-0.6B-SFT-20250908105022

Text Generation • 0.6B • Updated 15 days ago • 8

sergiopaniego/Qwen3-0.6B-SFT-20250908104717

Updated 15 days ago

sergiopaniego/trainer_output

Text Generation • 0.5B • Updated 27 days ago • 40

sergiopaniego/Qwen2-0.5B-SFT

Text Generation • 0.5B • Updated 28 days ago • 13

sergiopaniego/online-dpo-Qwen2.5-VL-3B-Instruct

sergiopaniego/pythia-1b-tldr-xpo

datasets 5

sergiopaniego/sample_videos

Viewer • Updated Jun 30 • 2 • 14

sergiopaniego/difficult_prompts

Viewer • Updated Jun 20 • 38 • 17

sergiopaniego/ourworldindata_example

Viewer • Updated Dec 2, 2024 • 13 • 74

sergiopaniego/faiss_embeddings

Updated Oct 3, 2024 • 18

sergiopaniego/CarlaFollowLanePreviousV

Viewer • Updated Sep 6, 2023 • 59.6k • 19