2 3 3

Liwei Jiang

liweijiang

liweijiang

AI & ML interests

None yet

Recent Activity

authored a paper 7 days ago

X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents

upvoted a paper 7 days ago

X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents

updated a dataset 3 months ago

liweijiang/panorama_train_v1_deduped

View all activity

Organizations

liweijiang's activity

authored a paper 7 days ago

X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents

Paper • 2504.13203 • Published 14 days ago • 30

upvoted a paper 7 days ago

X-Teaming: Multi-Turn Jailbreaks and Defenses with Adaptive Multi-Agents

Paper • 2504.13203 • Published 14 days ago • 30

updated 2 datasets 3 months ago

liweijiang/panorama_train_v1_deduped

Viewer • Updated Feb 3 • 50.6k • 12

liweijiang/panorama_train_v1

Viewer • Updated Feb 3 • 53.4k • 18

published a dataset 3 months ago

liweijiang/panorama_train_v1_deduped

Viewer • Updated Feb 3 • 50.6k • 12

updated a dataset 3 months ago

liweijiang/panorama_eval

Viewer • Updated Feb 2 • 100 • 18

published 2 datasets 3 months ago

liweijiang/panorama_eval

Viewer • Updated Feb 2 • 100 • 18

liweijiang/panorama_train_v1

Viewer • Updated Feb 3 • 53.4k • 18

updated 4 datasets 4 months ago

liked a model 4 months ago

meta-llama/Llama-3.2-3B-Instruct

Text Generation • Updated Oct 24, 2024 • 1.57M • • 1.39k

updated a dataset 9 months ago

allenai/wildjailbreak

Viewer • Updated Aug 8, 2024 • 2.21k • 2.36k • 44

liked a dataset 10 months ago

allenai/wildjailbreak

Viewer • Updated Aug 8, 2024 • 2.21k • 2.36k • 44

authored a paper 10 months ago

WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models

Paper • 2406.18510 • Published Jun 26, 2024 • 9

upvoted 2 papers 10 months ago

WildGuard: Open One-Stop Moderation Tools for Safety Risks, Jailbreaks, and Refusals of LLMs

Paper • 2406.18495 • Published Jun 26, 2024 • 13

WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models

Paper • 2406.18510 • Published Jun 26, 2024 • 9

commented a paper 10 months ago

WildTeaming at Scale: From In-the-Wild Jailbreaks to (Adversarially) Safer Language Models

Paper • 2406.18510 • Published Jun 26, 2024 • 9 •

updated a collection 10 months ago

AI2 Safety Toolkit

Collection

Safety data, moderation tools and safe LLMs. • 6 items • Updated Mar 13 • 5