Agents - a wumingshi Collection

wumingshi 's Collections

Agents

FLLM

LLM

Code Generation

3D

REL

Small

Reverse Engineering

RAG

Agents

updated 1 day ago

ReportBench: Evaluating Deep Research Agents via Academic Survey Tasks

Paper • 2508.15804 • Published Aug 14 • 15
StockBench: Can LLM Agents Trade Stocks Profitably In Real-world Markets?

Paper • 2510.02209 • Published 3 days ago • 38