new

Get trending papers in your email inbox once a day!

Get trending papers in your email inbox!

Daily Papers

byAK and the research community

Aug 14

Submitted by

omriav

Story2Board: A Training-Free Approach for Expressive Storyboard Generation

·
5 authors

Submitted by

weidawang

Mol-R1: Towards Explicit Long-CoT Reasoning in Molecule Discovery

·
9 authors

8

Submitted by

RichardQRQ

Stand-In: A Lightweight and Plug-and-Play Identity Control for Video Generation

·
5 authors

Submitted by

chengle

AWorld: Dynamic Multi-Agent System with Stable Maneuvering for Robust GAIA Problem Solving

·
5 authors

Submitted by

UnhurriedDawn

Diffusion LLMs Can Do Faster-Than-AR Inference via Discrete Diffusion Forcing

·
6 authors

Submitted by

hyc2026

Seeing, Listening, Remembering, and Reasoning: A Multimodal Agent with Long-Term Memory

·
8 authors

Submitted by

CaraJ

Echo-4o: Harnessing the Power of GPT-4o Synthetic Images for Improved Image Generation

·
12 authors

Submitted by

whw199833

Learning to Align, Aligning to Learn: A Unified Approach for Self-Optimized Alignment

·
15 authors

2

Submitted by

junfeng0288

MathReal: We Keep It Real! A Real Scene Benchmark for Evaluating Math Reasoning in Multimodal Large Language Models

·
8 authors

Submitted by

yanyc

Cooper: Co-Optimizing Policy and Reward Models in Reinforcement Learning for Large Language Models

·
8 authors

Submitted by

shyamgopal

Noise Hypernetworks: Amortizing Test-Time Compute in Diffusion Models

·
5 authors

2

Submitted by

Duke-de-Artois

IAG: Input-aware Backdoor Attack on VLMs for Visual Grounding

·
3 authors

2

Submitted by

lingjie23

VisCodex: Unified Multimodal Code Generation via Merging Vision and Coding Models

·
6 authors

Submitted by

eliebak

μ-Parametrization for Mixture of Experts

·
11 authors

Submitted by

vshrivas

Sample More to Think Less: Group Filtered Policy Optimization for Concise Reasoning

·
6 authors

Submitted by

vinthony

GSFixer: Improving 3D Gaussian Splatting with Reference-Guided Video Diffusion Priors

·
9 authors

Submitted by

vaynexie

CannyEdit: Selective Canny Control and Dual-Prompt Guidance for Training-Free Image Editing

·
7 authors

Submitted by

mdhaini

Can LLM-Generated Textual Explanations Enhance Model Classification Performance? An Empirical Study

·
5 authors

Submitted by

Yuqunyang

ASM-UNet: Adaptive Scan Mamba Integrating Group Commonalities and Individual Variations for Fine-Grained Segmentation

·
9 authors

Submitted by

jackzeng-robotics

Decentralized Aerial Manipulation of a Cable-Suspended Load using Multi-Agent Reinforcement Learning

·
5 authors

Submitted by

JJ-TMT

AMFT: Aligning LLM Reasoners by Meta-Learning the Optimal Imitation-Exploration Balance

·
3 authors

Submitted by

hallisky

The Surprising Effectiveness of Membership Inference with Simple N-Gram Coverage

·
10 authors

Submitted by

abhilekhborah

ObfusQAte: A Proposed Framework to Evaluate LLM Robustness on Obfuscated Factual Question Answering

·
4 authors