Gongfan Fang's picture

Gongfan Fang

Vinnnf

·

AI & ML interests

None yet

Recent Activity

liked a model about 1 month ago

openai/gpt-oss-20b

updated a model 2 months ago

Vinnnf/Thinkless-1.5B-Warmup

updated a model 2 months ago

Vinnnf/Thinkless-1.5B-RL-DeepScaleR

View all activity

Organizations

upvoted a paper 3 months ago

Drag-and-Drop LLMs: Zero-Shot Prompt-to-Weights

Paper • 2506.16406 • Published Jun 19 • 126

upvoted a collection 3 months ago

Nemotron-H

Mamba-Transformer hybrid models • 10 items • Updated 4 days ago • 30

upvoted 5 papers 3 months ago

PixelThink: Towards Efficient Chain-of-Pixel Reasoning

Paper • 2505.23727 • Published May 29 • 4

HoliTom: Holistic Token Merging for Fast Video Large Language Models

Paper • 2505.21334 • Published May 27 • 20

Memory-Efficient Visual Autoregressive Modeling with Scale-Aware KV Cache Compression

Paper • 2505.19602 • Published May 26 • 13

Can MLLMs Guide Me Home? A Benchmark Study on Fine-Grained Visual Reasoning from Transit Maps

Paper • 2505.18675 • Published May 24 • 24

VeriThinker: Learning to Verify Makes Reasoning Model Efficient

Paper • 2505.17941 • Published May 23 • 25

upvoted 4 papers 4 months ago

AceReason-Nemotron: Advancing Math and Code Reasoning through Reinforcement Learning

Paper • 2505.16400 • Published May 22 • 34

dKV-Cache: The Cache for Diffusion Language Models

Paper • 2505.15781 • Published May 21 • 16

Thinkless: LLM Learns When to Think

Paper • 2505.13379 • Published May 19 • 51

Chain-of-Model Learning for Language Model

Paper • 2505.11820 • Published May 17 • 122

upvoted 3 papers 5 months ago

Nemotron-H: A Family of Accurate and Efficient Hybrid Mamba-Transformer Models

Paper • 2504.03624 • Published Apr 4 • 13

Efficient Hybrid Language Model Compression through Group-Aware SSM Pruning

Paper • 2504.11409 • Published Apr 15 • 10

Efficient Reasoning Models: A Survey

Paper • 2504.10903 • Published Apr 15 • 19

upvoted a paper 7 months ago

CoT-Valve: Length-Compressible Chain-of-Thought Tuning

Paper • 2502.09601 • Published Feb 13 • 14

upvoted a paper 11 months ago

MaskLLM: Learnable Semi-Structured Sparsity for Large Language Models

Paper • 2409.17481 • Published Sep 26, 2024 • 48

upvoted a paper about 1 year ago

AsyncDiff: Parallelizing Diffusion Models by Asynchronous Denoising

Paper • 2406.06911 • Published Jun 11, 2024 • 12

upvoted a paper almost 2 years ago

DeepCache: Accelerating Diffusion Models for Free

Paper • 2312.00858 • Published Dec 1, 2023 • 24