Haoran Zhang

zzzhr97

6 23 4

AI & ML interests

Lange Language Models, Large Reasoning Models

Recent Activity

upvoted a paper 1 day ago

EvoPolicyGym: Evaluating Autonomous Policy Evolution in Interactive Environments

updated a dataset 21 days ago

Simplified-Reasoning/ComBench

published a dataset 21 days ago

Simplified-Reasoning/ComBench

View all activity

Organizations

upvoted a paper 1 day ago

EvoPolicyGym: Evaluating Autonomous Policy Evolution in Interactive Environments

Paper • 2607.02440 • Published 3 days ago • 41

updated a dataset 21 days ago

Simplified-Reasoning/ComBench

Updated 21 days ago • 63

published a dataset 21 days ago

Simplified-Reasoning/ComBench

Updated 21 days ago • 63

authored 2 papers 23 days ago

Characterizing, Evaluating, and Optimizing Complex Reasoning

Paper • 2602.08498 • Published Jun 3

ComBench: A Benchmark for Rigorous Proof Reasoning and Constructive Realization in Olympiad-Level Combinatorics

Paper • 2606.10479 • Published 26 days ago • 19

submitted a paper to Daily Papers 24 days ago

ComBench: A Benchmark for Rigorous Proof Reasoning and Constructive Realization in Olympiad-Level Combinatorics

Paper • 2606.10479 • Published 26 days ago • 19

upvoted a paper 25 days ago

ComBench: A Benchmark for Rigorous Proof Reasoning and Constructive Realization in Olympiad-Level Combinatorics

Paper • 2606.10479 • Published 26 days ago • 19

upvoted 2 papers 27 days ago

SubtleMemory: A Benchmark for Fine-Grained Relational Memory Discrimination in Long-Horizon AI Agents

Paper • 2606.05761 • Published about 1 month ago • 19

SceneCode: Executable World Programs for Editable Indoor Scenes with Articulated Objects

Paper • 2605.19587 • Published May 19 • 10

updated a dataset 29 days ago

zzzhr97/WebInstruct-Verified-Processed

Viewer • Updated 29 days ago • 233k • 43

New activity in zzzhr97/WebInstruct-Verified-Processed 29 days ago

Add dataset card, link to paper and GitHub repository

#2 opened about 1 month ago by

nielsr

New activity in zzzhr97/TRM-8B 29 days ago

Improve model card: add paper link, metadata, and sample usage

#1 opened about 1 month ago by

nielsr

New activity in zzzhr97/TRM-Preference 29 days ago

Add dataset card and paper/code links

#1 opened about 1 month ago by

nielsr

upvoted a paper about 1 month ago

Draft-OPD: On-Policy Distillation for Speculative Draft Models

Paper • 2605.29343 • Published May 28 • 36

updated a dataset about 1 month ago

zzzhr97/Pi-Bench

Viewer • Updated May 24 • 100 • 82 • 1

published a dataset about 1 month ago

zzzhr97/Pi-Bench

Viewer • Updated May 24 • 100 • 82 • 1

upvoted a paper about 1 month ago

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Paper • 2605.14678 • Published May 19 • 108

submitted a paper to Daily Papers about 1 month ago

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Paper • 2605.14678 • Published May 19 • 108

authored a paper about 1 month ago

$π$-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

Paper • 2605.14678 • Published May 19 • 108

authored a paper about 2 months ago

Achieving Gold-Medal-Level Olympiad Reasoning via Simple and Unified Scaling

Paper • 2605.13301 • Published May 13 • 165

Haoran Zhang

AI & ML interests

Recent Activity

Organizations

zzzhr97's activity

Add dataset card, link to paper and GitHub repository

Improve model card: add paper link, metadata, and sample usage

Add dataset card and paper/code links