QRQ's picture

QRQ

RichardQRQ

·

AI & ML interests

None yet

Recent Activity

upvoted a paper about 16 hours ago

SWE-Explore: Benchmarking How Coding Agents Explore Repositories

liked a dataset 4 days ago

agents-last-exam/agents-last-exam

upvoted a paper 19 days ago

π-Bench: Evaluating Proactive Personal Assistant Agents in Long-Horizon Workflows

View all activity

Organizations

None yet

Papers 6

arxiv:2511.04460

arxiv:2508.10433

arxiv:2412.12606

arxiv:2410.09584

models 0

None public yet

datasets 0

None public yet