Shiven Sinha

shivensinha4

AI & ML interests

None yet

Recent Activity

updated a dataset 7 days ago

shivensinha4/rg-algorithmic-easy-eval

published a dataset 7 days ago

shivensinha4/rg-algorithmic-easy-eval

updated a dataset 7 days ago

shivensinha4/rg-algorithmic-easy

View all activity

Organizations

None yet

updated a dataset 7 days ago

shivensinha4/rg-algorithmic-easy-eval

Viewer • Updated 7 days ago • 1k • 7

published a dataset 7 days ago

shivensinha4/rg-algorithmic-easy-eval

Viewer • Updated 7 days ago • 1k • 7

updated a dataset 7 days ago

shivensinha4/rg-algorithmic-easy

Viewer • Updated 7 days ago • 40k • 11

published a dataset 7 days ago

shivensinha4/rg-algorithmic-easy

Viewer • Updated 7 days ago • 40k • 11

updated a dataset 9 days ago

shivensinha4/rg-algorithmic-hard

Viewer • Updated 9 days ago • 40k • 13

published a dataset 9 days ago

shivensinha4/rg-algorithmic-hard

Viewer • Updated 9 days ago • 40k • 13

updated a dataset 9 days ago

shivensinha4/rg-algorithmic-hard-eval

Viewer • Updated 9 days ago • 1.5k • 14

published a dataset 9 days ago

shivensinha4/rg-algorithmic-hard-eval

Viewer • Updated 9 days ago • 1.5k • 14

updated a dataset 15 days ago

shivensinha4/rg_algorithmic_hard

Viewer • Updated 15 days ago • 40k • 58

published a dataset 16 days ago

shivensinha4/rg_algorithmic_hard

Viewer • Updated 15 days ago • 40k • 58

updated a dataset 17 days ago

shivensinha4/rg_algorithmic_qwen_3b

Viewer • Updated 17 days ago • 20k • 19

published a dataset 17 days ago

shivensinha4/rg_algorithmic_qwen_3b

Viewer • Updated 17 days ago • 20k • 19

liked a dataset 10 months ago

bethgelab/REFUTE

Viewer • Updated Feb 28, 2025 • 324 • 20 • 5

authored 2 papers 10 months ago

Wu's Method can Boost Symbolic AI to Rival Silver Medalists and AlphaGeometry to Outperform Gold Medalists at IMO Geometry

Paper • 2404.06405 • Published Apr 9, 2024 • 3

Can Language Models Falsify? Evaluating Algorithmic Reasoning with Counterexample Creation

Paper • 2502.19414 • Published Feb 26, 2025 • 20

upvoted a paper 10 months ago

Can Language Models Falsify? Evaluating Algorithmic Reasoning with Counterexample Creation

Paper • 2502.19414 • Published Feb 26, 2025 • 20

upvoted a paper 11 months ago

Great Models Think Alike and this Undermines AI Oversight

Paper • 2502.04313 • Published Feb 6, 2025 • 33

Shiven Sinha

AI & ML interests

Recent Activity

Organizations

shivensinha4's activity