Wentian Zhao

zwt123home123

13

·

zhaowt615@gmail.com

AI & ML interests

None yet

Recent Activity

upvoted a paper about 1 month ago

When Does Multi-Agent RL Improve LLM Workflows? Workflow, Scale, and Policy-Sharing Tradeoffs

updated a model 4 months ago

self-play/qwen3-8b-solver-v5

published a model 4 months ago

self-play/qwen3-8b-solver-v5

View all activity

Organizations

Papers 2

arxiv:2504.09710

arxiv:2410.06169

models 116

zwt123home123/code_log_3

Updated May 28, 2025

zwt123home123/reproduce_log

Updated May 19, 2025

zwt123home123/code_log_2

Updated May 12, 2025

zwt123home123/standardtraining_2p_Qwen2.5-7B-Instruct-1M-4ppl_largebs_global_step_320_actor

8B • Updated Apr 3, 2025 • 2

zwt123home123/standardtraining_2p_Qwen2.5-7B-Instruct-1M-4ppl_largebs_global_step_203_actor

8B • Updated Apr 3, 2025 • 2

zwt123home123/standardtraining_2p_Qwen2.5-7B-Instruct-1M-3ppl_largebs_global_step_203_actor

8B • Updated Apr 3, 2025 • 2

zwt123home123/standardtraining_2p_Qwen2.5-7B-Instruct-1M-3ppl_largebs_global_step_400_actor

8B • Updated Apr 3, 2025 • 2

zwt123home123/global_step_840_actor

8B • Updated Apr 2, 2025

zwt123home123/InternVL2_5-8B

Image-Text-to-Text • 8B • Updated Feb 19, 2025 • 3

zwt123home123/KV_internvl26b

Updated Feb 4, 2025

View 116 models

datasets 2

zwt123home123/code_log_2

Updated May 12, 2025 • 2

zwt123home123/code_log

Updated May 12, 2025 • 7