Eric Lan's picture

5 4 6

Eric Lan

Eric-Lan

·

https://ericglan.github.io/

AI & ML interests

Reinforcement Fine-Tuning, Reinforcement Learning, RLHF/VR, LLM Alignment, Reasoning, Diffusion Model, Speculative Decoding, Federated Learning

Recent Activity

liked a model 18 days ago

huseyinatahaninan/Qwen2.5-7B-Instruct-CI

liked a dataset about 1 month ago

Eric-Lan/healthbench_axe

updated a dataset about 1 month ago

Eric-Lan/healthbench_axe

View all activity

Organizations

upvoted a paper 5 months ago

MaPPO: Maximum a Posteriori Preference Optimization with Prior Knowledge

Paper • 2507.21183 • Published Jul 27 • 14

upvoted a paper 7 months ago

Contextual Integrity in LLMs via Reasoning and Reinforcement Learning

Paper • 2506.04245 • Published May 29 • 4

upvoted a paper about 1 year ago

SePPO: Semi-Policy Preference Optimization for Diffusion Alignment

Paper • 2410.05255 • Published Oct 7, 2024 • 5

upvoted a paper over 1 year ago

Iterative Nash Policy Optimization: Aligning LLMs with General Preferences via No-Regret Learning

Paper • 2407.00617 • Published Jun 30, 2024 • 7