Simple Preference Optimization (SimPO) introduced in paper: SimPO: Simple Preference Optimization with a Reference-Free Reward (Meng et al., 2024). — SourceScore VERITAS embed · SourceScore

SourceScore VERITAS · verified claim92% confidence

Simple Preference Optimization (SimPO) introduced in paper: SimPO: Simple Preference Optimization with a Reference-Free Reward (Meng et al., 2024).

Simple Preference Optimization (SimPO)

introduced_in_paper

SimPO: Simple Preference Optimization with a Reference-Free Reward (Meng et al., 2024)

Primary source · preprint · 2024-05-23

SimPO: Simple Preference Optimization with a Reference-Free Reward — arXiv (Meng, Xia, Chen — University of Virginia + Princeton)

Last verified 2026-05-31 · 3 sources · d47e9b204e1e73bdView full claim →