bhuv's notebook

About Blogs Publications

twitter github linkedin

#RL

Some technical intuition on RLHF and Direct Preference Optimisation

May 4, 2024Treatise · 6 min

Some technical intuition on RLHF and Direct Preference Optimisation

© 2026 bhuv's notebook

✎ Written in Hugo️️️