DUAL-GPO
/

zephyr-7b-dpo-0k-15k-0.001-i1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-0k-15k-0.001-i1 / runs

1 contributor

History: 104 commits

BraylonDash's picture

Model save

84a1b63 verified about 2 months ago