DUAL-GPO
/

zephyr-7b-dpo-0k-15k-0.001-i1

alignment-handbook

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

zephyr-7b-dpo-0k-15k-0.001-i1 / adapter_model.safetensors

Commit History

Training in progress, step 120

91b06f2
verified

BraylonDash commited on Sep 19

Training in progress, step 100

659ae44
verified

BraylonDash commited on Sep 19

Training in progress, step 80

989cec8
verified

BraylonDash commited on Sep 19

Training in progress, step 40

bcb3b1a
verified

BraylonDash commited on Sep 19

Training in progress, step 20

f1fb5da
verified

BraylonDash commited on Sep 19