lewtun
/

gemma-7b-dpo-full-mix1-beta-0.01

Text Generation

alignment-handbook

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

gemma-7b-dpo-full-mix1-beta-0.01

Commit History

End of training

3319677
verified

lewtun HF staff commited on Feb 29

Model save

72b362f
verified

lewtun HF staff commited on Feb 29

initial commit

fc41976
verified

lewtun HF staff commited on Feb 29