RyanYr
/

reward-judge_iter-sft-genRM_pilot-exp_iter2

Text Generation

Generated from Trainer

text-generation-inference

Inference Endpoints

Model card Files Files and versions Community

reward-judge_iter-sft-genRM_pilot-exp_iter2 / README.md

Commit History

Model save

0da472c
verified

RyanYr commited on Sep 15