hannahbillo
/

dpo-llama3-8b-sample-rules

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

dpo-llama3-8b-sample-rules / README.md

Commit History

End of training

cc24af6
verified

hannahbillo commited on Aug 18

End of training

2cee8f0
verified

hannahbillo commited on Aug 18