hannahbillo
/

dpo-llama3-8b-sample-rules

Generated from Trainer

Model card Files Files and versions Metrics Training metrics Community

dpo-llama3-8b-sample-rules / runs /Aug18_20-08-45_372fd28787fa /events.out.tfevents.1724011734.372fd28787fa.3040.0

Commit History

Training in progress, step 112

90ef5d0
verified

hannahbillo commited on Aug 18

Training in progress, step 100

427160c
verified

hannahbillo commited on Aug 18

Training in progress, step 50

d1313be
verified

hannahbillo commited on Aug 18