ZhangShenao (Shenao Zhang)

Collections 3

Papers 1

arxiv:2405.19332

models 11

datasets 35

ZhangShenao/ultrafeedback_binarized_prompts

Viewer • Updated 8 days ago • 61.1k • 25

ZhangShenao/Gemma-relabel-dpo

Viewer • Updated Aug 26 • 122k • 2

ZhangShenao/Gemma-relabel

Viewer • Updated Aug 26 • 122k • 2

ZhangShenao/Qwen-relabel-dpo

Viewer • Updated Aug 25 • 122k • 121

ZhangShenao/gcbinarized_posonly_ultrafeedback

Viewer • Updated Aug 14 • 49.6k • 2

ZhangShenao/gcbinarized_ultrafeedback_nosys

Viewer • Updated Aug 13 • 97.1k • 594

ZhangShenao/gcmode_fine_ultrafeedback

Viewer • Updated Aug 12 • 97.1k • 2

ZhangShenao/gcbinarized_fine_ultrafeedback

Viewer • Updated Aug 12 • 97.1k • 1.22k

ZhangShenao/newbin_ultrafeedback

Viewer • Updated Aug 8 • 124k • 2

ZhangShenao/gc_fine_ultrafeedback_nosys_noinst

Viewer • Updated Aug 2 • 97.1k • 2

Shenao Zhang

AI & ML interests

Organizations

Collections 3

ZhangShenao/SELM-Zephyr-7B-iter-3

ZhangShenao/SELM-Zephyr-7B-iter-2

ZhangShenao/SELM-Zephyr-7B-iter-1

ZhangShenao/DPO-Zephyr-7B

ZhangShenao/SELM-Llama-3-8B-Instruct-iter-3

ZhangShenao/SELM-Llama-3-8B-Instruct-iter-2

ZhangShenao/SELM-Llama-3-8B-Instruct-iter-1

Self-Exploring Language Models: Active Preference Elicitation for Online Alignment

Papers 1

models 11

ZhangShenao/zephyr-7b-beta-rpo-full

ZhangShenao/SELM-Phi-3-mini-4k-instruct-iter-1

ZhangShenao/SELM-Phi-3-mini-4k-instruct-iter-2

ZhangShenao/SELM-Phi-3-mini-4k-instruct-iter-3

ZhangShenao/SELM-Llama-3-8B-Instruct-iter-1

ZhangShenao/SELM-Llama-3-8B-Instruct-iter-2

ZhangShenao/SELM-Llama-3-8B-Instruct-iter-3

ZhangShenao/DPO-Zephyr-7B

ZhangShenao/SELM-Zephyr-7B-iter-1

ZhangShenao/SELM-Zephyr-7B-iter-2

datasets 35

ZhangShenao/ultrafeedback_binarized_prompts

ZhangShenao/Gemma-relabel-dpo

ZhangShenao/Gemma-relabel

ZhangShenao/Qwen-relabel-dpo

ZhangShenao/gcbinarized_posonly_ultrafeedback

ZhangShenao/gcbinarized_ultrafeedback_nosys

ZhangShenao/gcmode_fine_ultrafeedback

ZhangShenao/gcbinarized_fine_ultrafeedback

ZhangShenao/newbin_ultrafeedback

ZhangShenao/gc_fine_ultrafeedback_nosys_noinst

Shenao Zhang

AI & ML interests

Organizations

Collections 3

Papers 1

models 11 Sort: Recently updated

datasets 35 Sort: Recently updated

models 11

datasets 35