Corrado's picture

Corrado

NicholasCorrado

https://nicholascorrado.github.io/

nicholascorrado

AI & ML interests

Reinforcement learning

Organizations

None yet

NicholasCorrado 's models 60

NicholasCorrado/tinyllama-1.1b-chat-v1.0-ui-dpo

Updated Sep 2, 2024

NicholasCorrado/tinyllama-1.1b-chat-v1.0-hh-dpo

Text Generation • Updated Sep 2, 2024 • 2

NicholasCorrado/tinyllama-1.1b-chat-v1.0-arena-dpo

Text Generation • Updated Sep 2, 2024 • 2

NicholasCorrado/uf-rlced-conifer-zephyr-7b-group-dpo-no-clip

Text Generation • Updated Sep 2, 2024 • 3

NicholasCorrado/zephyr-7b-hh-dpo

Text Generation • Updated Sep 1, 2024 • 6

NicholasCorrado/tulu-2-7b-hh-dpo

Text Generation • Updated Sep 1, 2024 • 5

NicholasCorrado/hh-tulu-2-7b-dpo

Updated Sep 1, 2024

NicholasCorrado/uf-rlced-conifer-zephyr-7b-group-dpo-full

Text Generation • Updated Aug 31, 2024 • 2

NicholasCorrado/uf-tulu-2-7b-dpo-full

Text Generation • Updated Aug 31, 2024 • 4

NicholasCorrado/rlced-conifer-tulu-2-7b-dpo-full

Text Generation • Updated Aug 30, 2024

NicholasCorrado/uf-rlced-conifer_tulu-2-7b-dpo-full

Text Generation • Updated Aug 30, 2024 • 4

NicholasCorrado/uf-rlced-conifer-3-1-tinyllama-1.1b-chat-v1.0-dpo-full

Text Generation • Updated Aug 30, 2024 • 2

NicholasCorrado/uf-rlced-conifer-tinyllama-1.1b-chat-v1.0-dpo-full

Updated Aug 30, 2024

NicholasCorrado/uf-tulu-2-7b-dpo-full-2

Updated Aug 30, 2024

NicholasCorrado/rlced-conifer-zephyr-7b-dpo-full

Text Generation • Updated Aug 30, 2024

NicholasCorrado/uf-rlced-conifer-zephyr-7b-dpo-full

Text Generation • Updated Aug 30, 2024 • 11

NicholasCorrado/uf-gemma-2b-it-dpo-full

Updated Aug 29, 2024

NicholasCorrado/uf-rlced-50k-zephyr-7b-dpo-full

Updated Aug 29, 2024

NicholasCorrado/ultrafeedback-binarized-tulu-2-7b-dpo-full

Text Generation • Updated Aug 29, 2024 • 7

NicholasCorrado/ultrafeedback-binarized-tulu-2-7b-dpo-full-2

Updated Aug 29, 2024

NicholasCorrado/uf_rlced_conifer_tulu-2-7b-dpo-full

Updated Aug 29, 2024

NicholasCorrado/hh-rlhf-gemma-2b-dpo-full

Updated Aug 29, 2024

NicholasCorrado/rlced_conifer_zephyr-7b-dpo-full

Text Generation • Updated Aug 28, 2024 • 6

NicholasCorrado/conifer_zephyr-7b-dpo-full

Updated Aug 28, 2024

NicholasCorrado/zephyr-7b-group-dpo-full-4

Text Generation • Updated Aug 28, 2024

NicholasCorrado/zephyr-7b-group-dpo-full-3

Text Generation • Updated Aug 27, 2024

NicholasCorrado/zephyr-7b-group-dpo-full-2

Updated Aug 26, 2024

NicholasCorrado/zephyr-7b-group-dpo-full

Updated Aug 25, 2024

NicholasCorrado/zephyr-7b-dpo-full

Text Generation • Updated Aug 25, 2024 • 3

NicholasCorrado/mixed_ref_losses

Updated Aug 23, 2024