Comparative Study:OPT-350M and GPT-2 w Reward-based Training - a DrishtiSharma Collection

DrishtiSharma 's Collections

Whisper Fine-tuning Event: Winning Models

Comparative Study:OPT-350M and GPT-2 w Reward-based Training

Adapter

Impact of Weight Decay on MBart-large-50 for EN-ES

Studying Impact of Batch Size and Mixed Precision

Studying Impact of lora_alpha on Llama-2 Quantized with GPTQ

Llama-2-7b on Databricks-Dolly-15k BigBench Hard Evaluation

Multifaceted Attention Analysis in Llama2 w En & Hi Dolly15k

Comparative Study:OPT-350M and GPT-2 w Reward-based Training

updated Sep 11, 2023

Comparative Study: Training OPT-350M and GPT-2 on Anthropic’s HH-RLHF Dataset Using Reward-Based Training