bguan
/

lunar_lander_v2_ppo_4

Reinforcement Learning

stable-baselines3

deep-reinforcement-learning

Model card Files Files and versions Community

lunar_lander_v2_ppo_4 / bguan_ppo_lunarlander4 /policy.optimizer.pth

Commit History

lunar lander model #4, using PPO trained with learning rate 0.0005 for 500K timesteps

0e6fc9b

bguan commited on May 9, 2022