Deep Reinforcement Learning

Module 3

Off-Policy Methods & Tooling

DDPG, TD3, and SAC for continuous control, plus the Spinning Up toolkit for running, logging, and benchmarking experiments.

4 readings 1 quiz 1 lab

Readings

Deep Deterministic Policy Gradient (DDPG)

TD3 & Soft Actor-Critic (SAC)

Running, Logging & Benchmarking

Key Papers in Deep RL

Quizzes

Off-Policy Methods & Tooling Quiz

6 questions · 70% to pass

Labs

DDPG & SAC in TensorFlow