Myvideo

Guest

Login

DRL Course 2023 | Policy Gradient. Off-Policy Algorithms

Uploaded By: Myvideo
1 view
0
0 votes
0

Курс Deep Reinforcement Learning 2023: Сезон курсов : В седьмой лекции: Продолжаем рассматривать MDP с бесконечным пространством состояний и действий Обсуждается Deterministic Policy Gradient теорему и выводим DDPG и TD3 Рассматриваем Soft Policy Iteration и выводим SAC Автор курса: Антон Плаксин, исследователь в группе и доцент Уральского федерального университета. Наши соц.сети: Telegram: Вконтакте: Канал с вакансиями в telegram: Канал с апдейтами по курсам: Как попасть в чат сообщества ODS Mattermost:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later