Myvideo

Guest

Login

Петр Кудеров | Методы Актор-Критик в CleanRL: PPO, SAC, DDPG

Uploaded By: Myvideo
1 view
0
0 votes
0

Младший научный сотрудник AIRI, инженер-исследователь ФИЦ ИУ РАН Петр Кудеров рассказывает про продвинутые алгоритмы из семейства актор-критик методов (PPO, SAC, DDPG) на примере их реализации в библиотеке CleanRL. Ссылка на библиотеку CleanRL: Ссылки на реализации рассмотренных алгоритмов: 1) PPO: 2) SAC: 3) DDPG: Плейлист со всеми лекциями «Лето с AIRI»: Анонсы научных мероприятий всегда публикуются в Telegram-канале AIRI:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later