Myvideo

Guest

Login

DRL Course | Dynamic Programming. Policy and Value Iterations

Uploaded By: Myvideo
1 view
0
0 votes
0

Курс Deep Reinforcement Learning: Сезон курсов: В третьей лекции: Поговорили про принцип динамического программирования; Рассмотрели понятия v- и q-функций, а также понятия оптимальной политики; Выписали уравнения Белламана и научились их решать методами Policy Iteration и Value Iteration. Наши соц.сети: Telegram: Вконтакте:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later