Myvideo

Guest

Login

DRL Course | Model-Free Reinforcement Learning: Monte-Carlo, SARSA, Q-Learning

Uploaded By: Myvideo
2 views
0
0 votes
0

Курс Deep Reinforcement Learning: Сезон курсов: В четвертой лекции: Рассматривается случай MDP с неизвестными функциями награды и перехода между состояниями; Рассмотрели подход Monte-Carlo и Temporal-Difference для нахождения Q-функции в этом случае; Обсудили epsilon-жадные политики; Вывили алгоритмы Monte-Carlo, SARSA и Q-learning Наши соц.сети: Telegram: Вконтакте:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later