Fast Reinforcement Learning with Generalized Updates & Evolving Reinforcement Learning Algorithms

About Share Download Add to

Видео включает два доклада: “Fast reinforcement learning with generalized policy updates“ Одной из важных проблем в обучении с подкреплением является то, что зачастую, чтобы выучить удовлетворительную политику, нужно провести достаточно большое число взаимодействий агента с окружением. Авторами рассматриваемой статьи предлагается решать эту проблему с помощью подхода «разделяй и властвуй». Часто, сложную задачу можно представить в виде последовательно или параллельно выполняемых простых задач. Для такого перехода авторами вводятся обобщенные версии policy evaluation и improvement. Таким образом, можно использовать решение одной задачи для решения других. Решение авторов помогает добиться сильного прироста в скорости сходимости алгоритмов обучения с подкреплением (алгоритм сходится на несколько порядков быстрее Q-learning). Докладчик: Сергей Полежаев. “Evolving Reinforcement Learning Algorithms“ Существует множество различных применений обучения с подкреплением: начиная с настольных игр и заканчивая б

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/bE0wc2IzanROWlh0QkFMczkrWWxxTm15d2lEcWl3RTVob3JUamF2SGZJUT0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later