Myvideo

Guest

Login

Forgetful Experience Replay in Hierarchical Reinforcement Learning from Demonstrations

Uploaded By: Myvideo
3 views
0
0 votes
0

Зачастую успешные алгоритмы глубокого обучения с подкреплением требует большого количества взаимодействий между агентом и средой и, как следствие, являются вычислительно сложными. Существует множество подходов для увеличения эффективности собранных эпизодов, например иерархическое обучение и имитационные алгоритмы, использующие экспертную оценку. В случае последних, для упрощения процесса разметки иногда понижается качество траекторий, что может негативно сказаться на процессе обучения. Исследование авторов статьи предлагает объединение данных подходов для случая низкокачественной экспертной оценки, используя особую забывчивую структуру буфера опыта. Описанный подход является универсальным и может быть использован совместно с различными off-Policy методами. Докладчик: Александр Киракосян.

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later