QMIX / Graph Attention Networks with Positional Embeddings

About Share Download Add to

00:00:00 QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning 00:22:58 Graph Attention Networks with Positional Embeddings QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning Во многих областях обучения с подкреплением возникает необходимость обучить сразу несколько агентов действовать в общей среде. В таких задачах важно понять, как оценивать вклады каждого из агентов в достижение общей цели. Авторы статьи “QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning” предложили новый алгоритм QMIX, который способен решать более широкий класс задач по сравнению со своими предшественниками. Новый подход был протестирован на игре StarCraft, в которой хорошо согласованные действия игроков необходимы для победы. На семинаре мы обсудим следующие темы: - Почему сложно заставить несколько агентов кооперироваться, не мешая друг другу - Какие основные подходы существуют в мультиагентном обучении - Как обучают алгор

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/VEsxWUFuKzAvcW5qWFZhamY3cmV0SDhrWmRlNy9mVWU4a01IcVNFbytxUT0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later