Myvideo

Guest

Login

QMIX / Graph Attention Networks with Positional Embeddings

Uploaded By: Myvideo
6 views
0
0 votes
0

00:00:00 QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning 00:22:58 Graph Attention Networks with Positional Embeddings QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning Во многих областях обучения с подкреплением возникает необходимость обучить сразу несколько агентов действовать в общей среде. В таких задачах важно понять, как оценивать вклады каждого из агентов в достижение общей цели. Авторы статьи “QMIX: Monotonic Value Function Factorisation for Deep Multi-Agent Reinforcement Learning” предложили новый алгоритм QMIX, который способен решать более широкий класс задач по сравнению со своими предшественниками. Новый подход был протестирован на игре StarCraft, в которой хорошо согласованные действия игроков необходимы для победы. На семинаре мы обсудим следующие темы: - Почему сложно заставить несколько агентов кооперироваться, не мешая друг другу - Какие основные подходы существуют в мультиагентном обучении - Как обучают алгор

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later