Myvideo

Guest

Login

DeepHack RL Михаил Павлов (5vision)

Uploaded By: Myvideo
1 view
0
0 votes
0

Недавно в Москве проходил очередной хакатон DeepHack по обучению с подкреплением, в котором надо было написать универсального агента для игр Atari. Михаил Павлов рассказал решение своей команды 5vision, с которым они заняли второе место. Из видео вы сможете узнать: - Как задача обучения с подкреплением может быть превращена в задачу обучения с учителем - Откуда набирать обучающую выборку - Как решается проблема наличия случайности в среде - Какой подход применять на этапе обучения модели по готовой выборке - Какие существуют проблемы в обучении с учителем и как их можно решать - Как можно улучшить использованный подход DeepHack RL: Слайды: Код: и Узнать о текущих соревнованиях можно на сайте Узнать о новых тренировках и видео можно из групп: ВКонтакте Facebook

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later