DeepHack RL Михаил Павлов (5vision)

Uploaded By: Myvideo

Published on

16 Sep 2024

1 view

0

0 votes

0

About Share Download Add to

Недавно в Москве проходил очередной хакатон DeepHack по обучению с подкреплением, в котором надо было написать универсального агента для игр Atari. Михаил Павлов рассказал решение своей команды 5vision, с которым они заняли второе место. Из видео вы сможете узнать: - Как задача обучения с подкреплением может быть превращена в задачу обучения с учителем - Откуда набирать обучающую выборку - Как решается проблема наличия случайности в среде - Какой подход применять на этапе обучения модели по готовой выборке - Какие существуют проблемы в обучении с учителем и как их можно решать - Как можно улучшить использованный подход DeepHack RL: Слайды: Код: и Узнать о текущих соревнованиях можно на сайте Узнать о новых тренировках и видео можно из групп: ВКонтакте Facebook

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/MFFDRG1vejBMSE5sMVFseExYR0JwTnduZC9tdEZtVE43a01jVnV3Mk5Qaz0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

DeepHack RL Сергеи Овчаренко (WPLFF)

2 months ago

00:44:01

DeepHack RL Сергеи Овчаренко (WPLFF)

1 49%

DeepHack RL Михаил Павлов (5vision)

2 months ago

00:47:50

DeepHack RL Михаил Павлов (5vision)

1 67%

Январь 2017 | Даиджест соревновании по анализу данных

2 months ago

00:21:57

Январь 2017 | Даиджест соревновании по анализу данных

1 36%

Maksim Kretov - Applications of RL techniques in NLP_ An overvi

3 years ago

00:51:52

Maksim Kretov - Applications of RL techniques in NLP_ An overvi

61 50%

Anton Lokhmotov - Cross-platform performance optimisation of deep learning

3 years ago

01:15:55

Anton Lokhmotov - Cross-platform performance optimisation of deep learning

2 14%

FINAL GAME

3 years ago

00:01:17

FINAL GAME

1 92%

Witali Dunin-Barkowski - Neural roots of deep mind

3 years ago

00:41:31

Witali Dunin-Barkowski - Neural roots of deep mind

2 46%

Andrew Barto - Intrinsically motivated reinforcement learning

3 years ago

01:24:45

Andrew Barto - Intrinsically motivated reinforcement learning

1 16%

Alexander Gasnikov - Безградиентные двухточечные методы для стохастической оптимизации

3 years ago

01:11:35

Alexander Gasnikov - Безградиентные двухточечные методы для стохастической оптимизации

4 31%

Andrey Raigorodskiy - Перспективные исследовательские задачи

3 years ago

01:08:44

Andrey Raigorodskiy - Перспективные исследовательские задачи

1 90%

Gabriel Synnaeve - E2D2_ Episodic exploration for deep deterministi

3 years ago

00:57:10

Gabriel Synnaeve - E2D2_ Episodic exploration for deep deterministi

1 66%

Marc Bellemare - The role of density models in reinforcement learni

3 years ago

00:51:30

Marc Bellemare - The role of density models in reinforcement learni

1 45%

Tejas Kulkarni - Revisiting successor representations

3 years ago

00:52:25

Tejas Kulkarni - Revisiting successor representations

1 56%

Andrey Lavrentyev - Neural networks for сyber-security of industrial objects

3 years ago

00:59:27

Andrey Lavrentyev - Neural networks for сyber-security of industrial objects

1 78%

Doina Precup - Temporal abstraction in reinforcement learning

3 years ago

01:04:25

Doina Precup - Temporal abstraction in reinforcement learning

7 17%

Yulia Sandamirskaya - Neuronal dynamics and autonomous learning in robotics

3 years ago

01:44:35

Yulia Sandamirskaya - Neuronal dynamics and autonomous learning in robotics

2 52%

Andrey Chertok - Reinforcement learning for market-making application in trading

3 years ago

01:06:51

Andrey Chertok - Reinforcement learning for market-making application in trading

7 68%

Alexey Dosovitskiy - Visuomotor control in 3D environments

3 years ago

01:44:25

Alexey Dosovitskiy - Visuomotor control in 3D environments

1 57%

Konstantin Vorontsov - Регуляризация матричных разложений

3 years ago

01:11:54

Konstantin Vorontsov - Регуляризация матричных разложений

1 68%

Mikhail Burtsev - Model-based reinforcement learning for alternating environments

3 years ago

00:54:34

Mikhail Burtsev - Model-based reinforcement learning for alternating environments

1 16%

: Andrey Lavrentyev - Neural networks for сyber-security of industrial objects

7 years ago

00:59:28

: Andrey Lavrentyev - Neural networks for сyber-security of industrial objects

1 41%

: Maksim Kretov - Applications of RL techniques in NLP: An overview

7 years ago

00:52:02

: Maksim Kretov - Applications of RL techniques in NLP: An overview

42 42%

: Witali Dunin-Barkowski - Neural roots of deep mind

8 years ago

00:41:32

: Witali Dunin-Barkowski - Neural roots of deep mind

47 62%

: Andrew Barto - Intrinsically motivated reinforcement learning

8 years ago

01:24:46

: Andrew Barto - Intrinsically motivated reinforcement learning

29 91%

0 Comments

Guest