Myvideo

Guest

Login

Дмитриев К.В. - Методы машинного обучения в анализе изображений - 14. Обучение с подкреплением

Uploaded By: Myvideo
1 view
0
0 votes
0

00:00:19 Алгоритмы бустинга. Градиентный бустинг. CatBoost. Доклад Воропаева Романа 00:07:14 Обучение с подкреплением (ОП). Виды ОП 00:15:50 Задача “многорукого бандита“ 00:41:05 Конечный марковский процесс принятия решений. ОП без моделирования системы 01:03:52 Метод Монте-Карло. Метод SARSA. Метод Q-обучения. Методы on- и off-policy 01:22:36 Аппроксимация функции значимости. Метод DQN. Policy gradient 01:40:28 ОП с моделированием среды. Недостатки ОП Ссылка на плейлист:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later