Myvideo

Guest

Login

Введение в обучение с подкреплением: происхождение и отличительные особенности

Uploaded By: Myvideo
1 view
0
0 votes
0

Погрузимся в историю RL для понимание того, чем это семейство алгоритмов отличается от основного машинного обучения. Рассмотрим RL не только с точки зрения вычислений, но и взглянем на него через призму поведенческих и когнитивных наук. Разберем классический пример многорукого бандита — автомата для казино — чтобы продемонстрировать возможности примитивного алгоритма RL в упрощенной среде. Поговорим о самых знаковых приложениях RL нашего времени. «Reinforcement Learning» - Преподаватель: Андрей Маргерт - исследователь Машинного Обучения в Wageningen Research, работает над технологиями для улучшения качества, безопасности и доступности продуктов Пройдите опрос по итогам мероприятия - Следите за новостями проекта: - Telegram: - ВКонтакте: - LinkedIn: - Хабр:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later