На занятии вы познакомитесь с базовыми алгоритмами обучения с подкрепления. Вы узнаете о трех парадигмах машинного обучения и поймете, чем обучение с подкреплением отличается от остальных. Разберетесь с основными понятиями этой области, такими как окружение, агент, награда, политика. Поймете, чем марковский процесс принятия решений отличается от случайного поиска и как на его основе обучить агента действовать в незнакомой среде и получать максимальную награду. Так же вы разберете два базовых алгоритма обучения с подкреплением SARSA и Q-learning и поймете почему они лежат в основе всех современных алгоритмов. «Reinforcement Learning» - Преподаватель: Игорь Стурейко - Teamlead, главный инженер в FinTech Пройдите опрос по итогам мероприятия - Следите за новостями проекта: - Telegram: - ВКонтакте: - LinkedIn: - Хабр:
Hide player controls
Hide resume playing