На занятии вы познакомитесь с тем, как применять нейросети для решения задач обучения с подкреплением. Мы рассмотрим, в чем проявляются недостатки классических алгоритмов и как нейросети помогают их решить. Посмотрим, как реализовать алгоритм Q-learning на базе нейросети и какие возможности перед нами открывает это решение. Поговорим о различных видах функции потерь и сформируем реализацию для алгоритма DQN (Deep Q-learning). В заключении рассмотрим какие дополнительные условия предъявляются к архитектуре нейросети, моделирующей поведение агента в алгоритме DQN. «Reinforcement Learning» - Преподаватель: Игорь Стурейко - Teamlead, главный инженер в FinTech Пройдите опрос по итогам мероприятия - Следите за новостями проекта: - Telegram: - ВКонтакте: - LinkedIn: - Хабр:
Hide player controls
Hide resume playing