Курс Deep Reinforcement Learning 2023: Сезон курсов : В пятой лекции: Рассматриваются MDP с бесконечным пространством состояний Обсуждаются аппроксимации Q-функции с помощью линейной комбинации и нейронных сетей Выводится алгоритм Deep Q-Networks (DQN) Обсуждаются его различные модификации Автор курса: Антон Плаксин, исследователь в группе и доцент Уральского федерального университета. Наши соц.сети: Telegram: Вконтакте: Канал с вакансиями в telegram: Канал с апдейтами по курсам: Как попасть в чат сообщества ODS Mattermost:
Hide player controls
Hide resume playing