Курс Deep Reinforcement Learning: Сезон курсов: В пятой лекции: Рассматриваются MDP с бесконечным пространством состояний; Обсуждаются аппроксимации Q-функции с помощью линейной комбинации и нейронных сетей; Выводится алгоритм Deep Q-Networks (DQN); Обсуждаются его различные модификации Наши соц.сети: Telegram: Вконтакте:
Hide player controls
Hide resume playing