Myvideo

Guest

Login

DRL Course 2023 | Introduction to Reinforcement Learning. Cross-Entropy Method

Uploaded By: Myvideo
1 view
0
0 votes
0

Курс Deep Reinforcement Learning 2023: Сезон курсов: В первой лекции: Раскрывается содержательная идея принципа обучения с подкреплением. Описывается математически строгая постановка задачи обучения с подкреплением в терминах марковских процессов принятия решений. Рассматриваются примеры задач, которые могут быть формализованы в рамках этой постановки. Обсуждается понятие политики агента. При дополнительных ограничениях, исследуется взгляд на задачу обучения с подкреплением как на задачу конечномерно математической оптимизации. Опираясь на это, приводится эволюционный алгоритм Кросс-энтропии, должным образом модифицированный в соответствии с особенностями задачи обучения с подкреплением. Обсуждаются недостатки этого алгоритма и способы их преодоления. Автор курса: Антон Плаксин, исследователь в группе и доцент Уральского федерального университета. Наши соц.сети: Telegram: Вконтакте: Канал с вакансиями в telegram: Канал с вакансиями в matrix: #/#jobs-list:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later