Лекция №15 Обучение с подкреплением

Uploaded By: Myvideo

Published on

22 Mar 2024

298 views

0

0 votes

0

About Share Download Add to

Пятнадцатое занятие на курсе «Нейронные сети и их применение в научных исследованиях» для группы НС262 шестого потока обучения. Преподаватель: Артём Васильев Дата: 00:00 Заставка 01:04 Reinforcement learning (RL) 05:00 Обучение с подкреплением 11:53 Примеры задач, решаемых с использованием RL 22:03 Устоявшаяся терминология 23:20 Stateless environment in RL 24:02 Задача о многоруких бандитах 29:07 Gymnasium framework 35:40 Поиск оптимальной стратегии решения 50:52 Cross-entropy method (CEM) 51:29 Пример оптимизации недифференцируемого функционала 59:51 Пример CEM в gym 01:14:45 Марковский процесс принятия решений (Markov decision process, MDP) 01:16:49 Markov property 01:17:37 Markov process 01:31:07 Проблема поиска оптимальной политики 01:56:37 Поиск оптимальной политики Беллмана для MDP (решение “MDP“) 02:36:59 Пример c CartPole DQN Материалы лекции: Открыть в Colab: Открыть в HTML-формате:

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/VHgyOWNDbGVmbnNiMm84ZnE0alh5dHFRSUM5QmVLSnhRejA3L09tSjVBST0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

Виктор Ефимов Алан Мамиев. Жизнь как путь к свету

17 hours ago

01:09:41

Виктор Ефимов Алан Мамиев. Жизнь как путь к свету

1 76%

Уничтожение древней истории человечества

17 hours ago

01:34:28

Уничтожение древней истории человечества

1 69%

Советская власть против коммунистической диктатуры

17 hours ago

00:52:20

Советская власть против коммунистической диктатуры

1 27%

Беларусь. Начало

17 hours ago

01:11:51

Беларусь. Начало

1 65%

БАЗА про тёмный ретрит Опыт самадхи и Живое Знание за 10 минут. Откровенное интервью ANAR DREAMS

2 days ago

00:11:33

БАЗА про тёмный ретрит Опыт самадхи и Живое Знание за 10 минут. Откровенное интервью ANAR DREAMS

1 28%

ЧЕРЕЗ ВРЕМЯ И ПРОСТРАНСТВО - НА МАШИНЕ ВРЕМЕНИ. Владимир Сурдин

2 days ago

00:47:12

ЧЕРЕЗ ВРЕМЯ И ПРОСТРАНСТВО - НА МАШИНЕ ВРЕМЕНИ. Владимир Сурдин

1 53%

Осознанный дизайнер | Вадим Гранич | Prosmotr

3 days ago

00:22:51

Осознанный дизайнер | Вадим Гранич | Prosmotr

1 7%

Гомеопатия. Как у меня пригорело

4 days ago

00:19:16

Гомеопатия. Как у меня пригорело

1 41%

Что такое революция // Роман Осин. Философский камень №15

4 days ago

00:46:37

Что такое революция // Роман Осин. Философский камень №15

1 18%

Красивые боги | ПОЛНАЯ ВЕРСИЯ

4 days ago

02:02:10

Красивые боги | ПОЛНАЯ ВЕРСИЯ

4 44%

Андрей Фурсов - Мир сломался. Почему Как Что дальше

4 days ago

01:48:28

Андрей Фурсов - Мир сломался. Почему Как Что дальше

1 44%

ЗАЩИТИ СЕБЯ: Их слова угроза твоему здоровью и будущему малыша

4 days ago

00:17:16

ЗАЩИТИ СЕБЯ: Их слова угроза твоему здоровью и будущему малыша

1 14%

СЛУЖЕБНЫЙ РОМАН - режиссерский разбор

5 days ago

01:20:00

СЛУЖЕБНЫЙ РОМАН - режиссерский разбор

1 72%

Тревожно-депрессивное расстройство. Общая тревожность, панические атаки, соматизация l №3 Депрессия

6 days ago

00:14:07

Тревожно-депрессивное расстройство. Общая тревожность, панические атаки, соматизация l №3 Депрессия

1 83%

АУМ СИНРИКЁ. Самая страшная секта XX века | ФАЙБ

7 days ago

01:13:53

АУМ СИНРИКЁ. Самая страшная секта XX века | ФАЙБ

1 58%

Декабристы. Жизнь и судьба | Курс Владимира Мединского | XIX век

1 week ago

02:56:25

Декабристы. Жизнь и судьба | Курс Владимира Мединского | XIX век

1 16%

И.Н. Острецов: Спор в лицо с физиками-ядерщиками. Термоядерный синтез-туфта научная Кто прав

2 weeks ago

00:16:58

И.Н. Острецов: Спор в лицо с физиками-ядерщиками. Термоядерный синтез-туфта научная Кто прав

1 90%

Вячеслав Дубынин: Мозг и сон (Лекция 27)

3 weeks ago

01:03:29

Вячеслав Дубынин: Мозг и сон (Лекция 27)

1 11%

Как растворить Камни в ПОЧКАХ без операции и дробления!

3 weeks ago

00:21:21

Как растворить Камни в ПОЧКАХ без операции и дробления!

1 66%

Китай при Си Цзиньпине: люди и политика взгляд изнутри / Илья Фальковский

1 month ago

02:06:03

Китай при Си Цзиньпине: люди и политика взгляд изнутри / Илья Фальковский

1 12%

ПУТЫ КАРМИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ. Леонид Тугутов (Лакшми Нараяна дас). Лекция-семинар.

1 month ago

02:30:26

ПУТЫ КАРМИЧЕСКОЙ ДЕЯТЕЛЬНОСТИ. Леонид Тугутов (Лакшми Нараяна дас). Лекция-семинар.

1 83%

Артемий Лебедев про Россию, отношение к людям и про свой аутизм.

1 month ago

01:08:21

Артемий Лебедев про Россию, отношение к людям и про свой аутизм.

1 65%

Причина большинства болезней. Связь здоровья людей и здорового состояния почв.

1 month ago

00:40:46

Причина большинства болезней. Связь здоровья людей и здорового состояния почв.

1 92%

Самый могущественный тайный орден. От убийства царя до завоевания космоса | ФАЙБ

2 months ago

01:00:38

Самый могущественный тайный орден. От убийства царя до завоевания космоса | ФАЙБ

95 19%

0 Comments

Guest