Основные алгоритмы обучения с подкреплением SARSA и Q-learning // Демо-занятие курса Reinforcement Learning

Uploaded By: Myvideo

Published on

30 Aug 2024

103 views

0

0 votes

0

About Share Download Add to

На занятии мы разберем: - что такое обучение с подкреплением и чем оно принципиально отличается от других подходов машинного обучения; - что такое функция ценности состояния и функция ценности действия-состояния, как они связаны между собой и как помогают нашему агенту учиться; - уравнение Беллмана - основное уравнение в обучении с подкреплением; - метод SARSA - метод итеративного обучения агента; - метод Q-learning - метод итеративного оптимального обучения агента. Занятие будет полезно начинающим специалистам по машинному обучению, которые стремятся расширить свой набор навыков и инструментов обучением с подкреплением. На практической части мы на Python “с нуля“ без использования каких-либо фреймворков реализуем два алгоритма обучения с подкреплением и убедимся, что наш агент успешно обучается. «Reinforcement Learning» - Преподаватель: Игорь Стурейко - (к.ф.-м.н.) Teamlead, главный инженер Дополнительные материалы: Пройдите опрос по итогам мероприятия - Следите за новостями проекта: - Telegram: - ВКонтакте: - LinkedIn: - Хабр:

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/eGN4UmEraW9DVFMrTVQ1U1Vaa1dwcmUwK1U4akJKY0hSTS9DKytMWFowaz0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

Как правильно мечтать и загадывать желания во времена неопределенности и хаоса

2 days ago

01:38:08

Как правильно мечтать и загадывать желания во времена неопределенности и хаоса

1 7%

Mentor In Tech 6.0: Обзор технологий искусственного интеллекта

2 months ago

01:10:05

Mentor In Tech 6.0: Обзор технологий искусственного интеллекта

1 58%

НОТА в ООН от Правительства СССР -

2 months ago

00:18:45

НОТА в ООН от Правительства СССР -

1 21%

РЕАКЦИЯ: Парень гитариста. Пердящая Базука. 5 лет. Итоги.

2 months ago

00:07:02

РЕАКЦИЯ: Парень гитариста. Пердящая Базука. 5 лет. Итоги.

6 50%

ADSENSE В РОССИИ ЗАБЛОКИРОВАН. ВОТ РЕШЕНИЕ! Возврат монетизации и вывод денег с YouTube

2 months ago

00:17:57

ADSENSE В РОССИИ ЗАБЛОКИРОВАН. ВОТ РЕШЕНИЕ! Возврат монетизации и вывод денег с YouTube

2 9%

Вадим Лёвкин - Развитие позитивного мышления

2 months ago

00:57:06

Вадим Лёвкин - Развитие позитивного мышления

1 57%

Бибба-бобба. Видос уже на монтаже

2 months ago

03:54:52

Бибба-бобба. Видос уже на монтаже

1 86%

Новое в рекомендациях по терапии АГ в России и не только. В поисках идеала

2 months ago

01:11:20

Новое в рекомендациях по терапии АГ в России и не только. В поисках идеала

1 49%

РКН БЕССИЛЕН! Вы проиграли! БЛОГЕРЫ И ЗРИТЕЛИ НЕ ИДУТ НА РОССИЙСКИЕ ПЛОЩАДКИ

2 months ago

00:20:41

РКН БЕССИЛЕН! Вы проиграли! БЛОГЕРЫ И ЗРИТЕЛИ НЕ ИДУТ НА РОССИЙСКИЕ ПЛОЩАДКИ

1 8%

ПЕРЕХОД ПРИНЦИПЫ НОВОГО МИРА ЕВА ГАЙЯ

2 months ago

00:58:03

ПЕРЕХОД ПРИНЦИПЫ НОВОГО МИРА ЕВА ГАЙЯ

1 71%

Мой принцип цветокоррекции фотографий в Фотошопе. Часть 1.

2 months ago

00:14:50

Мой принцип цветокоррекции фотографий в Фотошопе. Часть 1.

1 69%

Обновленные отечественные клинические рекомендации по ведению пациентов с ОКС и ИБС: ДАТ в 2024 году

2 months ago

01:00:15

Обновленные отечественные клинические рекомендации по ведению пациентов с ОКС и ИБС: ДАТ в 2024 году

1 81%

10 главных мифов о самообороне. Запомни, ЭТО НЕ РЕБОТАЕТ

2 months ago

00:09:48

10 главных мифов о самообороне. Запомни, ЭТО НЕ РЕБОТАЕТ

1 93%

МИР ИЛЛЮЗОРЕН - НАЧАЛО ХАОСА | ИллюзШоу Часть 1

2 months ago

02:31:50

МИР ИЛЛЮЗОРЕН - НАЧАЛО ХАОСА | ИллюзШоу Часть 1

1 48%

Эту музыку можно слушать ВЕЧНО! Скажи ЖИЗНИ ДА!

2 months ago

02:00:58

Эту музыку можно слушать ВЕЧНО! Скажи ЖИЗНИ ДА!

2 11%

Л.А. Вязов и др. География и хронология славянского расселения по данным археогенетики

2 months ago

01:38:25

Л.А. Вязов и др. География и хронология славянского расселения по данным археогенетики

1 57%

Сумма похищенных активов у граждан СССР с учетом оборота за 30 лет

2 months ago

00:13:01

Сумма похищенных активов у граждан СССР с учетом оборота за 30 лет

1 19%

ВЫСОКОЕ ДАВЛЕНИЕ. Панические АТАКИ. ГИПЕРТОНИЯ. Что делать Доктор Сергей Бубновский/МОЁ ЗДОРОВЬЕ

2 months ago

00:47:15

ВЫСОКОЕ ДАВЛЕНИЕ. Панические АТАКИ. ГИПЕРТОНИЯ. Что делать Доктор Сергей Бубновский/МОЁ ЗДОРОВЬЕ

1 15%

Семинар Методика рентгеновского исследования толстого кишечника

2 months ago

01:31:24

Семинар Методика рентгеновского исследования толстого кишечника

1 63%

СЕРВИСЫ GOOGLE УЙДУТ ИЗ РОССИИ Кто и зачем нагнетает На YouTube поменяли важное

2 months ago

00:18:06

СЕРВИСЫ GOOGLE УЙДУТ ИЗ РОССИИ Кто и зачем нагнетает На YouTube поменяли важное

1 43%

МАСТЕР-КЛАСС | СПУЩЕННОЕ ПЛЕЧО | КАК У РАССЧИТАТЬ | НА ПРИМЕРЕ СТИЛЬНОГО СВИТЕРА КАК У КУЧИНЕЛЛИ

2 months ago

01:34:54

МАСТЕР-КЛАСС | СПУЩЕННОЕ ПЛЕЧО | КАК У РАССЧИТАТЬ | НА ПРИМЕРЕ СТИЛЬНОГО СВИТЕРА КАК У КУЧИНЕЛЛИ

1 76%

7. CS50 на русском: Лекция #7 Гарвард, Основы программирования, осень 2015 год

2 months ago

00:48:00

7. CS50 на русском: Лекция #7 Гарвард, Основы программирования, осень 2015 год

1 27%

4. CS50 на русском: Лекция #4 Гарвард, Основы программирования, осень 2015 год

2 months ago

00:53:09

4. CS50 на русском: Лекция #4 Гарвард, Основы программирования, осень 2015 год

1 53%

2. CS50 на русском: Лекция #2 Гарвард, Основы программирования, осень 2015 год

2 months ago

01:04:16

2. CS50 на русском: Лекция #2 Гарвард, Основы программирования, осень 2015 год

1 38%

0 Comments

Guest