DRL Course 2023 |Dynamic Programming. Policy and Value Iterations

Uploaded By: Myvideo

Published on

16 Sep 2024

5 views

0

0 votes

0

About Share Download Add to

Курс Deep Reinforcement Learning 2023: Сезон курсов: В третьей лекции: - Поговорили про принцип динамического программирования - Рассмотрели понятия v- и q-функций, а также понятия оптимальной политики. - Выписали уравнения Белламана и научились их решать методами Policy Iteration и Value Iteration. Автор курса: Антон Плаксин, исследователь в группе и доцент Уральского федерального университета. Наши соц.сети: Telegram: Вконтакте: Канал с вакансиями в telegram: Канал с апдейтами по курсам: Как попасть в чат сообщества ODS Mattermost:

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/SGh0RjVnMnNzeVNUL1VnY1VIUmZMalc5L0xBeTl1L1lmQlEzU1lCZU1RST0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

Section 2 - Chapter 33 - Headlights - DRL Lights

2 months ago

00:21:52

Section 2 - Chapter 33 - Headlights - DRL Lights

0 65%

DRL-FAN 2.0 League S19 (Stage8: Poland) H2 FWD

2 months ago

00:52:27

DRL-FAN 2.0 League S19 (Stage8: Poland) H2 FWD

2 72%

DRL-FAN 2.0 League S19 (Stage6: Wales) GroupB RWD

3 months ago

00:47:20

DRL-FAN 2.0 League S19 (Stage6: Wales) GroupB RWD

5 55%

DRL-FAN 2.0 League S19 (Stage2: Germany) 2000cc

4 months ago

00:45:02

DRL-FAN 2.0 League S19 (Stage2: Germany) 2000cc

1 70%

DRL

7 months ago

00:26:22

DRL

5 95%

DRL-FAN 2.0 League S17 (Stage8: Argentina) H3 RWD

10 months ago

00:52:56

DRL-FAN 2.0 League S17 (Stage8: Argentina) H3 RWD

12 81%

DRL-FAN 2.0 League S17 (Stage5: USA) R2 FWD

11 months ago

00:18:10

DRL-FAN 2.0 League S17 (Stage5: USA) R2 FWD

111 56%

77 DRL advantages for strategy efficiency and performance

11 months ago

00:07:48

77 DRL advantages for strategy efficiency and performance

0 29%

88 How to develop a drl trading system

11 months ago

00:01:38

88 How to develop a drl trading system

0 71%

89 Steps required to develop a drl strategy

11 months ago

00:07:00

89 Steps required to develop a drl strategy

0 37%

DRL Course | Разбор домашних заданий 4-6. Подведение итогов курса

12 months ago

00:48:12

DRL Course | Разбор домашних заданий 4-6. Подведение итогов курса

11 68%

DRL Course | Dynamic Programming. Policy and Value Iterations

12 months ago

00:57:45

DRL Course | Dynamic Programming. Policy and Value Iterations

25 49%

DRL Course | Практическое занятие 5. Deep Q-Networks (DQN)

12 months ago

00:54:42

DRL Course | Практическое занятие 5. Deep Q-Networks (DQN)

19 6%

DRL Course | Разбор домашних заданий 1-3

12 months ago

01:10:06

DRL Course | Разбор домашних заданий 1-3

14 77%

DRL Course | Policy Gradient

12 months ago

01:07:56

DRL Course | Policy Gradient

18 64%

DRL Course | Практическое занятие 6. Deep Deterministic Policy Gradient (DDPG)

12 months ago

01:15:12

DRL Course | Практическое занятие 6. Deep Deterministic Policy Gradient (DDPG)

21 62%

DRL Course | Value Function Approximation. Deep Q-Networks (DQN)

12 months ago

01:18:31

DRL Course | Value Function Approximation. Deep Q-Networks (DQN)

17 72%

DRL Course | Практическое занятие 4. Monte-Carlo and SARSA

12 months ago

00:53:37

DRL Course | Практическое занятие 4. Monte-Carlo and SARSA

5 46%

DRL Course | Model-Free Reinforcement Learning: Monte-Carlo, SARSA, Q-Learning

12 months ago

01:13:56

DRL Course | Model-Free Reinforcement Learning: Monte-Carlo, SARSA, Q-Learning

14 10%

DRL Course | Практическое занятие 2. PyTorch and Deep Cross-Entropy Method.

12 months ago

01:19:14

DRL Course | Практическое занятие 2. PyTorch and Deep Cross-Entropy Method.

31 14%

DRL Course | Практическое занятие 3. Policy Iteration

12 months ago

01:17:06

DRL Course | Практическое занятие 3. Policy Iteration

14 90%

DRL Course | Introduction to Neural Networks. Deep Cross-Entropy Method

12 months ago

01:01:08

DRL Course | Introduction to Neural Networks. Deep Cross-Entropy Method

16 52%

DRL Course | Практическое занятие 1. Cross-Entropy Method

12 months ago

01:21:36

DRL Course | Практическое занятие 1. Cross-Entropy Method

17 10%

DRL Course | Introduction to Reinforcement Learning. Cross-Entropy Method

12 months ago

01:30:49

DRL Course | Introduction to Reinforcement Learning. Cross-Entropy Method

34 61%

0 Comments

Guest