AIRI Seminars | In-Contex Reinforcement Learning

Uploaded By: Myvideo

Published on

14 Nov 2024

1 view

0

0 votes

0

About Share Download Add to

Владислав Куренков, руководитель группы «Адаптивные агенты» в AIRI, расскажет о стремительно развивающейся и набирающей популярность среди исследователей области In-Context Reinforcement Learning. Доклад будет посвящён её истокам, существующим алгоритмам, таким как Algorithm Distillation и Decision Pre-Trained Transformer, а также её связи с Meta Reinforcement Learning. Кроме того, будет затронута тема текущих подходов к созданию Generalist Agents без использования LLM и причин нехватки open-source моделей и бенчмарков в этом направлении. Оппонентом выступит кандидат математических наук, научный сотрудник Международной лаборатории стохастических алгоритмов и анализа многомерных данных ФКН НИУ ВШЭ Сергей Самсонов.

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/RGdhdytZYm5mYWQxTG1hdGNFTzZrOGlTODZ0VTdvNENnejRsRXFsOFAwTT0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

AIRI Seminars | In-Contex Reinforcement Learning

9 hours ago

00:00:00

AIRI Seminars | In-Contex Reinforcement Learning

1 57%

AIRI Seminars | Основные проблемы прикладной математики и ИИ

1 day ago

01:34:51

AIRI Seminars | Основные проблемы прикладной математики и ИИ

742 34%

AIRI Seminars | Умнее значит лучше Куда двигаются методы визуальной локализации и картографирования

1 week ago

01:31:57

AIRI Seminars | Умнее значит лучше Куда двигаются методы визуальной локализации и картографирования

238 62%

AIRI Seminars | Оценка LLM на длинных контекстах: бенчмарки, результаты и подходы к удлинению контекста

3 weeks ago

01:25:40

AIRI Seminars | Оценка LLM на длинных контекстах: бенчмарки, результаты и подходы к удлинению контекста

359 54%

AIRI Seminars | ИИ для регистрации, анализа и воспроизведения цвета

1 month ago

01:31:47

AIRI Seminars | ИИ для регистрации, анализа и воспроизведения цвета

390 76%

AIRI Seminars | Крупномасштабная структура естественного языка, или поймай бота

2 months ago

01:26:36

AIRI Seminars | Крупномасштабная структура естественного языка, или поймай бота

582 25%

AIRI Seminars | Оптимальные алгоритмы асинхронного и параллельного обучения

2 months ago

01:36:22

AIRI Seminars | Оптимальные алгоритмы асинхронного и параллельного обучения

267 64%

Прямой эфир LLM в AI Talent Hub

3 months ago

01:23:53

Прямой эфир LLM в AI Talent Hub

1 72%

Первый Большой Семинар AIRI

6 months ago

01:39:07

Первый Большой Семинар AIRI

989 9%

Семинар по обидиенс Варвары Большаковой

1 year ago

00:01:58

Семинар по обидиенс Варвары Большаковой

16 26%

Как мультимодальные модели учатся понимать текст, картинки, видео... Андрей Кузнецов Семинар AGI

1 year ago

01:33:45

Как мультимодальные модели учатся понимать текст, картинки, видео... Андрей Кузнецов Семинар AGI

1 91%

Как мультимодальные модели учатся понимать текст, картинки, видео и аудио Андрей Кузнецов Семинар AGI

1 year ago

01:33:51

Как мультимодальные модели учатся понимать текст, картинки, видео и аудио Андрей Кузнецов Семинар AGI

67 11%

Семинар по обидиенс с Инной Баженовой

2 years ago

00:01:49

Семинар по обидиенс с Инной Баженовой

7 53%

Семинар по обидиенс с Еленой Лимоновой

2 years ago

00:02:06

Семинар по обидиенс с Еленой Лимоновой

8 10%

Семинар по обидиенс

2 years ago

00:01:48

Семинар по обидиенс

221 58%

Какие технологии приведут нас к AGI Татьяна Шаврина Семинар AGI

2 years ago

01:43:13

Какие технологии приведут нас к AGI Татьяна Шаврина Семинар AGI

4 91%

БДОУ г. Омска Детский сад №130_творческая мастерская по изготовлению открытки Парусник в технике Айрис фолдинг

2 years ago

00:04:00

БДОУ г. Омска Детский сад №130_творческая мастерская по изготовлению открытки Парусник в технике Айрис фолдинг

8.8K 39%

Семинар NOML: Efficient Deep Active Learning for Text Processing.

2 years ago

01:07:33

Семинар NOML: Efficient Deep Active Learning for Text Processing.

1 56%

Семинар по обидиенс с Инной Баженовой, июль 2022

2 years ago

00:03:58

Семинар по обидиенс с Инной Баженовой, июль 2022

1.6K 16%

Курмуков Анвар (AIRI) Эволюция обучения ResNet с 2015 и до наших дней

3 years ago

01:05:43

Курмуков Анвар (AIRI) Эволюция обучения ResNet с 2015 и до наших дней

8 22%

Ирина Гуляева. Продажа ценности. Семинар E-commerce

3 years ago

01:53:43

Ирина Гуляева. Продажа ценности. Семинар E-commerce

1 86%

Типичные ошибки категорийного менеджера - Екатерина Бузукова

3 years ago

00:08:34

Типичные ошибки категорийного менеджера - Екатерина Бузукова

2 26%

Семинар Актуальные аспекты заготовки кормов в сезон 2019 года

4 years ago

00:03:12

Семинар Актуальные аспекты заготовки кормов в сезон 2019 года

1 79%

Айрис - семинарий со звездой(МиссКазНУ 2013)

12 years ago

00:05:23

Айрис - семинарий со звездой(МиссКазНУ 2013)

53 75%

0 Comments

Guest