Владислав Куренков, руководитель группы «Адаптивные агенты» в AIRI, расскажет о стремительно развивающейся и набирающей популярность среди исследователей области In-Context Reinforcement Learning. Доклад будет посвящён её истокам, существующим алгоритмам, таким как Algorithm Distillation и Decision Pre-Trained Transformer, а также её связи с Meta Reinforcement Learning. Кроме того, будет затронута тема текущих подходов к созданию Generalist Agents без использования LLM и причин нехватки open-source моделей и бенчмарков в этом направлении. Оппонентом выступит кандидат математических наук, научный сотрудник Международной лаборатории стохастических алгоритмов и анализа многомерных данных ФКН НИУ ВШЭ Сергей Самсонов.
Hide player controls
Hide resume playing