Embodied AI Reading Club | Построение стратегии поведения по языковой инструкции в сложных мультимодальных средах

About Share Download Add to

В докладе рассматриваются идеи, предложенные в статьях “Game On: Towards Language Models as RL Experimenters“ () и “Instruction Following with Goal-Conditioned Reinforcement Learning in Virtual Environments“ (). В первой работе авторы используют большую языковую модель для построения учебного плана обучения RL-агента в задаче следования инструкциям, что позволяет автоматически генерировать последовательность подзадач для эффективного обучения. Во второй статье языковая модель предсказывает высокоуровневый план по языковой инструкции, а RL-агент обучается с помощью учебного плана на различных списках возможных задач Недостатком этих подходов является необходимость иметь заранее определенный список подзадач, на основе которого языковая модель формирует план. Однако хотелось бы, чтобы модель самостоятельно строила план, не полагаясь на заданный перечень возможных задач Рассматриваются подходы, которые позволяют: – строить стратегию поведения в сложных мультимодальных средах по языковой инструкции – формировать автономные учебные планы с помощью языковых моделей для обучения RL-агента – создавать гибкие планы действий без фиксированного списка подзадач Статьи: 1. Game On: Towards Language Models as RL Experimenters: 2. Instruction Following with Goal-Conditioned Reinforcement Learning in Virtual Environments: Не пропускайте анонсы новых мероприятий и будьте в курсе новостей: ▪️Телеграм-канал AIRI: ▪️Комьюнити AIRI: g57c7ytnSY9jYzUy ▪️Телеграм-канал Embodied AI Reading Club:

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/akw5ZWJnQmNDOU1XMndoR21Ray9HVDBZU2R3S28rRXlzR3lOalN5UU56WT0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later