В докладе рассматривается два подхода: Optimus-1 и AdaMemento. 1) Optimus-1 разработан для решения long horizon задач и протестирован в среде Minecraft. Агент использует Hybrid Multimodal Memory модуль, который включает в себя Hierarchical Directed Knowledge Graph и Abstracted Multimodal Experience Pool 2) AdaMemento предназначен для решения задач с разреженными наградами. Memory-reflection module позволяет учитывать положительный и отрицательный опыт, а fine-grained intrinsic motivation paradigm позволяет различать схожие состояния для улучшения exploration Статьи: 1. Optimus-1: Hybrid Multimodal Memory Empowered Agents Excel in Long-Horizon Tasks: 2. AdaMemento: Adaptive Memory-Assisted Policy Optimization for Reinforcement Learning: Не пропускайте анонсы новых мероприятий и будьте в курсе новостей: ▪️Телеграм-канал AIRI: ▪️Комьюнити AIRI: g57c7ytnSY9jYzUy ▪️Телеграм-канал Embodied AI Reading Club:
Hide player controls
Hide resume playing