Поговорим о способах построения мультимодальных моделей, о современных возможностях больших языковых моделей, существующих ограничениях архитектур такого типа и тенденциях в развитии мультимодальности и LLM. Расскажем о задаче понимания изображений, видео и звука, а также о подходах в генерации и редактировании визуального контента, включая изображения, видео и 3D. Обсудим применение мультимодальных моделей и их потенциал в будущем.
Hide player controls
Hide resume playing