Спикер: Дмитрий Болотов, ML Engineer - SaluteSpeech, ASR Описание: Расстановка знаков пунктуации в системах распознавания речи играет важную роль. От неё зависит качество решения последующих задач, а так же восприятие пользователем распознанного текста. Мы сравним два подхода к решению данной задачи: Е2Е и каскадную систему. Для каскадной системы мы покажем основные архитектуры моделей пунктуации, выделим плюсы и минусы каждой архитектуры. Расскажем про перенос знаний из Whisper в LSTM и мультимодальную модель пунктуации. Data Fest 2024: Презентацию к докладу Вы можете скачать в треке секции Speech: ______ Наши соц.сети: Telegram: Вконтакте: Канал с вакансиями в telegram: Канал с апдейтами по курсам: Как попасть в чат сообщества ODS Mattermost:
Hide player controls
Hide resume playing