Как современные технологии делают доступнее мир для слабослышащих людей? 🫰🏻 В новом выпуске подкаста мы встретились с Лизой Петровой — Computer Vision инженером из SberDevices. Лиза и ее команда занимаются задачами, связанными с компьютерным зрением и автоматической обработкой жестовых языков. Выпуск получился очень интересным! Мы обсудили: 📍Как собирались и готовились данные для самого большого датасета для распознавания РЖЯ 📍Важно ли разработчикам знать жестовый язык, чтобы делать state-of-the-art модели 📍Как команде удалось создать лучшую в мире модель по распознаванию американского жестового языка Ведущая, продюсер: Мария Бочарова (tg: @soimmary) Монтажер: Андрей Чиркин 🎧 Подписывайтесь на нас в соц. сетях: 📩 Вопросы и предложения отправляйте на почту: @ Таймкоды: 0:42 Путь Лизы в Data Science и карьера в SberDevice 4:14 Проекты R&D команды SberDevices: HaGRID, Slovo, EasyPortrait. Что такое face parsing, матирование, гармонизация 9:05 Инклюзия. Потребность в распознавании РЖЯ 11:30 Корректные обращения к слабослыщащим 12:46 Датасет Slovo – как он создавался и какие были проблемы 22:12 Изучение РЖЯ ради проекта 24:45 Лучшая в мире модель по распознаванию американского жестокого языка SignFlow 27:12 Как ML-модели работают с видео 30:48 План развития: непрерывная речь, перевод, контекст 33:43 Первый в мире открытый датасет РЖЯ и аналоги в других стран 35:56 Результаты обучения модели 37:29 Потенциал продукта 39:29 Будущее сурдопереводчиков 40:00 Мотивация работать в индустрии
Hide player controls
Hide resume playing