Myvideo

Guest

Login

Оптимизация инференса нейронок на CPU / Анастасия Торунова (Тинькофф)

Uploaded By: Myvideo
1 view
0
0 votes
0

Приглашаем на конференцию HighLoad 2024, которая пройдет 2 и 3 декабря в Москве! Программа, подробности и билеты по ссылке: -------- HighLoad Foundation 2022 Презентация и тезисы: В докладе расскажу, с какими проблемами мы столкнулись при запуске синтеза речи в прод: * особенности архитектуры WaveNet; * сервинг вокодера в реальном времени на CPU. И как их решили с помощью своей реализации с использованием векторных инструкций и квантизации весов модели. Нашли ошибку в видео? Пишите нам на support@

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later