Myvideo

Guest

Login

Леонид Синев, Владислав Ветров - Ускорение больших генеративных моделей в NLP

Uploaded By: Myvideo
4 views
0
0 votes
0

— презентация Large generative language models speedup optimization Современные языковые модели — большие, мощные, но неторопливые. Обзор классических подходов к сжатию моделей. Практический опыт ускорения генеративных языковых моделей типа ruGPT-3 при помощи фреймворков ONNX Runtime, Deepspeed, FasterTransformer. Ускорение моделей за счёт архитектурных изменений. Размещение одной модели по нескольким GPU Data Fest 2023: Трек “NLP“: Наши соц.сети: Telegram: Вконтакте:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later