Myvideo

Guest

Login

Sentence-level pretraining Борис Зубарев

Uploaded By: Myvideo
544 views
0
0 votes
0

Борис Зубарев рассказывает о том, как ему удалось повысить f1 на 7 пунктов в многоклассовой классификации на 5-ти тысячах размеченных примерах за счет использования предтренировки и чего-то среднего между аугментациями и proxy labelling. Как и многие, он не может использовать большие модели типа BERT для инференса, примеров мало и tf-idf логистическая регрессия выглядит довольно неплохим вариантом, пока не добыты еще данные. Но когда важны метрики прямо сейчас, можно найти выход получше, особенно если есть неразмеченные данные, итоговая модель evolved transformer inception и она влезла в 20 мс инференса на CPU. Секция NLP Moscow Data Science Major Презентации – Соц сети серии мероприятий Data Fest:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later