Спикер: Меркушов Лев Юрьевич, аналитик данных Департамента анализа данных и моделирования (ДАДМ) Банка ВТБ. Анонс: На занятии мы научимся работать с библиотекой Hugging Face. В частности, познакомимся с тем, как устроены языковые модели, что такое токенизация текста и для чего она нужна, рассмотрим несколько подходов к решению задач выделения именованных сущностей (Named Entity Recognition) и отношений (Relation Extraction) с использованием языковых моделей: рассмотрим их как задачу классификации последовательности токенов (Sequence Classification) и как задачу ответа на вопрос по фрагменту текста (Model Reading Comprehension). В конце занятия мы напишем цикл для дообучения языковой (fine-tuning) модели и посмотрим на некоторые техники для эффективной работы с моделями в случае ограниченного количества вычислительных ресурсов.
Hide player controls
Hide resume playing