Мы вновь встретились с Татьяной Шавриной, чтобы поговорить о новых способах решения задачи бинарной классификации в контексте NLP, разобраться, как работают трансформеры, формирующие из слов вектор и как все-таки сформировать сабмит в нужном формате для загрузки на платформу. В этом году участникам олимпиады предоставлен датасет, в котором около 6 000 вопросов для более чем 800 текстов из 5 разных областей. Вопросы с вариантами ответов. Задача участников - написать алгоритм, который определит, какие ответы правильные. Основные принципы: - Ответ содержится в нескольких предложениях, а не в одном! - Ответ не четко (дословно) прописан в тексте. Полный мэтч ответа в изначальном параграфе найти нельзя. - Количество правильных ответов может быть любым.
Hide player controls
Hide resume playing