На семинаре мы рассмотрим задачу перевода вопроса на естественном языке к базе данных в выполнимый запрос (например, на языке SQL). Многие исследователи предлагают решать ее с помощью нейросетей, которые обучаются на данных, содержащих базы, вопросы к ним и соответствующие правильные запросы. Однако собирать такую разметку сложно, так как нужно, чтобы аннотаторы знали язык запросов для их написания. Я расскажу, как с помощью промежуточных представлений можно отказаться от использования разметки с запросами для обучения, но при этом сохранить возможность модели генерировать выполняемые запросы. Статья: SPARQLing Database Queries from Intermediate Question Decompositions, EMNLP 2021, Код: Докладчик: Ирина Сапарина, НИУ ВШЭ, Yandex Research
Hide player controls
Hide resume playing