Data Fest Online 2020 Code Mining track Спикер: Владимир Коваленко, Senior researcher [club169012512|@JetBrains] Research. В этой работе мы применяем обнаружение аномалий к исходному коду и байткоду для облегчения разработки языка программирования и его компилятора. Мы определяем аномалию как фрагмент кода, отличающийся от типичного кода, написанного на определенном языке программирования. Выявление таких фрагментов выгодно как разработчикам языка, так и конечным пользователям, так как аномалии могут указывать на потенциальные проблемы с компилятором или с производительностью во время выполнения. Более того, аномалии могут соответствовать проблемам в проектировании языка. В качестве целевого языка программирования мы выбрали Kotlin. Мы описываем и обсуждаем подходы к получению векторных представлений исходного кода и байткода, а также к выявлению аномалий в векторных фрагментах кода. В статье представлен метод, направленный на выявление двух типов аномалий: AST-аномалии и так называемые аномалии, вызванные компилятором, которые возникают только в скомпилированном байткоде. Мы описываем несколько экспериментов, использующих различные комбинации методов векторизации и обнаружения аномалий, и обсуждаем типы обнаруженных аномалий и их полезность для разработчиков языка. Мы демонстрируем, что извлеченные аномалии и лежащая в их основе техника извлечения дают дополнительную ценность для развития языка. Полезные ссылки: - «Using Large-Scale Anomaly Detection on Code to Improve Kotlin Compiler». - страница исследовательской группы ML methods [club169012512|@JetBrains].Research. Посмотреть эфир и список треков и организаторов Зарегистрироваться на фест и получить доступ к трекам Вступить в сообщество Соцсети Data Fest:
Hide player controls
Hide resume playing