Spark — пожалуй, самый популярный фреймворк для работы с большими данными, предоставляющий инструменты для построения и обучения различных ML-моделей. CatBoost — открытая библиотека для градиентного бустинга от компании Яндекс. В рамках вебинара мы обсудим, как подружить Spark и CatBoost; рассмотрим процесс обучения моделей на SparkML; научимся обучать CatBoost модели на больших данных; разберём, как встраивать CatBoost в компоненты SparkML. Курс Data Engineer: Записывайтесь до 10 декабря. Последний поток в этом году!
Hide player controls
Hide resume playing