Как одной строчкой кода ускорить Pandas в два раза, а Spark в полтора? Как единообразно хранить, обрабатывать и передавать колоночные данные в 12 языках программирования? На эти и многие другие вопросы отвечает Apache Arrow — низкоуровневый фреймворк для хранения и обработки колоночных данных, интегрированный в популярные высокоуровневые фреймворки. Разберем основные принципы и особенности применения Apache Arrow для оптимизации обработки больших данных.
Hide player controls
Hide resume playing