В рамках доклада: - Решим простую задачку по вычислению TopN с помощью SQL на потоке данных; - Разберем как осуществляется агрегация в потоке данных и что там может быть сложного; - Сравним решение TopN задачки на Apache Spark и Apache Flink, поймем что лучше и почему; - Ускорим вычисление в 10 раз путем несложных оптимизаций. Презентация: Codefest:
Hide player controls
Hide resume playing