Данила, BigData Tool Master, собрал Hadoop - кластер, Запустил Dataset Он скрипты на Scala Run’ил на Spark постоянно И писал в HDFSssss Если во время доклада “Когда все данные станут большими...“ мы будем говорить о вопросах и ответах, то на этом мастер-классе мы уже потопчемся в вотчине BigData-разработчиков. Начнем с классики на Hadoop, познаем боль MapReduce job, потыкаем Pig Hive, затем плавно свальсируем в сторону Spark и попишем код в легком и удобном pipeline - стиле. Для кого хорошо подходит данный мастер-класс: вы умеете читать и понимать код на Java на уровне хотя бы Junior, умеете писать SQL-запросы, в универе вы ходили хоть на одну пару по матану или терверу, вас либо недавно поставили, либо вскоре поставят на проект, где надо уметь ручками работать с вышеперечисленным зверинцем. Ну или вам просто интересно посмотреть на мощь даннодробилок, написанных на Java, и у вас в анамнезе неудачный опыт с NoSQL/SQL, как хранилищем, которое было ответственно за все, включая аналитику.
Hide player controls
Hide resume playing