Техносфера Group, МГУ им. М.В. Ломоносова. Курс “Методы распределенной обработки больших объемов данных в Hadoop“ Лекция №2 “Основы Hadoop“ Лектор - Алексей Романенко. История Hadoop и его применение. Хранение данных, кластер Hadoop. Системные принципы. Горизонтальное масштабирование вместо вертикального. Код к данным. Отказы оборудования. Инкапсуляция сложности реализации. Сравнение с СУБД (RDBMS). Экосистема Hadoop. Дистрибутивы, вендоры, поддерживаемые ОС. Полезная литература. Hadoop на Cloudera VM. Импорт и запуск VM. Копирование файлов в HDFS. Запуск MapReduce-задачи в Hadoop. Проверка результатов.
Hide player controls
Hide resume playing