Myvideo

Guest

Login

Airflow: Выгрузка данных в S3 #10

Uploaded By: Myvideo
65 views
0
0 votes
0

Это десятое финальное видео из цикла по основам Airflow — и оно о настоящем ETL. Генерируем данные, загружаем в PostgreSQL и строим DAG, который выгружает их по дням в MinIO. Всё вместе: PostgresHook, S3Hook, XCom и временные файлы — никакого хардкода, только порядок и автоматизация. Показываю, как Airflow оркестрирует реальный пайплайн от базы до хранилища. Это итог всего, что мы прошли: подключения, DAG-зависимости, динамические даты и расписание. Теперь вы не просто читаете про пайплайны — вы их собираете. А впереди — новые горизонты: Airflow Kafka, отслеживание lineage, инкрементальные загрузки, CI/CD для DAG’ов и многое другое. Спасибо, что были со мной в этом цикле. Теперь вы не просто смотрите на DAG — вы его строите. --------- Подписывайтесь на телеграмм: Telegram Материалы по видео (руководство по подготовке данных для задачи и исходный код): Видео из цикла - Как работают данные: практические кейсы. Если Вы когда-нибудь задумывались или хотите узнать как данные перемещаются внутри реальных продуктов, как строятся пайплайны, отслеживается их состояние и обеспечивается надёжная передача информации между системами - то этот цикл видео для Вас! Этот курс — гид в мир современных data-технологий. Я не буду просто теоретизировать, в результате мы вместе построим настоящую инфраструктуру обработки данных с нуля. 00:00 Приветственное слово 00:27 Логика пайплайна, которую напишем 01:14 Технические детали и подготовка к реализации пайплайна 05:01 Реализация dag’а для взаимодействия с БД и выгрузкой в S3 14:36 Заключительное слово #DataEngineering #ApacheAirflow #ETL #TechTutorial #DataInfrastructure #HandsOnTutorial #VkEducation

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later