0:00:00 Заставка 0:00:01 Содержание лекции 0:01:56 Проблема воспроизводимости ML-экспериментов 0:27:58 Работа с данными 0:47:12 Шаблон кода для обучения моделей на PyTorch Lightning 1:16:08 Как запуститься локально 1:23:03 Как запуститься в Colab 1:39:41 Яндекс. Датасфера Подборка полезных материалов по теме лекции: Презентация: Блокноты лекции: - EDA и подготовка разбиения данных на train-val-test на примере датасета PCAM: - Запуск и обучение модели в среде Colab: - Предлагаемый, в качестве шаблона, репозиторий с воспроизводимым кодом обучения модели классификации на Lightning: Полезные ссылки: - Большой, но крайне дружелюбный туториал по git (Для тех, кто всё откладывал знакомство с этим инструментом): - Инструкция по работе с сервисом Яндекс.Датасфера: - Инструмент Weights & Biases для распределенной визуализации экспериментов: - Как заменить логирование в TB на логирование в W&B для Lightning пайплайнов: - MLflow: - Популярная статья о том, что такое MLflow и как им пользоваться: - Надстройка для гита, которая позволяет версионировать данные — DVC: - Статья о том как пользоваться DVC:
Hide player controls
Hide resume playing