Myvideo

Guest

Login

CV Week 2024 l Лекция 6 RL tuning for diffusion models I ШАД

Uploaded By: Myvideo
252 views
0
0 votes
0

Спикер: Александр Шишеня, ведущий разработчик в Службе компьютерного зрения. На лекции рассмотрим подходы к финальному дотюниванию диффузионных моделей с помощью обучения с подкреплением: разберем базовый бэкграунд в обучении с подкреплением, как получаются «реворд» модели и более подробно обсудим DPO и PPO подходы. После окончания подключайтесь к лекции 7 YandexART — a production-grade diffusion model: Скачать презентацию по лекции: Материалы интенсива, которые уже прошли: Лекция 1 Introduction to diffusion models: Семинар 1 Basic diffusion implementation: Лекция 2 DPM formulation via SDE and ODE: Семинар 2 Implementing an efficient sampler: Лекция 3 Diffusion architectures. Training and sampling techniques. Text-to-image formulation: Семинар 3 Text-to-image generation: Лекция 4 Diffusion distillation. ODE-based methods: Лекция 5 ODE-free diffusion distillation: Семинар 4 Implementing text-to-image consistency models: Узнать больше о Школе анализа данных можно на сайте:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later