00:00:15 Рекуррентная нейронные сеть 00:17:13 Распространение градиента в РНС 00:21:30 Градиент сквозь время 00:26:26 Усечённое распространение градиента 00:30:18 Long short-term memory (LSTM) 00:46:15 Механизм внимания 00:58:26 Блок внимания в общем виде 01:02:11 Self-Attention block 01:06:05 Маскированный слой внимания 01:07:17 Трансформер 01:14:51 От рекуррентных сетей к трансформерам 01:17:11 Зоопарк трансформеров 01:18:56 Модели GPT-генерация текстов Ссылка на плейлист: #мгу #физфак #машинноеобучение #доленко
Hide player controls
Hide resume playing