Pretrained Transformers as Universal Computation Engines (Machine Learning Research Paper Explained)

Uploaded By: Myvideo

Published on

16 Mar 2021

17 views

0

0 votes

0

About Share Download Add to

#universalcomputation #pretrainedtransformers #finetuning Large-scale pre-training and subsequent fine-tuning is a common recipe for success with transformer models in machine learning. However, most such transfer learning is done when a model is pre-trained on the same or a very similar modality to the final task to be solved. This paper demonstrates that transformers can be fine-tuned to completely different modalities, such as from language to vision. Moreover, they demonstrate that this can be done by freezing all attention layers, tuning less than .1% of all parameters. The paper further claims that language modeling is a superior pre-training task for such cross-domain transfer. The paper goes through various ablation studies to make its point. OUTLINE: 0:00 - Intro & Overview 2:00 - Frozen Pretrained Transformers 4:50 - Evaluated Tasks 10:05 - The Importance of Training LayerNorm 17:10 - Modality Transfer 25:10 - Network Architecture Ablation 26:10 - Evaluation of the Attention Mask 27:20 - Are FPTs

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/UWU1N2MrcFBMNThqMko5dHI3d3Q4RXM2RzMxajZtb0kzWnl4ODBFaENjYz0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

UAG: методика ускорения генерации LLM с любыми моделями в качестве ассистента

7 days ago

00:00:16

UAG: методика ускорения генерации LLM с любыми моделями в качестве ассистента

1 90%

Embodied AI Reading Club | Применение трансформерных моделей для Embodied AI

1 week ago

01:17:43

Embodied AI Reading Club | Применение трансформерных моделей для Embodied AI

32 19%

Andrej Karpathy Let's build GPT: from scratch, in code, spelled out.

3 weeks ago

01:56:19

Andrej Karpathy Let's build GPT: from scratch, in code, spelled out.

64 65%

Авраменко А.П. - Введение в обработку естественного языка - 4. Information extraction in the era of transformers & GenAI

3 weeks ago

01:01:38

Авраменко А.П. - Введение в обработку естественного языка - 4. Information extraction in the era of transformers & GenAI

7 14%

Конференция SUPCON Прогресс и формирование завтрашнего дня

4 weeks ago

00:09:51

Конференция SUPCON Прогресс и формирование завтрашнего дня

219 30%

Дмитрий Нестерук Разработка с использованием искусственного интеллекта

1 month ago

02:42:27

Дмитрий Нестерук Разработка с использованием искусственного интеллекта

1 20%

TPT - Time-series Pre-trained Transformer (Video)

1 month ago

00:01:17

TPT - Time-series Pre-trained Transformer (Video)

10 41%

Sentence-level pretraining Борис Зубарев

2 months ago

00:13:44

Sentence-level pretraining Борис Зубарев

414 20%

Anatoly Potapov: Pre-training Transformers with Catalyst

2 months ago

00:15:10

Anatoly Potapov: Pre-training Transformers with Catalyst

3 95%

Взлом GPT агентов #нейросети #gpt #угрозы нейросетей #искусственныйинтеллект #openai #нейронныесети

2 months ago

00:00:51

Взлом GPT агентов #нейросети #gpt #угрозы нейросетей #искусственныйинтеллект #openai #нейронныесети

10 39%

YATI НОВЫЙ АЛГОРИТМ ЯНДЕКСА 2020 + 7 ПРАКТИЧЕСКИХ SEO-СОВЕТОВ

3 months ago

01:10:12

YATI НОВЫЙ АЛГОРИТМ ЯНДЕКСА 2020 + 7 ПРАКТИЧЕСКИХ SEO-СОВЕТОВ

3 8%

O mnimo que voc precisa saber sobre IA pra sobreviver ao Hype

3 months ago

00:44:02

O mnimo que voc precisa saber sobre IA pra sobreviver ao Hype

1 27%

Спросить GPT в @RecruitCambot

3 months ago

00:01:00

Спросить GPT в @RecruitCambot

9 82%

Let's build GPT: from scratch, in code, spelled out.

4 months ago

01:56:20

Let's build GPT: from scratch, in code, spelled out.

1 74%

chatGPT помогает писать код

5 months ago

00:34:34

chatGPT помогает писать код

1 44%

На Госуслугах начали тестировать технологию GPTОб этом сообщил глава Министерства цифрового развития (Минцифры) России Максу

5 months ago

00:00:05

На Госуслугах начали тестировать технологию GPTОб этом сообщил глава Министерства цифрового развития (Минцифры) России Максу

1.8K 61%

Exploring the Wild West Through AI: 84 Epic Digital Artworks. A must-see!

5 months ago

00:04:16

Exploring the Wild West Through AI: 84 Epic Digital Artworks. A must-see!

1 61%

Разблокируй весь потенциал медитации и йоги с Chat GPT + Muse | ИИ на службе научного просветления.

6 months ago

00:28:52

Разблокируй весь потенциал медитации и йоги с Chat GPT + Muse | ИИ на службе научного просветления.

39 68%

ПАСХА ИЛИ ПЕСАХ КАКАЯ РОЛЬ МОИСЕЯ

6 months ago

00:21:58

ПАСХА ИЛИ ПЕСАХ КАКАЯ РОЛЬ МОИСЕЯ

2 74%

Chat Gpt гладкий бредогенератор

8 months ago

00:10:13

Chat Gpt гладкий бредогенератор

196 39%

Заработок в интернете на ChatGPT и Canva в 2024

8 months ago

00:16:00

Заработок в интернете на ChatGPT и Canva в 2024

1 5%

AI superpowered networks (NVIDIA and Cisco join forces)

9 months ago

00:17:58

AI superpowered networks (NVIDIA and Cisco join forces)

1 39%

Нейросеть Sora которая ГЕНЕРИРУЕТ ВИДЕО от OpenAI

9 months ago

00:09:09

Нейросеть Sora которая ГЕНЕРИРУЕТ ВИДЕО от OpenAI

1 29%

Chat GPT: TODO список с помощью сверхразума

9 months ago

00:09:15

Chat GPT: TODO список с помощью сверхразума

1 39%

0 Comments

Guest