Как сравнивают LLM: бенчмаркинг

Uploaded By: Myvideo

Published on

3 Oct 2024

161 view

0

0 votes

0

About Share Download Add to

3 октября в 12:00 доктор технических наук Владимир Крылов расскажет о бенчмарках для LLM. Рассмотрим современные методы оценивания способностей больших языковых моделей решать различные задачи. Вы узнаете: 🔸какие бенчмарки для определения лучших моделей сейчас наиболее типичны; 🔸как применяется шахматный рейтинг ELO для бенчмаркинга; 🔸что такое Leaderboard Arena; 🔸какие частные, но важные бенчмарки применяются для проблемно ориентированных моделей и мультимодальных LLM. Если вы хотите работать в ИТ и в Artezio, отправляйте своё резюме по ссылке Подписывайтесь на телеграм-канал AI4Dev:

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/ZTg5d0ROMWw1MVdINW44cTltTE5YV0tCcFVnM0lpU09oZFU0SHIweDZPMD0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

VPN Платный или Бесплатный В чем разница Полный разбор и сравнение

2 hours ago

00:30:44

VPN Платный или Бесплатный В чем разница Полный разбор и сравнение

1 50%

БИТВА СУПЕРМАРКЕТОВ: Какой Оливье вкуснее Сравниваем Магнит, Пятёрочку и Ленту

47 minutes ago

00:13:34

БИТВА СУПЕРМАРКЕТОВ: Какой Оливье вкуснее Сравниваем Магнит, Пятёрочку и Ленту

2 34%

Исследование, опубликованное в журнале Proceedings of the National Academy of Sciences, показало

3 hours ago

00:00:39

Исследование, опубликованное в журнале Proceedings of the National Academy of Sciences, показало

1 70%

Как меня восхищают и создают результаты клиентов! Живой пример за 3 минуты с утра

4 hours ago

00:11:26

Как меня восхищают и создают результаты клиентов! Живой пример за 3 минуты с утра

16 42%

Тайтл Легендари против Модева / О демпинге перепродаж / Сравнение цен / И где ликвидность

4 hours ago

00:16:15

Тайтл Легендари против Модева / О демпинге перепродаж / Сравнение цен / И где ликвидность

3 42%

Купил 3 квартиры в Мурино СПБ / Сравнение и обзор: ЦДС, Мавис, Евроинвест

47 minutes ago

01:05:32

Купил 3 квартиры в Мурино СПБ / Сравнение и обзор: ЦДС, Мавис, Евроинвест

344 6%

Step Review Xeon E5-2690v2 VS Ryzen 5 1600: сравнение в работе и играх. 2011 vs AM4

4 hours ago

00:24:58

Step Review Xeon E5-2690v2 VS Ryzen 5 1600: сравнение в работе и играх. 2011 vs AM4

3 73%

TOUGHBUILT Vs Magnusson. Какая сумка лучше Сравнение и обзор от Миши #секретыоконщика

6 hours ago

00:10:50

TOUGHBUILT Vs Magnusson. Какая сумка лучше Сравнение и обзор от Миши #секретыоконщика

641 36%

Про самогон и пиво Какой выход самогона у дрожжей Double Snake C48! РЕЗУЛЬТАТ МЕНЯ ПОРАЗИЛ!

7 hours ago

00:03:34

Про самогон и пиво Какой выход самогона у дрожжей Double Snake C48! РЕЗУЛЬТАТ МЕНЯ ПОРАЗИЛ!

4 93%

Черный

8 hours ago

00:00:37

Черный

9 11%

Какую PlayStation покупать в 2025: СРАВНИВАЕМ PS5 PRO и PS5 Slim а РАЗНИЦА ВООБЩЕ ЕСТЬ

8 hours ago

00:13:27

Какую PlayStation покупать в 2025: СРАВНИВАЕМ PS5 PRO и PS5 Slim а РАЗНИЦА ВООБЩЕ ЕСТЬ

1.4K 21%

Просто о кадрах. Как посчитать сверхурочную работу при суммированном учете

8 hours ago

00:06:02

Просто о кадрах. Как посчитать сверхурочную работу при суммированном учете

398 17%

Сравнил усилители АB и D класса и ВОТ ЧТО ПОЛУЧИЛОСЬ!

8 hours ago

00:11:42

Сравнил усилители АB и D класса и ВОТ ЧТО ПОЛУЧИЛОСЬ!

1.6K 62%

А НУЖНЫ ЛИ ЛАРЬКИ

10 hours ago

00:02:33

А НУЖНЫ ЛИ ЛАРЬКИ

1 82%

XpucT Stable Diffusion UI Правильная установка, ПОЛНАЯ настройка, сравнение на видеокартах

11 hours ago

01:06:17

XpucT Stable Diffusion UI Правильная установка, ПОЛНАЯ настройка, сравнение на видеокартах

1 59%

GodRay Графика Driveclub это нечто! Сравнение с Forza Motorsport 2023

12 hours ago

00:18:40

GodRay Графика Driveclub это нечто! Сравнение с Forza Motorsport 2023

14 79%

Новогодний круиз по Карибам на обновленном лайнере Oceania Insignia. Обзор корабля и маршрута!

14 hours ago

00:38:27

Новогодний круиз по Карибам на обновленном лайнере Oceania Insignia. Обзор корабля и маршрута!

1 65%

Путешествие будет приятным.1982.(СССР. фильм-мелодрама)

15 hours ago

01:15:03

Путешествие будет приятным.1982.(СССР. фильм-мелодрама)

1 49%

Месяц с PS5 Pro полный обзор, сравнение FPS с PS5 и окончательный вердикт!

10 hours ago

00:18:56

Месяц с PS5 Pro полный обзор, сравнение FPS с PS5 и окончательный вердикт!

79.1K 26%

We Tried the Most Popular Instant Cameras! - Instant Camera Roundup

19 hours ago

00:14:04

We Tried the Most Popular Instant Cameras! - Instant Camera Roundup

2 8%

Parikov Matvey NUBIA Z70 ULTRA / ФОТО НА МАКСИМАЛКАХ / FULLSIZE / GCAM / СРАВНЕНИЕ С VIVO X100 ULTRA

20 hours ago

00:33:54

Parikov Matvey NUBIA Z70 ULTRA / ФОТО НА МАКСИМАЛКАХ / FULLSIZE / GCAM / СРАВНЕНИЕ С VIVO X100 ULTRA

7 11%

Parikov Matvey NUBIA Z70 ULTRA / ФОТО В ПАРИЖЕ / СРАВНЕНИЕ С VIVO X100 ULTRA

20 hours ago

00:32:05

Parikov Matvey NUBIA Z70 ULTRA / ФОТО В ПАРИЖЕ / СРАВНЕНИЕ С VIVO X100 ULTRA

2 73%

Какой бывает сутаж / Что использую я

21 hour ago

00:20:03

Какой бывает сутаж / Что использую я

344 25%

Самопомощь в новогодние праздники

22 hours ago

00:09:11

Самопомощь в новогодние праздники

626 36%

0 Comments

Guest