Максим Пантелеев: Тext deduplication on social media data

Uploaded By: Myvideo

Published on

16 Sep 2024

3 views

0

0 votes

0

About Share Download Add to

Data Fest Online 2021 NLP in Industry track Всем привет! Меня зовут Пантелеев Максим и в этом докладе я хочу рассказать об одной часто встречающейся задаче в обработке естественного языка - дедупликация текстового массива. Эта задача часто встречается в анализе пользовательских обращений, твитов, так и как один из этапов подготовки данных для тренировки сложных моделей, н/п BERT/GPT и тд. Расскажу сходствах и отличиях этой задачи от задачи кластеризации, об основанных на поиске ближайших соседях подходах и не только, сравню качество работы выбранных методов дедупликации на некоторых известных датасетах, а так же ответить на вопрос как влияют на качество дедубликации существующие эмбеддинги текстов, н/п такие как USE/fasttext/word2vec/glove/tfidf и тд Посмотреть эфир и список треков и организаторов: Зарегистрироваться на фест и получить доступ к трекам: Вступить в сообщество: Соцсети Data Fest:

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/T2lmeGw1S2pLU212azdqS05IZUxlaEt6aXJSTXRScDlZVkNlN01KLzIyQT0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

БИТВА ПАП I Трейлер I В кино с 10 октября

3 months ago

00:02:02

БИТВА ПАП I Трейлер I В кино с 10 октября

1 84%

Она манит аномально | треилер к... Самарской области

3 months ago

00:10:26

Она манит аномально | треилер к... Самарской области

1 46%

Кажется, навсегда - короткометражный фильм о чувстве, которое вы будете помнить всю жизнь

3 months ago

00:16:56

Кажется, навсегда - короткометражный фильм о чувстве, которое вы будете помнить всю жизнь

1 21%

Если Бог строит дом | ЮС 2023 | Wolrus Worship | Милеуша Шаламова (LIVE)

3 months ago

00:03:53

Если Бог строит дом | ЮС 2023 | Wolrus Worship | Милеуша Шаламова (LIVE)

1 18%

Совершенный Мир |Wolrus WORSHIP & Milleusha (LYRIC VIDEO)

4 months ago

00:06:53

Совершенный Мир |Wolrus WORSHIP & Milleusha (LYRIC VIDEO)

1 59%

Достоин | Wolrus Worship | ЮС 2023 | Милеуша Шаламова (LIVE)

4 months ago

00:07:08

Достоин | Wolrus Worship | ЮС 2023 | Милеуша Шаламова (LIVE)

1 49%

АРИЭЛЬ - Тишина

5 months ago

00:05:14

АРИЭЛЬ - Тишина

1 38%

Смотреть на Тебя | Wolrus Worship | Миля Шаламова, Даниель Рустамов (LIVE)

5 months ago

00:05:28

Смотреть на Тебя | Wolrus Worship | Миля Шаламова, Даниель Рустамов (LIVE)

1 17%

Отражая Твой Свет | Wolrus Worship| Анна Комазенкова, Данил Рафиков (LIVE)

5 months ago

00:05:10

Отражая Твой Свет | Wolrus Worship| Анна Комазенкова, Данил Рафиков (LIVE)

1 48%

Таня Артистка - Шибко Браво. Премьера клипа 2024

5 months ago

00:07:08

Таня Артистка - Шибко Браво. Премьера клипа 2024

1 48%

НЕОЯЗЫЧЕСТВО. Во что НЕ верили наши предки (Пантелеев, Комнатный Рыцарь) / Минутная История

5 months ago

01:26:38

НЕОЯЗЫЧЕСТВО. Во что НЕ верили наши предки (Пантелеев, Комнатный Рыцарь) / Минутная История

1 9%

Диана Анкудинова - GOOD GIRL (Official Lyric Video 2024)

5 months ago

00:02:21

Диана Анкудинова - GOOD GIRL (Official Lyric Video 2024)

1 24%

Блатная Дискотека Шансона

6 months ago

01:16:33

Блатная Дискотека Шансона

1 16%

Взлет и посадка на авианосец (МиГ-29К, Ка-27)

6 months ago

00:04:51

Взлет и посадка на авианосец (МиГ-29К, Ка-27)

1 12%

Новости Покера | Скандал вокруг чемпиона ВСОП, Лучший игрок WSOP, Реальные призовые победителей

6 months ago

00:10:59

Новости Покера | Скандал вокруг чемпиона ВСОП, Лучший игрок WSOP, Реальные призовые победителей

1 87%

Новости Покера | Новый чемпион мира по покеру, Подсказчики на WSOP, Новичок в зале покерной славы

6 months ago

00:10:26

Новости Покера | Новый чемпион мира по покеру, Подсказчики на WSOP, Новичок в зале покерной славы

1 46%

Алавастровый сосуд

6 months ago

00:06:13

Алавастровый сосуд

1 62%

NINJA WAY CUP | 15-17 лет, PRO

6 months ago

02:36:01

NINJA WAY CUP | 15-17 лет, PRO

1 43%

На Вершинах Твоих |Wolrus Worship & Milleusha (LIVE)

6 months ago

00:05:59

На Вершинах Твоих |Wolrus Worship & Milleusha (LIVE)

1 88%

Сорок розовых кустов. 4 Серия. Мелодрама. Сериал

6 months ago

00:44:41

Сорок розовых кустов. 4 Серия. Мелодрама. Сериал

1 43%

11. Арабская ночь - Кирилл Гордеев

6 months ago

00:05:34

11. Арабская ночь - Кирилл Гордеев

1 91%

Знаю | Wolrus Worship | Даниель Рустамов (LIVE)

7 months ago

00:05:49

Знаю | Wolrus Worship | Даниель Рустамов (LIVE)

1 81%

Cмотри

8 months ago

00:00:51

Cмотри

1 29%

Огонь хвалы | Wolrus Worship| Миля Шаламова (LIVE)

8 months ago

00:04:48

Огонь хвалы | Wolrus Worship| Миля Шаламова (LIVE)

1 10%

0 Comments

Guest