Максим Пантелеев | Text deduplication on social media data

Uploaded By: Myvideo

Published on

16 Sep 2024

2 views

0

0 votes

0

About Share Download Add to

Data Fest Online 2021 NLP in Industry track Всем привет! Меня зовут Пантелеев Максим и в этом докладе я хочу рассказать об одной часто встречающейся задаче в обработке естественного языка - дедупликация текстового массива. Эта задача часто встречается в анализе пользовательских обращений, твитов, так и как один из этапов подготовки данных для тренировки сложных моделей, н/п BERT/GPT и тд. Расскажу сходствах и отличиях этой задачи от задачи кластеризации, об основанных на поиске ближайших соседях подходах и не только, сравню качество работы выбранных методов дедупликации на некоторых известных датасетах, а так же ответить на вопрос как влияют на качество дедубликации существующие эмбеддинги текстов, н/п такие как USE/fasttext/word2vec/glove/tfidf и т.д. Посмотреть эфир и список треков и организаторов: Зарегистрироваться на фест и получить доступ к трекам: Вступить в сообщество: Соцсети Data Fest:

Share with your friends

Link:

Embed:

<iframe width="640" height="360" src="//myvideo.cc/embed/OFJDTmZJeitYR0l0OEp2L2VrNDRXRk1CYzI5UWhRUGlNeGxFYVNJK0lmWT0" frameborder="0" webkitallowfullscreen mozallowfullscreen allowfullscreen></iframe>

Video Size:

Custom size:

x

Autoplay video

Hide player controls

Hide resume playing

Add to Playlist:

Favorites

My Playlist

Watch Later

БИТВА ПАП I Трейлер I В кино с 10 октября

4 months ago

00:02:02

БИТВА ПАП I Трейлер I В кино с 10 октября

1 43%

Она манит аномально | треилер к... Самарской области

4 months ago

00:10:26

Она манит аномально | треилер к... Самарской области

1 57%

Кажется, навсегда - короткометражный фильм о чувстве, которое вы будете помнить всю жизнь

4 months ago

00:16:56

Кажется, навсегда - короткометражный фильм о чувстве, которое вы будете помнить всю жизнь

1 24%

Если Бог строит дом | ЮС 2023 | Wolrus Worship | Милеуша Шаламова (LIVE)

4 months ago

00:03:53

Если Бог строит дом | ЮС 2023 | Wolrus Worship | Милеуша Шаламова (LIVE)

1 62%

Совершенный Мир |Wolrus WORSHIP & Milleusha (LYRIC VIDEO)

5 months ago

00:06:53

Совершенный Мир |Wolrus WORSHIP & Milleusha (LYRIC VIDEO)

1 62%

Достоин | Wolrus Worship | ЮС 2023 | Милеуша Шаламова (LIVE)

5 months ago

00:07:08

Достоин | Wolrus Worship | ЮС 2023 | Милеуша Шаламова (LIVE)

1 70%

АРИЭЛЬ - Тишина

6 months ago

00:05:14

АРИЭЛЬ - Тишина

1 52%

Смотреть на Тебя | Wolrus Worship | Миля Шаламова, Даниель Рустамов (LIVE)

6 months ago

00:05:28

Смотреть на Тебя | Wolrus Worship | Миля Шаламова, Даниель Рустамов (LIVE)

1 55%

Отражая Твой Свет | Wolrus Worship| Анна Комазенкова, Данил Рафиков (LIVE)

6 months ago

00:05:10

Отражая Твой Свет | Wolrus Worship| Анна Комазенкова, Данил Рафиков (LIVE)

1 12%

Таня Артистка - Шибко Браво. Премьера клипа 2024

6 months ago

00:07:08

Таня Артистка - Шибко Браво. Премьера клипа 2024

1 79%

Диана Анкудинова - GOOD GIRL (Official Lyric Video 2024)

6 months ago

00:02:21

Диана Анкудинова - GOOD GIRL (Official Lyric Video 2024)

1 40%

Блатная Дискотека Шансона

7 months ago

01:16:33

Блатная Дискотека Шансона

1 42%

Взлет и посадка на авианосец (МиГ-29К, Ка-27)

7 months ago

00:04:51

Взлет и посадка на авианосец (МиГ-29К, Ка-27)

1 84%

Новости Покера | Скандал вокруг чемпиона ВСОП, Лучший игрок WSOP, Реальные призовые победителей

7 months ago

00:10:59

Новости Покера | Скандал вокруг чемпиона ВСОП, Лучший игрок WSOP, Реальные призовые победителей

1 87%

Новости Покера | Новый чемпион мира по покеру, Подсказчики на WSOP, Новичок в зале покерной славы

7 months ago

00:10:26

Новости Покера | Новый чемпион мира по покеру, Подсказчики на WSOP, Новичок в зале покерной славы

1 26%

Алавастровый сосуд

7 months ago

00:06:13

Алавастровый сосуд

1 12%

NINJA WAY CUP | 15-17 лет, PRO

7 months ago

02:36:01

NINJA WAY CUP | 15-17 лет, PRO

1 6%

На Вершинах Твоих |Wolrus Worship & Milleusha (LIVE)

7 months ago

00:05:59

На Вершинах Твоих |Wolrus Worship & Milleusha (LIVE)

1 62%

Сорок розовых кустов. 4 Серия. Мелодрама. Сериал

7 months ago

00:44:41

Сорок розовых кустов. 4 Серия. Мелодрама. Сериал

1 30%

11. Арабская ночь - Кирилл Гордеев

7 months ago

00:05:34

11. Арабская ночь - Кирилл Гордеев

1 6%

Знаю | Wolrus Worship | Даниель Рустамов (LIVE)

8 months ago

00:05:49

Знаю | Wolrus Worship | Даниель Рустамов (LIVE)

1 87%

Cмотри

9 months ago

00:00:51

Cмотри

1 14%

Огонь хвалы | Wolrus Worship| Миля Шаламова (LIVE)

9 months ago

00:04:48

Огонь хвалы | Wolrus Worship| Миля Шаламова (LIVE)

1 14%

DOROFEEVA - вотсап (Official Music Video)

9 months ago

00:02:51

DOROFEEVA - вотсап (Official Music Video)

1 85%

0 Comments

Guest