Это Иван Дёгтев, руководитель аналитики качества генеративных моделей, и его доклад на конференции Data Driven 2024. Иван показал, как готовят датасеты для YaGPT. А ещё рассказал три истории о том, как данные формируют совершенно разные пути обучения модели. Больше интересных материалов для аналитиков данных ищите в телеграм-канале Yandex for Analytics:
Hide player controls
Hide resume playing