Myvideo

Guest

Login

Математика - - Выбор предикторов - 2 часть + конспект от YandexGPT

Uploaded By: Myvideo
5 views
0
0 votes
0

Математика - - Выбор предикторов - 2 часть конспект от YandexGPT 00:04 Линейная модель и мультиколлинеарность • В видео обсуждается линейная модель и мультиколлинеарность, которая может привести к проблемам с предсказанием. • Для решения этой проблемы используется метод выбора наилучших предикторов, который выбирает те, которые обладают наивысшими оценками. 05:53 Выбор предикторов и их влияние • В видео объясняется, как использовать метод выбора наилучших предикторов для определения наиболее значимых предикторов в модели. • Обсуждается, что выбор предикторов должен быть основан на экспертных знаниях и не должен быть сделан автоматически. • Также объясняется, что мультиколлинеарность может привести к проблемам с предсказанием, но это не всегда так. • В видео также обсуждаются различные аспекты мультиколлинеарности и их влияние на предсказание. 19:13 Обсуждение методов отбора предикторов • В видео обсуждается использование различных методов отбора предикторов в модели. • Один из методов - использование функции “Select“ из библиотеки Python. • Однако, автор видео утверждает, что этот метод не имеет смысла, так как он может привести к неправильным выводам и отнять время. 27:28 Рекурсивный метод отбора предикторов • В видео предлагается использовать рекурсивный метод отбора предикторов, который заключается в удалении предикторов с наименьшим коэффициентом корреляции. • Этот метод может быть оправдан, если мы знаем, какие предиктора не важны, и хотим построить модель с меньшим количеством предикторов. 34:00 Влияние единиц измерения на вероятность дефолта • В видео обсуждается влияние единиц измерения на вероятность дефолта. • Например, если мы измеряем долги в миллионах рублей, а не в рублях, то коэффициент корреляции может измениться. • Это может быть использовано для профилактики сердечно-сосудистых катастроф, так как увеличение единиц измерения может привести к увеличению вероятности дефолта. 37:51 Стандартизация признаков • В видео обсуждается важность стандартизации признаков в линейной регрессии для получения корректных результатов. • Объясняется, что стандартизация позволяет сравнивать признаки с разными единицами измерения и делает их безразмерными величинами. 46:22 Пример использования стандартизации • В качестве примера рассматривается задача прогнозирования уровня артериального давления в зависимости от возраста и окружности талии. • Объясняется, как стандартизация признаков позволяет избежать ошибок при сравнении коэффициентов и получить корректные результаты. 50:21 Применение стандартизации в других задачах • В качестве домашнего задания предлагается стандартизировать признаки и посмотреть, как это повлияет на результаты. • Также обсуждается важность отбора предикторов в задачах прогнозирования и использование различных методов для оценки качества построенных моделей. 54:56 Проблемы с отбором признаков • Обсуждаются проблемы с отбором признаков, включая необходимость указания количества признаков и их выбор из лучших или худших. • Упоминается, что даже лучшие методы отбора требуют указания количества признаков или их выбора из лучших или худших. 57:03 Статистический подход к отбору признаков • Обсуждается статистический подход к отбору признаков, основанный на проверке гипотез. • Упоминается, что этот подход реализован в библиотеке sklearn, но не включен в нее. 01:00:00 Частотный подход к отбору признаков • Обсуждается частотный подход к отбору признаков, который оценивает вероятность события, а не его правдоподобие. • Упоминается, что частотный подход не учитывает априорную вероятность, что может привести к ошибочным суждениям. 01:06:25 Отказ от статистического подхода • Авторы библиотеки sklearn отказались от статистического подхода, обосновывая это тем, что он не всегда конструктивен и не всегда обоснован. • Вместо этого они используют другие методы, такие как метод регуляризации некорректно поставленных задач. 01:08:16 Домашнее задание • Домашнее задание состоит в чтении и выполнении параграфа 5.6 из главы 5 “Множественная линейная регрессия“ в книге “Машинное обучение с использованием Python“. • В этом параграфе обсуждаются гипотезы о том, что модель с предиктором и модель без предиктора статистически не отличаются друг от друга. Весь плейлист:

Share with your friends

Link:

Embed:

Video Size:

Custom size:

x

Add to Playlist:

Favorites
My Playlist
Watch Later