Математика - - Выбор предикторов - 2 часть конспект от YandexGPT 00:02 Обсуждение коэффициента детерминации • В видео обсуждается применение коэффициента детерминации в задачах классификации. • Указывается, что коэффициент детерминации не применим в задачах классификации, так как он чувствителен к перекодированию групп. 03:37 Обсуждение метрик классификации • Обсуждаются другие метрики классификации, такие как коэффициент корреляции, которые не меняются при перекодировании групп. 07:37 Разбор данных и задачи • В видео разбираются данные и задача с хроническими заболеваниями вен нижних конечностей. • Обсуждаются различные модели регрессии и их применение в анализе данных. 17:52 Оценка коэффициентов методом наименьших квадратов • В видео объясняется, как оценить коэффициенты модели с помощью метода наименьших квадратов. • Для этого вычисляется сумма квадратов отклонений между предсказанными и фактическими значениями. 22:22 Влияние предиктора на ошибку • Если предиктор влияет на зависимую переменную, то сумма квадратов отклонений для полной модели будет меньше, чем для редуцированной модели. 26:55 Статистический критерий • Для проверки значимости влияния предиктора на зависимую переменную используется статистический критерий. • Если отношение между величинами близко к единице, то влияние предиктора считается незначимым. 33:39 Обсуждение распределения Фишера-Снедекора • В видео обсуждается распределение Фишера-Снедекора, которое описывает распределение случайной величины. • Плотность распределения равна нулю для положительных значений и имеет резкий горб и длинный хвост. 35:49 Число степеней свободы • Число степеней свободы - это количество независимых переменных, которые можно выбрать произвольно. • В редуцированной модели число степеней свободы равно объему выборки минус количество фиксированных параметров. 41:32 Импорт и инициализация переменных • В видео импортируется класс для построения линейных регрессионных моделей и инициализируются переменные для работы с данными. 46:07 Сравнение моделей и построение регрессии • В видео сравниваются модели с разным количеством предикторов и строится регрессия с использованием метода наименьших квадратов. • В процессе построения модели используется флаг для определения момента, когда добавление предикторов становится нецелесообразным. 51:57 Введение в регрессию • В видео обсуждается процесс построения регрессионной модели, где факторы вводятся в модель по очереди. • В процессе построения модели, факторы, которые уже есть в модели, используются для улучшения модели. 57:59 Тестирование моделей • После построения каждой модели, проводится тестирование, чтобы определить, является ли модель хорошей или нет. • Если модель оказывается хорошей, то она включается в расширенную модель, если нет, то она исключается. 01:01:56 Определение значимости факторов • Для определения значимости факторов, используется критерий Фишера, который сравнивает наблюдаемое значение критерия с критическим значением. • Если наблюдаемое значение больше критического, то гипотеза отвергается и фактор включается в модель. 01:11:34 Обсуждение отбора предикторов • В видео обсуждается использование критерия Фишера для отбора предикторов в модели. • Упоминается, что в SPSS реализован хороший отбор предикторов для нелинейных моделей, таких как логистическая регрессия и Кокс регрессия. 01:16:04 Вопросы и ответы • В конце видео автор отвечает на вопросы зрителей. • Обсуждаются различные подходы к отбору предикторов и их применение в различных задачах. • Упоминается, что SPSS хорошо подходит для статистических задач, но также может использоваться в промышленности. Весь плейлист:
Hide player controls
Hide resume playing