Математика - - Вычисление отношения шансов Анализ выживаемости клиентов - 2 часть = конспект от YandexGPT = 00:02 Обсуждение шансов и коэффициентов в контексте задачи о вероятности невозврата кредита. • Вычисление отношения шансов и определение содержательного смысла коэффициента. 07:45 Опрос аудитории о понимании содержательного смысла коэффициентов и их интерпретации. 11:48 Точность модели и чувствительность • Обсуждение точности модели и ее влияния на общую точность классификации. • Обсуждение ошибок первого и второго рода и их влияния на точность модели. 12:34 Таблица сопряжённости (Contingency table) The Hosmer-Lemeshow goodness of fit test • Обсуждение таблицы сопряжённости The Hosmer-Lemeshow goodness of fit test и ее использования для оценки качества модели. • Обсуждение подхода к оценке качества модели, предложенного The Hosmer-Lemeshow goodness of fit test. 14:35 Анализ данных о заемщиках • Рассматриваются данные о заемщиках, их вероятность дефолта и количество возвратов. • Обсуждаются ошибки в прогнозах и их влияние на точность модели. 24:30 Анализ данных о пользователях цифрового телевидения • Рассматриваются данные о пользователях цифрового телевидения, их демографические характеристики и продолжительность пользования услугами. • Обсуждаются факторы, влияющие на продолжительность пользования услугами и вероятность отключения от оператора. 32:16 Анализ выживаемости клиентов • Обсуждение использования линейной регрессии и других методов для анализа выживаемости клиентов. • Упоминание о методе Каплана-Майера для анализа выживаемости. 37:53 Разбиение клиентов на группы • Разбиение клиентов на четыре группы по типу услуг: базовый, расширенный, премиум и тотал. • Сравнение выживаемости клиентов в каждой группе. 45:12 Анализ цензурированных клиентов • Обсуждение цензурированных клиентов, которые подключились менее трех месяцев назад и не наблюдались в течение этого периода. • Упоминание о возможности расторжения договора и возврата денег за оставшийся период. 50:31 Расчет доли терминальных событий • Участники видео обсуждают, как рассчитать долю терминальных событий, то есть тех, кто прекратил обслуживание. • Они обсуждают, как учитывать цензурированных клиентов, которые могут быть включены в расчет, но не обязательно доживут до конца квартала. 58:02 Кумулятивная доля выживших • Участники обсуждают, как рассчитать кумулятивную долю выживших, то есть вероятность дожить до конца интервала, если известно, что первый квартал успешно пройден. • Они также обсуждают, как рассчитать условную вероятность дожить до конца второго квартала, если известно, что первый квартал успешно пройден. 01:01:43 Формулы и алгоритмы • Участники обсуждают, где найти формулы и алгоритмы для расчета кумулятивной доли выживших и условной вероятности дожить до конца второго квартала. • Они также обсуждают, как использовать хелп-файл и алгоритм для расчета этих показателей. 01:05:48 Анализ выживаемости клиентов • Обсуждение кумулятивной вероятности и рекуррентного выражения для выживаемости клиентов. • Сравнение выживаемости клиентов с разными типами обслуживания: базовый, расширенный, электронный и тотал. 01:16:50 Медианное время выживания • Медианное время выживания - это время, когда половина клиентов все еще жива. • За 60 месяцев наблюдения половина клиентов все еще активна. • За 90 месяцев наблюдения медианное время выживания меньше, чем максимальный промежуток наблюдения. 01:21:53 Обсуждение задач • Обсуждается вопрос о том, что считать цензурированным событием в задаче о правителях. • Упоминается, что в задаче о почке, если бы человек умер от всех причин, включая ДТП, то это было бы цензурированным событием. 01:24:32 Выбор программного обеспечения • Упоминается, что можно использовать любой софт для решения задач, включая Python или SPSS. • Рекомендуется попробовать решить задачи в разных средах, чтобы лучше понять их. Весь плейлист:
Hide player controls
Hide resume playing