00:07 Видео начинается с обсуждения анализа выживаемости и базы данных, содержащей информацию о пациентах с варикозным расширением вен. 08:45 Нормализация данных и проблемы с базой данных • Обсуждаются требования к нормализации данных в базах данных, включая атомарность, отсутствие дублирования и отсутствие зависимостей между данными. • В базе данных, которую анализируют, данные не соответствуют этим требованиям, что может привести к проблемам при анализе. 18:37 Анализ выживаемости и рецидив • Обсуждается анализ выживаемости и рецидив у пациентов с варикозным расширением вен. • Отмечается, что рецидив может произойти в любой момент после проведения лечения, и что данные в базе данных могут быть не точными и не отражать реальное состояние пациентов. 21:45 Анализ данных о пациентах • В видео обсуждается анализ данных о пациентах, которые наблюдались у проктолога, уролога, стоматолога, терапевта и других специалистов. • Обсуждается, как важно быть погруженным в предметную область, чтобы правильно анализировать данные. 33:58 Загрузка данных и анализ • В видео обсуждаются различные способы загрузки данных и их анализа. • Обсуждаются различные подходы к анализу данных, включая использование анализа выживаемости и других методов. • В видео также обсуждаются различные способы объединения данных в один датафрейм. 43:04 Выводы и рекомендации • В видео подводятся итоги анализа данных и даются рекомендации по дальнейшим действиям. • Обсуждаются возможные проблемы с данными, такие как отсутствие дат или других важных сведений. • В конце видео автор предлагает объединить данные в один датафрейм и провести анализ выживаемости. 44:34 Анализ данных • Обсуждение важности пола и возраста в анализе данных о рецидивах. • Загрузка и анализ данных из базы. 59:26 Работа с регулярными выражениями • Обсуждение использования регулярных выражений для работы с данными. • Создание функции для извлечения нужных значений из данных. • Обсуждение использования модификаторов для регулярных выражений. 01:12:16 Регулярные выражения • Обсуждение использования регулярных выражений для разбора строк и выделения определенных частей. • Упоминается, что регулярные выражения могут быть жадными или ленивыми, в зависимости от того, сколько символов они захватывают. 01:20:17 Именованные группы захвата • Демонстрация использования именованных групп захвата для упрощения работы с регулярными выражениями. • Объясняется, как использовать именованные группы для выделения определенных частей строки. 01:30:00 Работа с датами • Разбор примера строки с датами и их выделение с помощью регулярных выражений. • Обсуждение различных подходов к работе с датами и их представлению в виде строк. 01:42:37 Финальная обработка строки • Завершение работы с регулярными выражениями и выделение финиша из строки. • Обсуждение возможных изменений в строке и их влияния на конечный результат. 01:46:51 Анализ выживаемости вен • В видео обсуждается анализ выживаемости вен у пациентов, перенесших операцию. • Задача состоит в том, чтобы определить, сколько времени пройдет до наступления рецидива. • Для этого используется датафрейм с данными о времени до наступления события и о том, наблюдалось ли событие. 02:00:09 Оценка выживаемости вен • Для оценки выживаемости вен используются различные методы, включая логистическую регрессию и случайный лес. • Обсуждаются преимущества и недостатки каждого метода, а также их точность и надежность. 02:01:27 Интервалы и цензурированных данных • Важным аспектом анализа выживаемости вен является учет цензурированных данных, то есть случаев, когда пациент выбыл из наблюдения. • Это позволяет более точно оценить выживаемость вен и избежать ошибок в расчетах. 02:10:46 Сравнение выживаемости мужчин и женщин • В видео обсуждается сравнение выживаемости мужчин и женщин в контексте онкологических заболеваний. • Упоминается, что пол не влияет на выживаемость, и что важно сравнивать средние значения выживаемости для разных групп пациентов. 02:21:50 Доверительные интервалы и выборка • Обсуждается, что выборка не должна быть одного размера, и что важно учитывать соотношение классов при сравнении средних значений. • Упоминается, что при сравнении средних значений, выборка не должна быть одного размера. 02:30:39 Риск и доверительные интервалы • В видео обсуждаются риски и доверительные интервалы, и как они могут меняться с течением времени. • Указывается, что чем меньше выборка, тем шире доверительный интервал, и что это может быть связано с уменьшением числа пациентов с течением времени. 02:35:56 Работа с данными • Создание новой таблицы с возрастными группами. • Обсуждение использования возраста в качестве переменной. 02:51:41 Кокс регрессия • Обсуждение использования Кокс регрессии для анализа влияния возраста на выживаемость. • Обсуждение доверительных интервалов и коэффициентов при возрасте. 02:56:13 Заключение • Обсуждение важности использования доверительных интервалов для оценки влияния возраста на выживаемость.
Hide player controls
Hide resume playing