В этом видео мы разберемся, каким образом можно оценить зависимость между несколькими случайными величинами. Самым простым видом зависимости является линейная, и именно такую зависимость позволяет распознать ковариация и корреляция. Мы подробно изучим эти понятия и их свойства и на ряде примеров продемонстрируем, что коэффициент корреляции тем ближе к единице (или минус единице), чем ближе зависимость между двумя случайными величнами к линейной. В таком случае мы говорим, что между случайными величинами наблюдается сильная корреляция. Если же наблюдается слабая корреляция, т.е. коэффициент корреляции близок к нулю, то возможно два варианта: либо случайные величины независимы, либо же между ними существует какая-то нелинейная зависимость. Наконец, мы введем одно из самых распространенных многомерных распределений: многомерное нормальное распределение, которое параметризуется вектором математических ожиданий и ковариационной матрицей. Полученные знания мы закрепим, исследовав в jupyter notebook kaggle-датасет с
Hide player controls
Hide resume playing