Data Fest Online 2020 Causal Inference in ML Track Causal Inference with Panel Data Панельная структура дает большой простор для анализа причинно-следственных связей как с экспериментальными, так и с историческими данными. В первом случае, мы можем изучать оптимальные стратегии воздействия, в то время как во втором, мы можем использовать панельные данные, чтобы контролировать ненаблюдаемые индвивидуальные характеристики. В то же время, анализ панельных данных - это довольно сложная задача, потому что мы не можем просто использовать знакомые методы, основанные на задачах предсказания. В рамках этого доклада я сфокусируюсь на методах, связанных с задачами заполнения матриц и обсужу два алгоритма: Matrix Completion with Nuclear-Norm Penalization (Athey et al. (2017)) и Synthetic Difference-in-Differences (Arkhangelsky et al. (2018)). Panel data provides tremendous opportunities for causal inference with both experimental and observational design. In the former case, we can learn optimal dynamic treatment policies, while in the latter, we can control for potentially unobserved confounders. Simultaneously, panel data analysis is challenging, since generally, one cannot merely use conventional prediction-based methods to impute counterfactuals. I focus on techniques connected with matrix completion problems familiar from high-dimensional statistics literature (or literature on collaborative filtering in ML) in this talk. I will discuss two algorithms: Matrix Completion with Nuclear-Norm Penalization (Athey et al. (2017)), and Synthetic Difference-in-Differences (Arkhangelsky et al. (2018)). Посмотреть эфир и список треков и организаторов: Зарегистрироваться на фест и получить доступ к трекам: Вступить в сообщество: Соцсети Data Fest:
Hide player controls
Hide resume playing