Реальные данные зачастую содержат пропуски, дубликаты, некорректные значения. Все это может влиять на качество анализа данных и способствовать неверным выводам, поэтому сырые данные требуют предварительной обработки. Основные методы подготовки данных мы рассмотрим на вебинаре. На открытом уроке мы последовательно рассмотрим этапы обработки данных: - обработка пропусков - обработка дубликатов - поиск аномалий В результате вебинара слушатели узнают о методах подготовки данных и научатся чистить данные при помощи библиотеки Pandas. Наш открытый урок подойдет тем, кто хочет познакомиться с основами обработки данных, никогда не работал с библиотекой Pandas или имеет небольшой опыт. «Аналитик данных» - Преподаватель: Вероника Иванова - Data Scientist в Домклик Пройдите опрос по итогам мероприятия - Следите за новостями проекта: - Telegram: - ВКонтакте: - LinkedIn: - Хабр: В ограниченном доступе - будет повтор!
Hide player controls
Hide resume playing