Анализ и обработка данных

Раздел 1. Библиотека Pandas

  1. Объекты DataFrame и Series: создание и доступ к элементам
  2. Изменение, соединение и группировка датафреймов

Раздел 2. EDA

  1. Классификация данных и задачи EDA
  2. Практика EDA: часть 1, часть 2, часть 3

Раздел 3. Очистка данных

  1. Ошибки в данных
  2. Пропущенные значения: часть 1, часть 2, дополнительные материалы
  3. Пропуски во временных рядах

Раздел 4. Преобразование данных

  1. Преобразование количественных данных: часть 1, часть 2, дополнительные материалы
  2. Работа с выбросами
  3. Кодирование категориальных переменных

Раздел 5. Пример: прогноз текучести кадров

На основе информации о сотрудниках, а также данных о том, покинул человек компанию или нет, предлагается построить предсказывающий текучесть кадров (employee churn) классификатор.

Employee Churn Prediction