Анализ и обработка данных | Курсы машинного обучения

Анализ и обработка данных

анализ данных

На этом курсе мы продолжим изучать описательную статистику, а также узнаем как преобразовывать и очищать данные, необходимые для создания модели.

Раздел 1. Исследовательский анализ данных

Мы уже приобрели первые навыки исследовательского анализа данных. Пора расширить наши знания. Параллельно мы детально изучим Pandas, Matplotlib, Seaborn и Plotly.

  1. Библиотека Pandas
  2. EDA: визуализации и статистика

Раздел 2. Обработка данных

Данные, которые мы используем для анализа, редко бывают идеальными. В них часто встречаются ошибочные и пропущенные значения. Отдельная сложность — различающийся диапазон признаков и категориальные переменные.

  1. Очистка данных: дубликаты, неверные и пропущенные значения
  2. Преобразование данных

Поздравляю с завершением курса анализа данных! Теперь, когда мы познакомились с основами ML, изучили Питон и научились анализировать данные, нам предстоит перейти к построению моделей, и начнем мы этот путь с изучения методов оптимизации.