
На этом курсе мы продолжим изучать описательную статистику, а также узнаем как преобразовывать и очищать данные, необходимые для создания модели.
Раздел 1. Исследовательский анализ данных
Мы уже приобрели первые навыки исследовательского анализа данных. Пора расширить наши знания. Параллельно мы детально изучим Pandas, Matplotlib, Seaborn и Plotly.
- Библиотека Pandas
- EDA: визуализации и статистика
Раздел 2. Обработка данных
Данные, которые мы используем для анализа, редко бывают идеальными. В них часто встречаются ошибочные и пропущенные значения. Отдельная сложность — различающийся диапазон признаков и категориальные переменные.
- Очистка данных: дубликаты, неверные и пропущенные значения
- Преобразование данных
Поздравляю с завершением курса анализа данных! Теперь, когда мы познакомились с основами ML, изучили Питон и научились анализировать данные, нам предстоит перейти к построению моделей, и начнем мы этот путь с изучения методов оптимизации.