
На этом курсе мы продолжим изучать описательную статистику, а также узнаем как преобразовывать и очищать данные, необходимые для создания модели.
Раздел 1. Исследовательский анализ данных
Мы уже приобрели первые навыки исследовательского анализа данных. Пора расширить наши знания. Параллельно мы систематизируем работу с библиотеками Pandas, Matplotlib и Seaborn.
- Библиотека Pandas
- Качественные и количественные данные
Раздел 2. Обработка данных и работа с признаками
Данные, которые мы используем для анализа, редко бывают идеальными. В них часто встречаются пропущенные значения и повторы. Отдельная сложность для построения моделей — категориальные переменные и различающийся диапазон признаков.
- Ошибки в данных: пропущенные и неверные значения, повторы
- Преобразование данных
Поздравляю с завершением курса анализа данных! Теперь, когда мы познакомились с основами ML, изучили Питон и научились анализировать данные, нам предстоит погрузиться глубже, и начнем мы этот путь с изучения методов оптимизации.