Анализ данных | Курсы машинного обучения

Анализ данных

На этом курсе мы продолжим изучать статистику, а также узнаем как загружать, преобразовывать и очищать данные, необходимые для создания модели.

Перед этим советую пройти первые два раздела вводного курса.

Раздел 1. Статистика для продолжающих

Мы уже умеем строить графики и познакомились с основами статистики на Питоне. Пора систематизировать и расширить наши знания.

  1. Категориальные переменные
  2. Количественные признаки: меры среднего
  3. Количественные признаки: дисперсия и СКО
  4. Дополнительные примеры

Раздел 2. Библиотека Pandas

На вводном курсе мы научились создавать датафреймы библиотеки Pandas из питоновского словаря. В этом разделе мы рассмотрим новые форматы исходных данных, научимся изменять и анализировать датафреймы.

  1. Создание датафрейма
  2. Базовые преобразования
  3. Объединение таблиц
  4. Строки и столбцы в датафрейме
  5. Статистика в Pandas

Раздел 3. Предварительная обработка данных

Данные, которые мы используем для анализа, редко бывают идеальными. В них часто встречаются пропущенные значения и повторы. Отдельная сложность для построения моделей — категориальные переменные и различающийся диапазон признаков.

  1. Пропущенные значения и повторы
  2. Работа с категориальными признаками
  3. Нормализация данных

Поздравляю с завершением курса анализа данных! Мы близки к тому, чтобы перейти к практической работе по обучению и настройке моделей.