Анализ данных и машинное обучение существенно опираются на результаты из математического анализа, линейной алгебры, методов оптимизации, теории вероятностей. Без фундаментальных знаний по этим наукам невозможно понимать, как устроены методы анализа данных. Данный курс направлен на то, чтобы сформировать этот фундамент. Мы обойдёмся без сложных формул и доказательств и сделаем упор на интерпретации и понимании смысла математических понятий и объектов.
Для успешного применения методов анализа данных нужно уметь программировать. Фактическим стандартом для этого в наши дни является язык Python. В данном курсе мы предлагаем познакомиться с его синтаксисом, а также научиться работать с его основными библиотеками, полезными для анализа данных.
В этом курсе вы познакомитесь с фундаментальными математическими понятиями, необходимыми для анализа данных, и получите начальный навык программирования на Python. Курс состоит из двух больших частей. Первая часть курса – практическая, она посвящена языку программирования Python. Вы познакомитесь с синтаксисом и идеологией языка, научитесь писать простые программы. Также вы узнаете о библиотеках, которые часто применяются на практике для анализе данных, например, NumPy, SciPy, Matplotlib и Pandas. Вторая часть курса посвящена таким разделам математики как линейная алгебра, математический анализ, методы оптимизации и теория вероятностей. При этом, упор делается на разъяснение математических понятий и их применение на практике, а не на вывод сложных формул и доказательство теорем.
Неделя 1 Введение
- Знакомство с Python
- Основы математического анализа
Неделя 2 Библиотеки Python и линейная алгебра
- Библиотеки NumPy, Matplotlib, SciPy, Pandas
- Линейная алгебра
- Assignment Линейная алгебра: сходство текстов и аппроксимация функций
Неделя 3 Оптимизация и матричные разложения
- Градиент и оптимизация гладких функций
- Оптимизация негладких функций
- Assignment Оптимизация в Python: глобальная оптимизация и оптимизация негладкой функции
- Матричные разложения
Неделя 4 Случайность
- Вероятность и случайные величины
- Статистики
- Assignment Центральная предельная теорема своими руками
- Рекомендации книг от авторов курса
- Пример задачи: решение задачи регрессии на примере предсказания качества вина по его химическим параметрам.