- Таблица с вашими оценками
- Youtube-каналы с записями семинаров: канал Филиппа, канал Максима
- Материалы для каждого семинара лежат в папках
/sem*
- Если вы хотите скачать из репозитория конкретную папку, просто вставьте ссылку на неё в сервис для скачки.
- Любые вопросы можно задавать в общий чат. Там можно найти поддержку и пофлудить.
- Канал с основными объявлениями
- Репозиторий с материалами курса по python из прошлого семестра (там же инструкция по установки анаконды и тп)
Добро пожаловать на курс по анализу данных. Основная цель этого курса - научить вас работе с данными. Мы научимся анализировать таблицы, строить красивый визуал, проверять гипотезы, симулировать случайные величины, а также посмотрим на базовые концепции машинного обучения.
На семинарах мы будем активно использовать различные понятия из теории вероятностей и математической статистики. Лекции и семинары по ним лучше не прогуливать ;)
Домашки:
- ДЗ-1: генерации случайных величин и numpy
- ДЗ-2: EDA в pandas: анализируем чеки и ищем VaR
- ДЗ-3: Определяем пол клиента по транзакциям
- ДЗ-4: АБ-тестирование
Мини-самостоялки:
- МСР-1: вариант-1 вариант-2
- МСР-2: вариант-1 вариант-2
- МСР-3: вариант-1 вариант-2
- Если есть желание, можно порешать тесты из мидтёрмов и экзаменов по МО
- МСР-4: вариант-1 вариант-2
- sem01 Вспоминаем питон на задачах про симуляции! Говорим про распределения. Вводимся в scipy и matplotlib.
- sem02 Вводимся в numpy
- sem03 Вводимся в pandas и визуализацию
- sem04 Метод моментов, ЦПТ, доверительные интервалы.
- sem05 Больше EDA и разной визуализации!
- sem06 Базовое машинное обучение. Вводим основные понятия ML. Говорим про KNN.
- sem07 Разбираемся с линейной регрессией и как её обучить.
- sem08 Обсуждаем решуляризацию и подбор гиперпараметров
- sem09 Что такое классификация и логистическая регрессия?
- sem10 Метрики классификации. Roc-auc.
- sem11 АБ-тестирование, гипотезы, критерии.
- sem12 Больше гипотез и критериев! Непараметрические тесты.
- sem13 Семинар про бустрап.
- sem14 Метод максимального правдоподобия.
- sem15 Резервный семинар на всякий случай.
Вы получаете две оценки. Одну за курс, вторую за независимый экзамен. Оценка за курс ставится по формуле:
Итог = Округление(0.1 * МСР + 0.4 * ДЗ + 0.3 * П + 0.2 * КР)
- МСР — мини-тесты на парах
- ДЗ — домашние работы (их будет 4 штуки, по каждой логической части курса)
- П — свой проект длинной в семестр (расскажем детали позже)
- КР — контрольная в виде демо-варианта независимого экзамена
Обратите внимание, что отдельная оценка будет ставиться за независимый экзамен. Чтобы его сдать придётся заботать не только питон, но ещё и матстат с тревером.
Весь контент, созданный для этого курса распространяются на правах лицензии MIT License либо на правах лицензии WTFPL на ваш выбор. Материалы публикуются как общественное достояние.