Скачать Машинное обучение. Экспертный уровень [Otus] [Михаил Лебедев, Мария Тихонова, Игорь Стурейко]

Принц

Администратор
Регистрация
16 Дек 2016
Сообщения
183.375
Реакции
465.824
Складчина: Машинное обучение. Экспертный уровень [Otus] [Михаил Лебедев, Мария Тихонова, Игорь Стурейко]



Продвинутые ML приемы для Data Scientists, желающих повысить свой профессиональный уровень до Middle+

Для кого этот курс?

Для аналитиков: научитесь применять методы машинного обучения в прогнозах
Для программистов: научитесь строить end-to-end пайплайны и выводить ML-модели в production
Для Специалистов в сфере Data Science и ML инженеров: усовершенствуйте навыки и продвигайтесь по карьерной лестнице
Необходимые знания

Python (pandas, sklearn, numpy)
Понимание базовых принципов и алгоритмов ML
Математический анализ (вычисление производных сложных функций)
Линейная алгебра (матричные операции и собственные вектора)
Теория вероятностей и мат. статистики (понимание дисперсии, мат. ожидания, законы распределений).
Что даст вам этот курс?
Вы изучите продвинутые методы машинного обучения, которые позволят вам уверенно себя чувствовать на ведущих Middle+ / Senior позициях и справляться с нестандартными задачами.
После вебинара вы получаете Jupyter Notebook с разбором практического кейса с занятия. По итогу курса у вас будет обширная база знаний по каждому модулю.

Что вы сможете после обучения:

Настраивать окружение и писать production код, готовый к внедрению
Работать с AutoML подходами и понимать ограничения в их применении
Понимать и уметь применять Байесовские методы и обучение с подкреплением для соответствующих задач
Решать сложные задачи, связанные с рекомендательными системами, временными рядами и RL, например: ранжирование, поиск одинаковых товаров, классификация изображений, динамическое ценообразования, оптимизация логистики, прогнозирование торговли и многие другие.
Разрабатывать и создавать нейросетевые AI-модели.
Применять широкий спектр нейросетевых AI-моделей для разнообразных задач.
Программа

Бонусный модуль NLP
Бонусный модуль Графы
Временные ряды
Рекомендательные системы. Задача ранжирования
Bayesian Learning, PyMC
Reinforcement Learning
Production
Production. AutoML
Проектная работа


Спойлер: Программа подробно:
Бонусный модуль NLP
Нейросетевые языковые модели и практические методы применения LLM и фундаментальных моделей.
Тема 1: Нейросетевые языковые модели и стратегии генерации текста
Тема 2: Машинный перевод и seq2seq
Тема 3: Архитектура Transformer и концепция attention mechanism
Тема 4: Transfer learning; BERT model
Тема 5: Генеративные языковые модели GPT3 и методы few, zero-shot learning
Тема 6: Towards ChatGPT
Тема 7: Теория промптинга LLM
Тема 8: Sentence-transformers
Тема 9: Langchain
Тема 10: RAG - генерация на основе базы знаний

Бонусный модуль Графы
В этом модуле мы научимся работать с новым типом данных - графами. Разберем самые широко используемые библиотеки: NetworkX, Stellar. Познакомимся с задачами Community Detection, Link Prediction и Node Classification.
Тема 1: Введение в графы: основные понятия. NetworkX, Stellar
Тема 2: Анализ графов и интерпретация. Community Detection
Тема 3: Link Prediction и Node Classification

Временные ряды
Данный модуль посвящен продвинутым методам работы с временными рядами. Мы разберём различные способы генерации признаков из временных рядов, а также две важные задачи, которые можно решать с таким типом данных: кластеризацию и сегментацию.
Тема 1: Извлечение признаков. Fourier и Wavelet transformation, Automatic Feature generation - tsfresh
Тема 2: Unsupervised подходы: Кластеризация временных рядов
Тема 3: Unsupervised подходы: Сегментация временных рядов
Тема 4: Прогнозирование временных рядов
Тема 5: Поиск аномалий во временных рядах

Рекомендательные системы. Задача ранжирования
В этом модуле мы будем работать с различными типами рекомендательных систем. Рассмотрим случаи явного (explicit) и неявного (implicit) фидбека, а также крайне важную для рекомендаций задачу ранжирования - learning to rank. Также мы научимся работать с одной из самых популярных питоновских библиотек для рекомендательных систем.
Тема 1: Введение в теорию рекомендательных систем и их практическое применение
Тема 2: Проблема холодного старта. Метод поиска ближайших соседей
Тема 3: SVD и ALS алгоритмы
Тема 4: Практическое занятие по рекомендательным системам. Двухуровневая модель
Тема 5: Обзор нейросетевых моделей

Bayesian Learning, PyMC
В этом модуле мы познакомимся с очень важным и полезным направлением работы с данными (и не только) - байесовским обучением. В отличие от привычных нам моделей, где мы зачастую получаем точечную оценку коэффициентов и точечные же предсказания, в байесовской парадигме мы будем работать с целыми вероятностными распределениями и получать гораздо более мощные инструменты для работы с вероятностями. Мы подробно изучим теоретическую основу байесовских методов, включая способы получения оценок распределений при помощи сэмплирования, разберём байесовский подход к АB-тестированию, а также обобщенные линейные модели (GLM), способные решать задачи регрессии и классификации.
Тема 1: Введение в вероятностное моделирование, апостериорные оценки, сэмплирование
Тема 2: Markov Chain Monte-Carlo (MCMC), Metropolis–Hastings
Тема 3: Байесовское АB-тестирование
Тема 4: Generalized linear model (GLM) - байесовские регрессии, вывод апостериорных оценок коэффициентов
Тема 5: Практическое занятие по GLM
Тема 6: Практическое занятие по логит-регрессии
Тема 7: Байесовская сеть доверия: практическое занятие

Reinforcement Learning
Обучение с подкреплением (RL) - одно из очень перспективных направлений машинного обучения, которое находит всё больше применений на практике. Мы начнём с изучения теоретических основ RL, рассмотрим способ проведения АБ-тестов с использованием многоруких бандитов, а также разберём самые популярные алгоритмы: Markov Decision Process, Value Iteration, Policy Iteration, Temporal Difference, SARSA и Q-learning. При этом большой упор делается на практическое применение этих методов для решения реальных задач.
Тема 1: Введение в обучение с подкреплением
Тема 2: Multi-armed bandits для оптимизации AB-тестирования, от теории - сразу в бой
Тема 3: Практическое занятие: Multi-armed bandits в ecommerce: search оптимизация
Тема 4: Markov Decision Process, Value function, Bellman equation
Тема 5: Value iteration, Policy iteration
Тема 6: Monte Carlo Methods
Тема 7: Temporal Difference (TD) и Q-learning
Тема 8: SARSA и Практическое занятие: финансовый кейс TD и Q-learning
Тема 9: Deep Q-Network (DQN) алгоритм
Тема 10: Deep Policy Gradient (PG) алгоритм
Тема 11: Actor-Critic алгоритм

Production
Модуль полностью посвящен внедрению ML-проектов в прод. Мы подробно разберём сериализацию моделей, создание API и контейнеризацию в Docker и Kubernetes.
Тема 1: Production Code проекта на примере задачи классификации/регрессии, Virtual environments, dependency management, pypi/gemfury
Тема 2: REST-архитектура: Flask API
Тема 3: Docker: Структура, применение, деплой
Тема 4: Сети и Docker compose
Тема 5: Практическое занятие по работе в проде: деплой докера в Yandex Cloud
Тема 6: Колоночные БД и объектные хранилища
Тема 7: Версионирование данных. DVC
Тема 8: Воспроизводимость и версионирование. MLFlow

Production. AutoML
В этом модуле мы научимся грамотно структурировать код production ML-проекта с использованием виртуальных оболочек и менеджеров зависимостей. Также мы познакомимся с продвинутыми методами оптимизации кода и новыми способами кодирования категориальных переменных. Мы научимся работать с самыми популярными библиотеками для AutoML, поймём их преимущества и недостатки, а также области применения на практике.
Тема 1: Практическое занятие - Оптимизация кода, parallelization, multiprocessing, ускорение pandas, Modin для Pandas
Тема 2: Advanced Data Preprocessing. Categorical Encodings
Тема 3: Featuretools - а вы что, за меня и признаки придумывать будете?
Тема 4: H2O и TPOT - а вы что, за меня и модели строить будете?
Тема 5: Поиск нечетких дублей
Тема 6: Практическое занятие - Построение end-to-end пайплайнов и сериализация моделей

Проектная работа
Заключительный месяц курса посвящен проектной работе. Свой проект — это то, над чем интересно поработать слушателю. То, что можно создать на основе знаний, полученных на курсе. При этом не обязательно закончить его за месяц. В процессе написания по проекту можно получить консультации преподавателей.
Тема 1: Выбор темы проекта
Тема 2: Предзащита проектных работ №1
Тема 3: Предзащита проектный работ №2
Тема 4: Защита проектных работ

Преподаватели

Михаил Лебедев. Tech Lead DS. Банк России
Александр Андреянков. Senior ML Engineer. Райффайзен Банк
Николай Осипов. MLOps Engineer. Kadam
Виталий Сидоренко. Senior Data Scientist. Магнит
Максим Бекетов. Аспирант. ФКН ВШЭ
Мария Тихонова. Лидер Research кластера. Сбер, ВШЭ
Екатерина Дмитриева
Игорь Стурейко. (к.ф.-м.н.) Teamlead, главный инженер FinTech
Алексей Кисляков (д.э.н., к.т.н.) преподаватель/ученый-исследователь
Российская академия народного хозяйства и государственной службы при Президенте РФ (Владимирский филиал)
Вероника Иванова. Data Scientist Sber AI Lab
Андрей Канашов Senior Data Scientist Самолет
Полная стоимость: 126000 руб.




СКАЧАТЬ