Промышленный Machine Learning на больших данных (2020)
Представляем вам практический курс по инструментам и технологиям работы с большими данными. Вы освоите все необходимые навыки машинного обучения для потоковых данных и распределенной среды. В программу включены необходимые знания из областей Data Science и Data Engineering, которые позволят вам обрабатывать большие данные и писать распределенные алгоритмы на Spark.
Содержание:
- Градиентный спуск и линейные модели
- Обзор основных методов и метрик машинного обучения
- Основы программирования на Scala
- Распределенные хранилища
- Эволюция параллельных алгоритмов
- Менеджеры ресурсов в распределенных системах
- Основы Apache Spark
- Эволюция параллельных алгоритмов №2
- Перенос МЛ-алгоритмов в распределенную среду
- ML в Apache Spark
- Разработка собственных блоков для SparkML
- Сторонние библиотеки для использования со Spark
- Оптимизация гиперпараметров и AutoML
- Потоковая обработка данных
- Spark Streaming
- Структурный и непрерывный стриминг в Spark
- Альтернативные потоковые фреймворки
- Определение цели МЛ-проекта и предварительный анализ
- Долгосрочные ML-цели на примере задачи уменьшения оттока
- А-Б тестирование 1
- А-Б тестирование 2
- Подходы к выводу ML-решений в продакшн
- Версионирование, воспроизводимость и мониторинг
- Онлайн-сервинг моделей
- Паттерны асинхронного потокового ML и ETL
- Если надо Python
- Альтернативные фреймворки с поддержкой Python
- Production Code на Python. Организация и Packaging кода
- REST-архитектура - Flask API
- Docker - Структура, применение, деплой
- Amazon Sagemaker
- AWS ML Service
- Нейросети
- Распределенное обучение и инференс нейросетей
- Градиентный бустинг на деревьях
Автор: Дмитрий Бугайченко и др.
Язык: русский
Продолжительность: 61:33:51
Формат: MP4 (+доп.файлы)
Видео: AVC, ~1684x900, ~1684 Kbps
Аудио: AAC, 128 Kbps, 48.0 KHz
Скачать обучающее видео "Промышленный Machine Learning на больших данных" (8,32 ГБ):
tottall 24/03/21 Просмотров: 2727
0