Курс «20774 Облачная аналитика больших данных (Big Data) при помощи машинного обучения в Azure» ориентирован на специалистов, желающих обрабатывать большие объёмы данных с помощью таких современных средств автоматизации, как машинное обучение. Также курс будет интересен специалистам, изучающим HDInsight и R.
На курсе слушатели научатся анализировать большие данные и визуализировать результаты при помощи машинного обучения в Azure. Также в курсе рассмотрены такие инструменты анализа больших данных как HDInsight и R.
Рекомендуемый уровень подготовки:
Успешное окончание курсов 20773 Анализ больших данных (Big Data) с помощью Microsoft R и 20767 Разработка и эксплуатация хранилищ данных на SQL Server 2016
Прослушав данный курс, Вы научитесь:
- объяснять принципы работы механизмов машинного обучения, используемые алгоритмы и языки;
- описывать возможности машинного обучения в Azure и перечислять основные функции Azure Machine Learning Studio;
- загружать и исследовать различные типы данных для машинного обучения Azure;
- использовать методы подготовки наборов данных для использования с машинным обучением Azure;
- использовать регрессионные алгоритмы и алгоритмы работы нейронных сетей в рамках машинного обучения Azure;
- использовать алгоритмы классификации и кластеризации в рамках машинного обучения Azure;
- использовать преимущества R и Python при работе с машинным обучением Azure;
- использовать гипер-параметры, множество алгоритмов и моделей для решения аналитических задач;
- предоставлять пользователям доступ к результатам отработки моделей машинного обучения Azure;
- использовать подключения к когнитивным службам (Cognitive Services API) для обработки текста и изображений, создания рекомендаций и описание использования нейронных сетей в рамках машинного обучения Azure;
- использовать HDInsight в рамках машинного обучения Azure;
- использовать язык R и сервер R в рамках машинного обучения Azure;
- объяснять, как развернуть и настроить SQL Server для поддержки служб R.
После изучения данного курса рекомендуем прослушать курс:
Программа курса
Модуль 1. Введение в машинное обучение
- Что такое машинное обучение?
- Введение в алгоритмы машинного обучения
- Введение в языки машинного обучения
- Лабораторная работа: Введение в машинное обучение
Модуль 2. Введение в машинное обучение Azure
- Обзор машинного обучения Azure
- Введение в Azure Machine Learning Studio
- Разработка и размещение приложений машинного обучения Azure
- Лабораторная работа: Введение в машинное обучение Azure
Модуль 3. Работа с наборами данных
- Классификация данных
- Импорт данных для машинного обучения Azure
- Исследование и преобразование данных в машинном обучении Azure
- Лабораторная работа: Визуализация данных
Модуль 4. Подготовка данных для использования машинного обучения Azure
- Предварительная обработка данных
- Обработки неполных данных
- Лабораторная работа: Подготовка данных для использования машинного обучения Azure
Модуль 5. Использование средств конструирования и выборки
- Использование компонент конструирования
- Использование компонент выбора
- Лабораторная работа: Использование rxExec и revoPemaR для распараллеливания операций
Модуль 6. Построение моделей машинного обучения Azure
- Процессы машинного обучения Azure
- Оценка и применение моделей
- Применение регрессионных алгоритмов
- Использование нейронных сетей
- Лабораторная работа: Построение моделей машинного обучения Azure
Модуль 7. Классификация и кластеризация в моделях машинного обучения Azure
- Алгоритмы классификации
- Методы кластеризации
- Выбор алгоритмов
- Лабораторная работа: Классификация и кластеризация в моделях машинного обучения Azure
Модуль 8. Использование R и Python в машинном обучении Azure
- Использование R
- Использование Python
- Использование блокнотов Jupyter
- Поддержка R и Python
- Лабораторная работа: Использование R и Python в машинном обучении Azure
Модуль 9. Инициализация и оптимизация моделей машинного обучения
- Использование гипер-параметров
- Использование нескольких алгоритмов и моделей
- Сравнение и оценка ансамбля
- Лабораторная работа: Инициализация и оптимизация моделей машинного обучения
Модуль 10. Использование моделей машинного обучения Azure
- Развертывание и публикации моделей
- Экспорт данных
- Лабораторная работа: Использование моделей машинного обучения Azure
Модуль 11. Использование когнитивных служб
- Обзор когнитивных служб
- Обработка текста
- Обработка изображений
- Создание рекомендаций
- Лабораторная работа: Использование когнитивных служб
Модуль 12. Использование машинного обучения с HDInsight
- Введение в HDInsight
- Типы кластеров HDInsight
- HDInsight и модели машинного обучения
- Лабораторная работа: Использование машинного обучения с HDInsight
Модуль 13. Использование R-сервисов машинного обучения
- Обзор R и сервера R
- Использование сервера R в моделях машинного обучения
- Использование R с SQL Server
- Лабораторная работа: Использование R-сервисов машинного обучения
В конце обучения на курсе проводится итоговая аттестация в виде теста или на основании оценок за практические работы, выполненных в процессе обучения
Microsoft SQL Server 2016 — мощная и безопасная система управления базами данных, готовая к работе в самых важных и бизнес-приложениях, высокого уровня, позволяющая сокращать финансовые затраты на сервис систем и производство новых приложений.
SQL Server 2016 обеспечивает рекордную производительность благодаря новым технологиям работы с памятью, что поможет заказчикам ускорить свой бизнес и реализовать новые сценарии работы.
Кроме того, SQL Server 2016 позволяет использовать новые гибридные облачные решения. Это позволит воспользоваться новыми преимуществами облачных вычислений. Например в таких сценариях как резервное копирование в облако и аварийное восстановление локально установленного SQL Server.
SQL Server 2016 предлагает лучшие возможности в отрасли бизнес-аналитики благодаря интеграции с такими привычными инструментами, как Excel и Power BI для Office 365.
Основные нововведения включают:
- Поддержка in-memory OLTP (Hekaton). SQL Server 2016 обладает возможностью размещения таблиц и хранимых процедур в оперативной памяти, что позволит добиться существенного выигрыша в производительности транзакционных приложений.
- Обновляемые колоночные индексы. Колоночные индексы используются, в основном, в аналитических приложениях. Они позволяют значительно ускорить выполнение запросов по схемам данных, характерных для OLAP (звезда, снежинка). В версии 2016 это ограничение снято, и колоночные индексы получат возможность обновляться при внесении изменений в данные, как традиционные индексы.
- Новый тип управляемого ресурса в Resource Governor. Регулятор ресурсов используется для разделения вычислительных мощностей компьютера между различными приложениями, обращающимися к SQL Server, что дает возможность приоритезировать нагрузку, а также гарантирует, что приложение не выйдет за пределы назначенных ему ресурсов, забирая на себя все, что выделено серверу баз данных. Это позволяет обеспечить предсказуемую работоспособность. В предыдущих версиях к ресурсам относились память и процессорное время, ввод-вывод.
- Улучшенная отказоустойчивость. Группа высокой доступности AlwaysOn теперь включает 8 вторичных реплик (против 4-х в предыдущей версии).
- Интеграция с Облаком. Возможность размещать в Windows Azure файлы БД большого размера для on-premise SQL Server, а также выполнять в Windows Azure резервное копирование, в том числе с новыми возможностями шифрования.
|