Нейронные сети из теоретических научных исследований перешли в реальную жизнь, и анализ текста активно интегрируется в программные решения. Нейронные сети способны решать самые сложные задачи обработки естественного языка.
На курсе "Глубокое обучение (нейронные сети) на Python часть 3. Анализ текстовых данных и обработка естественного языка" слушатели научатся применять методы машинного обучения для анализа текста в реальных задачах, используя возможности и библиотеки Python. От поиска модели и предварительной обработки данных к приемам классификации и кластеризации текстов, визуальной интерпретации, анализу графов, использованию глубокого обучения для анализа текста.
Прослушав данный курс, Вы узнаете:
- Что такое корпус?
- Как проводить трансформацию корпуса
- Как распределяются слова в пространстве
- Как создать приложение классификации текста
- Как кластеризовать документы по сходству
- Как провести контекстно-зависимый анализ текста
- Как визуализировать пространство признаков
- Как извлечь графы из текста
- Где применимо обучение для рекомендаций
Научитесь:
- Понимать сложности компьютерной обработки естественного языка
- Создавать собственный корпус данных
- Предварительно обрабатывать и преобразовывать корпус данных
- Создать приложения классификации текста
- Проводить кластеризацию для выявления сходств в тексте
- Проводить контекстно-зависимый анализ текста
- Визуализировать текст
- Применять графовые методы анализа текста
- Создавать чат-боты
Аудитория: начинающие специалисты в области программирования, рассматривающие предмет как ступень к изучению Data Science, желающих продолжить знакомство с темой машинного обучения, с технологиями анализа текстовой информации.
Предварительная подготовка: Опыт программирования на языке Python и знание основных библиотек Python для научных расчетов: Numpy, Pandas, Matplotlib. Понимание разделов математики: теория вероятности, статистика, математический анализ, линейная алгебра. Навыки работы с алгоритмами машинного обучения и начальные навыки работы с нейронными сетями (технологиями глубокого обучения).
Курсы, рекомендуемые для предварительного прохождения:
- Программирование на Python, часть 1
- Программирование на Python, часть 2
- Программирование на Python, часть 3. Numpy для Data Science
- Программирование на Python, часть 4. Pandas для Data Science. Высокопроизводительная обработка и анализ данных в Pandas
- Математика для Data Science, часть 1. Теория вероятностей и статистика
- Математика для Data Science, часть 2. Математический анализ и линейная алгебра
- Машинное обучения на Python, часть 1
- Машинное обучения на Python, часть 2
- Глубокое обучение (нейронные сети) на Python часть 1
- Глубокое обучение (нейронные сети) на Python часть 2
Курсы, рекомендуемые для последующего прохождения:
- Разработка конвейеров, автоматизация и развертывание моделей машинного обучения
Программа курса
1 Сложности компьютерной обработки естественного языка
2 Естественные языки и вычисления
2.1 Парадигма Data Science
2.2 Приложения данных, основанные на анализе естественного языка
2.3 Язык как данные
3 Создание собственного корпуса
3.1 Что такое корпус?
3.2 Управление корпусом данных
3.3 Объекты чтения корпусов
4 Предварительная обработка и преобразование корпуса
4.1 Разбивка документов
4.2 Трансформация корпуса
5 Конвейеры векторизации и преобразования
5.1 Слова в пространстве
5.2 Scikit-Learn API
5.3 Конвейеры
6 Классификация в текстовом анализе
6.1 Классификация текста.
6.2 Создание приложений классификации текста
7 Кластеризация для выявления сходств в тексте
7.1 Обучение на текстовых данных без учителя
7.2 Кластеризация документов по сходству
7.3 Моделирование тематики документов
8 Контекстно-зависимый анализ текста
8.1 Извлечение признаков на основе грамматики
8.2 Извлечение признаков на основе n-грамм
8.3 Модели языка n-грамм
9 Визуализация текста
9.1 Визуализация пространства признаков
9.2 Диагностика моделей
9.3 Визуальная настройка
10 Графовые методы анализа текста
10.1 Вычисление и анализ графов
10.2 Извлечение графов из текста
10.3 Разрешение сущностей
11 Чат-боты
11.1 Основы диалогового взаимодействия
11.2 Правила вежливой беседы
11.3 Занимательные вопросы
11.4 Обучение для рекомендаций
В конце обучения на курсе проводится итоговая аттестация в виде теста или на основании оценок за практические работы, выполненных в процессе обучения.
Свободно распространяемое программное обеспечение популярно как среди частных лиц, так и среди организаций. Действительно, СПО позволяет серьезно экономить на приобретении лицензий для компаний, которые многократно тиражируют программное решение. Также благодаря тому, что СПО можно квалифицированно дорабатывать собственными силами под конкретные нужды организации, оно приобретает еще и дополнительную гибкость и удобство в использовании.
Открытое программное обеспечение — это программное обеспечение с открытым исходным кодом. Исходный код создаваемых программ открыт, то есть доступен для просмотра и изменения. Это позволяет использовать уже созданный код для создания новых версий программ, для исправления ошибок и, возможно, помочь в доработке открытой программы.
В конце обучения на курсах проводится итоговая аттестация в виде теста или на основании оценок за практические работы, выполненные в процессе обучения.
Учебный центр "Интерфейс" оказывает консалтинговые услуги по построению моделей бизнес-процессов, проектированию информационных систем, разработке структуры баз данных и т.д.
- Нужна помощь в поиске курса?
Наша цель заключается в обеспечении подготовки специалистов, когда и где им это необходимо. Возможна корректировка программ курсов по желанию заказчиков! Мы расскажем Вам о том, что интересует именно Вас, а не только о том, что жестко зафиксировано в программе курса. Если вам нужен курс, который вы не видите на графике или у нас на сайте, или если Вы хотите пройти курс в другое время и в другом месте, пожалуйста, сообщите нам, по адресу mail@interface.ru или shopadmin@itshop.ru
- Поговорите со своим личным тренинг-менеджером!
Мы предоставляет Вам индивидуальное обслуживание. Если у вас есть потребность обсудить, все вопросы касательно обучения, свяжитесь, пожалуйста c нами по телефонам: +7 (495) 925-0049, + 7 (495) 229-0436. Или любым другим удобным для Вас средствами связи, которые Вы можете найти на сайтах www.interface.ru или www.itshop.ru
|