III уровень Большие данные

Data Science: обработка естественного языка

Нетология
366,00 часов длительность
Онлайн формат
Начальный уровень
1 поток (закрыт) 23.05.2022-22.05.2023
2 поток (закрыт) 20.06.2022-19.06.2023
3 поток (закрыт) 22.08.2022-21.08.2023
4 поток (закрыт) 24.10.2022-23.10.2023

Описание

О профессии

Специалист по обработке естественного языка работает с любым текстом как с данными. Он создает основу работы поисковиков, машинного перевода, чатботов, вирутальных ассистентов. Эти навыки необходимы в большинстве digital-сфер.

Средняя зарплата в Data Science через год работы – 200 000 ₽, по данным исследования hh.ru.

Освойте высокооплачиваемую профессию со скидкой. Государство оплатит от 50% до 100% стоимости обучения. 

 

Кому будет полезен этот курс

Новичкам в Data Science

Вы научитесь создавать сайты и веб-приложения на языке JavaScript и станете квалифицированным специалистом в frontend-разработке. 

Разработчикам

Курс даёт хорошую базу для перехода из программирования в Data Science и анализ больших данных. Вас ждёт много практической работы, разбор кейсов и новые полезные знакомства.

Аналитикам

Вы научитесь извлекать максимум из больших массивов данных для быстрой проверки гипотез и построения прогнозов. Систематизируете знания и углубитесь в сферу Data Science.

 

О Нетологии

Нетология — образовательная платформа. Обучаем современным востребованным профессиям. 35+ тыс. дипломированных выпускников, 10 лет на рынке и 8 направлений обучения.

 

Наши преимущества

  • Преподаватели из крупнейших IT-компаний России
  • Обучение на практике и подробная обратная связь
  • Готовые кейсы в портфолио и помощь в их оформлении
  • Помощь с трудоустройством и поддержка на всех этапах
  • Диплом государственного образца 
  • Возможность получить налоговый вычет — 13%

 

Чему вы научитесь

  • Распознавание и синтез устной речи
  • Построение математическое модели для классификации текста
  • Поиск и работа с негативными отзывами
  • Обучение и программирование голосовых помощников
  • Создание алгоритма, преобразующего текст в его сокращённую версию
  • Оптимизация бизнес-процессов с помощью машинного обучения
  • Текстовый анализ и модерация ненадлежащего контента

По каждому блоку вы выполните домашние задания и получите подробную обратную связь.

 

Как проходит обучение

  • Смотрите видеолекции и участвуете в вебинарах
  • Закрепляете знания на практике
  • Создаете проект в портфолио
  • Получаете диплом и находите новую работу

 

Диплом подтвердит вашу квалификацию

Мы обучаем по государственной лицензии. При успешной защите итоговых проектов вы получите диплом, который сможете добавить к резюме и показать при устройстве на работу.

 

Трудоустройство

Поможем найти работу после обучения. У вас будет возможность работать из дома и получать конкурентную зарплату.

  • Поможем составить дорожную карту поиска работы
  • Научим проходить интервью
  • Поможем оформить резюме и портфолио ваших работ
  • Научим находить вакансии под выбранную профессию

 

Часов в программе
154,00 часа
лекции
137,00 часов
практика
34,00 часа
промежуточная аттестация
1 час
входная диагностика
40 часов
итоговая аттестация
366,00 часов
всего
Цель программы
Формирование у слушателей компетенций, необходимых для профессиональной деятельности по созданию и сопровождению информационных систем, автоматизирующих задачи организационного управления и бизнес-процессы в организациях различных форм собственности с целью повышения эффективности деятельности организаций - пользователей информационных систем.
Актуальность
Бизнес всё больше нуждается в Data Science. Спрос на специалистов появился в связи с активным ростом продуктовых направлений. При этом на рынке острый дефицит кадров. В 2021 году на одну вакансию приходилось менее 3 резюме при норме для рынка в 5–6 предложений. Работодатели готовы нанимать специалистов без опыта, развивать их и платить высокие зарплаты.

Зарплата специалиста по данным исследования HeadHunter:

100 000 ₽ – 150 000 ₽ зарабатывает junior-специалист
200 000 ₽ – 250 000 ₽ зарабатывает middle-специалист
300 000 ₽ – 350 000 ₽ зарабатывает senior-специалист
Входная диагностика 1 час
Входное тестирование на определение уровня базовых знаний в аналитике
Итоговая аттестация 40 часов
Дипломная работа

Компетенции

Профессиональные


Работа с базами данных в SQL
Знать:

• знать архитектуру и структуру базы данных в общем виде
• понимать алгоритм применения аналитических функций SQL
• ориентироваться в разных форматах файлов

Уметь:

• писать простые SQL запросы, чтобы получать данные из базы данных (БД)
• писать джоины, чтобы создавать новые таблицы
• группировать, фильтровать данные из БД
• импортировать и экспортировать данные в БД
• работать с разными форматами файлов

Владеть:

• использовать базу данных PostgreSQL, чтобы хранить данные
• использовать аналитические функции SQL, чтобы изучать характеристики данных

Анализ данных в Python
Знать:

• знание основ Python и основ системы контроля версий

Уметь:

• умение работать с библиотеками для анализа данных (numpy, scipy, pandas)
• умение работать со статистикой в Python (Основы описательной статистики, статистический анализ данных, методы математической оптимизации)

Владеть:

• владение инструментами Python (знание базовых и продвинутых типов данных, циклов, функций и классов)

Feature engineering и предобработка данных
Знать:

• знать, как проверять данные на полноту, целостность, валидность, правильность, наличие шумов, ошибок и пропусков
• понимать, как осуществлять сокращение размерности данных алгоритмами PCA, LDA, NMF с помощью sklearn

Уметь:

• уметь описывать основные проблемы данных
• уметь удалять шумы в данных, ошибочные знания, пропуски с помощью numpy и pandas
• уметь обрабатывать текстовые данные, чтобы передавать их в алгоритмы машинного обучения

Владеть:

• использование алгоритмов PCA, LDA, NMF с помощью sklearn для сокращения размерности данных

Построение модели обучения
Знать:

• знать базовые алгоритмы машинного обучения с помощью библиотеки sklearn
• знать алгоритмы кластеризации
• определять критерии точности модели

Уметь:

• строить деревья решений
• строить модель логистической регрессии
• использовать кросс-валидацию и регуляризацию, чтобы бороться с переобучением
• строить линейную и полиноминальную регрессию
• строить ансамбли моделей

Владеть:

• использовать GridSearch и RandomizedSearch, Model Specific CV, Out of Bag approach для подбора параметров модели
• использовать Random Forest в задачах классификации

Обработка естественного языка (NLP)
Знать:

• знать особенности анализа тональности текста
• понимать принципы классификации текстов
• знать принципы построения и визуализации моделей скрытых тем

Уметь:

• анализировать тональность текста
• извлекать сущности из текста
• классифицировать тексты
• выполнять простую (токенизация) и сложную (опеределение частей речи и синтаксических зависимостей) проработку текстов
• строить и визуализировать модели скрытых тем
• выделять и визуализровать ключевые слова из текста
• обучать модели распределенного представления слов
• генерировать тексты
• собирать и размечать тексты

Владеть:

• использование Transformers BERT для работы с текстами

Требования

Нет

Образование
  • Высшее образование
  • Среднее профессиональное образование

Модули

свернуть
60,00ч
Модуль 1 Старт в профессии. SQL
Узнаете, как будет организовано обучение на курсе, научитесь пользоваться личным кабинетом Нетологии, работать в учебном чате и быстро находить нужную информацию. Модуль поможет улучшить навыки работы с ПК и интернетом. Вы попрактикуетесь в решении повседневных аналитических задач, научитесь мыслить и рассуждать как аналитик. Познакомитесь с центром развития карьеры Нетологии и построите план по поиску работы во время дальнешего обучения на курсе. В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
55,00ч
Модуль 3 Математика для анализа данных
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации.
83,00ч
Модуль 2 Python для анализа данных
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
127,00ч
Модуль 4 Машинное обучение. Обработка естественного языка
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации. Научитесь строить простые полносвязанные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования НС в блоках CV и NLP. Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.
60,00ч
Модуль 1 Старт в профессии. SQL
Узнаете, как будет организовано обучение на курсе, научитесь пользоваться личным кабинетом Нетологии, работать в учебном чате и быстро находить нужную информацию. Модуль поможет улучшить навыки работы с ПК и интернетом. Вы попрактикуетесь в решении повседневных аналитических задач, научитесь мыслить и рассуждать как аналитик. Познакомитесь с центром развития карьеры Нетологии и построите план по поиску работы во время дальнешего обучения на курсе. В идеальном мире data scientist получает готовые данные, чтобы строить модели, но мир неидеален. Вы научитесь с помощью SQL получать данные из БД, фильтровать, агрегировать, а также импортировать и экспортировать.
83,00ч
Модуль 2 Python для анализа данных
Вы научитесь пользоваться базовыми инструментами и подходами в Python, чтобы начать работать с данными. Повторите основы линейной алгебры, теории множеств, методов математической оптимизации, описательной статистики, статистического анализа данных, а также научитесь реализовывать это на языке Python.
55,00ч
Модуль 3 Математика для анализа данных
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации.
127,00ч
Модуль 4 Машинное обучение. Обработка естественного языка
Научитесь проверять данные на полноту, целостность, валидность, наличие шумов, ошибок и пропусков. Узнаете, как очищать данные с помощью NumPy и pandas, как сокращать размерности данных алгоритмами PCA, LDA, NMF. Научитесь строить деревья решений и модели логистической, линейной и полиномиальной регрессии. Узнаете, как использовать Random Forest в задачах классификации. Научитесь строить простые полносвязанные сети уровня LeNet и AlexNet и экспериментировать с их обучением. Получите теоретическую и практическую базу для использования НС в блоках CV и NLP. Вы освоите морфологический и синтаксический анализ, дистрибутивную семантику и информационный поиск, научитесь снижать размерность в векторной модели, классифицировать, извлекать информацию и генерировать тексты.

Преподаватели

Сапрыкин

Артур

Нетология

Data Scientist

Шеянова

Мария

Million Agents

Старший специалист по машинному обучению

Аксенова

Анна

Sber

Аналитик данных

Никишина

Ирина

Нетология

Аналитик данных

85 000 p
Авторизуйтесь чтобы записаться

Профстандарт

Специалист по большим данным

06.042

Ответственный за программу

support@netology.ru

+78002008167