Описание образовательной программы
Магистерская образовательная программа 09.04.03 Прикладная информатика "Интеллектуальный анализ данных” (онлайн) очной формы обучения формирует комплексные компетенции в области интеллектуальных методов обработки и анализа данных, извлечения знаний из данных, современных программных систем и языков программирования для анализа данных, методов машинного обучения.
Обучение проходит полностью в онлайн формате, вечером в некоторые рабочие дни и днём по субботам. Все материалы для обучения доступны магистрантам в электронной образовательной среде университета. Работа с руководителем магистерской диссертации тоже проходит в режиме онлайн.
Актуальность образования.
Выпускники магистратуры будут обладать навыками сбора, обработки и анализа данных различной природы (табличные, текстовые, изображения, сигналы и видео), разработки дизайна исследования, построения pipelines, выполнения исследования от сбора данных до представления и интерпретации результатов анализа. Они работают специалистами в области интеллектуального анализа данных: Data Scientist, Data analytics, Machine Learning Engineer, Data Engineer, AI Researcher.
Такие специалисты требуются в компаниях всех отраслей экономики: банки, медицина, ритейл, телеком, промышленность, образование, медиа, ИТ, безопасность и др. Интеллектуальные методы позволяют выявлять скрытые закономерности в огромных объемах информации, прогнозировать риски, диагностировать неисправности, что помогает принимать обоснованные решения в любой области. Примеры задач выпускников программы:
- Медицина. Диагностика и прогнозирование развития заболеваний и осложнений;
- Экономика. Прогнозирование тенденций рынка и управление рисками;
- Банки. Прогнозирование возврата кредита, обнаружение мошенничества;
- Розничная торговля. Оптимизация ассортимента, оптимизация запасов, персонализация рекомендаций покупателям;
- Маркетинг. Прогнозирование эффективности рекламы, спроса, поведения потребителей и ценообразования, рекомендации;
- Телекоммуникации. Улучшение сетевых операций, качества обслуживания, предсказание оттока клиентов и разработка новых продуктов и услуг.
- Программирование: владение языками программирования Python, R, SQL.
- Работа с данными: работа с большими объемами данных, включая сбор, очистку, обработку и визуализацию, применение инструментов Hadoop, Spark, Kafka, SQL и NoSQL СУБД.
- Применение алгоритмов машинного обучения (классификация, регрессия, кластеризация и др.).
- Применение статистических методов для анализа данных, выявление закономерностей и проверка гипотез.
- Моделирование данных: построение моделей данных, которые отражают структуру и взаимосвязи между различными элементами данных.
- Визуализация данных: умение представлять результаты анализа данных в виде графиков, диаграмм и интерактивных дашбордов с использованием инструментов типа Tableau, Power BI, Matplotlib, Seaborn и других.
- Обработка естественного языка (NLP): навыки работы с текстовыми данными, включая извлечение информации, классификацию текстов, анализ тональности и другие задачи NLP.
- Обработка изображений и сигналов.
- Разработка дизайна исследований, подготовка аналитических отчетов.
- Развертывание и эксплуатация моделей: опыт настройки и развертывания моделей машинного обучения в производственных средах, мониторинг их производительности и регулярное дообучение/оптимизация.
Основные изучаемые дисциплины
- статистический анализ данных;
-
машинное обучение;
-
нейронные сети;
-
методология интеллектуального анализа данных;
-
компьютерная лингвистика;
-
обработка сигналов и изображений;
-
основы Data Engineering;
-
технологии сбора и предварительной обработки данных;
-
методы объяснимого искусственного интеллекта;
-
продуктовая аналитика;
-
биоинформатика;
-
управление проектами анализа данных.