ОСНОВЫ УПРАВЛЕНИЯ ДАННЫМИ: ОБЗОР ИНСТРУМЕНТОВ И МЕТОДОВ — SynergyCom

ОСНОВЫ УПРАВЛЕНИЯ ДАННЫМИ: ОБЗОР ИНСТРУМЕНТОВ И МЕТОДОВ

Код курса: DS-002 Продолжительность: 3 дня (24 часа)

Целевая аудитория — аналитики в различных областях: маркетинге, ИТ, промышленности, работники аналитических отделов коммерческих и государственных организаций.

Цель обучения — освоение инструментов анализа данных с целью формирования отчетности по операционному мониторингу, а также построение прогнозной аналитики (без использования программного обеспечения); навыки проведения самостоятельных исследований методами анализа данных и эффективное пользование результатами готовых статистических исследований.

Программа тренинга:

1. Введение

  • Общая концепция методологии по анализу данных.
  • Обзор целей и задач, решаемых методами анализа данных.
  • Импорт и экспорт данных, взаимодействие с базами данных.
  • Предварительная обработка («чистка») данных — обработка пропущенных значений, значений-выбросов, дублированных и некорректных элементов, избыточных значений.
  • Описание и предварительный анализ данных: стратификация (расслоение данных). Визуализация исходных данных, анализ графиков и диаграмм.
  • Поиск наиболее значимых факторов. Отсеивание проблем (работа с регрессивными моделями): прямой отбор, обратное исключение, Stepwise, лучшие подмножества.
  • Поиск закономерностей в данных: свободный поиск; прогностическое моделирование; анализ исключений; ассоциативные правила.

2. Классификация и регрессия данных

  • Ключевые понятия и определения.
  • Деревья классификации и регрессии: графическое представление результатов, методика построения моделей, параметры качества построенных моделей, разделение данных на обучающую и контрольную выборки, метод кросс-валидации.
  • Другие методики построения деревьев: CHAID модели, Растущие деревья классификации и регрессии (Boosted trees), Случайные леса (Random forests).
  • Метод опорных векторов. Ансамбли моделей: бустинг и бэггинг.
  • Сравнение качества построенных моделей. Совместное использование построенных моделей. Применение построенных моделей на новых данных.
  • Общие знания о классических методах регрессионного анализа: множественная и логистическая регрессии, выбор переменных для анализа, критерий Акаике и Шварца.
  • Дискриминантный анализ. Анализ цензурированных данных, Анализ выживаемости.

3. Дополнительные методы анализа данных

  • Кластеризация: постановка задачи, ключевые понятия и определения, методы кластеризации. Методы разбиения, Иерархические методы, Плотностные методы, Сетевые методы, Модельные методы, Концептуальная кластеризация.
  • Понижение размерности: постановка задачи, методы понижения размерности.
  • Поиск информации в текстовых данных. Автоматизация анализа данных, генерирование автоматических отчётов (информация о программном обеспечении).
  • Совместное использование методов анализа данных. Классификация методов анализа данных: параметрические, непараметрические и семипараметрические методы.

Теоретические знания будут подкреплены практическими навыками. Слушатели смогут инструментами и методами, представленными в ходе тренинга, обработать собственные массивы данных, классифицировать данные, формировать закономерности, проводить отсев данных и прогнозировать будущие решения для возможности адаптации бизнеса под ключевые показатели деятельности. При подготовке курса есть возможность адаптации тренинга под отраслевую направленность компании Заказчика.

Время проведения курса пока не определено, отправьте нам заявку, пожалуйста.

Возможно, мы предложим пройти курс в дистанционном режиме или организуем выездной курс, если у Вас группа.

Направления обучения

Поиск по сайту