DSAV: Анализ данных и визуализация в R
Курс по методам Data Mining и визуализации больших данных с использование R-Studio. Манипуляция данных в R, работа с датафреймами и датасетами, подготовка данных и пакеты по работе с графикой ggplot, plotly
Аудитория: специалисты Data Scientists, Аналитики по работе с Большими данными, бизнес-аналитики и руководители, желающие получить расширенную теоретическую и практическую подготовку по использованию R—Studio в проектах анализа больших данных.
Программа
- Основы статистики и простая линейная регрессия
- Что такое ваши данные
- Статистические выводы
- Введение в машинное обучение
- Простая линейная регрессия
- Диагностика и трансформация
- Коэффициент определенности
- Базовое программирование с R
- Введение в R. Что такое R?
- R-Studio, пакеты и рабочая область
- Основные элементы языка R
- Типы объектов данных. Локальный импорт/экспорт данных
- Введение функций и управляющих операторов
- Углубленное изучение объектов данных
- Функции. Программирование функций
- Базовые элементы данных
- Преобразование данных (Reshape, Split, Combine)
- Символы. Обработка строк. Даты и временные метки
- Сбор Веб-данных
- API источники данных
- Подключение к внешней базе данных
- Манипулирование данными с помощью «dplyr»
- Подмножество, преобразование и переупорядочение наборов данных
- Объединение наборов данных
- Групповые операции над наборами данных
- Графика данных и визуализация данных
- Основные подходы к визуализации данных и графики данных. Base, Grid, Lattice, ggplot2
- Построение графиков больших данных с ggplot2
- Расширенная визуализация в R
- Настраиваемая графика с помощью ggplot2
- Титулы, системы координат, масштабы, темы, метки, легенда scatterplot с многоразмерными данными, визуализация временной последовательности, карты
- Интерактивная визуализация в R.