- 1 место. Курс «Язык R для анализа данных» — Skillbox
- 2 место. Курс «Язык R для аналитики» — Нетология
- 3 место.Курс «R для лингвистов: программирование и анализ данных» — Открытое образование
- Курс «R для интернет-маркетинга» — ИП Уваров М. В.
- Курс «Программирование на языке R. Уровень 1. Базовые знания» — Центр компьютерного обучения «Специалист» при МГТУ им.Н.Э.Баумана
- Курс «Основы программирования на R» — Stepik
- Курс «Язык программирования R для начинающих» — BitDegree
- Курс «Статистика, R и анализ данных» — Бластим
Подборка бесплатных и платных обучающих онлайн-курсов по языку программирования R для начинающих с нуля и продвинутых.
- Длительность — 4 месяца
- Онлайн в удобное время
- Обучение на практике
- Доступ к курсу навсегда.
Кому подойдёт этот курс:
- Аналитикам и исследователям без опыта программирования на R
Научитесь программировать на R с нуля и автоматизируете свою работу. Сможете решать более сложные задачи и повысите свою ценность на рынке. - Аналитикам и исследователям, которые используют R в работе
Систематизируете знания и изучите продвинутые функции R. Сможете тратить меньше времени на ежедневные рутинные задачи. - Тем, кто хочет работать в аналитике
Освоите популярный инструмент для работы с данными и научитесь обрабатывать информацию с помощью языка R.
Сделаете шаг к карьере в аналитике и обойдёте конкурентов уже на старте.
Чему вы научитесь:
- Обрабатывать данные базовыми средствами R и с помощью библиотеки tidyverse
- Выполнять разведывательный анализ данных в R
- Создавать интерактивные графики с помощью библиотеки Plotly
- Визуализировать данные с помощью библиотеки ggplot2
- Анализировать линейные регрессионные модели и представлять результаты
- Создавать интерактивные аналитические панели с помощью библиотеки Shiny.
Содержание курса:
Онлайн-лекции и практические задания с подробным разбором.
17 тематических модулей, 72 онлайн-урока
Язык программирования R
- Знакомство с языком R и базовые операции
Установите R и RStudio — среду для разработки на R — и познакомитесь с её интерфейсом. Узнаете, как создавать файлы R и Rmarkdown, начнёте изучать синтаксис языка и познакомитесь с понятием вектора в R. - Типы и структуры данных
Изучите типы данных в R и научитесь преобразовывать данные из одного типа в другой. Разберёте структуры данных в R: векторы, матрицы, датафреймы и списки. Узнаете, как с ними работать. - Управляющие конструкции
Научитесь использовать условную конструкцию if-else, проверять условия, работать с циклами и функциями.
Обработка данных. Библиотека tidyverse
- Чтение и запись файлов в R
Узнаете, как работать с файлами в рабочей папке, читать и записывать файлы форматов csv, txt и Excel. - Обработка данных базовыми средствами R
Научитесь использовать датафреймы и работать с данными с помощью базовых средств R. Узнаете, как выводить описание датафрейма, работать со строками и столбцами. - Обработка данных с библиотекой tidyverse: часть 1
Познакомитесь с библиотекой tidyverse и её возможностями. Разберёте особенности синтаксиса tidyverse и изучите работу с разными функциями. Узнаете, как группировать и агрегировать данные, выгружать сводную информацию с помощью библиотеки stargazer. - Обработка данных с библиотекой tidyverse: часть 2
Научитесь трансформировать структуру данных и объединять таблицы. - Работа с пропущенными значениями в R
Научитесь выполнять поиск и подсчёт пропущенных значений и искать в них закономерности. Поймёте, как визуализировать пропущенные значения с помощью библиотек mice и VIM и заполнять пропуски средствами tidyverse. - Работа с порядковыми и категориальными данными в R
Изучите шкалы данных: числовую, порядковую и категориальную. Разберёте особенности факторных данных в R и операции с ними. Научитесь работать с категориальными данными с forcats.
Визуализация данных
- Визуализация данных в R
Научитесь строить простейшие графики базовыми средствами R — гистограмму, диаграмму рассеяния и линейный график. Узнаете, как их настраивать и выгружать в файл. - Визуализация данных с библиотекой ggplot2
Узнаете, как строить графики с библиотекой ggplot2. Научитесь работать с одномерными, двумерными и нечисловыми данными и группировать данные на графиках.
Статистический анализ данных в R
- Разведывательный анализ данных в R
Познакомитесь с описательными статистиками в R. Научитесь пользоваться библиотекой psych и искать нетипичные значения. Изучите коэффициенты корреляции Пирсона и Спирмена и поймёте, как их применять. Узнаете о понятии корреляционных матриц, сможете их визуализировать и выгружать в отчёт. - A/B-тесты: выборочное оценивание
Узнаете, как ставить задачи и выбирать дизайн для A/B-тестирования. Научитесь проводить выборочное оценивание, выявлять проблемы в выборке и вычислять её объём с учётом погрешности и уровня доверия к данным. Сможете рассчитывать и анализировать доверительные интервалы в A/B тестировании. - A/B-тесты: проверка статистических гипотез
Научитесь проверять статистические гипотезы с помощью тестов и разберёте возможные ошибки при проверке. Узнаете, как сравнивать доли и средние в A/B-тестировании, и изучите алгоритм запуска A/B-теста. - Поиск взаимосвязей в данных в R
Научитесь выделять взаимосвязи в количественных и категориальных данных. Изучите простую линейную регрессию. Узнаете, как работать с регрессионной моделью, проверять её качество, выгружать результаты и включать их в отчёт Rmarkdown.
Продвинутая визуализация и представление результатов анализа
- Интерактивные графики с библиотекой Plotly
Познакомитесь с проектом Plotly, разберёте его возможности, особенности синтаксиса и функции. Научитесь строить интерактивные графики Plotly в 2D и 3D и публиковать результаты на RPubs. - Аналитические панели в R: фреймворк Shiny
Изучите проект Shiny, его возможности и устройство кода. Установите библиотеку Shiny, научитесь редактировать шаблонное приложение, добавлять на дэшборд меню, строки датафрейма и элементы интерфейса.
Дипломный проект
- Обработка и анализ социально-экономических данных
Вы выгрузите данные из разных файлов, соберёте их в единый датафрейм и обработаете его. Проведёте разведывательный анализ, построите регрессионные модели и графики, а затем представите результаты и интерпретацию в отчёте.
Чему вы научитесь:
- Собирать данные
Из большинства аналитических систем - Преобразовывать R‑скрипты
Для переработки получаемых данных в зависимости от задач - Анализировать процессы
С помощью скриптов и показывать результаты на графиках.
Программа:
- Базовые принципы программирования на R
Рассмотрим базовые возможности языка R, научимся настраивать R-Studio и начнём использовать для простых операций.
- R и R-Studio
- Переменные их типы
- Объявление переменных в R
- Арифметические операции
- Логические переменные и операции
- Ветвление
- Циклы.
- Отличия R от традиционного программирования
Познакомимся с векторами и техниками программирования в R.
- Понятие вектора, векторные операции
- Использование функций
- Обзор основных функций и пакетов R.
- Работа с наборами данных
Научимся импортировать данные в R, познакомимся с фреймами данных, освоим базовые операции (просмотр, обращение к данным, преобразование, соединение, фильтрация). Разберём этапы анализа данных. Узнаем, какой workflow есть при анализе данных и какие действия нужно выполнить.
- DataFrame — что это и для чего
- Импорт DataFrame в R
- Простейшее исследование DataFrame
- Доступ к переменным DataFrame (знак $)
- Базовые операции с DataFrame
- Фильтрация DataFrame
- Использование библиотеки dplyr для объединения Data Frames
- Тип данных «список» (list): что это такое, для чего и как с ним работать.
- Визуализация в R
Познакомимся со способами визуализации данных в R, научимся применять визуализацию в зависимости от данных, интерпретировать графики. Научимся оценивать распределение, описательные статистики для двух и более переменных, узнаем о корреляции и регрессии.
- Базовый шаблон ggplot
- Построение точечной и линейной диаграмм и их параметризация
- Исследование числовых данных с помощью гистограммы и boxplot
- Исследование категориальных переменных на столбчатых диаграммах. Нормирование
- Дополнительные приёмы при исследовании данных на графиках: jitter, география
- Какие типы диаграмм для каких данных использовать и другие правила хорошего тона при визуализации.
- Этапы анализа данных. Подготовка и очистка данных
Научимся работать с данными разного формата, а также «очищать» данные — придавать некачественным данным пригодный для анализа вид.
- Некачественные данные: как заполнить отсутствующие значения
- Изменение формата данных: когда данные поступают не в пригодном для анализа формате. Функции spread, gather, separate. Конвертация между типами
- Работа с датами и временем
- Работа со строками и библиотекой stringr
- Основы регулярных выражений в R: как их использовать эффективно и не сломать голову.
- Основы моделирования в R
Узнать про основные модели прогнозирования, познакомимся с линейной регрессией и научимся её построению, оценке и использованию.
- Подготовка данных для моделирования. Стандартизация, нормирование, проверка гипотез о нормальном распределении
- Модели прогнозирования. Линейная регрессия
- Определение линейной регрессии
- Построение модели линейной регрессии в R
- Оценка модели линейной регрессии
- Кластеризация. Метод К-средних.
- Предоставление результатов анализа. Продвинутая визуализация
Познакомимся с продвинутыми способами визуализации данных в R и предоставления результатов анализа данных бизнесу.
- Картография с помощью библиотеки leaflet
- Таблицы и сводные таблицы: библиотеки DT и rpivotTable
- Возможности библиотеки Plotly для визуализации, использование ggplotly
- Как представлять результаты своей работы
- Что такое веб-приложения Shiny и какие возможности в них есть
- Архитектура веб-приложения: UI-функция, серверная функция, файл Global
- Базовые UI-элементы Shiny.
- Разработка аналитических веб-приложений в R (Shiny)
Научимся реализовывать удобный интерфейс для работы с аналитикой в R для бизнес-пользователя.
- Изучаем шаблон дашборда shinydashboard для создания интерфейса приложения
- Изучаем реактивность и возможность её ограничивать функцией isolate()
- Обзор базовых элементов управления и кейсов их использования
- Дополнительные способы визуализации в приложении: встраиваем графики ggplot, таблицы, карты.
- Дипломный проект
В рамках дипломного проекта вы будете использовать язык R для улучшения работы интернет-магазина или создадите приложения для моделирования доходности личных накоплений. Вы самостоятельно изучите и подготовите данные для анализа в R, построите предиктивную модель и преобразуете её в удобный и читаемый вид.
Дипломная работа выполняется самостоятельно под руководством эксперта курса и позволяет закрепить весь спектр знаний и навыков, полученных на программе.
Вашу квалификацию подтвердят документы установленного образца.
Курс знакомит слушателей с основами программирования на языке R, а также позволяет разобраться во всех этапах анализа данных.
В ходе курса на примере задач теоретической и компьютерной лингвистики будут рассмотрены математические основы методов статистического анализа.
Курс рассчитан на студентов-лингвистов, однако не предполагает никаких предварительных знаний по лингвистике, программированию и математике.
Программа:
- Введение в R: основные элементы, функции, циклы
- Продвинутая обработка данных: пакеты tidyr и dplyr
- Работа со строками: строки в R, регулярные выражения
- Визуализация данных: base R vs. ggplot2
- Интерактивная визуализация: rmarkdown, plotly, lingtypology
- Работа с текстами: пакет tidytext
- Введение в статистику: основы фриквентисткой статистики, формулировка гипотез
- Корреляция и линейная регрессия
- Кластеризация
- Логистическая регрессия.
Результаты обучения:
Готовность использовать основные законы научных дисциплин в профессиональной деятельности, применять методы математического анализа и моделирования, теоретического и экспериментального исследования в лингвистике.
По окончании обучения выдаётся сертификат.
Курс поможет автоматизировать большую часть повседневной, рутинной работы интернет-маркетологов и веб-аналитиков с помощью скриптов, написанных на языке программирования R.
Целевая аудитория курса — интернет-маркетологи и веб-аналитики, которые ежедневно работают с такими сервисами, как Яндекс Директ, Google Ads, Google Analytics, Яндекс Метрика и т.д.
Вы научитесь:
- Собирать данные из большинства популярных рекламных и веб-аналитических систем
- Преобразовывать данные с помощью R-скриптов
- Работать с клиент-серверными, облачными и локальными базами данных на языке R
- Разрабатывать скрипты, которые будут осуществлять рассылку писем, а также создавать наглядные графики.
Программа курса:
1 модуль. Введение в R
- История, возможности, преимущества и недостатки языка R.
- Загрузка и установка языка R и среды разработки RStudio.
- Области применения R скриптовв Power BI.
- Знакомство со средой разработки RStudio.
- Условные конструкции, Циклы и функции в R
- Основные классы объектов в R.
- Работа со строками в R.
- Манипуляция с данными в R, пакеты dplyr, data.table, tidyr, sqldf.
- Работа с датами и временем в R, пакет lubridate.
- Рекомендации по оформлению кода и обработка ошибок.
2 модуль. Загрузка данных в Power BI из API рекламных площадок и парсинг веб-сайтов с помощью языка R
- Что такое API.
- Загрузка данных из Google AdWords.
- Загрузка данных из Яндекс Директ.
- Загрузка данных из Facebook.
- Загрузка данных из Вконтакте.
- Загрузка данных из MyTarget
- Загрузка данных из Google Analytics.
- Загрузка данных из API Яндекс Метрики.
- Загрузка данных из
- SearchConsoleи Google Trends.
- Работа с API Youtube.
- Парсинг сайтов с помощью пакета rvest.
- Отправка HTTP запросов из R, пакет httr.
3 модуль. Работа с данными загруженными из API рекламных систем и парсинга сайтов
- Работа с Google Таблицами из R.
- Визуализация данных с помощью пакета ggplot2.
- Отправка и чтение данных из СУБД (MySQL, PostgreSQL, SQLite, Google BigQuery)
- Отправка почты с помощью пакета mailR.
- Настройка запуска скриптов по расписанию, пакет taskscheduleR.
- Создание телеграм ботов на языке R.
Электронный сертификат по окончании курса.
Цель курса — дать слушателям знания, которые помогут овладеть базовыми навыками анализа и визуализации данных в среде R.
Курс предназначен для широкого круга специалистов, которым необходимо искать закономерности в большом количестве данных, визуализировать их и строить статистически корректные выводы.
Вы научитесь:
- работать в среде RStudio;
- разбираться в типах данных языка R;
- использовать ветвление и циклы;
- создавать и вызывать функции на R;
- работать с векторами, списками, массивами и таблицами;
- использовать формулы и факторы;
- настраивать атрибуты объектов;
- использовать наследование и полиморфизм;
- обрабатывать ошибки, возникающие в программе;
- использовать трассировку кода;
- научитесь пользоваться отладчиком;
- работать с текстами и датой/временем;
- использовать стандартные распределения и базовую визуализацию данных.
Программа курса:
36 ак. часов
Модуль 1. Знакомство с языком R и со средой разработки (2 ак. ч.)
- Основные особенности языка R
- Библиотеки языка R
- Интерфейс среды разработки RStudio
- Практика: Конфигурирование RStudio, загрузка и подключение библиотек, и работа со справочной системой
Модуль 2. Типы данных в R и работа с ними (4 ак. ч.)
- Понимание системы типов R. Всё есть объект
- Вектора, списки, матрицы и, массивы
- Практика: Элементарная статистика из базовой библиотеке R
- Формулы и функции в R
- Практика: Написание и вызов простейших функций. Файлы скриптов и их подключение
- Атрибуты объектов
- Вспомогательные и специальные составные объекты
- Практика: Работа с объектом Data frame, использование библиотеки dplyr
Модуль 3. Написание выражений и команд в R (4 ак. ч.)
- Символы, константы и операции языка R
- Практика: Создание своих операций
- Условное выполнение кода (if…else)
- Циклы for, while и repeat
- Практика: Нахождение минимума и максимума при наличии пропущенных данных (NA)
- Взаимодействие с другими языками программирования
- Практика: Вызов написанной на Си функции
- ДЗ: найти локальные экстремумы функции (x3+2×2-3) /(x2+2) на отрезке [-2;2]
Модуль 4. Написание функций в R (4 ак. ч.)
- Аргументы функций и сопоставление аргументов
- Область видимости объектов
- Понятие окружения (Environment)
- Замыкание и анонимные функции
- Возвращаемое значение функции
- Практика: Написание и вызов функций для вычисления характеристик объектов (минимум/максимум, среднее и т.д.)
Модуль 5. Объектно-ориентированное программирование (4 ак. ч.)
- Класс объекта
- Наследование в R
- Диспетчеризация вызовов функций/методов
- UseMethod()
- NextMethod()
- Практика: Написание и вызов полиморфных функций для вычисления характеристик объектов (минимум/максимум, среднее и т.д.)
- ДЗ: написать функцию сортировки векторов, матриц и массивов с возможностью выбора алгоритма сортировки
Модуль 6. Исключения и отладка в R (3 ак. ч.)
- Генерация исключений/ошибок в R
- Перехват и обработка исключений/ошибок
- Конфигурирование обработка исключений/ошибок
- Отладка кода и функций
- Трассировка кода
- Практика: Поиск, исправление и/или игнорирование ошибок в R программах
Модуль 7. Полезные функции из базовой библиотеки языка R (3 ак. ч.)
- Работа с датой и временем
- Обработка текстов/строк
- Регулярные выражения
- Использование стандартных распределений
- Визуализация графиков функций
- Практика: Графическая проверка нормальности распределения
- ДЗ: Проверка гипотез нормальности распределения с использованием различных критериев, гистограмма и построение её огибающей, диаграмма квантиль-квантиль.
Курс познакомит слушателей с языком R, основными структурами данных и семантическими правилами. Мы также рассмотрим несколько углублённых тем, которые помогут овладеть принципами написания эффективного кода.
Программа курса:
Модуль 1: базовые структуры и понятия
- Введение в курс
- Переменные, глобальное окружение, справка
- Векторы (часть 1)
- Управляющие конструкции, работа с пакетами
- Векторы (часть 2)
Модуль 2: продвинутые структуры
- Матрицы и списки
- Дата фреймы
- Факторы и строки
Модуль 3: продвинутое программирование
- Функции
- Элементы функционального программирования
- Обработка данных при помощи dplyr
- Заключение: что дальше?
По окончании обучения выдаётся сертификат.
Научитесь использовать различные пакеты для управления, визуализации данными и других задач, извлекать и передавать данные в среду R, решать проблемы бизнеса в процессе обучения, создавать циклы, переменные, инструкции и т.д.
Содержание:
- Введение в R
- Введение в R-программирование
- Ввод и вывод данных
- Настройка порядка выполнения
- Основные концепты R программирования
- Матричная конструкция в R
- Таблица данных R
- Применение новой функции над списком или вектором
- Управление данными в Dplyr
- Визуализация данных в R с помощью ggplot2
- Введение в машинное обучение
- Заключение R.
Девятидневный практический курс, на котором вы не только научитесь статистике, но и поймете её.
Научим не только получать в программе p-value, но и считать и понимать мощность теста, размер эффекта и другие параметры.
В конце курса вы самостоятельно выполните и презентуете проект. Можно прийти со своим проектом, можно выбрать из предложенных.
Программа:
Первый день: основы R
- Презентация плана программы: краткий overview
- Введение в R и RStudio
- R как калькулятор
- Операторы, функции
- Типы данных
- Вектора, матрицы, списки, датафреймы
Второй день: препроцессинг данных в R, введение в tidyverse
- Импорт данных
- Работа с «проектами» RStudio
- Препроцессинг данных базовыми средствами R
- Условные конструкции в R
- Создание функций
- Циклы и семейство функций apply
- Работа с пакетами
- Пакеты data.table и tidyverse
- Основы tidyverse: readr, tibble, magrittr
- Базовые операции с данными в tidyverse: выбор строк и колонок, создание колонок
- Агрегирование данных в dplyr
Третий день: продвинутый препроцессинг данных в tidyverse, описательная статистика
- Концепция Tidy Data. Широкие и длинные таблицы, tidyr
- Работа с реляционными данными в tidyverse
- Функциональное программирование в purrr
- Описательная статистика (центральные тенденции, меры разброса, ассиметрия, эксцесс, функции и пакеты для описательной статистики)
Четвертый день: визуализация в пакете ggplot2, введение в статистику вывода
- Визуализация в R: базовые средства визуализации
- Layered Grammar of Graphics и ggplot2
- Средства динамической визуализации в R: HTML-виджеты
- Самостоятельное упражнение на визуализацию
- Уровень значимости. Ошибки I и II рода— Выборка и генеральная совокупность
- Виды распределений, параметры распределений
- Нормальное распределение. Функции распределений в R
- Оценка параметров, точечные и интервальные оценки, доверительный интервал
- Проверка гипотез. Нулевая и альтернативная гипотеза, p-value
Пятый день: основные статистические тесты, практика анализа данных
- z-критерий и t-критерий
- Понятия уровня значимости и статистической мощности
- Оценка статистической мощности, размера эффекта и размера выборки в R
- Практика анализа данных, препроцессинг рабочих датасетов для девятого дня
Шестой день: практика анализа данных, основные статистические тесты (продолжение)
- Непараметрические методы
- Обзор задач и методов в статистике. Как выбрать метод для анализа данных
- Дисперсионный анализ (ANOVA) и его разновидности
- Корреляция, коэффициенты корреляции
Седьмой день: Общая линейная модель
- Линейная регрессионная модель
- Допущения линейной модели. «Остатки», МНКи goodness-of-fit
- Множественная линейная регрессия и общая линейная модель (general linear model)
Восьмой день: Обобщения линейной модели, многомерные методы
- Логистическая регрессия. Обобщенная линейная регрессия (generalized linear model)
- Смешанная линейная модель (Linear mixed effects models)
- Другие многомерные методы: кластерный анализ, MDS и PCA
Девятый день: самостоятельный проект.