Обложка канала

R4marketing | канал Алексея Селезнёва | Язык R

Автор канала Алексей Селезнёв, руководитель отдела аналитики в Netpeak, автор R пакетов: ryandexdirect, rfacebookstat и др. В канале публикуются статьи, доклады, новости, заметки по языку R.

R4marketing | канал Алексея Селезнёва | Язык R

4 года назад
Открыть в
​​Краткое руководство по строкам и регулярным выражениям в R Сейчас легко найти данные. Но вот найти высококачественные оказывается весьма проблематично. Одна из характерных черт низкопробных данных в том, что они запутаны и редко точны. Сколько бы мы, профессионалы в этой сфере, не говорили об алгоритмах и проверке моделей, большую часть времени занимает именно очистка данных. В этом смысле работа со строками требует несколько иного набора навыков, чем работа с теми же списками или data.frame. В текущей статье, как вы уже поняли, мы будем учиться максимально эффективно управлять строками. Начнем! Содержание: ● Вставка и разделение ● Общее число символов и разделение ● regexec() , gregexpr() и grep()sub() и gsub() ● Регулярные выражения (REGEX) ● Метасимволы ● Квантификаторы ● Метасимволы начала и завершения ● Плейсхолдер ● Последовательности ● Символьные классы ● Группировка и оператор ИЛИ ● Экранирование #статьи_по_R