Автор канала Алексей Селезнёв, руководитель отдела аналитики в Netpeak, автор R пакетов: ryandexdirect, rfacebookstat и др.
В канале публикуются статьи, доклады, новости, заметки по языку R.
Краткое руководство по строкам и регулярным выражениям в R
Сейчас легко найти данные. Но вот найти высококачественные оказывается весьма проблематично. Одна из характерных черт низкопробных данных в том, что они запутаны и редко точны. Сколько бы мы, профессионалы в этой сфере, не говорили об алгоритмах и проверке моделей, большую часть времени занимает именно очистка данных.
В этом смысле работа со строками требует несколько иного набора навыков, чем работа с теми же списками или data.frame. В текущей статье, как вы уже поняли, мы будем учиться максимально эффективно управлять строками. Начнем!
Содержание:
● Вставка и разделение
● Общее число символов и разделение
● regexec() , gregexpr() и grep()
● sub() и gsub()
● Регулярные выражения (REGEX)
● Метасимволы
● Квантификаторы
● Метасимволы начала и завершения
● Плейсхолдер
● Последовательности
● Символьные классы
● Группировка и оператор ИЛИ
● Экранирование
#статьи_по_R