Обложка канала

R4marketing | канал Алексея Селезнёва | Язык R

Автор канала Алексей Селезнёв, руководитель отдела аналитики в Netpeak, автор R пакетов: ryandexdirect, rfacebookstat и др. В канале публикуются статьи, доклады, новости, заметки по языку R.

R4marketing | канал Алексея Селезнёва | Язык R

5 лет назад
Открыть в
​​Пакет framecleaner является обёрткой над dplyr::mutate(), и предоставляет несколько функций для краткого решения общих проблем, возникающих при приведении в порядок небольших и средних наборов данных. Ниже разберём несколько примеров.
 
# тестовый набор данных
tibble::tibble(
  date = c("20190101", "20190305", "20201012"),
  numeric_val = c(1, NA, 5),
  char_val = c("", "    val ", "-")
) -> sample_table
1. Пометка пустых значений как NA. По умолчанию функция make_na() заменяет значения c("-", "", " ", "null") на NA, но вы можете расширить список этих значений.
 
sample_table %>% 
  make_na()
2. Быстрое удаление лишних пробелов в строковых переменных.
 
sample_table %>% 
  remove_whitespace()
3. Быстрое преобразование строкового описание даты в тип даты.
 
sample_table %>% 
  set_date()
4. Эвристическое перемещение столбцов таблицы таким образом, что бы строковые данные, и даты были в левой части таблицы, а числа в правой. Столбцы одного типа сортируются дополнительно по алфавиту.
 
sample_table %>% 
  relocate_all()
5. Применение всех описанных выше операций одной функцией.
 
sample_table %>% 
  clean_frame()
6. Замена NA значений на заданное.
 
sample_table %>% 
  fill_na()
Ссылки: - примеры коды взяты из виньетки пакета framecleaner - пакет framecleaner вошел в ТОП 40 опубликованных на CRAN в октябре 2021 #заметки_по_R