Пакет framecleaner является обёрткой над dplyr::mutate(), и предоставляет несколько функций для краткого решения общих проблем, возникающих при приведении в порядок небольших и средних наборов данных.
Ниже разберём несколько примеров.
# тестовый набор данных
tibble::tibble(
date = c("20190101", "20190305", "20201012"),
numeric_val = c(1, NA, 5),
char_val = c("", " val ", "-")
) -> sample_table
1. Пометка пустых значений как NA.
По умолчанию функция make_na() заменяет значения c("-", "", " ", "null") на NA, но вы можете расширить список этих значений.
sample_table %>%
make_na()
2. Быстрое удаление лишних пробелов в строковых переменных.
sample_table %>%
remove_whitespace()
3. Быстрое преобразование строкового описание даты в тип даты.
sample_table %>%
set_date()
4. Эвристическое перемещение столбцов таблицы таким образом, что бы строковые данные, и даты были в левой части таблицы, а числа в правой. Столбцы одного типа сортируются дополнительно по алфавиту.
sample_table %>%
relocate_all()
5. Применение всех описанных выше операций одной функцией.
sample_table %>%
clean_frame()
6. Замена NA значений на заданное.
sample_table %>%
fill_na()
Ссылки:
- примеры коды взяты из виньетки пакета framecleaner
- пакет framecleaner вошел в ТОП 40 опубликованных на CRAN в октябре 2021
#заметки_по_R