R4marketing | канал Алексея Селезнёва | Язык R(@R4marketing). Как найти наиболее часто используемые имена переменных во всех R-скриптах Достаточно важно давать

Как найти наиболее часто используемые имена переменных во всех R-скриптах Достаточно важно давать понятные, описательные и при этом желательно не очень длинные имена создаваемым объектам. От имён переменных во многом зависит читабельность вашего кода. Хотите проверить, какие имена переменным вы наиболее часто присваиваете? Код приведённый ниже поможет построить рейтинг имён объектов в ваших R скриптах. Перед использованием скрипта установите пакеты tidyverse и tfse

 
library(tidyverse)

## Функция чтения списка файлов
## Список расширений файлов можно менять на своё усмотрение
read_r_files <- function(...) {
  dirs <- unlist(list(...))
  r <- unlist(lapply(dirs, list.files,
                     pattern = "\\.(R|Rmd|Rmarkdown|rmd|r|Rhistory)$",
                     recursive = TRUE,
                     full.names = TRUE,
                     all.files = TRUE))
  suppressWarnings( x <- unlist(lapply(r, tfse::readlines)))
  x
}

## Читаем все R файлы
rss <- read_r_files(c(r"(C:\Users\Ashel\Documents)", r"(C:\my_develop_workshop)"))


## из каждого файла забираем всё, что идёт до знака присваивания "<-"
df_names <- rss %>% 
  stringr::str_extract("\\w+(?=.*<-)") %>% 
  na.omit() %>% 
  table(df_name = .) %>% 
  as_tibble()

## выводим рейтинг наиболее используемых имён
df_names %>% 
  arrange(-n)

Ссылки: - идея и её реализация подсмотрена тут #заметки_по_R