Обложка канала

R4marketing | канал Алексея Селезнёва | Язык R

Автор канала Алексей Селезнёв, руководитель отдела аналитики в Netpeak, автор R пакетов: ryandexdirect, rfacebookstat и др. В канале публикуются статьи, доклады, новости, заметки по языку R.

R4marketing | канал Алексея Селезнёва | Язык R

4 года назад
Открыть в
​​Как найти наиболее часто используемые имена переменных во всех R-скриптах Достаточно важно давать понятные, описательные и при этом желательно не очень длинные имена создаваемым объектам. От имён переменных во многом зависит читабельность вашего кода. Хотите проверить, какие имена переменным вы наиболее часто присваиваете? Код приведённый ниже поможет построить рейтинг имён объектов в ваших R скриптах. Перед использованием скрипта установите пакеты tidyverse и tfse
 
library(tidyverse)

## Функция чтения списка файлов
## Список расширений файлов можно менять на своё усмотрение
read_r_files <- function(...) {
  dirs <- unlist(list(...))
  r <- unlist(lapply(dirs, list.files,
                     pattern = "\\.(R|Rmd|Rmarkdown|rmd|r|Rhistory)$",
                     recursive = TRUE,
                     full.names = TRUE,
                     all.files = TRUE))
  suppressWarnings( x <- unlist(lapply(r, tfse::readlines)))
  x
}

## Читаем все R файлы
rss <- read_r_files(c(r"(C:\Users\Ashel\Documents)", r"(C:\my_develop_workshop)"))


## из каждого файла забираем всё, что идёт до знака присваивания "<-"
df_names <- rss %>% 
  stringr::str_extract("\\w+(?=.*<-)") %>% 
  na.omit() %>% 
  table(df_name = .) %>% 
  as_tibble()

## выводим рейтинг наиболее используемых имён
df_names %>% 
  arrange(-n) 
Ссылки: - идея и её реализация подсмотрена тут #заметки_по_R