Автор канала Алексей Селезнёв, руководитель отдела аналитики в Netpeak, автор R пакетов: ryandexdirect, rfacebookstat и др.
В канале публикуются статьи, доклады, новости, заметки по языку R.
Неравный join
Автор: Илья Шутов (@iMissile)
Задача объединения табличных представлений очень часто встречается как в аналитике, так и в разработке (БД). Существует несколько различных типов слияний, фактически, это операции над множествами. Не будем погружаться в детали, на эту тему написано множество книг, семинаров, публикаций. Посмотрим на эти механизмы в преломлении практических задач. Будем смотреть по нарастающей сложности и пытаться решить их на «офисном» ноутбуке, не привлекая бесконечные мощности больших данных или реляционные БД.
Содержание:
● Задача 1. Корабли и рыбы
● Задача 2. Дома и магазины
● Задача 3. Ищем e-mail ботов
● Задача 4. Поиск похожих документов
#статьи_по_R