Data Science at the Command Line
Автор: Jeroen Janssens (2021)
Это руководство демонстрирует, как гибкость командной строки может помочь вам стать более эффективным и продуктивным специалистом по данным. Вы узнаете, как комбинировать небольшие, но мощные инструменты командной строки для быстрого получения, очистки, исследования и моделирования ваших данных. Для начала автор предоставляет образ Docker, содержащий более 80 инструментов, которые пригодятся вам при работе с Windows, macOS или Linux.
Во время чтения книги вы научитесь:
✔️Получать данные с веб-сайтов, API, баз данных и электронных таблиц;
✔️Выполнять операции очистки текста, файлов CSV, HTM, XML и JSON;
✔️Исследовать данные, вычислять описательную статистику и создавать визуализации;
✔️Создавать повторно используемые инструменты командной строки из однострочников и существующего кода на Python или R.
Скачать книгу