Обложка канала

habr.com

37749 @habr_com

Официальный канал Хабра

habr.com

3 года назад
Открыть в
Кластеризация текста в PySpark Любой текст — это не просто коллекция слов, он содержит мысли и намерения автора. Но вручную невозможно обработать огромное количество текстовой информации и понять, какие данные они могут содержать. В таком случае поможет кластеризация текста, которая позволит получить представление о данных.