До конца сезона Big Data осталось 4 дня! На наш бигдата-торт упали ещё три больших вишни: рейтинговые хабрааавторы рассказали про оптимизацию расходов на железо, кластеризацию sms‑сообщений с pyspark.ml и проверку госзакупок с помощью СУБД BaseX: 💿 Сassandra для бедных — пускаем в ход HDD 🧾 Кластеризация текста в PySpark 👔 Извлечение открытых данных сайта zakupki.gov.ru с помощью СУБД BaseX Другие интересные кейсы: 👹 Бигдата, ты ли это? 🐦 Как дать крылья своей сводной таблице в Apache Superset 🧒 Все DETR'ы мира 🎲 Байесовский подход к A/B-тестированию 🏥 Геопространственные технологии для управления паспортом медицинского участка Если вы тоже хотите поделиться опытом, ждём ваших статей на Хабре. Только поторопитесь, сезон Big Data мы проводим вместе с Газпромбанком до 7 июня.