Канал про системный анализ и управление IT-проектами. Обзоры книг по тематике, истории про IT-компании и полезная информация для аналитиков и менеджеров.
Ребята из VK написали статью о том, как решали проблему мониторинга метрик: что считать отклонением, как и куда слать алерты
Начали с простого — сравнения с предыдущим интервалом по времени, потом взяли скользящее среднее, скользящие границы и в конце концов пришли к ML-модели.
Что интересно, в алертах добавили сразу подсчет, сколько это в деньгах, а отправляют в тг-боте, чтобы не пропустить среди писем в почте.
Статья интересная, прочитать можно на хабре.
Пытаясь уследить за всем многообразием метрик и срезов на дашбордах, можно легко упустить из виду важное изменение метрик, сигнализирующее о проблеме. И если вовремя не отреагировать, то можно...