5 млн долларов за строчку кода: подробный разбор сбоя сервисов Datadog
В марте сервисы Datadog не работали более суток. Что пошло не так, как отреагировала команда инженеров и что можно извлечь из этого инцидента? Это перевод эксклюзивного исследования, которое провел Гергели Орош, консультант mobile.dev, автор нескольких книг по работе с инфраструктурой, в прошлом — инженер в Uber, Skype и Microsoft.