Обложка канала

запуск завтра

15701 @ctodaily

Будни технического директора новостного стартапа. «Закрытие Parse и куда с него переехать», очередной лонгрид «как программируют в NASA» и прочие ссылки с hackernews. Ну и истории, конечно.

запуск завтра

4 года назад
Открыть в
История на этом заканчивается, дальше мои мысли. 1. Бизнесу сегодня выгодно хранить как можно больше данных о клиентах. PR-щики могут врать сколько угодно в духе «ваш звонок очень важен для нас», но ни один коммерческий сервис сегодня не разрабатывается с мыслью «как минимизировать утечки персональных данных». Почему? Простая экономика: дополнительные данных могут теоретически когда-нибудь повысить прибыльность бизнеса, а за утечку перс данных их максимум пожурят и выпишут штраф в треть месячной зарплаты одного программиста. Да и технически проще хранить всё вечно, чем придумывать какие-то специальные правила удаления. 2. Технически можно, например, не хранить вообще никаких персональных данных, которые не нужны для работы сервиса. Доставили заказ — удалили имя человека, телефон и прочее. Примерный адрес, сумму и вес можно сохранить отдельно, без имен — для того, чтобы оптимизировать потом логистику на основе анализа больших данных, как мы любим. Или вынести персональные данные в тот же контур, что и данные банковских карт, их крадут очень редко — но этот подход сильно сложнее, персональные данные нужны для работы службы тех. поддержки, например — тут будет очень много нюансов. 3. Это большая и интересная техническая задача, но решить её до смешного просто. Для того, чтобы убрать проблему утечки персональных данных, достаточно законодательно изменить бизнес-мотивацию. Ввести штрафы за утечки в районе процентов от годового оборота компании. 2% оборота яндекса за 2021 год — это 7 миллиардов рублей. Примерно 2 тысячи рублей каждому потерпевшему и ещё столько же в бюджет. С такой мотивацией бизнес мгновенно направит туда свои инженерные таланты, а я смогу записать классный эпизод подкаста о том, как там всё круто сделано. Примерно это и пытается сделать GDPR. Если бы у нас был нормальный парламент — сам бы предложил такой закон. 🔥 Базы данных можно комбинировать и это как мешать бензин с гудроном. В оригинальной утечке Яндекс.Еды не было ФИО клиентов, только имя. Но полное ФИО клиентов есть в утечке СДЭК (крупнейшей курьерской-почты России). В обоих базах есть общее поле — номер телефона. Сопоставляем записи по номеру телефона и вуаля — теперь мы знаем не только код домофона, но и полные ФИО большого числа клиентов Яндекс.Еды. Чем больше баз ты скачал и скомбинировал — тем больше узнаешь о человеке. Будет полезно сделать подобный хороший интерфейс ко всем украденным базам данных — тогда, наконец, общество поймёт, насколько много лишнего о нас знают корпорации и насколько наплевательски они относятся к нашим данным. Наша личная жизнь сегодня буквально ничего не стоит (ок, 100 тысяч рублей за пару миллионов человек).