Меня больше всего заинтересовала конечно эта часть:
1) определения количества пользователей на территории Республики Казахстан;
7) размещать в открытом доступе информацию о среднестатистическом ежемесячном количестве пользователей на территории Республики Казахстан за последние шесть месяцев функционирования онлайн-платформы
Как можно определить количество пользователей на территории РК? Либо в лоб требовать пользователей указать страну (и надеяться на их добросовестность) либо собирать IP адреса и смотреть по ним. Понятное дело, что значительное число сайтов и так используют сервисы типа Google Analytics, которые собирают эти данные. Но даже тут есть нюансы.
1. Полный IP адрес это Персональные Данные (ПД). Если вы собираете ПД граждан РК, вы должны хранить эти ПД на серверах физически расположенных на територии РК (закон о ПД).
2. Если я не ошибаюсь, у гугла нет серверов на территории РК. Т.е. скорее всего использование гугл аналитики для сбора ПД казахстанцев незаконно. Нюанс в том, что не все данные, которые собирает гугл аналитика — это ПД. Например, факт посещения N-ного сайта 1000 раз это не ПД. Если же хранится 1000 строчек с точными IP адресами — это ПД.
3. До четвертой версии, гугл собирал IP адреса по умолчанию и хранил их в логах. Т.е. это все таки сбор ПД. Примечательно, что в таком случае GDPR требует либо получать согласие от пользователей, либо маскировать IP адрес (убирать как минимум один из октетов).
4. Но если мы хотим знать количество пользователей за месяц (как предписывает закон) — нам надо уметь различать посещения от разных пользователей. Ну т.е. знать соответствуют 10 посещений трем или пяти уникальным пользователям. В теории есть разные способы отличать пользователей, но вроде как сервисы аналитики используют все мета-данные, которые им доступны: версия браузера, user-agent, IP адрес и так далее. Из них генерируется cookie, которая и является уникальным идентификатором пользователя. Примечательно, что вроде как эту куку, присвоенную пользователю, гугл хранит внутри браузера. Не совсем понимаю как это работает с негугловыми браузерами, но если вы используете хром, это подразумевает, что гугл (не владелец сайта, а именно гугл) может идентифицировать вас в логах посещений всех сайтов, на которых установлена гугл аналитика. И может связывать это в единый датасет. Такие куки называются cross-site tracking cookie или third party cookie. К слову, AdGuard, который я не раз рекомендовал, позволяет устанавливать время жизни first party и third party куков. Можно даже поставить 0 минут (т.е. block immediately, что я и сделал для third party).
Если вам стало неприятно от прочтения предыдущего абзаца и у вас появляется неприязнь к гугл аналитике, у меня есть хорошая новость: всегда есть альтернатива. Например, Matomo, который open source, т.е. его можно хостить на своем сервере (т.е. все данные будут принадлежать владельцу ресурса и только ему). И к слову, вся аналитика на сайтах Бейонда с начала 2021 года собирается именно с помощью matomo, который поднят на сервере, физически расположенном на территории РК. Пожалуй главная мысль, которую я хотел бы донести этим постом — если вы создаете какой-нибудь сайт и вам захочется знать насколько он востребован (вполне адекватное желание) — не спешите отдавать все данные гуглу. Попробуйте matomo или любое другое open source решение.