🧠🤳 Как TikTok читает мысли
NYT получил доступ к внутреннему документу «TikTok Algo 100», подготовленному инженерами сервиса для сотрудников нетехнических отделов, чтобы объяснить работу алгоритма.
Интерес к алгоритмам TikTok во многом связан с социальной повесткой. Обеспокоенность пользователей вызывает пугающая чуткость соцсети к их душевной жизни: например, один пользователь заявил, что TikTok смог распознать его сексуальную ориентацию раньше, чем он сам себе в этом признался. Экспертов беспокоит влияние алгоритмов TikTok на подростков: соцсеть может распознать его депрессивные наклонности и усилить их, в результате чего он может причинить себе вред. Сотрудник TikTok поделился документом с журналистами из-за схожих опасений.
Отчасти документ «TikTok Algo 100» подтверждает очевидную догадку, что главная задача TikTok — вызвать зависимость от сервиса. Цель алгоритма — увеличить две метрики: проведённое на платформе время (time spent) и показатель удерживания пользователя в приложении (retention).
При этом сама работа алгоритмов технологически довольно проста, согласно предоставленному документу:
▪️ Базовая оценка того или иного видео основывается, во-первых, на предсказании алгоритма, будет ли оно интересно пользователю, во-вторых — на фактическом поведении людей, посмотревших ролик. Анализируется, было ли воспроизведено видео, сколько времени его смотрели, оставляют ли пользователи лайки/комментарии.
▪️Приводятся и более специфические фильтры. Например, иногда, чтобы понять ролик, необходимо быть в контексте предыдущих видео автора — тогда алгоритм добавляет фильтр 'same_author_seen'. Если алгоритм видит, что пользователю становится скучно в TikTok, он может отменить применение некоторых фильтров, провоцирующих воспроизведение однотипного контента вроде 'same_tag_today'.
💬 Точность рекомендаций TikTok достигается благодаря огромному набору данных и очень вовлечённым пользователям. «Это не какая-то магия алгоритмов», — заключает профессор Калифорнийского университета в Сан-Диего.
Неоднозначна и политика соцсети в отношении частного контента. NYT стало известно, что модераторы в TikTok имеют доступ не только к видео, опубликованным в открытом доступе, но и к контенту, адресованному друзьям; а также к неопубликованному контенту, который только загружен на платформу. Отсутствие сквозного шифрования как в WhatsApp, Telegram или Signal делает любые данные более уязвимыми для утечек или покупки брокерами данных.
It’s the most successful video app in the world. Our columnist has obtained an internal company document that offers a new level of detail about how the algorithm works.