Обложка канала

Капиталист 2.0

6775 @biznesbiz

Рассказываем как заработать на технологиях

Капиталист 2.0

7 лет назад
Открыть в
[ПОЧЕМУ FaceApp - НЕ ТО, ЧЕМ КАЖЕТСЯ]

Многие из вас решили посмотреть, как будут выглядеть в старости через FaceApp. Любопытно, а главное бесплатно - казалось бы, какой может быть подвох?:) Он есть и не один.

Приложения такого рода (речь о “загрузи свое фото и скажи нам ‘Икс’”, где икс может быть любым конкретным признаком содержания фото - возрастом, полом, указанием профессии, хроническим заболеванием человека на фото и так далее) как правило представляют собой конкретный, тщательно спланированный компанией-автором бизнес-процесс. Его можно описать так: “получить максимально ценную размеченную базу данных так, чтобы никому за нее не платить”.

Искусственный интеллект (он же - “ИИ”) и нейронные сети, как его разновидность, безусловно, имеет огромный потенциал практического применения, но одна из главных проблем “дата-сатанистов” (шикарный русский сленг для термина data-scientist), настраивающих модели для ИИ, - это чистота разметки базы. Если вы сидите и пытаетесь получить из какой-то базы данных пользу при помощи ИИ, главный стопор частенько именно в том, чтобы четко классифицировать информацию по конкретным признакам. Грубо говоря, кто-то должен посмотреть в цифры, и сказать, что этот номер - это паспорт, а вот это - именно водительские права, а в случаях фоточек - что это собачка, это кошечка, а это несовершеннолетний подросток славянской внешности. Если информация полностью размечена, то есть, классифицирована, вы, как data-scientist, можете начинать творить в ней чудеса, вроде создания ботов, автоматически ищущих всех несовершеннолетних славянских подростков в сети ВКонтакте, затем анализирующих все тексты на их стенах и, если найдено слово “наркотик” или упоминания конкретных названий препаратов, автоматически добавляющих всех этих подростков в особый список госнаркоконтроля (хотя подросток а) мог просто цитировать чью-то статью б) быть не в курсе, что за ним следят). Пример вымышленный, совпадения случайны. Я привожу его, чтобы вы поняли простую вещь - до того, как база не размечена, извлечение из нее практической пользы крайне затруднительно - для этого можно использовать интересные технические решения, но задача нетривиальная. Поэтому в сухом остатке - разметка имеет колоссальную ценность. В долларах, рублях, евро, фунтах.

В Китае проблема разметки в прямом смысле может решаться в ручную: парой миллионов китайцев, что получают приказ партии и целыми днями только и делают, что размечают фотографии по принципу “банан/не банан”, за минимальную зарплату (ибо партии не нужны безработные и опасные элементы). Западный мир претендует на демократию, поэтому обожает комбинировать капитализм и социализм по своему усмотрению. В частности, жить по принципу “зарабатывать по-максимуму, а платить по-минимуму”. Этот подход приводит к хитрым шагам вроде “CAPTCHA” (когда, чтобы авторизоваться на сайте, ва заставляют “доказать, что вы не машина” кликая на мосты/автобусы/котиков на фотках), тестам вроде “кто ты в Звездных войнах”, приложениям типа FaceApp и вирусным акциям типа “челлендж запостить, как я выглядел 20 лет назад”. Все эти задачи не имеют НИЧЕГО общего с декларируемыми. В реальности, капча помогает гуглу (как его автору) получать петабайты размеченных фото, результаты тестов “кто ты в звездных войнах” (а это ни что иное, как типовой тест на определение психологического типа) - немедленно привязываются к вашим данным браузера и сливаются маркетологам для контекстной рекламы (и вы можете сами в этому убедиться, почитав правила, на которых соглашаетесь участвовать - я просто не хочу тратить сейчас время в этом посте), а приложения типа FaceApp и аналоги - это ни что иное, как хитрый инструмент получения данных о топологии возрастных изменений.