Если допускать, что китайские производители смартфонов всё же собирают данные о пользователях. Для этого требуются знания. В первую очередь - методы сбора данных. Какие именно данные неважно - пусть data lake будет максимально широким. Собираем всё, что возможно: время использования смартфона, приложения, время сна и бодрствования, данные геопозиции. Далее классифицирем данные по категориям и для каких целей понадобится: разработка новых фишек в операционной системе, предпочтения пользователей для продажи периферии, разработка экосистемы бренда, продажа данных (самое простое). Далее выдвигаем гипотезы, анализируем данные и проверяем работает модель или нет. Кстати, чтобы всё это изучить вы можете обратиться к моим хорошим знакомым в SkillFactory, у них как раз запускается курс Data Science - http://bit.ly/2wapJfB