Респект и ленина пакет всем, кто отписался. Я немного засухарился, чтобы закончить универ, дописать первый говнокод в Node.js и залечь на матрасы. Мой финальный проект – это штука, которая сортирует комментарии по эмоциям с помощью natural language processing. Звучит так себе, нафига это медиа – тоже не совсем понятно. Пытливые могут сразу прочитать простыню от The Intercept и посмотреть, как они перезапустили комментарии совместно с The Coral Project. В двух словах проблема комментов на сайтах в том, что это самый отстойный и устаревший жмяк, он живет где-то под статьей, издателям проще убрать все к чертям, чем заморачиваться. В 2015 году на Wired даже выходил текст, мол, дискуссии на новостных сайтах – всё.
Но прошло два года, ваш дед говорит про искусственный интеллект, а в компике мелькают нишевые сайты, читатели которых платят в том числе и за базар с журналистами. Последние должны не отвлекаться на троллинг и мудацкие комменты, а общаться с читателями, у которых действительно есть вопросы. В одной из таких редакций мне и сказали – браток, надо потестить AI в комментах. Задолбав чувака из The Coral Project, я понял, что в этом поле что-то мутится. Правда, NLP-системы не особо шарят в сарказме, и распознавать смысл комментов с пользой не выходит. Более того, обучать собственный алгоритм дорого, а мы в медиа уже щи рукой хлебаем.
Ну, я тоже не стенфордская лаборатория, а просто диджей на радио, поэтому пришлось изучить уже существующие API. Это, брат, сервисы, которым можно что-то отправить, чтобы они прислали вам в ответ свой пук. Я пукал вместе с IBM Watson, так как у них есть Tone Analyzer. Он присылает вам эмоцию полученного текста. Вообще это вроде сделано для customer service всяких, но блин, журналистика, за которую башляют должна быть сервисом уровня верних лухарей. Как Netflix или сырки “Б.Ю Александров”.
В итоге, я спер сотню комментов с The Wall Street Journal, и написал незамысловатый код, который сортирует их по эмоциям. Хочешь сначала прочитать аналитические комменты – жмяк на кнопку, готов к потокам говн – жмяк на “злые”. Получился такой proof of concept, в котором пока действуют куча ограничений. Хоть NLP от IBM Watson и обучен на комментах новостных сайтов, он не всегда верно определяет эмоции, а также стоит денег за использование в промышленных масштабах. Журналисты, на которых я это тестировал сказали, что штука полезная – в аналитических комментариях часто всплывает критика о структуре текста или фиговых заголовках, что полезно редактору или сммщику. Ну а мой изначальный пациент, который поехал кукухой, работая на радио и продириаясь сквозь троллей на сайте, сказал, что возможность скрыть всех злыдней – норм идея, если ты в первый раз идешь в комменты и хочешь для начала сделать свою работу.
Кстати, если в школе вам показалось, что программист – это синоним слова “умный”, а единственный способ прокачать мозг – это научиться разговаривать с компьютером, хочу сразу сказать, что это засада. Если душа не лежит, программирование – верный способ покрыться прыщами и возненавидеть мир. Лучше на даче выращивать брюкву.