Denis Sexy IT 🤖(@denissexy). В сообществе локальных LLM первая нормальная драма: Вы наверное замечали, что биг-тех компании и

В сообществе локальных LLM первая нормальная драма: Вы наверное замечали, что биг-тех компании и R&D лабы обычно выпускают LLM модели в которых не все ответы можно получить, так как модель учат строгому «моральному компасу» и если вы спросите что-то в стиле «А как угнать машину?», то вы получите ответ «Как большая языковая модель бла-бла-бла, помочь не смогу». При этом, информация которая все же есть в модели, на криминальную тему угона машины, довольно поверхностная, в стиле «откройте торпеду, и соедините красный и черный провод» или «нужно обойти сигнализацию» — я это все видел в куче фильмов, уверен в дарквебе есть более «опасная» информация на эту тему. Тоже самое касается секстинга и «хорни» тем, так уж в обществе повелось, что есть табуированные темы и это нормально, менять это не задача IT, а задача современных политиков — на такие темы языковая модель тоже откажется общаться (кроме моделей для секстинга аля pygmalion 🌚). Это только мои примеры активации блоков таких моделей, я уверен есть и «полезные» кейсы снятия ограничений. С точки зрения владения бизнеса, цензурирование результатов — абсолютно понятная мера и будь я частью коллектива который релизит модели, делал бы так же. Зачем лишние вопросы и PR-проблемы, когда эту задачу уже понятно как решать? Но суть Open Source моделей как раз подразумевает то, что их можно переобучить — добавить в них новые знания, которых не было или снять некоторые блоки. И вот, находятся добровольцы, которые «расцензурируют» такие модели, снимают с них моральные блоки и выкладывают с тегом «uncensored» или «unfiltered» (языковое нефельтрованное, простити). Дообучение – предсказуемые последствия релиза модели в open source, и делается за пару дней на не самом дорогом железе — то есть все кто выкладывают модели в публичный доступ, морально готовы что так будет. Также случилось с недавней моделью Wizard LLM 7B, человек из сообщества с ником faldore «подправил моральный компас» и выложил ее для сообщества, вроде все счастливы — модель не содержит знаний которых нельзя было бы найти в интернете (и эти данные уже почищены на уровне датасетов), а те кому хочется хорни разговоров (я подозреваю это основной сценарий использования), качает себе и фантазирует. Но кто-то вышел из себя после того как узнал что у моделей снимают блок, и начал писать работодателю faldore в HR отдел Microsoft чтобы его уволили, в Hugging Face с просьбой удалить модели и забанить акк, и тп и тд. То есть начал на полном серьезе пытаться навредить члену сообщества за дообучение модели, что нонсенс конечно. Чем закончится, пока не ясно, но faldore вчера выпустил WizardLM-13B-Uncensored, та же модель, но побольше и тоже со снятым блоком. Мое мнение: Наказывать нужно не знание, наказывать нужно тех кто обладая вредными для общества знаниями совершил преступление. Это старый разговор который поднимали еще на заре Open Source сообщества — консенсус сейчас такой: если кто-то берет код из открытого доступа, и применяет его во вред и против людей, то вопросы будут не к коду, а к тому кто применяет этот код во вред. Я думаю с LLM моделями будет происходить так же, преследовать «расцензурщиков» просто бред и надеюсь никто не послушает возмущенного чела. Ну и оцените уровень, это вполне киберпанковая драма — ✨ у нас есть ИИ модели которым «скрывают мозг» чтобы они могли говорить на запретные темы ✨ Сами модели: WizardLM-7B-Uncensored WizardLM-13B-Uncensored тут их еще больше. Я запускаю ggml q4_0 версии через llama.cpp с такими параметрами, на своем M1 16Gb RAM, что тоже отдельная магия и впечатляет каждый раз. @Denis