Обложка канала

addmeto

65087 @addmeto

Ровно один час в день я трачу на то, чтобы читать новости и писать в блог.

addmeto

4 года назад
Открыть в
Riley Goodside обращает внимание разработчиков на то, что простое использование GPT-3 и других текстовых моделей ИИ очень легко эксплуатировать злоумышленнику. По сути, если ваша программа вставляет пользовательский ввод “в нейронку”, а оттуда получает ответ и работает с ним, ничего не помешает пользователю придумать способы для манипуляции ИИ. Тема довольно глубокая, потому что простого способа ее решения или обхода пока нет. Впрочем, пока и применение таких текстовых моделей ограничено. simonwillison.net/2022/Se…njection
Prompt injection attacks against GPT-3

Riley Goodside, yesterday: Exploiting GPT-3 prompts with malicious inputs that order the model to ignore its previous directions. pic.twitter.com/I0NVr9LOJq- Riley Goodside (@goodside) September 12, 2022 Riley provided several examples. Here’s …

simonwillison.net