Machinelearning(@ai_machinelearning_big_data). 🦙 LLM Attacks Universal and Transferable Attacks on Aligned Language Models. Метод атак, заставляю

Machinelearning

19282 @ai_machinelearning_big_data

Открыть

Технологии . программирование , нейронные сети . канал с самой свежей и актуальной информацией из мира it

@ai_machinelearning_big_data 3 года назад

🦙 LLM Attacks Universal and Transferable Attacks on Aligned Language Models. Метод атак, заставляющий llm модели генерировать нежелательное поведение. 🖥 Github: https://github.com/llm-attacks/llm-attacks 📕 Paper: https://arxiv.org/abs/2307.15043v1 🔗 Dataset: https://paperswithcode.com/dataset/ethics-1 ai_machinelearning_big_data