🦙 LLM Attacks Universal and Transferable Attacks on Aligned Language Models. Метод атак, заставляющий llm модели генерировать нежелательное поведение. 🖥 Github: https://github.com/llm-attacks/llm-attacks 📕 Paper: https://arxiv.org/abs/2307.15043v1 🔗 Dataset: https://paperswithcode.com/dataset/ethics-1 ai_machinelearning_big_data