Poetry to jailbreak AI
Kijk, zo nuttig en effectief is poëzie: je kunt er LLMs mee om de tuin leiden en ze dingen laten doen die ze eigenlijk niet zouden moeten doen, en meer. En als ik het goed begrijp is door mensen gemaakte poëzie daar nog beter in dan poëzie die weer met LLMs wordt gegenereerd. Hier, in een wetenschappelijk paper ‘Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models’: https://arxiv.org/abs/2511.15304.
0 Comments
RSS for comments on this post.