Hackers ‘jailbreak’ modelos AI poderosos en un esfuerzo global para resaltar fallos.
Pliny the Prompter afirma que normalmente le lleva alrededor de 30 minutos romper los modelos de inteligencia artificial más poderosos del mundo. El hacker pseudónimo ha manipulado el Llama 3 de Meta para compartir instrucciones sobre cómo hacer napalm. Hizo que el Grok de Elon Musk elogiara a Adolf Hitler. Su propia versión hackeada del … Leer más