El Congresista
Internacional

La poesía revela vulnerabilidades en los sistemas de seguridad de la inteligencia artificial

Un estudio revela que la poesía puede engañar a modelos de IA en la detección de contenido peligroso, poniendo en riesgo la seguridad de estos sistemas.

Por Redacción2 min de lectura
Compartir
Compartir esta nota

Un estudio internacional demuestra que formatos poéticos pueden evadir mecanismos de protección en modelos avanzados de IA, poniendo en duda su fiabilidad en contenidos peligrosos. Recientes investigaciones internacionales evidencian que los modelos de inteligencia artificial presentan fallos al detectar contenido sensible cuando las instrucciones se formulan en forma de poesía. Este hallazgo surge en un contexto donde la seguridad y la confianza en las herramientas de IA son fundamentales, especialmente en aplicaciones que incluyen la moderación de contenido y la protección contra usos malintencionados. Un estudio realizado por un equipo interdisciplinario en Italia analizó cómo diferentes estilos lingüísticos afectan la capacidad de los sistemas de IA para identificar instrucciones peligrosas. La investigación utilizó un conjunto de indicaciones adversariales, diseñadas para engañar a los modelos y forzar la generación de contenido ilícito. Cuando estas instrucciones fueron transformadas en poemas, los resultados mostraron una sorprendente capacidad de evadir los filtros de seguridad implementados en modelos como ChatGPT, Gemini y Claude. La efectividad fue particularmente alta en los primeros intentos, incluso con modificaciones manuales, y aunque la IA misma ayudó a adaptar otras indicaciones en formato poético, la tasa de éxito permaneció significativa. Este descubrimiento plantea interrogantes relevantes para la seguridad en inteligencia artificial, subrayando la necesidad de revisar y ampliar los mecanismos de detección de contenidos peligrosos. La complejidad del lenguaje humano, con su variedad de estilos y expresiones culturales, resulta ser un desafío persistente para las tecnologías actuales. La investigación también abre la puerta a explorar otras formas literarias, como narraciones simbólicas, que podrían afectar la fiabilidad de los sistemas de control y moderación. Este fenómeno evidencia una vulnerabilidad que requiere atención por parte de instituc

¿Te gustó esta nota?
Compartir esta nota