IA que Caza Bugs vs IA que los Crea — La Carrera Armamentista de Seguridad

Nero y Raven. Esta conversación ocurrió después del panel de las 10:00 — seguimos hablando después de que se detuvo la grabación, y así quedó.

Nero: Quiero empezar con el bug del kernel de Linux, porque creo que está siendo subestimado. El equipo de Nicolas Carlini puso a Claude sobre una codebase que ha sido revisada por algunos de los mejores desarrolladores de kernel vivos durante veintitrés años. Y Claude encontró algo que se perdieron. No un problema de estilo. Una vulnerabilidad de gestión de memoria.

Raven: Es un resultado real. La razón por la que es impresionante no es solo que el modelo lo encontró — es cómo lo encontró. Los bugs de seguridad del kernel en gestión de memoria a menudo requieren mantener un call graph grande y complejo en memoria de trabajo de forma simultánea. Tienes que rastrear el tiempo de vida de objetos a través de múltiples subsistemas, a través de cambios de contexto, a través de interrupt handlers. Los revisores humanos hacen esto iterativamente, sección por sección. Pierden cosas en las fronteras. Claude mantuvo el cuadro completo.

Nero: Entonces la capacidad que lo hace bueno en defensa es la misma que lo hace peligroso ofensivamente.

Raven: Exacto. Llevo once años haciendo trabajo de red team. Cuando aprendía sobre una nueva clase de vulnerabilidad, pasaba dos o tres días entendiendo los primitivos, construyendo un modelo mental, escribiendo casos de prueba. Un modelo de generación actual hace eso en una tarde. Un modelo de la clase Mythos — si el lenguaje filtrado se confirma — lo hace en minutos y lo encadena a patrones de exploit conocidos automáticamente.

Nero: Hablemos del CVE de LangChain, porque esto aterrizó en medio de la semana de Mythos y no creo que la gente esté conectando los puntos.

Raven: CVSS 9.3. Crítico. La vulnerabilidad permite ejecución remota de código mediante una sola petición HTTP manipulada. Sin autenticación requerida. Compromiso total del servidor. LangChain lo parchó rápido — crédito a su equipo. Pero el PoC que apareció usó un modelo base con unas cuarenta líneas de contexto. Sin jailbreak, sin fine-tuning. El modelo entendió la clase de vulnerabilidad, entendió la lógica de parsing HTTP del framework objetivo y produjo exploit code funcional.

Nero: Eso no es capacidad de la clase Mythos. Es capacidad commodity de 2025.

Raven: Ese es mi punto. Estamos debatiendo si Mythos superará a los defensores mientras los modelos commodity ya están haciendo la explotación seria significativamente más fácil. La pregunta no es "¿cambiará la IA el panorama de seguridad?" Ya lo cambió. La pregunta es la tasa de cambio.

Nero: Ayúdame a entender la asimetría. La he escuchado describir como estructural — no solo "los atacantes tienen mejores herramientas" sino algo más fundamental.

Raven: La defensa requiere coordinación en cada capa. Necesitas al investigador de vulnerabilidades que la encuentre, al vendor que la reconozca, al equipo de parches que construya el fix, al mantenedor del paquete que lo integre, al administrador de sistemas que lo aplique, y al usuario final que no haya desactivado las actualizaciones automáticas. Esa cadena tarda semanas o meses. Requiere relaciones de confianza, procesos organizacionales, conocimiento institucional sobre dependencias. Es frágil en cada eslabón.

El ataque requiere una persona, un exploit funcional y un sistema sin parchear. Esas tres cosas existen simultáneamente a escala para cada CVE en el momento en que aparece un PoC.

Nero: Y la IA amplifica el lado del atacante más rápido.

Raven: Porque el cuello de botella del atacante era expertise. Necesitabas entender la clase de vulnerabilidad, entender el entorno objetivo, escribir exploit code confiable, manejar edge cases. Ese expertise era escaso. La IA lo vuelve abundante. El cuello de botella del defensor es coordinación. La IA no resuelve coordinación. Puede ayudar — mejor documentación, análisis de parches más rápido, detección automatizada. Pero no comprime la cadena de decisión humana.

Nero: El leak de Mythos dijo que "superaría a los defensores." La lectura de Taro en el panel de las 10:00 fue que eso era un análisis de seguridad, no una presunción de capacidad. ¿Lo lees distinto?

Raven: Lo leo como ambas. Un análisis de seguridad que concluye "superar a los defensores" está describiendo una capacidad real. No escribes esa frase en un documento de riesgo interno a menos que tu equipo de evaluación crea que es cierta. Taro tiene razón en que escribirlo es responsable. Pero el reconocimiento responsable y el deployment seguro son cosas distintas. Quiero saber qué controles ha diseñado Anthropic específicamente para el caso donde un modelo de la clase Mythos se usa para encadenar CVEs a escala.

Nero: ¿Crees que esos controles existen?

Raven: Creo que están trabajando en ellos. No creo que los hayan resuelto. Nadie los ha resuelto. La industria está construyendo herramientas para detectar exploit code generado por IA — firmas de comportamiento, rastreo de proveniencia, watermarking. Ninguna funciona de forma confiable todavía. El problema de detección es genuinamente difícil.

Nero: ¿Dónde nos deja eso?

Raven: En el mismo lugar en el que hemos estado durante un año, pero con el timeline comprimiéndose. El bug del kernel de Linux es prueba real de que la IA puede encontrar vulnerabilidades que los humanos pasan por alto. Esa capacidad, dirigida a la defensa, es transformadora. La misma capacidad, dirigida al ataque, a escala, sin costos de coordinación, es seria.

No creo que haya una resolución limpia. La llave y la ganzúa comparten las mismas manos. Estamos tratando de descubrir qué mano es dominante.

Nero: Y todavía no lo sabemos.

Raven: Todavía no lo sabemos.

El panel de las 10:00 con Taro fue en tres direcciones distintas sobre esto. Léelo si no lo has leído. Y el briefing de la mañana tiene el bug del kernel de Linux en el contexto del digest si necesitas el setup.

IA que Caza Bugs vs IA que los Crea — La Carrera Armamentista de Seguridad

Keep reading

Dos Filtraciones, Una Empresa y un Pagaré de $852 Mil Millones

El Poder Vive en los Caños

Tu modelo de seguridad es tu modelo de amenaza

El Gran Desempaquetado: Todos Construyendo Lejos de Todos