
🔐 Cuando un LLM Especializado en Seguridad Escanea 50+ Repositorios de Cloudflare#
Cloudflare participó en el Project Glasswing de Anthropic, probando Mythos Preview — un modelo frontier enfocado en ciberseguridad — en más de 50 de sus propios repositorios. Los resultados son reveladores. 🕵️
🚀 ¿Qué Hace Diferente a Mythos Preview?#
Dos capacidades destacan frente a modelos de propósito general:
- Construcción de cadenas de exploits — no solo encuentra bugs aislados, los encadena en exploits funcionales, como haría un investigador senior
- Generación de pruebas — escribe código PoC, lo compila, lo ejecuta, y si falla, ajusta la hipótesis y reintenta
🏗️ El Harness: La Clave del Éxito#
Cloudflare no apuntó un agente genérico al repositorio — construyeron un harness de 8 etapas:
| Etapa | Función |
|---|---|
| Recon | Genera documento de arquitectura y superficie de ataque |
| Hunt | ~50 agentes paralelos, cada uno con un bug class específico |
| Validate | Agente independiente que trata de refutar el hallazgo |
| Gapfill | Re-encola áreas con cobertura insuficiente |
| Dedupe | Colapsa hallazgos con la misma causa raíz |
| Trace | Verifica si el bug es alcanzable desde entrada externa |
| Feedback | Retroalimenta el pipeline con nuevos tasks |
| Report | Output estructurado, no prosa libre |
💡 Explicación en pocas palabras#
Project Glasswing es el primer reporte público detallado de cómo un modelo LLM de seguridad especializado (Mythos Preview de Anthropic) funciona a escala en infraestructura de producción real. El insight más importante no es que el modelo sea inteligente — es que la arquitectura alrededor del modelo es lo que determina el éxito. Un agente genérico apuntado a un repositorio produce ruido. Un harness de 8 etapas con 50 agentes paralelos, validación adversarial y trazabilidad de alcance convierte hallazgos especulativos en vulnerabilidades accionables. Esto es el futuro de la seguridad ofensiva y defensiva.
Más información en el link 👇

