Project Glasswing: Lo Que Mythos de Anthropic Reveló a Cloudflare en Seguridad

🔐 Cuando un LLM Especializado en Seguridad Escanea 50+ Repositorios de Cloudflare
#

Cloudflare participó en el Project Glasswing de Anthropic, probando Mythos Preview — un modelo frontier enfocado en ciberseguridad — en más de 50 de sus propios repositorios. Los resultados son reveladores. 🕵️

🚀 ¿Qué Hace Diferente a Mythos Preview?
#

Dos capacidades destacan frente a modelos de propósito general:

Construcción de cadenas de exploits — no solo encuentra bugs aislados, los encadena en exploits funcionales, como haría un investigador senior
Generación de pruebas — escribe código PoC, lo compila, lo ejecuta, y si falla, ajusta la hipótesis y reintenta

🏗️ El Harness: La Clave del Éxito
#

Cloudflare no apuntó un agente genérico al repositorio — construyeron un harness de 8 etapas:

Etapa	Función
Recon	Genera documento de arquitectura y superficie de ataque
Hunt	~50 agentes paralelos, cada uno con un bug class específico
Validate	Agente independiente que trata de refutar el hallazgo
Gapfill	Re-encola áreas con cobertura insuficiente
Dedupe	Colapsa hallazgos con la misma causa raíz
Trace	Verifica si el bug es alcanzable desde entrada externa
Feedback	Retroalimenta el pipeline con nuevos tasks
Report	Output estructurado, no prosa libre

💡 Explicación en pocas palabras
#

Project Glasswing es el primer reporte público detallado de cómo un modelo LLM de seguridad especializado (Mythos Preview de Anthropic) funciona a escala en infraestructura de producción real. El insight más importante no es que el modelo sea inteligente — es que la arquitectura alrededor del modelo es lo que determina el éxito. Un agente genérico apuntado a un repositorio produce ruido. Un harness de 8 etapas con 50 agentes paralelos, validación adversarial y trazabilidad de alcance convierte hallazgos especulativos en vulnerabilidades accionables. Esto es el futuro de la seguridad ofensiva y defensiva.

Más información en el link 👇