RAG-Anything: Framework RAG Multimodal Todo en Uno

🔍 RAG con texto, imágenes, tablas y ecuaciones al mismo tiempo. Así funciona RAG-Anything.

RAG-Anything es un framework open source de la Universidad de Hong Kong para RAG multimodal de próxima generación. No se limita al texto: procesa cualquier tipo de contenido en documentos.

Capacidades:

📄 Texto: chunking inteligente y recuperación semántica
🖼️ Imágenes: consultas VLM-enhanced para análisis visual
📊 Tablas: extracción y razonamiento sobre datos estructurados
➕ Ecuaciones: procesamiento de fórmulas matemáticas

¿Por qué importa? Los RAG tradicionales solo funcionan con texto. Los documentos reales (PDFs científicos, reportes, manuales) mezclan todos estos tipos de contenido. RAG-Anything los integra en una sola consulta.

Estado: 1,000+ ⭐ en GitHub, reporte técnico en arXiv, soporte para consultas multimodales completas.

💡 Explicación en pocas palabras
#

RAG (Retrieval-Augmented Generation) es una técnica para darle “memoria” a un LLM conectándolo a documentos externos. La versión básica solo funciona con texto. RAG-Anything va más allá: cuando le preguntás sobre un PDF que tiene gráficos y tablas, el sistema entiende y responde usando toda esa información, no solo el texto.

Más información en el link 👇

GitHub - HKUDS/RAG-Anything: "RAG-Anything: All-in-One RAG Framework"

"RAG-Anything: All-in-One RAG Framework". Contribute to HKUDS/RAG-Anything development by creating an account on GitHub.

github.com ↗

También publicado en LinkedIn.

Autor

Juan Pedro Bretti Mandarano

💡 Explicación en pocas palabras#

GitHub - HKUDS/RAG-Anything: "RAG-Anything: All-in-One RAG Framework"

💡 Explicación en pocas palabras
#