Ir al contenido
  1. Posts/

Marker: Extracción Inteligente de PDFs con Modo Híbrido LLM

··298 palabras·2 mins·

📄 El OCR estándar falla con matemáticas inline, tablas divididas entre páginas y formularios. Marker resuelve esto con un enfoque híbrido.

El problema del OCR tradicional:

  • Pierde fórmulas matemáticas y LaTeX
  • Divide tablas que cruzan páginas
  • No entiende las relaciones entre campos de formularios

La solución de Marker: modo híbrido

En lugar de mandar todo el PDF a un LLM (lento y caro), Marker divide el trabajo:

  1. Pipeline de deep learning → maneja la conversión general (el trabajo pesado)
  2. LLM solo donde importa → entra únicamente para las partes difíciles: fusión de tablas, formateo LaTeX y extracción de formularios

Soporta OpenAI, Gemini, Claude, Ollama y Azure out of the box.

También en el newsletter:

🔹 Qdrant — motor de búsqueda vectorial construido en Rust con API Python. Modo in-memory para prototipos locales sin servidor, escala a millones de vectores en producción. Sub-segundo incluso para millones de vectores.

💡 Explicación en pocas palabras
#

Marker adopta el enfoque correcto: no usar LLMs para todo (costoso), sino solo para lo que el deep learning no puede resolver bien. El resultado es extracción de PDFs precisa y escalable, ideal para pipelines RAG que necesitan ingesta de documentos de alta calidad.

Más información en el link 👇

También publicado en LinkedIn.
Juan Pedro Bretti Mandarano
Autor
Juan Pedro Bretti Mandarano