
🐻❄️ ¿Tu pipeline de datos falló por un cambio de esquema? Polars tiene la solución.
Los cambios de esquema en datos vienen en 4 formas:
📥 Aditivo — aparece una columna nueva
📤 Sustractivo — desaparece una columna esperada
🔄 Deriva de tipo — el tipo de dato cambia (ej: Int32 → Int64)
💥 Ruptura — columna renombrada o incompatible (requiere manejo manual)
📊 Por formato, Polars ofrece:
CSV:
schema_overridespara columnas problemáticas conocidasinfer_schema=Falsepara leer todo como textoignore_errors=Truepara silenciar errores (usar con cuidado)
Parquet multi-archivo:
missing_columns="insert"→ rellena con null columnas faltantesScanCastOptions(integer_cast="upcast")→ amplía tipos de entero sin pérdidapl.concat(..., how="diagonal_relaxed")→ maneja todo a la vez
Delta Lake:
schema_mode="merge"→ evolución aditiva y sustractiva en un parámetro
Apache Iceberg:
update_schema()+pl.scan_iceberg→ evolución de esquema como ciudadano de primera clase
💡 Explicación en pocas palabras#
Imagina que tienes una tabla de datos y de repente alguien agrega o elimina una columna. Esto se llama un cambio de esquema. Polars es una librería de Python para trabajar con datos, y este artículo explica cómo detectar y manejar esos cambios automáticamente, según el formato de archivo que uses (CSV, Parquet, Delta Lake o Iceberg), para que tu pipeline no falle.
Más información en el link 👇

