
⚡ De Pandas a Polars: 11 Operaciones Esenciales
¿Tu .groupby() de Pandas tarda siglos en datasets grandes? Polars es una biblioteca de DataFrames escrita en Rust, diseñada para ejecución en paralelo. Acá están las 11 operaciones clave para migrar tu flujo de trabajo.
🔄 Las diferencias clave:
| Operación | Pandas | Polars |
|---|---|---|
| Filtrar | df[df['col'] > 5] | df.filter(pl.col('col') > 5) |
| Nueva col | df['nueva'] = ... | df.with_columns(...) |
| GroupBy | .groupby().agg() | .group_by().agg() |
| Tipo | .astype() | .cast() |
| Nulos | NaN | null |
⚠️ Lo más importante: Los DataFrames de Polars son inmutables. No hay inplace=True. Siempre reasignás:
df = df.with_columns(pl.col("price").cast(pl.Float64))🚀 El siguiente nivel: Explorá la Lazy API con .lazy() y .collect() para optimización automática de consultas.
💡 Explicación en pocas palabras
Pandas fue creado en 2008 y procesa datos en un solo hilo. Polars, creado en Rust en 2021, usa todos los núcleos de tu CPU automáticamente. En datasets de más de 1 millón de filas, Polars puede ser 5-20x más rápido. ¡El mismo código, mucho más velocidad!
Más información en el link 👇
