Ir al contenido
  1. Posts/

6 Decisiones Que Todo AI Engineer Debe Tomar (y Nadie Enseña)

··415 palabras·2 mins·

⚙️ Lo Que Los Cursos de IA No Te Enseñan: Las 6 Decisiones de Producción
#

Los cursos te enseñan a hacer un modelo preciso. Raramente te enseñan las decisiones que vienen justo después. Esta es la guía basada en investigación real. 🎯

📊 Los 6 Trade-offs en Producción
#

1. Build vs. Buy en la era LLM

  • < 100k peticiones/día → API externa (GPT-4o Mini) es la respuesta correcta
  • 1M peticiones/día → el costo por token empieza a comerse el margen

  • ⚠️ El 70-80% del costo de self-hosting es personal, no hardware

2. Complejidad del Modelo vs. Mantenibilidad

  • Principio CACE de Google: “Changing Anything Changes Everything”
  • El código del modelo es una fracción pequeña del sistema real
  • ¿Quién debuggea esto en 6 meses? Si la respuesta es “unclear” — ahí está la decisión

3. Cantidad vs. Calidad de Datos

  • Más datos + mucho ruido = performance plana o peor
  • El “data swamp”: colecionas todo porque el storage es barato
  • Datos médicos con etiquetas de expertos > datasets enormes con anotaciones inconsistentes

4. Throughput vs. Latencia (Batch vs. Real-Time)

  • La mayoría de problemas de negocio NO necesitan predicciones en sub-segundo
  • Batch inference: puntuaciones de churn diarias, recomendaciones semanales
  • Si el usuario no nota si la predicción tiene 5 min o 5ms → usa batch

5. Prompt Engineering vs. Fine-Tuning

  • Prompting: rápido, barato, flexible. Empieza aquí siempre
  • Fine-tuning GPT-4o para customer support = ~$10k + 6 semanas de data prep
  • DSPy (prompt optimization) superó fine-tuning en algunos benchmarks con 35x menos rolloutsF

6. Automatización vs. Supervisión Humana

  • AI maneja volumen, velocidad y reconocimiento de patrones
  • Humanos manejan irreversibilidad
  • HITL selectivo: revisión humana solo para casos edge, baja confianza, alto riesgo

💡 Explicación en pocas palabras
#

El principio que unifica estos 6 trade-offs: en producción, el costo de una decisión rara vez se paga donde se toma. Un modelo más complejo te cuesta en mantenimiento 6 meses después. Un sistema en tiempo real te cuesta en infraestructura 24/7 para siempre. Datos sucios te cuestan en ciclos de re-entrenamiento. Un prompt inteligente te cuesta en fragilidad ante casos edge. Y la automatización completa te cuesta cuando algo irreversible sale mal. El arte del AI engineering es saber dónde aterriza el costo — y preguntarlo lo suficientemente temprano para actuar.

Más información en el link 👇

También publicado en LinkedIn.
Juan Pedro Bretti Mandarano
Autor
Juan Pedro Bretti Mandarano