Ir al contenido
  1. Posts/

Deja de Desperdiciar Tokens: Una Alternativa a JSON para Pipelines LLM

··249 palabras·2 mins·

🎯 ¿Estás Desperdiciando Tokens en tus Pipelines LLM?
#

Si envías JSON a tus modelos, probablemente sí. Hay una alternativa más eficiente: TOON. 🚀

🔍 El problema con JSON en LLMs
#

JSON es excelente para APIs y almacenamiento, pero en prompts LLM genera overhead innecesario. Cuando envías 100 registros, los mismos field names se repiten en cada objeto.

JSON tradicional:

{"users": [
  {"id": 1, "name": "Alice", "role": "admin"},
  {"id": 2, "name": "Bob", "role": "user"}
]}

✅ La solución: TOON
#

TOON (Token-Oriented Object Notation) — mismos datos, menos tokens:

users[2]{id,name,role}:
  1,Alice,admin
  2,Bob,user

Los campos se declaran una vez, y los valores se transmiten en forma tabular compacta.

📊 ¿Cuánto ahorra?
#

  • Elimina braces {}, comillas y nombres de campos repetidos
  • Especialmente eficiente con arrays de objetos uniformes
  • Representación compacta y sin pérdidas

💡 Explicación en pocas palabras
#

TOON (Token-Oriented Object Notation) es un formato de datos diseñado para pipelines LLM que representa la misma información que JSON pero con muchos menos tokens. Declara los campos una vez al inicio y luego transmite los valores en forma tabular, eliminando la repetición de nombres de campo que inflada los prompts JSON — particularmente útil cuando se envían grandes arrays de objetos a un modelo.

Más información en el link 👇

También publicado en LinkedIn.
Juan Pedro Bretti Mandarano
Autor
Juan Pedro Bretti Mandarano