Ir al contenido
  1. Posts/

¿Cómo Funciona Shazam? El Truco de los Puntos Conectados

··292 palabras·2 mins·

🎵 Shazam: el truco es ignorar casi todo

¿Cómo puede tu teléfono reconocer una canción en segundos, incluso en un café ruidoso? No escucha la melodía. No reconoce la letra. Hace algo más astuto.

🔍 El proceso en cuatro pasos:

  1. Captura el sonido como una onda de presión de aire digitalizada
  2. Transforma la onda con una FFT (Transformada de Fourier) → convierte el audio en un espectrograma tiempo/frecuencia
  3. Descarta el 99% → solo conserva los picos más intensos, creando un “mapa de constelación” de puntos
  4. Genera huellas digitales → empareja cada punto con los cercanos → 3 números (frecuencia A, frecuencia B, diferencia de tiempo) = 1 hash único

🗄️ La magia del índice invertido: En vez de comparar tu audio con cada canción, el sistema busca cada hash tuyo en una tabla gigante donde cada hash apunta a las canciones que lo contienen. Es como el índice al final de un libro. El resultado: millones de canciones comparadas en fracciones de segundo.

🔊 ¿Por qué funciona bien con ruido? Porque el ruido ambiente rara vez genera los picos más dominantes en ninguna región del espectrograma.

🎤 ¿Por qué falla al tararear? Porque genera hashes distintos a los de la grabación original.

💡 Explicación en pocas palabras
#

Shazam identifica canciones convirtiendo unos pocos segundos de audio en una huella digital compacta basada en los picos de frecuencia más fuertes y sus relaciones temporales, que luego compara con una base de datos de millones de canciones usando un índice invertido que responde en milisegundos.

Más información en el link 👇

También publicado en LinkedIn.
Juan Pedro Bretti Mandarano
Autor
Juan Pedro Bretti Mandarano