Lost in translation (parte II)

Esta es la segunda parte de un artículo dónde explicamos las diferencias entre los formatos mp3 y wav. Puedes leer la primera parte aquí.

Terminología del audio digital

Para poder hablar sobre frecuencias y amplitudes y sus especificaciones en un contexto moderno, vamos a definir el “sonido calidad CD” con un poco de teoría.

El audio se almacena digitalmente en un CD mediante una técnica conocida como PCM (Pulse Code Modulation). El lenguaje PCM consiste en instantáneas de amplitudes de onda de un audio, medidas en intervalos de tiempo regulares y específicos. Así, en el formato CD nos encontramos con 44.100 mediciones de amplitud de onda por segundo, o lo que es lo mismo, tiene una frecuencia de muestreo de 44,1 kHz. Esto es muy importante ya que el Teorema de Nyquist afirma que “el límite de mayor frecuencia del sistema de audio digital PCM depende de la frecuencia de muestreo, y que la frecuencia de muestreo debe ser al menos el doble de la frecuencia más alta que será grabada“. Traduciendo podemos decir que una frecuencia de muestreo de 44,1 kHz puede, en teoría, almacenar frecuencias de hasta justo por encima de 20 kHz, que es aproximadamente el límite teórico de frecuencia más alta que el oído humano puede apreciar. Tiene sentido, ¿no?.

pulse code modulation

Onda senoidal siendo muestreada y cuantificada en PCM

El “sonido calidad CD” usa 16 dígitos binarios para representar el valor de amplitud de cada muestra. Esto se conoce como longitud de palabra (a menudo incorrectamente descrito como profundidad de bit). Cuánto mejor sea esta longitud de palabra, mejor será el rango dinámico que se puede capturar. En el caso del CD (su longitud de palabra son 16 bits) le permite una relación señal-ruido de 93 dB. Aunque el rango dinámico es ligeramente mejor que eso, ya que podemos percibir sonido por debajo de la medida del ruido de fondo.

Aproximadamente, cada aumento de 9 dB en el rango dinámico equivale a percibir el doble de volumen de sonido, así que (aunque es mejor que una cinta analógica en este aspecto), el rango dinámico del formato CD está muy por debajo de los 140 dB del rango dinámico del oido humano.

Todo esto no debe confundirse con el bit rate (velocidad de bits), que se expresa en kbps (kilobits por segundo) y que es una medida de la cantidad de datos requeridos para representar un segundo de audio. El audio estéreo de la calidad CD tiene un bit rate de 1,4Mb/segundo, de acuerdo con la siguiente fórmula:

 16 (bits) x 44.100 (fs) x 2 (dos canales en la señal estéreo) = 1411,2 kbps (o lo que es lo mismo: 1,4 Mb/sg)

PCM es un “crudo” ó formato no comprimido, lo que quiere decir que toda la información que es capturada es almacenada. En otras palabras, el bit stream (flujo de bits) que entra en el sistema cuando se graba es identico, en teoría, al bit-stream reproducido por el sistema. Refiriéndonos al sonido calidad CD, los sistemas profesionales de grabacion de audio PCM actualmente usan longitud de palabra de 24 bit, dando lugar a una teórica relación señal-ruido de 141dB y una frecuencia de muestreo de hasta 192 kHz, para una mayor respuesta a frecuencias altas.

fabricación de cd

Fabricación de un CD

La información de PCM es normalmente almacenada en archivos de WAV o AIFF, que son archivos relativamente grandes cuando se comparan con los formatos comprimidos. Esto no es una sorpresa, por supuesto, ya que el objetivo de la compresión de datos es reducir el tamaño de los archivos, para que así el contenido pueda descargarse más rapido a través de Internet, para poder almacenar más canciones en tu iPod.

Los formatos de audio comprimidos pueden clasificarse como:

  • Con pérdidas (MP3, AAC, WMA, y Ogg Vorbis)
  • Sin pérdidas (FLAC, ALAC de Apple y MP3 HD).

Los formatos con pérdidas son ejemplos de lo llamado percepción de formatos de codificación de audio, eso que hace explotar la psicoacústica: el oído humano se hace suposiciones acerca de lo que podemos oir y no podemos oir.

 

ipods

iPod ¿pasado, presente o futuro?

En pocas palabras, los formatos con pérdidas siempre muestran algunas pérdidas de calidad, porque el contenido del audio que sale del decodificador en la reproducción no es el mismo que el contenido del audio que originalmente entró en el decodificador.

Si un individuo puede percibir esa pérdida de calidad es otra cuestión, así que exploraremos cuáles son los efectos de la compresión de datos con pérdidas y cómo se manifiestan en términos audibles en la siguiente entrega de este artículo.

(Artículo traducido de Lost in Translation de Ian Corbett, para la revista SOS Edición Abril 2012)