La verdad oculta acerca del Dither
Segunda Parte
Segunda Parte
Representación gráfica de un tono puro de 1 KHz con un nivel de -60dB generado como un
archivo de audio de 24 bits y 44.1 KHz.
En la primera entrega de esta serie, hablamos sobre audio digital y especialmente tocamos el tema de la cuantización. En esta ocasión abordaremos la cuestión de la linealidad de los dispositivos digitalizadores de audio. Todo es aplicable a la problemática que conlleva trabajar a 24 o 32 bits para luego hacer un mixdown o render a 16 bits, es decir, pasar de una cantidad mayor de bits a una menor. ¿Cómo decidimos cuáles bits eliminar?, ¿eliminamos los menos significativos y listo?
Resultado de eliminar los últimos y menos significativos 8 bits del gráfico anterior para obtener
un archivo de 16 bits. Se puede apreciar que los peaks & deeps de la onda son menos curvos.
Dither.
Si vamos al principio del proceso de captura de una señal análoga, podríamos teóricamente decir que ésta utiliza una cuantización compuesta por un número infinito de bits de resolución, luego, al digitalizarla estaríamos bajando desde una cantidad mayor de bits a una menor, lo que acarrea distorsión o ruido debido a la “cuadrificación” de la señal como resultado de un número de intervalos de cuantización menor. Es por esto que les rebelo un secreto: el hardware profesional de audio, antes de digitalizar, introduce una señal análoga con valores aleatorios de voltaje cuya amplitud máxima es del órden de la mitad del ancho del intervalo de cuantización que se quiera usar. Esta señal es muy similar al ruido blanco y se conoce como Dither Análogo. Si alguien les dijo alguna vez que el audio digital era cristalino y sin ruido de fondo, los engañó vilmente (je, je).¿Pero cómo?, ¡¿añadir aún más ruido?!... ¿no estaremos empeorando la situación?. La verdad es que agregamos un ruido, sí, pero está diseñado para ser imperceptible a niveles de escucha normales, de hecho estamos hablado de niveles bajo los -100 dB.
Función de transferencia de un sistema con cuantización ideal sin dither.
Como se puede ver, dista mucho de ser lineal.
En la práctica, lo que a nosotros nos gustaría es que la función de transferencia de nuestro dispositivo capturador de audio sea lineal, es decir, que los niveles que entran sean los mismos que salen. Esto claramente no se cumple en un digitalizador ideal, ya que la función de transferencia es escalonada, lo que dista bastante de la línea recta que buscamos. Además, debido a los escalones, se introducirían graves y bastante molestas distorsiones en la señal de salida. El ruido aleatorio a bajo nivel es tolerado mucho mejor por las personas que la distorsión, por lo tanto, vamos a cambiar la distorsión por un tolerable, y en la práctica, imperceptible ruido blanco.
Agregando un Dither adecuado, vamos a lograr que en promedio, la función sea bastante
más lineal, ya que el ruido blanco fluctúa aleatoriamente entre los intervalos de cuantización.
La función de transferencia promediada resultante de agregar Dither, no es perfecta, pero
es por lejos mucho más lineal que la de un sistema de cuantización ideal.
Lo anterior es otra razón para grabar con el mayor nivel posible desde la fuente sonora, y no usar innecesariamente algo que a muchos les gusta hasta el abuso: la normalización de nivel a diestra y siniestra, ya que estamos aumentando el ruido del dither inicial y podríamos llevarlo a ser audible.
Un pequeño ejemplo:
Tenemos un archivo de audio que contiene un tono puro de 1KHz a -60dB, generado utilizando 24 bits de resolución. Si observamos su espectro vemos un único y pronunciado peak centrado en 1Khz. (imaginence que es su mezcla, bella y perfecta):
Veamos que pasa si lo guardamos a 16 bits simplemente truncando los últimos 8 bits:
Resultado de truncar los 8 bits menos significativos del archivo de 24 bits.
Se aprecia la aparición de una gran distorsión debido a los armónicos producidos al "cuadrificar" la señal.
¡¡Horror!!... ¿qué es todo eso?... Es el monstruo de la distorsión por cuantización que amenaza con devorar a nuestra pobre e indefensa mezcla, tan bella ella... ja ja. Hablando en serio, eso le podría pasar a su trabajo si no tienen la precaución de aplicar un Dither adecuado al momento de bajar a 16 bits.
Veamos cómo se vería el resultado de haber aplicado dither al momento de recuantizar:
Agregando Dither reemplazamos distorsión por ruido, lo que es mucho más tolerable por el oído.
La línea amarilla muestra el archivo con dither y la blanca la versión sin dither.
Obviamente, nada es perfecto, y para lograr linealidad y evitar la distorsión tenemos que sacrificar un poco el rango dinámico y agregar ruido, en todo caso, es un pequeño precio, ya que si se fijan, el nivel del ruido ronda los -130dB.
En la siguiente entrega hablaremos del famoso Shaping o modelado del ruido para lograr un rango dinámico aparente mayor, de los diferentes tipos de dither y de su correcta utilización.
Saludos.
Nombre Real: Héctor Montoya


