Codificación de audio

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 19 de marzo de 2018; las comprobaciones requieren 30 ediciones .

En el corazón de la codificación de audio usando una PC está el proceso de convertir las vibraciones del aire en vibraciones de corriente eléctrica y el posterior muestreo de una señal eléctrica analógica . La codificación y reproducción de información de sonido se lleva a cabo con la ayuda de programas especiales ( editor de sonido ). La calidad de la reproducción del audio codificado depende de la frecuencia de muestreo y su resolución (profundidad de codificación del sonido: el número de niveles)

Principios de la digitalización del sonido

El sonido digital  es una señal sonora analógica representada por valores numéricos discretos de su amplitud [1] .

La digitalización del sonido es una tecnología para medir la amplitud de una señal de audio con un determinado paso de tiempo y luego registrar los valores obtenidos en forma numérica [1] . Otro nombre para la digitalización de audio es conversión de audio de analógico a digital.

La digitalización de audio implica dos procesos:

Discretización del tiempo

El proceso de muestreo de tiempo es el proceso de obtención de valores de señal que se convierten con un cierto paso de tiempo: el paso de muestreo . El número de mediciones de la magnitud de la señal, realizadas por unidad de tiempo, se denomina frecuencia de muestreo o frecuencia de muestreo , o frecuencia de muestreo (del inglés "sampling" - "sample"). Cuanto menor sea el paso de muestreo, mayor será la frecuencia de muestreo y la representación más precisa de la señal que obtendremos.

Esto es confirmado por el teorema de Kotelnikov (en la literatura extranjera se encuentra como el teorema de Nyquist-Shannon). Según él, una señal analógica con un espectro limitado se describe con precisión mediante una secuencia discreta de valores de su amplitud si estos valores se toman a una frecuencia que es al menos el doble de la frecuencia más alta del espectro de la señal. Es decir, una señal analógica que contiene una frecuencia espectral igual a F m puede representarse con precisión mediante una secuencia de valores de amplitud discretos si la frecuencia de muestreo F d es: F d >2F m .

En la práctica, esto significa que para que la señal digitalizada contenga información sobre todo el rango de frecuencias audibles de la señal analógica original (20 Hz - 20 kHz), es necesario que la frecuencia de muestreo seleccionada sea de al menos 40 kHz. El número de muestras de amplitud por segundo se denomina frecuencia de muestreo (si la frecuencia de muestreo es constante).

La principal dificultad de la digitalización es la imposibilidad de registrar los valores de la señal medidos con perfecta precisión (aunque esto es posible en base al teorema de Shenon y Kotelnikov).

Cuantificación de amplitud lineal (homogénea)

Asignemos N bits para registrar un valor de la amplitud de la señal en la memoria de la computadora. Esto significa que con la ayuda de una palabra de N bits, se pueden describir 2 N posiciones diferentes. Deje que la amplitud de la señal digitalizada oscile entre −1 y 1 de algunas unidades convencionales. Representemos este rango de cambio de amplitud - el rango dinámico de la señal - en forma de 2 N −1 intervalos iguales, dividiéndolo en 2 N niveles - cuantos. Ahora, para registrar cada valor de amplitud individual, debe redondearse al nivel de cuantificación más cercano. Este proceso se llama cuantización de amplitud. La cuantización de amplitud es el proceso de reemplazar los valores reales de la amplitud de la señal con valores aproximados con cierta precisión. Cada uno de los 2 N niveles posibles se denomina nivel de cuantificación, y la distancia entre los dos niveles de cuantificación más cercanos se denomina paso de cuantificación. Si la escala de amplitud se divide en niveles linealmente, la cuantificación se denomina lineal (homogénea).

La precisión de redondeo depende del número seleccionado (2 N ) de niveles de cuantificación que, a su vez, depende del número de bits (N) asignados para registrar el valor de amplitud. El número N se denomina profundidad de bits de cuantificación (es decir, la cantidad de dígitos, es decir, bits, en cada palabra), y los números obtenidos como resultado del redondeo de los valores de amplitud son muestras o muestras (del inglés " muestra” - “medición”). Se supone que los errores de cuantificación resultantes de la cuantificación de 16 bits permanecen casi imperceptibles para el oyente.

Este método de digitalización de señales (muestreo de señales en el tiempo junto con el método de cuantificación homogénea) se denomina modulación de código de pulsos (Eng. Pulse Code Modulation - PCM). La señal digitalizada como un conjunto de valores de amplitud sucesivos ya se puede almacenar en la memoria de la computadora. En el caso de que se registren valores de amplitud absoluta, este formato de registro se denomina PCM. El disco compacto de audio estándar ( CD-DA ), en uso desde principios de la década de 1980, almacena información en formato PCM con una frecuencia de muestreo de 44,1 kHz y cuantificación de 16 bits.

Otras formas de digitalizar

Convertidores de analógico a digital (ADC)

El proceso de digitalización de audio anterior se realiza mediante convertidores de analógico a digital (ADC) . Esta transformación incluye las siguientes operaciones:

  1. La limitación de banda se realiza mediante un filtro de paso bajo para suprimir los componentes espectrales cuya frecuencia supera la mitad de la frecuencia de muestreo.
  2. Discretización en el tiempo, es decir, la sustitución de una señal analógica continua por una secuencia de sus valores en puntos discretos en el tiempo - muestras. Este problema se resuelve mediante el uso de un circuito especial en la entrada del ADC, un dispositivo de muestreo y retención .
  3. La cuantificación de nivel es el reemplazo del valor de muestra de la señal con el valor más cercano de un conjunto de valores fijos: niveles de cuantificación.
  4. Codificación o digitalización, por lo que el valor de cada muestra cuantificada se representa como un número correspondiente al número ordinal del nivel de cuantificación.

Esto se hace de la siguiente manera: se “corta” una señal analógica continua en tramos, con una frecuencia de muestreo, se obtiene una señal digital discreta, que pasa por el proceso de cuantificación con cierta profundidad de bit, y luego se codifica, es decir, se reemplaza por una secuencia de símbolos de código. Para grabar audio en la banda de frecuencia de 20 Hz - 20 kHz, se requiere una frecuencia de muestreo de 44,1 kHz o superior. Para obtener una grabación de alta calidad, una profundidad de bits de 16 bits es suficiente, sin embargo, para ampliar el rango dinámico y mejorar la calidad de la grabación de sonido, se utiliza una profundidad de bits de 24 y 32 bits.

Codificación de sonido digitalizado antes de grabarlo en el medio

Hay muchas maneras diferentes de almacenar audio digital. El sonido digitalizado es un conjunto de valores de amplitud de señal tomados en ciertos intervalos de tiempo.

Terminología
  • codificador  : un programa (o dispositivo) que implementa un algoritmo de codificación de datos específico (por ejemplo, un archivador o un codificador MP 3), que acepta información de origen como entrada y devuelve información codificada en un formato específico como salida.
  • decodificador  - un programa (o dispositivo) que implementa la transformación inversa de una señal codificada en una decodificada.
  • El códec  es una unidad de software o hardware diseñada para codificar/decodificar datos.
Algunos formatos de digitalización de audio en comparación
Nombre del formato cuantización, bit Frecuencia de muestreo, kHz Número de canales Flujo de datos de disco, kbit/s Relación compresión/embalaje
CD dieciséis 44.1 2 1411.2 1:1 sin pérdidas
Dolby Digital (AC3) 16-24 48 6 hasta 640 ~ 12: 1 con pérdida
EDE 20-24 48; 96 hasta 8 antes de 1536 ~ 3: 1 con pérdida
DVD de audio dieciséis; veinte; 24 44,1; 48; 88,2; 96 6 6912 2:1 sin pérdidas
DVD de audio dieciséis; veinte; 24 176,4; 192 2 4608 2:1 sin pérdidas
MP3 flotante hasta 48 2 hasta 320 ~ 11: 1 con pérdida
CAA flotante hasta 96 hasta 48 hasta 529 con pérdidas
AAC+ ( SBR ) flotante hasta 48 2 hasta 320 con pérdidas
Ogg Vorbis hasta 32 hasta 192 hasta 255 hasta 1000 con pérdidas
AMM hasta 24 hasta 96 hasta 8 hasta 768 2:1, hay una versión sin pérdidas

Ciclo completo de conversión de audio: desde la digitalización hasta la reproducción del consumidor

Corrección de ruido y codificación de canales

La codificación de corrección de ruido permite, durante la reproducción de la señal, identificar y eliminar (o reducir la frecuencia de su aparición) errores de lectura de los medios. Para ello, al escribir en la señal recibida a la salida del ADC, se le añade redundancia artificial (bit de control), que posteriormente ayuda a restaurar el conteo dañado. Los dispositivos de grabación de audio suelen utilizar una combinación de dos o tres códigos de corrección de errores. También se aplica intercalado para una mejor protección contra errores de ráfaga .

La codificación de canales se utiliza para hacer coincidir las señales digitales con los parámetros del canal de transmisión (grabación/reproducción). Se agregan datos auxiliares a la señal útil para facilitar la decodificación posterior. Estas pueden ser señales de código de tiempo , señales de servicio, señales de sincronización.

En los dispositivos de reproducción de señales digitales, el decodificador de canales extrae señales de reloj del flujo de datos general y convierte la señal del canal entrante en un flujo de datos digitales. Después de la corrección de errores, la señal va al DAC.

El principio de funcionamiento del DAC

La señal digital recibida del decodificador se convierte en analógica. Esta transformación se lleva a cabo de la siguiente manera:

  1. El decodificador DAC convierte la secuencia de números en una señal cuantificada discreta
  2. Al suavizar en el dominio del tiempo, se genera una señal continua en el tiempo a partir de muestras discretas
  3. La recuperación final de la señal se realiza suprimiendo los espectros laterales en un filtro de paso bajo analógico.

Parámetros que afectan la calidad del sonido cuando pasa por el ciclo completo

Los principales parámetros que afectan la calidad del sonido en este caso son:

También son importantes los parámetros de la ruta analógica de los dispositivos de codificación y decodificación digital:

Métodos de codificación

Existen varios métodos para codificar información de audio con un código binario, entre los cuales hay dos direcciones principales: el método FM y el método Wave-Table.

El método FM (Modulación de frecuencia) se basa en que teóricamente cualquier sonido complejo se puede descomponer en una secuencia de señales armónicas simples de diferentes frecuencias, cada una de las cuales será una sinusoide regular, lo que significa que se puede describir mediante un código. . El proceso de descomposición de las señales de audio en series armónicas y su representación en forma de señales digitales discretas ocurre en dispositivos especiales llamados "convertidores de analógico a digital" (ADC).

El método de tabla de ondas (Wave-Table) se basa en el hecho de que las muestras de los sonidos del mundo circundante, instrumentos musicales, etc., se almacenan en tablas preparadas previamente. Los códigos numéricos expresan el tono, la duración y la intensidad del sonido. , y otros parámetros que caracterizan las características del sonido. Dado que los sonidos “reales” se utilizan como muestras, la calidad del sonido obtenido como resultado de la síntesis es muy alta y se acerca a la calidad del sonido de los instrumentos musicales reales.

Notas

  1. 1 2 Comprender la codificación de audio . Consultado el 27 de junio de 2011. Archivado desde el original el 13 de octubre de 2011.
  2. Sonido: un poco de teoría . Consultado el 27 de junio de 2011. Archivado desde el original el 28 de junio de 2011.
  3. Sonido digital: lo primero es lo primero . Consultado el 27 de junio de 2011. Archivado desde el original el 14 de octubre de 2011.

Véase también