Capa de audio MPEG-1 I

Capa 1 de audio MPEG-1
Extensión .mp1o.m1a
tipo MIME audio/mpeg [1] , audio/MPA [2]
Desarrollador ISO , CEI
Tipo de formato audio
Estándar(es) ISO/CEI 11172-3 [3] ,
ISO/CEI 13818-3 [4]
Sitio web mpeg.chiariglione.org

MPEG-1 Audio Layer I (abreviatura MP1 ) es uno de los tres formatos de compresión de audio con pérdida (nivel 1) definidos en el estándar MPEG-1 [5] . Si bien MPEG-1 Audio Layer I es compatible con la mayoría de los reproductores multimedia modernos , el formato se considera obsoleto. En su lugar, se utilizan principalmente los formatos MP2 y MP3 .

Los archivos que contienen solo información de audio MP1 usan la extensión .mp1 o, a veces, .m1a.

La tecnología de compresión MP1 utiliza un esquema de codificación de banda relativamente simple con 32 subbandas.

La capa I (capa 1) se recomienda para uso profesional en sistemas de grabación/regrabación de alta calidad de estudio con suficiente capacidad de memoria. Se caracteriza por una baja complejidad y un bajo grado de reducción de datos de audio.

La capa I de MPEG-1 también se usó en el casete compacto digital como parte del códec de audio PASC ( Codificación de subbanda adaptativa de precisión  ) .  Debido a la necesidad de transferir un flujo constante de bloques de datos individuales (fotogramas) a la cinta, PASC utilizó un bit adicional en el encabezado MPEG para determinar el inicio de un fotograma. La tasa de bits es siempre de 384 kbps [6] .

Parámetros básicos

Codificación y decodificación de audio MPEG-1 Layer I

Método de codificación

La señal de audio digital de entrada se divide en cuadros (frames), cada uno de los cuales se codifica y decodifica independientemente de otros cuadros. El tamaño de cuadro para la Capa I es de 384 muestras.

La banda de la señal de audio se divide en 32 subbandas utilizando filtros de paso de banda digitales. Todas las subbandas tienen el mismo ancho, que depende de la frecuencia de muestreo de la señal de entrada. Después de la división, la frecuencia de muestreo se reduce en un factor de 32, de modo que el número de muestras por cuadro en cada subbanda es 12.

Entonces los datos se cuantifican. Los factores de escala se determinan preliminarmente, que dependen del valor máximo de la señal. En este caso, el factor de escala se determina para cada subbanda del cuadro, es decir, para 12 muestras de la señal de subbanda. Antes de la cuantificación, los valores de la señal se dividen por los factores de escala apropiados.

Luego, la cuantificación de datos se realiza en el bloque de cuantificación y codificación. La compresión de la información de audio en el nivel de la Capa I se basa en un método denominado asignación de bits adaptable. Este método consiste en realizar la cuantificación con un número diferente de bits de cuantificación para diferentes subbandas de frecuencia. En este caso, se utiliza la cuantificación uniforme. El número total de bits asignados a todas las subbandas en un cuadro dado depende de la tasa de muestreo de la señal de entrada y de la tasa de bits de salida dada, es decir, del grado requerido de compresión de la información de audio. La distribución de bits sobre subbandas se realiza mediante el bloque modelo psicoacústico .

Para realizar la distribución de bits en el bloque del modelo psicoacústico, se analiza el espectro de la señal de audio original (no descompuesto en subbandas). Para ello, se realiza una transformada rápida de Fourier de tramos de esta señal en 512 muestras, tras lo cual se calcula el espectro de potencia de la señal sonora y la magnitud de la presión sonora en cada subbanda de frecuencia.

Luego, se analizan los componentes tonales (sinusoidales) y no tonales de la señal de audio, se determinan los umbrales de enmascaramiento locales y globales y se calculan las relaciones señal/máscara para todas las subbandas, en función de las cuales se asignan los bits a las subbandas.

En aquellas subbandas en las que la distorsión de audio causada por la cuantificación es menos perceptible para el oyente o está enmascarada por un mayor nivel de señal en otras subbandas, la cuantificación se hace más gruesa, es decir, se asignan menos bits para estas subbandas. Para subbandas completamente enmascaradas, no se asignan bits en absoluto. Gracias a esto, es posible reducir significativamente la cantidad de información transmitida manteniendo una calidad de sonido suficientemente alta.

Decodificación

Los datos contenidos en la trama se decodifican de acuerdo con su orden y tablas de códigos contenidas en el programa de trabajo del decodificador. La distribución de bits decodificados y los datos del factor de escala se utilizan para decodificar y descuantificar los datos de audio. Después de la descuantificación, las muestras de las señales de subbanda se multiplican por los factores de escala correspondientes.

Después de la decodificación y descuantificación, las muestras de señal de todas las subbandas se combinan en una señal de audio digital de salida.

Literatura

Enlaces

Compresión de audio digital: fundamentos psicoacústicos y algoritmos. Yuri Kovalguin

Véase también

Notas

  1. El tipo de medio de audio/mpeg - RFC 3003 (enlace descendente) . IETF (noviembre de 2000). Consultado el 15 de marzo de 2011. Archivado desde el original el 23 de marzo de 2012. 
  2. Registro de tipo MIME de formatos de carga útil RTP - RFC 3555 (enlace no disponible) . IETF (julio de 2003). Consultado el 15 de marzo de 2011. Archivado desde el original el 23 de marzo de 2012. 
  3. ISO/IEC 11172-3:1993 - Tecnología de la información -- Codificación de imágenes en movimiento y audio asociado para medios de almacenamiento digital hasta aproximadamente 1,5 Mbit/s -- Parte 3: Audio (enlace descendente) . ISO (1993). Consultado el 15 de marzo de 2011. Archivado desde el original el 23 de marzo de 2012. 
  4. 1 2 ISO/IEC 13818-3:1995 - Tecnología de la información - Codificación genérica de imágenes en movimiento e información de audio asociada - Parte 3: Audio (enlace descendente) . ISO (1995). Consultado el 15 de marzo de 2011. Archivado desde el original el 23 de marzo de 2012. 
  5. ISO/IEC 11172-3 "Codificación de imágenes en movimiento y audio asociado para medios de almacenamiento digital hasta aproximadamente 1,5 mbit/s. Audio parte 3»
  6. Casete compacto digital. Preguntas frecuentes
  7. Encabezado de cuadro de audio MPEG Archivado el 8 de febrero de 2015.
  8. ISO/IEC 13818-3 (segunda edición, 15 de abril de 1998) . Consultado el 15 de marzo de 2011. Archivado desde el original el 8 de agosto de 2011.