Capa 1 de audio MPEG-1 | |
---|---|
Extensión | .mp1o.m1a |
tipo MIME | audio/mpeg [1] , audio/MPA [2] |
Desarrollador | ISO , CEI |
Tipo de formato | audio |
Estándar(es) |
ISO/CEI 11172-3 [3] , ISO/CEI 13818-3 [4] |
Sitio web | mpeg.chiariglione.org |
MPEG-1 Audio Layer I (abreviatura MP1 ) es uno de los tres formatos de compresión de audio con pérdida (nivel 1) definidos en el estándar MPEG-1 [5] . Si bien MPEG-1 Audio Layer I es compatible con la mayoría de los reproductores multimedia modernos , el formato se considera obsoleto. En su lugar, se utilizan principalmente los formatos MP2 y MP3 .
Los archivos que contienen solo información de audio MP1 usan la extensión .mp1 o, a veces, .m1a.
La tecnología de compresión MP1 utiliza un esquema de codificación de banda relativamente simple con 32 subbandas.
La capa I (capa 1) se recomienda para uso profesional en sistemas de grabación/regrabación de alta calidad de estudio con suficiente capacidad de memoria. Se caracteriza por una baja complejidad y un bajo grado de reducción de datos de audio.
La capa I de MPEG-1 también se usó en el casete compacto digital como parte del códec de audio PASC ( Codificación de subbanda adaptativa de precisión ) . Debido a la necesidad de transferir un flujo constante de bloques de datos individuales (fotogramas) a la cinta, PASC utilizó un bit adicional en el encabezado MPEG para determinar el inicio de un fotograma. La tasa de bits es siempre de 384 kbps [6] .
La señal de audio digital de entrada se divide en cuadros (frames), cada uno de los cuales se codifica y decodifica independientemente de otros cuadros. El tamaño de cuadro para la Capa I es de 384 muestras.
La banda de la señal de audio se divide en 32 subbandas utilizando filtros de paso de banda digitales. Todas las subbandas tienen el mismo ancho, que depende de la frecuencia de muestreo de la señal de entrada. Después de la división, la frecuencia de muestreo se reduce en un factor de 32, de modo que el número de muestras por cuadro en cada subbanda es 12.
Entonces los datos se cuantifican. Los factores de escala se determinan preliminarmente, que dependen del valor máximo de la señal. En este caso, el factor de escala se determina para cada subbanda del cuadro, es decir, para 12 muestras de la señal de subbanda. Antes de la cuantificación, los valores de la señal se dividen por los factores de escala apropiados.
Luego, la cuantificación de datos se realiza en el bloque de cuantificación y codificación. La compresión de la información de audio en el nivel de la Capa I se basa en un método denominado asignación de bits adaptable. Este método consiste en realizar la cuantificación con un número diferente de bits de cuantificación para diferentes subbandas de frecuencia. En este caso, se utiliza la cuantificación uniforme. El número total de bits asignados a todas las subbandas en un cuadro dado depende de la tasa de muestreo de la señal de entrada y de la tasa de bits de salida dada, es decir, del grado requerido de compresión de la información de audio. La distribución de bits sobre subbandas se realiza mediante el bloque modelo psicoacústico .
Para realizar la distribución de bits en el bloque del modelo psicoacústico, se analiza el espectro de la señal de audio original (no descompuesto en subbandas). Para ello, se realiza una transformada rápida de Fourier de tramos de esta señal en 512 muestras, tras lo cual se calcula el espectro de potencia de la señal sonora y la magnitud de la presión sonora en cada subbanda de frecuencia.
Luego, se analizan los componentes tonales (sinusoidales) y no tonales de la señal de audio, se determinan los umbrales de enmascaramiento locales y globales y se calculan las relaciones señal/máscara para todas las subbandas, en función de las cuales se asignan los bits a las subbandas.
En aquellas subbandas en las que la distorsión de audio causada por la cuantificación es menos perceptible para el oyente o está enmascarada por un mayor nivel de señal en otras subbandas, la cuantificación se hace más gruesa, es decir, se asignan menos bits para estas subbandas. Para subbandas completamente enmascaradas, no se asignan bits en absoluto. Gracias a esto, es posible reducir significativamente la cantidad de información transmitida manteniendo una calidad de sonido suficientemente alta.
Los datos contenidos en la trama se decodifican de acuerdo con su orden y tablas de códigos contenidas en el programa de trabajo del decodificador. La distribución de bits decodificados y los datos del factor de escala se utilizan para decodificar y descuantificar los datos de audio. Después de la descuantificación, las muestras de las señales de subbanda se multiplican por los factores de escala correspondientes.
Después de la decodificación y descuantificación, las muestras de señal de todas las subbandas se combinan en una señal de audio digital de salida.
Compresión de audio digital: fundamentos psicoacústicos y algoritmos. Yuri Kovalguin
MPEG (Grupo de expertos en imágenes en movimiento) | |
---|---|
Secciones MPEG-1 | |
Secciones MPEG-2 |
|
Secciones MPEG-4 |
|
Secciones MPEG-7 |
|
Secciones MPEG-21 |
|
Secciones MPEG-D |
|
Compresión de audio | |
---|---|
Códecs | |
Habla/voz | |
sin pérdidas |
|
Estándares y formatos | |
contenedores de medios | |
---|---|
Audio video | |
Audio | |
Música | |
Ráster | |
Vector | |
Complejo |