Capa de audio MPEG-1 I

Capa 1 de audio MPEG-1
Extensión	.mp1o.m1a
tipo MIME	audio/mpeg [1] , audio/MPA [2]
Desarrollador	ISO , CEI
Tipo de formato	audio
Estándar(es)	ISO/CEI 11172-3 [3] , ISO/CEI 13818-3 [4]
Sitio web	mpeg.chiariglione.org

MPEG-1 Audio Layer I (abreviatura MP1 ) es uno de los tres formatos de compresión de audio con pérdida (nivel 1) definidos en el estándar MPEG-1 [5] . Si bien MPEG-1 Audio Layer I es compatible con la mayoría de los reproductores multimedia modernos , el formato se considera obsoleto. En su lugar, se utilizan principalmente los formatos MP2 y MP3 .

Los archivos que contienen solo información de audio MP1 usan la extensión .mp1 o, a veces, .m1a.

La tecnología de compresión MP1 utiliza un esquema de codificación de banda relativamente simple con 32 subbandas.

La capa I (capa 1) se recomienda para uso profesional en sistemas de grabación/regrabación de alta calidad de estudio con suficiente capacidad de memoria. Se caracteriza por una baja complejidad y un bajo grado de reducción de datos de audio.

La capa I de MPEG-1 también se usó en el casete compacto digital como parte del códec de audio PASC ( Codificación de subbanda adaptativa de precisión ) . Debido a la necesidad de transferir un flujo constante de bloques de datos individuales (fotogramas) a la cinta, PASC utilizó un bit adicional en el encabezado MPEG para determinar el inicio de un fotograma. La tasa de bits es siempre de 384 kbps [6] .

Parámetros básicos

MPEG-1 Layer I está estandarizado por ISO/IEC 11172-3, publicado por primera vez en 1993.
- Número de canales: 1 o 2.
- Frecuencias de muestreo: 32, 44,1 y 48 kHz.
- Tasa de bits: 32, 64, 96, 128, 160, 192, 224, 256, 288, 320, 352, 384, 416 y 448 kbps [7]
La extensión de formato se introdujo en MPEG-2 Audio Layer I y se definió en ISO/IEC 13818-3 (MPEG-2 Parte 3) [8] , la primera edición se publicó en 1995 [4]
- frecuencias de muestreo adicionales: 16, 22,05 y 24 kHz
- bitrates adicionales: 48, 56, 80, 112, 144 y 176 kbps.

Codificación y decodificación de audio MPEG-1 Layer I

Método de codificación

La señal de audio digital de entrada se divide en cuadros (frames), cada uno de los cuales se codifica y decodifica independientemente de otros cuadros. El tamaño de cuadro para la Capa I es de 384 muestras.

La banda de la señal de audio se divide en 32 subbandas utilizando filtros de paso de banda digitales. Todas las subbandas tienen el mismo ancho, que depende de la frecuencia de muestreo de la señal de entrada. Después de la división, la frecuencia de muestreo se reduce en un factor de 32, de modo que el número de muestras por cuadro en cada subbanda es 12.

Entonces los datos se cuantifican. Los factores de escala se determinan preliminarmente, que dependen del valor máximo de la señal. En este caso, el factor de escala se determina para cada subbanda del cuadro, es decir, para 12 muestras de la señal de subbanda. Antes de la cuantificación, los valores de la señal se dividen por los factores de escala apropiados.

Luego, la cuantificación de datos se realiza en el bloque de cuantificación y codificación. La compresión de la información de audio en el nivel de la Capa I se basa en un método denominado asignación de bits adaptable. Este método consiste en realizar la cuantificación con un número diferente de bits de cuantificación para diferentes subbandas de frecuencia. En este caso, se utiliza la cuantificación uniforme. El número total de bits asignados a todas las subbandas en un cuadro dado depende de la tasa de muestreo de la señal de entrada y de la tasa de bits de salida dada, es decir, del grado requerido de compresión de la información de audio. La distribución de bits sobre subbandas se realiza mediante el bloque modelo psicoacústico .

Para realizar la distribución de bits en el bloque del modelo psicoacústico, se analiza el espectro de la señal de audio original (no descompuesto en subbandas). Para ello, se realiza una transformada rápida de Fourier de tramos de esta señal en 512 muestras, tras lo cual se calcula el espectro de potencia de la señal sonora y la magnitud de la presión sonora en cada subbanda de frecuencia.

Luego, se analizan los componentes tonales (sinusoidales) y no tonales de la señal de audio, se determinan los umbrales de enmascaramiento locales y globales y se calculan las relaciones señal/máscara para todas las subbandas, en función de las cuales se asignan los bits a las subbandas.

En aquellas subbandas en las que la distorsión de audio causada por la cuantificación es menos perceptible para el oyente o está enmascarada por un mayor nivel de señal en otras subbandas, la cuantificación se hace más gruesa, es decir, se asignan menos bits para estas subbandas. Para subbandas completamente enmascaradas, no se asignan bits en absoluto. Gracias a esto, es posible reducir significativamente la cantidad de información transmitida manteniendo una calidad de sonido suficientemente alta.

Decodificación

Los datos contenidos en la trama se decodifican de acuerdo con su orden y tablas de códigos contenidas en el programa de trabajo del decodificador. La distribución de bits decodificados y los datos del factor de escala se utilizan para decodificar y descuantificar los datos de audio. Después de la descuantificación, las muestras de las señales de subbanda se multiplican por los factores de escala correspondientes.

Después de la decodificación y descuantificación, las muestras de señal de todas las subbandas se combinan en una señal de audio digital de salida.

Literatura

Smirnov A.V. Fundamentos de la televisión digital: Libro de texto - M.: Hotline-Telecom, 2001. - 224 p.: ill.

Enlaces

Compresión de audio digital: fundamentos psicoacústicos y algoritmos. Yuri Kovalguin

Véase también

MPEG-1
- Capa de audio MPEG-1 II
- MPEG-1 Capa III (MP3)
MPEG-2
- AAC (MPEG-2 Parte 7) : actualizado en 1999 e incluido en MPEG-4 Parte 3
MPEG-4
- AAC (MPEG-4 Parte 3)

Notas

↑ El tipo de medio de audio/mpeg - RFC 3003 (enlace descendente) . IETF (noviembre de 2000). Consultado el 15 de marzo de 2011. Archivado desde el original el 23 de marzo de 2012. (indefinido)
↑ Registro de tipo MIME de formatos de carga útil RTP - RFC 3555 (enlace no disponible) . IETF (julio de 2003). Consultado el 15 de marzo de 2011. Archivado desde el original el 23 de marzo de 2012. (indefinido)
↑ ISO/IEC 11172-3:1993 - Tecnología de la información -- Codificación de imágenes en movimiento y audio asociado para medios de almacenamiento digital hasta aproximadamente 1,5 Mbit/s -- Parte 3: Audio (enlace descendente) . ISO (1993). Consultado el 15 de marzo de 2011. Archivado desde el original el 23 de marzo de 2012. (indefinido)
↑ 1 2 ISO/IEC 13818-3:1995 - Tecnología de la información - Codificación genérica de imágenes en movimiento e información de audio asociada - Parte 3: Audio (enlace descendente) . ISO (1995). Consultado el 15 de marzo de 2011. Archivado desde el original el 23 de marzo de 2012. (indefinido)
↑ ISO/IEC 11172-3 "Codificación de imágenes en movimiento y audio asociado para medios de almacenamiento digital hasta aproximadamente 1,5 mbit/s. Audio parte 3»
↑ Casete compacto digital. Preguntas frecuentes
↑ Encabezado de cuadro de audio MPEG Archivado el 8 de febrero de 2015.
↑ ISO/IEC 13818-3 (segunda edición, 15 de abril de 1998) . Consultado el 15 de marzo de 2011. Archivado desde el original el 8 de agosto de 2011. (indefinido)

MPEG (Grupo de expertos en imágenes en movimiento)
MPEG-1 2 3 cuatro 7 21 A B C D mi V METRO tu
Secciones MPEG-1	Parte 3: Audio ( Capa I Capa II capa III )
Secciones MPEG-2	Parte 1: Sistemas ( Flujo de tráfico flujo del programa ) Parte 2: Vídeo (H.262) Parte 3: Audio ( Capa I Capa II Capa III MPEG multicanal ) Parte 6: DSM CC Parte 7: CAA
Secciones MPEG-4	Parte 2: Vídeo Parte 3: HE-AAC Parte 6: DMIF Parte 10: H.264 Parte 11: Descripción de la escena Parte 12: formato de archivo multimedia ISO Parte 14: formato de archivo MP4 Parte 17: Formato de transmisión de texto Parte 20: Aplicación de reproducción de escenas ligeras (LASeR)
Secciones MPEG-7	Parte 2: Lenguaje de descripción de definiciones (DDL)
Secciones MPEG-21	Partes 2, 3 y 9: Objeto Digital Parte 5: Lenguaje de descripción de derechos (REL)
Secciones MPEG-D	Parte 1: audio espacial MPEG

Compresión de audio
Códecs	ATRAC Dolby Digital /AC3 EDE musepack Opus TwinVQ (VQF) Vorbis AMM
Habla/voz	AMBÉ iLBC IMBE iSAC Nellymoser QCELP RTAudio SEDA Sirena Speex SVOPC veracidad
sin pérdidas	pérdida de manzana FLAC La audio de mono OptimFROG TAK Audio verdadero/ TTA paquete wav WMA sin pérdidas
Estándares y formatos	CAA RAM GRAMO. 711 718 719 722 723 723.1 726 728 729 729.1 729A HE-AAC MLP Audio MPEG-1 Capa I Capa II Capa III MT9 RealMedia SHN
Formatos de audio digital Comparación de formatos de audio digital

contenedores de medios
Audio video	3gp PPA AVI Bink DMF DPX Evo FLV MP4 MPEG MPEG-PS MPEG-TS MXF Matrosca (MKV) Medios Ogg Ogg Tiempo rapido RIFLE RealMedia Besazo VOB WebM WMV compresión comparación
Audio	AIFF MONO AU DDS DXD FLAC MLP MP3 SHN WAV AMM compresión comparación
Música	MIDI ( KAR ) rastreador de musica
Ráster	DNG FPX FLIF HEIF RCEI OIC ILBM JBIG2 JBIG JPEG XR (foto HD) JPEG / JP2 / JPEG-LS MNG EXR PCX PNG PSD PNM Crudo PELEA TGA WBMP WebP XCF PGF Animado: APNG , GIF Sin pérdidas: BMP Incluye compresión con pérdida: BPG
Vector	SWF AI CDR EPS PD SVG VRML campos electromagnéticos WMF X3D XPS 3D: 3DS Animado: SVG
Complejo	MCG DjVu PDF