Codificación de audio avanzada de alta eficiencia
La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la
versión revisada el 29 de abril de 2016; las comprobaciones requieren
6 ediciones .
Codificación de audio avanzada de alta eficiencia |
---|
|
tipo MIME |
audio/aacp , audio/3gpp y audio/3gpp2 |
Desarrollador |
YO ASI |
Tipo de formato |
formato de compresión de audio |
Contenida en |
3GP , MP4 , .dvb |
Expandido desde |
Codificación de audio avanzada |
Estándar(es) |
ISO/CEI 14496-3 [1] |
HE-AAC ( Codificación de audio avanzada de alta eficiencia ) es un formato de compresión de audio con pérdida definido como perfil de audio MPEG-4 (Parte 3) en ISO/IEC 14496-3 [1] . El formato es una extensión del perfil Low Complexity AAC (AAC LC) optimizado para aplicaciones de baja tasa de bits. El perfil HE-AAC versión 1 (HE-AAC v1) utiliza tecnología de restauración de alta frecuencia SBR ( replicación de banda espectral ) para mejorar la eficiencia de codificación en el dominio de la frecuencia. En la versión 2 del perfil HE-AAC (HE-AAC v2), la tecnología SBR se combina con la tecnología Parametric Stereo para aumentar la eficiencia de la codificación estéreo . Esta es una versión estandarizada y mejorada del códec de audio AACplus
.
HE-AAC se utiliza en los estándares de transmisión de radio digital DAB+ y Digital Radio Mondiale .
Historia
- HE-AAC versión 1 fue estandarizado como perfil de audio MPEG-4 en 2003 por el grupo MPEG y publicado como parte de MPEG-4 en ISO/IEC 14496-3:2001/Amd 1:2003 [4]
- HE-AAC versión 2 se estandarizó en 2006 como ISO/IEC 14496-3:2005/Amd 2:2006 [2] [5] .
- La tecnología de codificación paramétrica (PS) de Stereo Panorama utilizada en HE-AAC v2 fue estandarizada en 2004 por el grupo MPEG y publicada en ISO/IEC 14496-3:2001/Amd 2:2004 [6] .
- HE-AAC versión 2 también fue estandarizado bajo el nombre Enhanced aacPlus por el Consorcio 3GPP para UMTS 3G Multimedia Services en septiembre de 2004 (3GPP TS 26.401). El códec de audio aacPlus mejorado se basa en las tecnologías de codificación AAC LC, SBR y estéreo paramétrico y se define en el estándar de audio MPEG-4.
- Los predecesores de las tecnologías HE-AAC fueron los de Coding Technologies, conocido bajo el nombre comercial CT-aacPlus. El códec CT-aacPlus se obtuvo combinando MPEG-2 AAC LC con la tecnología de recuperación de alta frecuencia (SBR) de Coding Technologies. CT-aacPlus se utiliza en la transmisión por satélite de XM Radio . Posteriormente, Coding Technologies propuso SBR al grupo MPEG como base para HE-AAC.
- Posteriormente, pero antes de la estandarización de HE-AAC v2 por parte del grupo MPEG, Coding Technologies propuso fusionar HE-AAC v1 con la tecnología de codificación paramétrica estéreo 3GPP denominada Enhanced AAC+. Como resultado, aacPlus v2 y eAAC+ son ahora las marcas comerciales más conocidas de la tecnología HE-AAC v2. AAC+ y aacPlus son marcas comerciales de la tecnología HE-AAC v1.
Funciones de codificación
Las tecnologías AAC, SBR y Parametric Stereo son los componentes principales del perfil MPEG-4 HE-AAC v2.
- El códec AAC se utiliza para codificar el rango bajo y medio.
- En el corazón de la tecnología de restauración de alta frecuencia (SBR) se encuentra la estricta relación identificada entre las características de los rangos de alta y baja frecuencia de la señal de audio. Por lo tanto, se puede lograr una restauración muy adecuada del rango de alta frecuencia de la señal de audio original mediante la transposición (desplazamiento) de la región de baja frecuencia a la región de alta frecuencia. Antes de codificar, se analiza el rango de alta frecuencia (por encima de 7 kHz) en la señal de audio digital original y se extrae información sobre algunos de sus parámetros: por ejemplo, la envolvente espectral de la señal de entrada. Luego, después de la eliminación del exceso de componentes de alta frecuencia, se transmite al codificador un pequeño flujo de datos sobre las altas frecuencias eliminadas necesarias para su restauración, y solo se codifican las frecuencias bajas y medias restantes [7] .
- Codificación estéreo paramétrica, es decir, un método que aumenta la eficiencia de la codificación de señales estéreo cuando se transmiten datos de audio con una tasa de bits baja. La señal estéreo de entrada se mezcla en una señal mono y se analizan los parámetros que describen el panorama estéreo. Los parámetros estéreo requieren una pequeña fracción (2-3 kbps) del flujo de salida total requerido para transmitir una señal mono de calidad aceptable. Los dos parámetros utilizados para describir la información estéreo son panorama y ambiente. El parámetro pan contiene información de diferencia entre los canales derecho e izquierdo en diferentes bandas de frecuencia. De manera similar, el parámetro de entorno describe el entorno estéreo para un grupo de bandas de frecuencia. Ambos parámetros se codifican utilizando principios de codificación de entropía similares en el dominio de tiempo-frecuencia que se aplican a las envolventes SBR. También se aplica la cuantificación [7] .
Versiones
Comparación de versiones de códec HE-AAC:
Versión
|
Marca principal
|
Características del códec
|
Estándar
|
HE-AACv1
|
aacPlus v1, eAAC, AAC+, CT-aacPlus
|
AACLC+SBR
|
ISO/IEC 14496-3:2001/Amd 1:2003
|
HE-AAC v2
|
aacPlus v2, eAAC+, AAC++, AAC+ mejorado
|
AAC LC+SBR+PS
|
ISO/IEC 14496-3:2005/Amd 2:2006
|
Véase también
Notas
- ↑ 12ISO._ _ _ _ ISO/IEC 14496-3:1999 - Tecnología de la información - Codificación de objetos audiovisuales - Parte 3: Audio (enlace no disponible) . ISO (1999). Consultado el 16 de marzo de 2011. Archivado desde el original el 16 de febrero de 2012. (indefinido)
- ↑ 1 2 ISO/IEC JTC1/SC29/WG11/N7016 (2005-01-11), Texto de ISO/IEC 14496-3:2001/FPDAM 4, Audio Lossless Coding (ALS), nuevos perfiles de audio y extensiones BSAC , < http://www.itscj.ipsj.or.jp/sc29/open/29view/29n6475t.doc > . Consultado el 16 de marzo de 2011. Archivado el 3 de mayo de 2011 en Wayback Machine .
- ↑ Fraunhofer IIS, Tecnología de audio y video MPEG-4 , < http://www.itu.int/dms_pub/itu-r/oth/0A/07/R0A0700001F0001PDFE.pdf > . Consultado el 16 de marzo de 2011. Archivado el 4 de enero de 2012 en Wayback Machine .
- ↑ ISO. Extensión de ancho de banda, ISO/IEC 14496-3:2001/Amd 1:2003 (enlace no disponible) . ISO (2003). Consultado el 16 de marzo de 2011. Archivado desde el original el 16 de febrero de 2012. (indefinido)
- ↑ ISO. Codificación sin pérdida de audio (ALS), nuevos perfiles de audio y extensiones BSAC, ISO/IEC 14496-3:2005/Amd 2:2006 (enlace no disponible) . ISO (2006). Consultado el 16 de marzo de 2011. Archivado desde el original el 16 de febrero de 2012. (indefinido)
- ↑ ISO. Codificación paramétrica para audio de alta calidad, ISO/IEC 14496-3:2001/Amd 2:2004 (enlace no disponible) . ISO (2004). Consultado el 16 de marzo de 2011. Archivado desde el original el 16 de febrero de 2012. (indefinido)
- ↑ 1 2 Tecnología de replicación de banda espectral (SBR) y su aplicación en Broadcastin Archivado el 9 de marzo de 2011.
Enlaces
MPEG (Grupo de expertos en imágenes en movimiento) |
---|
|
Secciones MPEG-1 |
|
---|
Secciones MPEG-2 |
|
---|
Secciones MPEG-4 |
|
---|
Secciones MPEG-7 |
- Parte 2: Lenguaje de descripción de definiciones (DDL)
|
---|
Secciones MPEG-21 |
- Partes 2, 3 y 9: Objeto Digital
- Parte 5: Lenguaje de descripción de derechos (REL)
|
---|
Secciones MPEG-D |
- Parte 1: audio espacial MPEG
|
---|