H.265 o HEVC ( codificación de video de alta eficiencia ) es un formato de compresión de video que utiliza algoritmos más eficientes en comparación con H.264/MPEG-4 AVC [1] . La recomendación CCITT H.265, así como ISO/IEC 23008-2 MPEG-H Parte 2, es un desarrollo conjunto del Grupo de expertos en codificación de video (VCEG) del CCITT y el Grupo de expertos en imágenes en movimiento MPEG [2] . La recomendación del estándar se desarrolló en respuesta a la creciente necesidad de una mayor compresión de imágenes en movimiento para una amplia variedad de aplicaciones, como transmisión por Internet, transmisión de datos, videoconferencias, dispositivos de almacenamiento digital y transmisión de televisión [3] .
Se admiten formatos de fotogramas de hasta 8K ( UHDTV ) con una resolución de 8192 × 4320 píxeles [4] .
En 2004, VCEG comenzó a investigar el desarrollo de tecnologías que permitirían la creación de un nuevo estándar de compresión de video (o una mejora significativa del estándar H.264/MPEG-4 AVC). En octubre de 2004, se hizo una revisión de varias formas en las que H.264/MPEG-4 AVC podría mejorarse [5] .
H.265 originalmente estaba destinado a ser un estándar completamente nuevo, no una extensión de H.264 como HVC (codificación de video de alto rendimiento). Como parte del proyecto, se asignaron los nombres provisionales H.265 y H.NGVC ( English Next-generation Video Coding - la próxima generación de codificación de video), también hubo una parte importante del trabajo de VCEG antes de su evolución a HEVC. , un proyecto conjunto con MPEG en 2010. En abril de 2009, el proyecto se denominó NGVC; en julio de 2009, se llevó a cabo una reunión entre MPEG y VCEG, donde se discutió un mayor trabajo conjunto sobre NGVC y HVC.
Los requisitos previos para NGVC son una reducción del 50 % en la tasa de bits con una calidad de imagen subjetiva similar y una complejidad computacional comparable a H.264 de alto perfil. Dependiendo de la configuración, se espera que la complejidad computacional varíe de 1/2 a 3 en comparación con H.264 de perfil alto, mientras que en el primer caso NGVC debería proporcionar una tasa de bits un 25 % más baja [6] .
El Grupo de expertos en imágenes en movimiento de ISO/IEC (MPEG) inició un proyecto similar en 2007 , llamado provisionalmente Codificación de video de alto rendimiento. En julio de 2007, se tomó la decisión como objetivo del proyecto de lograr una reducción del 50% en la tasa de bits [7] . Para julio de 2009, los resultados del experimento mostraron una reducción promedio de la tasa de bits de alrededor del 20 % en comparación con AVC High Profile; estos resultados impulsaron a MPEG a comenzar la estandarización en colaboración con VCEG.
Para desarrollar el estándar MPEG y VCEG, crearon el Equipo colaborativo conjunto sobre codificación de video (JCT-VC) (Rec. UIT-T H.264|ISO/IEC 14496-10) [8] . La primera reunión del Equipo Conjunto de Codificación de Video (JCT-VC) se llevó a cabo en abril de 2010 . Se presentaron 27 proyectos completos. Las evaluaciones han demostrado que algunas propuestas pueden lograr la misma calidad de imagen que AVC con solo la mitad de la tasa de bits en muchas pruebas, de 2 a 10 veces la complejidad computacional, y algunos diseños han logrado una buena calidad subjetiva y buenos resultados de tasa de bits con menor complejidad computacional que codificación de referencia AVC de alto perfil. En esta reunión, se adoptó el nombre del proyecto conjunto - Codificación de video de alta eficiencia (HEVC) [9] .
El Comité del Proyecto HEVC fue aprobado en febrero de 2012 . En junio de 2012, MPEG LA anunció que había iniciado el proceso de aceptación de licencias conjuntas para patentes HEVC. Un borrador de Norma Internacional fue aprobado en julio de 2012 en una reunión celebrada en Estocolmo. Fröjdh, presidente de la delegación sueca de MPEG, cree que los productos comerciales compatibles con HEVC podrían lanzarse en 2013 [10] .
El 29 de febrero de 2012 en el Mobile World Congress , Qualcomm mostró un decodificador HEVC ejecutándose en una tableta Android con un procesador Qualcomm Snapdragon S4 de doble núcleo a 1,5 GHz. Se mostraron dos versiones del video con el mismo contenido, codificado en H.264/MPEG-4 AVC y HEVC. En este programa, HEVC mostró una reducción de casi el 50 % en la tasa de bits en comparación con H.264/MPEG-4 AVC [11] .
El 31 de agosto de 2012, Allegro DVT anunció el lanzamiento de dos codificadores de transmisión HEVC: el codificador HD-SDI AL1200 y el transcodificador IP AL2200 [12] . Allegro DVT declaró que los decodificadores de hardware HEVC no deberían esperarse hasta 2014, pero HEVC podría usarse antes en aplicaciones de decodificación de software. En IBC 2012, Allegro DVT mostró sistemas de transmisión IP HEVC basados en el transcodificador IP AL2200.
Ericsson en septiembre de 2012 en la Convención Internacional de Radiodifusión (IBC) presentó el primer codificador HEVC del mundo: Ericsson SVP 5500, diseñado para codificar video en tiempo real para transmitir televisión terrestre en redes móviles [13] .
En abril de 2013, el borrador fue adoptado como norma ITU-T [3] .
A principios de 2017, todos los principales fabricantes de procesadores implementaron soporte parcial para el estándar HEVC a nivel de hardware.
Se han propuesto muchas características nuevas como requisitos para el estándar:
Se supone que estas técnicas traerán el mayor beneficio en la codificación multipaso [14] .
El desarrollo de la mayoría de los estándares de codificación de video está diseñado principalmente para lograr la mayor eficiencia de codificación. La eficiencia de codificación se define como la capacidad de codificar video a la tasa de bits más baja posible mientras se mantiene un cierto nivel de calidad de video . Hay dos formas estándar de medir el rendimiento de la codificación de video, una es usar una métrica objetiva como la relación pico de señal a ruido (PSNR) y la otra es usar una medida subjetiva de la calidad del video. La evaluación subjetiva de la calidad de la imagen es el parámetro más importante para evaluar la codificación de video, ya que los espectadores perciben la calidad del video de manera subjetiva.
En lugar de los macrobloques utilizados en H.264, HEVC utiliza bloques con una estructura de codificación en forma de árbol. La ventaja del codificador HEVC está en el uso de bloques más grandes. Esto se demostró en las pruebas de PSNR con el modelo de codificador HM-8.0, donde los resultados de codificación se compararon con diferentes tamaños de bloque. Como resultado de las pruebas, se demostró que, en comparación con la codificación de bloques de 64×64 píxeles, la tasa de bits aumenta un 2,2 % cuando se utilizan bloques de 32×32 y aumenta un 11,0 % cuando se utilizan bloques de 16×16. . En pruebas de codificación de video con una resolución de 2560x1600 píxeles, al usar bloques de 32x32 píxeles, el bitrate aumenta en un 5,7%, y al usar bloques de 16x16 píxeles, en un 28,2% en comparación con video donde los bloques de tamaño 64x64, con el misma relación pico de señal a ruido. Las pruebas han demostrado que el uso de bloques más grandes es más eficiente al codificar video de alta resolución. Las pruebas también han demostrado que el vídeo codificado con bloques de 16x16 tarda un 60 % más en decodificarse que cuando se utilizan bloques de 64x64. Es decir, el uso de bloques más grandes aumenta la eficiencia de codificación y reduce el tiempo de decodificación [15] .
La eficiencia de codificación del perfil principal H.265 se comparó con H.264/MPEG-4 AVC High Profile (HP), MPEG-4 Advanced Simple Profile (ASP), H.263 High Profile Latency (HLP) y H.262/ Perfil principal MPEG-2 (MP). Los videos de entretenimiento y nueve secuencias de video de prueba a 12 tasas de bits diferentes se codificaron utilizando el modelo de prueba HEVC HM-8.0, cinco de ellos en resolución HD y cuatro en resolución WVGA (800 × 480). La reducción de la tasa de bits se determinó sobre la base de PSNR [15] .
Estándar de codificación de video | Reducción de la tasa de bits promedio | |||
---|---|---|---|---|
H.264/MPEG-4 AVCHP | ASP MPEG-4 | H.263 HLP | H.262/MPEG-2MP | |
MP HEVC | 35,4% | 63,7% | 65,1% | 70,8% |
H.264/MPEG-4 AVCHP | - | 44,5% | 46,6% | 55,4% |
ASP MPEG-4 | - | - | 3,9% | 19,7% |
H.263 HLP | - | - | - | 16,2% |
Al codificar video en HEVC, se utiliza el mismo enfoque "híbrido" que en todos los códecs modernos, comenzando con H.261. Consiste en aplicar predicción intra- e inter-frame (Intra-/Inter-) y codificación de transformada bidimensional.
En el codificador HEVC, cada cuadro de video se divide en bloques. El primer cuadro de la secuencia de video se codifica utilizando solo la predicción dentro del cuadro, es decir, la predicción espacial del nivel de muestra esperado dentro del cuadro se aplica a las muestras adyacentes, mientras que no hay dependencia de otros cuadros. Para la mayoría de los bloques de todos los demás cuadros de la secuencia, por regla general, se usa el modo de predicción temporal entre cuadros. En el modo de predicción entre fotogramas, basándose en los datos sobre el valor de las muestras del fotograma de referencia y el vector de movimiento, se estiman las muestras actuales de cada bloque. El codificador y el decodificador crean predicciones idénticas entre fotogramas al aplicar un algoritmo de compensación de movimiento utilizando vectores de movimiento y datos de modo seleccionado, que se transmiten como información adicional.
La señal de diferencia de predicción, que es la diferencia entre un bloque de referencia de un cuadro y su predicción, sufre una transformación espacial lineal. Luego, los coeficientes de transformación se escalan, cuantifican, se aplica la codificación de entropía y luego se transmiten junto con la información de predicción.
El codificador repite exactamente el ciclo de procesamiento del decodificador, de modo que en ambos casos se generarán predicciones idénticas de los datos subsiguientes. Por lo tanto, los coeficientes cuantificados transformados se desescalan y luego se destransforman para repetir el valor de la señal de diferencia decodificada. Luego, la diferencia se agrega a la predicción y el resultado resultante se filtra para suavizar los artefactos de bloqueo y cuantificación. La representación del cuadro final (idéntica al cuadro en la salida del decodificador) se almacena en el búfer de cuadros decodificados, que se utilizará para predecir cuadros posteriores. Como resultado, el orden en que se codifican y decodifican los marcos de procesamiento a menudo difiere del orden en que provienen de la fuente.
Se supone que el material de video en la entrada del codificador HEVC es un escaneo progresivo. HEVC no proporciona funciones de codificación entrelazadas explícitas, ya que no se usa en pantallas modernas y su distribución está disminuyendo. Sin embargo, HEVC introdujo metadatos para indicarle al codificador que el video entrelazado se codificó en uno de dos modos: como imágenes individuales, como dos campos (líneas pares o impares del cuadro) o el cuadro completo como un todo. Este método eficiente proporciona codificación de video entrelazado sin tener que sobrecargar a los decodificadores con un proceso de decodificación dedicado.
A partir de octubre de 2012, el proyecto incluía tres perfiles: Principal (Main), Main 10 (Principal 10) y Main Still Picture (Imagen fija principal) [16] .
Un perfil es un conjunto específico de herramientas de codificación y algoritmos que se pueden usar para crear un flujo de video correspondiente a este perfil [15] . El codificador, al formar un flujo de video, determina qué componentes se pueden usar para un perfil, mientras que el decodificador debe admitir todas las funciones para un perfil determinado.
Las siguientes restricciones están definidas para el perfil principal:
Main 10 es un perfil para codificar video con una profundidad de color de 10 bits por canal [16] .
Comparación de los principales elementos de los codificadores:
AVC (perfil alto) | HEVC (10 principales) | HEVC (perfil principal) | |
---|---|---|---|
Tamaño de bloque | Macrobloque 16×16 | Bloques con estructura de árbol de codificación de 64x64 a 8x8 | de 64×64 a 16×16 |
Bloques de predicción | Dividir hasta 4×4 | 64×64 a 4×4, predicción asimétrica | 64×64 a 8×8, predicción simétrica |
Transformar bloques | 8×8 y 4×4 | 32x32 16x16 8x8 4x4 + transformaciones no cuadradas | 32×32 16×16 8×8 4×4 |
Predicción intra-frame | 9 modos | 35 modos | 35 modos |
Transformación inversa | Filtro de desbloqueo | Filtro de desbloqueo, SAO | Filtro de desbloqueo, SAO |
Compensación de movimiento | Predicción del vector de movimiento | Predicción avanzada de vectores de movimiento (espacial y temporal) | |
Profundidad de color por canal | 8 bits | 10 bits | 8 bits |
Codificación de entropía | CABAC o CAVLC | CABAC usando operaciones paralelas |
El perfil principal de imágenes fijas permite codificar una sola imagen, sujeto a ciertas restricciones correspondientes al perfil principal [16] .
A partir de octubre de 2012, el proyecto HEVC definió dos capas: Main (Principal) y High (High), y 13 niveles [16] . Level (Nivel) es un conjunto de restricciones para el flujo de datos asociado con las capacidades computacionales del decodificador y la carga de memoria. El nivel se establece en función de la frecuencia de muestreo máxima, el tamaño de cuadro máximo, la tasa de bits máxima, la relación de compresión mínima y las capacidades de búfer de cuadro del decodificador y codificador. El concepto de una capa ( ing. Tier - tier) se introdujo para aplicaciones que difieren solo en la tasa de bits máxima y la capacidad del búfer de trama del codificador. La capa principal se ha diseñado para la mayoría de las aplicaciones, mientras que la capa alta está diseñada para aplicaciones más exigentes. Un decodificador correspondiente a una capa y capa en particular debe decodificar todos los flujos codificados con los parámetros de esa capa y capa y todas las capas y capas inferiores. Para los niveles inferiores a 4, solo se permite la capa central [1] [16] .
Nivel | máx. frecuencia de muestreo [ 17] (Hz) |
máx. tamaño de fotograma [ 17] (píxel) |
máx. tasa de bits para los perfiles Main y Main 10 (kbps) |
Ejemplo de resolución de cuadro @ máx. velocidad de fotogramas (tamaño máximo del búfer de fotogramas) |
mín. relación de
compresión | |
---|---|---|---|---|---|---|
Capa base | capa alta | |||||
una | 552 960 | 36 864 | 128 | - | 128×[email protected] (6) 176×[email protected] (6) |
2 |
2 | 3 686 400 | 122 880 | 1500 | - | 176×[email protected] (16) 352×[email protected] (6) |
2 |
2.1 | 7 372 800 | 245 760 | 3000 | - | 352×[email protected] (12) 640×[email protected] (6) |
2 |
3 | 16 588 800 | 552 960 | 6000 | - | 640×[email protected] (12) 720×[email protected] (8) 720×[email protected] (8) 960×[email protected] (6) |
2 |
3.1 | 33 177 600 | 983.040 | 10,000 | - | 720×[email protected] (12) 720×[email protected] (12) 960×[email protected] (8) 1280×[email protected] (6) |
2 |
cuatro | 66 846 720 | 2 228 224 | 12 000 | 30,000 | 1280×[email protected] (12) 1920×[email protected] (6) 2048×[email protected] (6) |
cuatro |
4.1 | 133 693 440 | 20 000 | 50,000 | 1280×[email protected] (12) 1920×[email protected] (6) 2048×[email protected] (6) |
cuatro | |
5 | 267 386 880 | 8 912 896 | 25 000 | 100,000 | 1920×[email protected] (16) 3840×[email protected] (6) 4096×[email protected] (6) |
6 |
5.1 | 534 773 760 | 40 000 | 160 000 | 1920×[email protected] (16) 3840×[email protected] (6) 4096×[email protected] (6) |
ocho | |
5.2 | 1 069 547 520 | 60 000 | 240 000 | 1920×[email protected] (16) 3840×[email protected] (6) 4096×[email protected] (6) |
ocho | |
6 | 1 069 547 520 | 35 651 584 | 60 000 | 240 000 | 3840×[email protected] (16) 4096×[email protected] (16) 4096×[email protected] (12) 7680×[email protected] (6) 8192×[email protected] (6) |
ocho |
6.1 | 2 139 095 040 | 120 000 | 480 000 | 3840×[email protected] (16) 4096×[email protected] (16) 4096×[email protected] (12) 7680×[email protected] (6) 8192×[email protected] (6) |
ocho | |
6.2 | 4 278 190 080 | 240 000 | 800 000 | 3840×[email protected] (16) 4096×[email protected] (16) 4096×[email protected] (12) 7680×[email protected] (6) 8192×[email protected] (6) |
6 |
ISO | Normas|
---|---|
| |
1 a 9999 |
|
10000 a 19999 |
|
20000+ | |
Ver también: Lista de artículos cuyos títulos comienzan con "ISO" |
Compresión de video | |
---|---|
Recomendaciones UIT-T | |
Normas ISO / IEC |
|
estándares SMPTE | |
Códecs MPEG-4 |
|
sin pérdidas |
|
Cine digital | |
Otros códecs | |
ver también |