Submuestreo de color

El submuestreo de color ( ing.  Chroma subsampling ) es una tecnología de codificación de imágenes en la que los valores de brillo se almacenan para cada píxel y los datos de color se almacenan para grupos de píxeles, por lo que la frecuencia de muestreo de las señales de diferencia de color puede ser menor que la frecuencia de muestreo. de la señal de brillo. Basado en la peculiaridad de la visión humana , expresada por una mayor sensibilidad a los cambios de brillo que de color. El submuestreo de color es una forma importante de reducir el tamaño de un flujo de datos de video digital ( compresión de video digital). Se utiliza en sistemas de televisión analógicos y digitales , grabación de video digital y algoritmos de compresión de imágenes como JPEG .

En la práctica, la codificación de imágenes se lleva a cabo reduciendo la resolución en los canales de diferencia de color mientras se mantiene la resolución en el canal de luminancia .

Historia

El método fue desarrollado por primera vez en la década de 1950 por Alda Bedford para el sistema de televisión en color RCA . Posteriormente se desarrolló en el estándar NTSC . Sin embargo, el principio de separar la información de brillo y color fue inventado incluso antes, en 1938 por Georges Valensi .

Introducción

Por compatibilidad con una señal de televisión en blanco y negro y por la posibilidad de reducir el ancho de banda requerido para la transmisión de información en color, la televisión en color utiliza esquemas de suma especiales para los tres componentes de la señal de video Y' - significa brillo, y RY' y BY' - las llamadas señales de diferencia de color. Para digitalizar una señal de video componente de acuerdo con las recomendaciones de ITU-R 601, se utiliza la codificación de acuerdo con las siguientes fórmulas:

Al transmitir tales señales, es posible restaurar los componentes de color originales: rojo (R), azul (B) y verde (G), que se utilizan en la mayoría de los sistemas de visualización de información de video.

Cuando Y', Cr, Cb, los componentes de diferencia de color de la representación de la señal de video Cr, Cb se transmiten con una resolución espacial dos veces menor que la resolución de la señal de luminancia, mientras que la frecuencia de muestreo para la señal de luminancia Y' se establece en 13,5 MHz, que es el doble que para las señales de diferencia de color Cr y Cb - 6,75 MHz. Para los estándares digitales, la frecuencia de muestreo base es de 3,375 MHz, por lo que las frecuencias de muestreo de la luminancia y las dos señales de diferencia de color estarán en una proporción de 4:2:2.

Para señales HDTV , de acuerdo con la Parte II de la Recomendación ITU-R 709-3, las tasas de muestreo para señales de luminancia son 74,25 MHz y crominancia 37,125 MHz.

Formatos de submuestreo

La estructura de muestreo de una señal se conoce como la relación entre las tres partes X:a:b (p. ej., 4:2:2) que describen el número de muestras de señales de luminancia y diferencia de color. A veces también se utiliza una notación de cuatro partes (4:2:2:4), donde el cuarto dígito, si se incluye, debe ser idéntico al primero, lo que indica la presencia de una señal de cuarto canal que contiene información de transparencia (canal alfa) . Estas partes son:

4:1:1       4:2:0       4:2:2       4:4:4
Y'CrCb                                
                               
= = = =
tu                                                                
                               
+ + + +
una 2 3 cuatro  X=4 una 2 3 cuatro  X=4 una 2 3 cuatro  X=4 una 2 3 cuatro  X=4
(Cr, Cb) una  un = 1 una 2  un = 2 una 2  un = 2 una 2 3 cuatro  un = 4
una  segundo = 1      segundo = 0 una 2  segundo = 2 una 2 3 cuatro  segundo = 4
¼ de resolución horizontal, resolución
vertical completa
½ resolución horizontal,
½ resolución vertical
½ resolución horizontal, resolución
vertical completa
resolución horizontal completa,
resolución vertical completa

4:4:4

Cada uno de los tres componentes Y'CbCr tiene la misma frecuencia de muestreo. Este esquema se utiliza a veces en costosos escáneres y posproducción cinematográfica . Por lo general, la interfaz HD-SDI de doble enlace del estándar SMPTE 372M se utiliza para proporcionar este ancho de banda . La primera conexión es para transmisión de señal 4:2:2, la segunda conexión es para señal 0:2:2, 4:4:4 se transmitirá en combinación.

Vale la pena señalar que "4:4:4" puede entenderse como el espacio de color R'G'B' , que no tiene ningún submuestreo de color. Los formatos de video como HDCAM SR pueden grabar video digital 4:4:4 R'G'B' a través de HD-SDI de doble enlace .

4:2:2

Se utiliza en la investigación científica, los sistemas profesionales y el formato MPEG-2 . La Recomendación 601 define un estándar de vídeo digital compuesto con una relación de tasa de muestreo de luminancia a diferencia de color de 4:2:2. En cada línea, se transmite la señal de luminancia completa y, para las señales de diferencia de color, se realiza una muestra cada segunda muestra. Por lo tanto, la resolución horizontal del color se reduce a la mitad.

4:2:1

Este modo también se define técnicamente. Se utiliza en un conjunto limitado de codificadores de hardware y software.

4:1:1

En una proporción de 4:1:1, la resolución horizontal de las señales de diferencia de color se reduce a una cuarta parte de la resolución total de la señal de luminancia, y el ancho de banda se reduce (aumento del ancho de banda) por un factor de dos en comparación con el no- modo de submuestreo. 4:1:1 se usó originalmente en DV , que no se consideraba transmisión y era el único formato de grabación de video aceptable para aplicaciones de consumo y de bajo presupuesto. Actualmente, el formato DV (con muestreo 4:1:1) se utiliza profesionalmente para la producción de noticias y la reproducción de videos a través de servidores.

En un sistema NTSC, si la frecuencia de muestreo de luminancia es de 13,5 MHz, esto significa que cada una de las señales Cr y Cb se muestrearán a 3,375 MHz, lo que corresponde a un ancho de banda máximo de Nyquist de 1,6875 MHz, mientras que el tradicional "NTSC High- End Analog Broadcast Encoder tendrá una frecuencia Nyquist de 1,5 MHz y 0,5 MHz para canales I/Q. Sin embargo, en la mayoría de los equipos, especialmente los televisores de bajo costo y las videograbadoras VHS/Betamax, los canales de color tienen un ancho de banda de solo 0,5 MHz para Cr y Cb (equivalente a I/Q). Por lo tanto, el sistema en realidad proporciona un mayor ancho de banda de color sobre las mejores especificaciones analógicas compuestas para NTSC, a pesar de usar solo 1/4 del ancho de banda de color completo de la señal digital "completa". Los formatos que usan 4:1:1 incluyen:

4:2:0

Varias configuraciones 4:2:0 se pueden encontrar en:

Para los componentes de diferencia de color Cb y Cr, cada segunda muestra se descarta durante el muestreo, tanto horizontal como verticalmente. Hay tres variantes de esquemas 4:2:0, que tienen diferentes ubicaciones de lecturas horizontales y verticales:

Este tipo de procesamiento de datos es especialmente adecuado para los sistemas de color PAL y SECAM. La mayoría de los formatos de video digital PAL usan 4:2:0 respectivamente, con la excepción de DVCPRO25 que usa 4:1:1. Las opciones 4:1:1 y 4:2:0 reducen los requisitos de ancho de banda a la mitad en comparación con la representación sin resolución reducida.

4:1:0

Compatible con algunos códecs, pero no muy utilizado. Esta relación utiliza la mitad de la resolución de color vertical y un cuarto de la horizontal, y solo una octava parte del ancho de banda de la resolución de color máxima.

3:1:1

Se utiliza en el formato de grabación de video de alta definición Sony HDCAM (no HDCAM SR) . En la dirección horizontal, las muestras de luminancia se muestrean a tres cuartas partes de la frecuencia de muestreo Full HD: 1440 muestras por línea frente a 1920 en HDCAM SR. En la dirección vertical, los canales de luminancia y crominancia se muestrean completamente en HD (1080 muestras).

Terminología

El término Y'UV se refiere a un esquema de codificación analógico mientras que Y'CbCr se refiere a esquemas de codificación digital. Una de las diferencias entre ellos es que el conjunto de coeficientes de las componentes de cromaticidad U, V y Cb, Cr es diferente. Sin embargo, el término YUV a menudo se usa incorrectamente cuando se refiere a la codificación Y'CbCr. Por lo tanto, expresiones como "4:2:2 YUV" siempre se refieren a "4:2:2 Y'CbCr" porque simplemente no existe tal cosa como 4:x:x en una codificación analógica como YUV.

Además, el término brillo y el símbolo Y a menudo se usan erróneamente, en referencia al brillo, que se indica con el símbolo Y'. Tenga en cuenta que la luminancia (Y') utilizada por los ingenieros de video se desvía de la luminancia (Y) en colorimetría (tal como lo define la CIE). La luminancia (en TV) se forma como una suma ponderada de componentes RGB con corrección gamma (tricolor). La luminancia se forma como una suma ponderada de componentes RGB lineales (tricolores).

En la práctica de CIE, el símbolo Y a menudo se usa incorrectamente para representar el brillo. En 1993, la SMPTE adoptó el Manual del Ingeniero EG 28 que aclara dos términos. Tenga en cuenta que el carácter ' (guión) se utiliza para indicar la corrección gamma.

Además, el concepto de croma/croma en los ingenieros de video es diferente de la crominancia en colorimetría. Chroma/chroma en la práctica de ingeniería de video se forma a partir de componentes no lineales de tres colores ponderados. Los términos "croma" y "saturación" a menudo se usan indistintamente para referirse a la crominancia.

Formatos de video

La siguiente tabla muestra las características de la mayoría de los formatos de video y los tipos de submuestreo de croma utilizados, así como otros parámetros relacionados, como la tasa de bits y la relación de compresión.

Formato Dueño Reducción de muestreo Profundidad del color Velocidad de datos
(Mbps)
Tipo de compresión Índice de compresión Resolución (píxeles)
Televisión de definición estándar (SD)
DV / MiniDV Varios 4:2:0 (PAL)
4:1:1 (NTSC)
8 bits 25 Deberes 5:1 720 × 576 (PAL)
720 × 480 (NTSC)
DVCPRO 25 panasonic 4:1:1 8 bits 25 Deberes 5:1 720 × 576 (PAL)
720 × 480 (NTSC)
DVCPRO 50 panasonic 4:2:2 8 bits cincuenta Deberes 3.3:1 720 × 576 (PAL)
720 × 480 (NTSC)
DVCAM sony 4:2:0 (PAL)
4:1:1 (NTSC)
8 bits 25 Deberes 5:1 720 × 576 (PAL)
720 × 480 (NTSC)
cámara beta digital sony 4:2:2 10 bits 90 Deberes 2,3:1 720 × 576 (PAL)
720 × 480 (NTSC)
Betacam SX sony 4:2:2 10 bits 18/170 MPEG-2 10:1 720 × 576 (PAL)
720 × 480 (NTSC)
MPEG IMX sony 4:2:2 8 bits 30
40
50
MPEG-2 6:1
4:1
3,3:1
720 × 576 (PAL)
720 × 480 (NTSC)
XDCAM sony 4:2:0/4:1:1
4:2:2
8 bits 30
40
50
DCT
MPEG-2
6:1
4:1
3,3:1
720 × 576 (PAL)
720 × 480 (NTSC)
Televisión de alta definición (HD)
DVCPRO 100 panasonic 4:2:2 8 bits 100 Deberes 6,7:1 1440×1080
960×720
Cámara HD sony 3:1:1 8 bits 144 MPEG-4 4:1 1440×1080
HDCAM SR sony 4:2:2
4:4:4
10 bits 440
880
MPEG-4 4,2:1
2,7:1
1920×1080
HDV Sony JVC Canon 4:2:0 8 bits 19/25 MPEG-2 18:1 1440x1080
1920x1080
1280x720
AVCHD panasonic sony 4:2:0 8 bits 18/24 H.264 /MPEG-4 1440x1080
1920x1080
1280x720
XDCAM HD sony 4:2:0 8 bits 18/50 MPEG-2 1440×1080
1280×720

Véase también

Literatura