Perfiles de datos RTP

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 15 de abril de 2022; la verificación requiere 1 edición .

Las aplicaciones de comunicación para redes informáticas , conferencias de audio y video en tiempo real que utilizan el Protocolo de transporte en tiempo real (RTP) utilizan el Protocolo de descripción de sesión (SDP) para describir los parámetros técnicos de los flujos de datos multimedia transportados en una sesión multimedia . Este conjunto de parámetros RTP para un flujo de medios y sus métodos de codificación se conoce como perfil RTP o 'perfil de audio y video RTP' ( 'RTP/AVP' ). Cada perfil se define con un identificador de tipo de carga útil estándar para cada tipo de medio utilizando el códec apropiado . [una]


Uso de perfiles en SDP

Los mensajes SDP con parámetros de sesión de medios se utilizan en protocolos de telefonía IP ,  como SIP , MGCP , por ejemplo . El protocolo SIP o MGCP se usa para los procedimientos de inicio y establecimiento de la conexión, y los mensajes SDP incorporados se usan para describir los posibles parámetros de una sesión de medios que se está formando entre dispositivos.

Veamos cómo se define el tipo de datos de medios en SDP usando un ejemplo específico.

v=0 o=- 1815849 0 EN IP4 194.67.15.181 s = Cisco SDP 0 c=EN IP4 194.67.15.181 t=0 0 m=audio 20062 RTP/AVP 99 18 101 100 a=rtpmap:99 G.729b/8000 a=rtpmap:101 teléfono-evento/8000 a=fmtp:101 0-15 a=rtpmap:100 X-NSE/8000 a=fmtp:100 200-202

El mensaje SDP anterior contiene la siguiente información. Se esperará tráfico de medios en un dispositivo con dirección IP ( IPv4 ) 194.167.15.181, puerto 20062. Este dispositivo admite varios tipos de tráfico de audio (códecs) descritos por los tipos de carga útil 99, 18, 100 y 101. Estos se especifican en el m =línea de audio. A continuación, en las líneas a=rtpmap, se aclaran los parámetros de los tipos de datos, ya que algunos tipos son dinámicos y no pueden determinarse unívocamente, simplemente por la línea m=audio. Entonces, por tipo de datos 99, este dispositivo significa el códec de voz G.729b (G.729 Anexo B, es decir, con soporte para supresión de ruido ). El tipo de datos dinámico 101 en este caso es la capacidad de recibir tonos DTMF (evento telefónico) de acuerdo con el estándar descrito en RFC 2833 . No hay ninguna especificación para el tipo de carga útil 18, y esto puede significar que el dispositivo es compatible con el códec de voz G.729, junto con una variación más simple del mismo códec descrito en el Anexo A (o el códec G.729a), ya que el tipo de datos 18 se asigna de forma exclusiva a estos códecs.


Tipos de datos para audio y video en RTP/AVP

RFC 3551 enumera los detalles de cada tipo de carga útil o un enlace a una descripción detallada. Los identificadores del 0 al 95 están reservados estáticamente para tipos de datos específicos. Los ID de carga útil 96 a 127 se utilizan para cargas útiles determinadas dinámicamente durante el establecimiento de la sesión. El documento recomienda números de puerto asignados dinámicamente, aunque los números de puerto 5004 y 5005 se han registrado para usar el perfil cuando no se requiere la asignación dinámica de puertos. El estándar también describe el proceso para registrar nuevos tipos de carga útil con IANA.

Las aplicaciones que funcionan con estos perfiles siempre deben admitir PCMU (códec de ley μ G.711, tipo de carga útil 0). Anteriormente, DVI4 (tipo de carga útil 5) también se recomendaba como tal, pero esta recomendación fue eliminada en agosto de 2013 por RFC 7007 , porque "muchas implementaciones de RTP no son compatibles con DVI4, y hay pocas razones para usarlo cuando se utilizan otras mucho más modernas". disponibles". códecs".


Tipo de datos (tipo de carga útil / PT) Nombre Tipo de Número de canales Frecuencia de reloj (Hz) [Nota 1] Tamaño de trama (ms) Tamaño de paquete predeterminado (ms) Descripción Enlaces
0 PCMU sonido una 8000 ningún veinte ITU-T G.711 PCM Ley µ audio 64 kbps RFC 3551
una reservado (anteriormente 1016) sonido una 8000 reservado, previamente CELP audio 4.8 Kbps RFC 3551 , anteriormente RFC 1890
2 reservado (anteriormente G.721) sonido una 8000 reservado, anteriormente ITU-T G.721 ADPCM audio 32 kbps RFC 3551 , anteriormente RFC 1890
3 G/M sonido una 8000 veinte veinte Audio europeo GSM Full Rate 13 Kbps (GSM 06.10) RFC 3551
cuatro G.723 sonido una 8000 treinta treinta Audio UIT-T G.723.1 RFC 3551
5 DVI4 sonido una 8000 ningún veinte Audio IMA ADPCM 32 Kbps RFC 3551
6 DVI4 sonido una 16000 ningún veinte Audio IMA ADPCM 64 kbps RFC 3551
7 LPC sonido una 8000 ningún veinte Audio de codificación predictiva lineal experimental 5,6 Kbps RFC 3551
ocho PCMA sonido una 8000 ningún veinte ITU-T G.711 PCM Ley A audio 64 kbps RFC 3551
9 G.722 sonido una 8000 [Nota 2] ningún veinte ITU-T G.722 audio 64 kbps RFC 3551 - Página 14
diez L16 sonido 2 44100 ningún veinte Audio estéreo PCM lineal de 16 bits 1411,2 kbps, [2] [3] [4] sin comprimir RFC 3551, página 27
once L16 sonido una 44100 ningún veinte Audio PCM lineal de 16 bits 705,6 kbps, sin comprimir RFC 3551, página 27
12 QCELP sonido una 8000 veinte veinte QCELP ( predicción lineal excitada del código de Qualcomm ) RFC 2658 , RFC 3551
13 CN sonido una 8000 Ruido cómodo .

El tipo de carga útil se usa con códecs que no admiten ruido de confort en el algoritmo de codificación, es decir, G.711 , G.722.1 , G.722 , G.726 , G.727 , G.728 , GSM 06.10 , Siren y .RTAudio .

RFC 3389
catorce AMP sonido 12 90000 8-72 Solo audio MPEG-1 o MPEG-2 RFC 3551 , RFC 2250
quince G728 sonido una 8000 2.5 veinte ITU-T G.728 audio 16 kbps RFC 3551
dieciséis DVI4 sonido una 11025 ningún veinte Audio IMA ADPCM 44.1 Kbps RFC 3551
17 DVI4 sonido una 22050 ningún veinte Audio IMA ADPCM 88,2 Kbps RFC 3551
Dieciocho G729 sonido una 8000 diez veinte ITU-T G.729 y G.729a audio 8Kbps RFC 3551, página 20
25 CELB video 90000 Vídeos de Sun CellB [5] RFC 2029
26 jpeg video 90000 vídeo JPEG RFC 2435
28 Nevada. video 90000 Vídeo en red de Xerox PARC (nv) [6] RFC 3551, página 32
31 H261 video 90000 Vídeo UIT-T H.261 RFC 4587
32 monovolumen video 90000 Vídeo MPEG-1 y MPEG-2 RFC2250
33 MP2T sonido/vídeo 90000 Flujo de transporte MPEG-2 RFC2250
34 H263 video 90000 Primera versión de video H.263 (1996) RFC 3551 , RFC 2190
dinámica H263-1998 video 90000 H.263 video segunda versión (1998) RFC 3551 , RFC 4629 , RFC 2190
dinámica H263-2000 video 90000 Vídeo H.263 tercera versión (2000) RFC 4629
dinámico (o perfil) H264AVC video 90000 Vídeo H.264 (MPEG-4 Parte 10) RFC 6184 , anteriormente RFC 3984
dinámico (o perfil) H264SVC video 90000 vídeo H.264 RFC 6190
dinámico (o perfil) H265 video 90000 Vídeo H.265 (HEVC) borrador-ietf-payload-rtp-h265
dinámico (o perfil) Teora video 90000 vídeo de teora borrador-barbato-avt-rtp-theora
dinámica iLBC sonido una 8000 20, 30 20, 30 iLBC 13,33 o 15,2 Kbps RFC 3952
dinámica PCMA-WB sonido una 16000 5 ITU-T G.711.1 Ley A RFC 5391
dinámica PCMU-WB sonido una 16000 5 UIT-T G.711.1 ley µ RFC 5391
dinámica G718 sonido 32000 (marcador de posición) veinte UIT-T G.718 draft-ietf-payload-rtp-g718
dinámica G719 sonido diferente 48000 veinte UIT-T G.719 RFC 5404
dinámica G7221 sonido 16000, 32000 veinte UIT-T G.722.1 y G.722.1 Anexo C RFC 5577
dinámica G726-16 sonido una 8000 ningún veinte ITU-T G.726 audio 16 kbps RFC 3551
dinámica G726-24 sonido una 8000 ningún veinte UIT-T G.726 audio 24 kbps RFC 3551
dinámica G726-32 sonido una 8000 ningún veinte ITU-T G.726 audio 32 kbps RFC 3551
dinámica G726-40 sonido una 8000 ningún veinte ITU-T G.726 audio 40 kbps RFC 3551
dinámica G729D sonido una 8000 diez veinte UIT-T G.729 Anexo D RFC 3551
dinámica G729E sonido una 8000 diez veinte UIT-T G.729 Anexo E RFC 3551
dinámica G7291 sonido 16000 veinte UIT-T G.729.1 RFC 4749
dinámica GSM-EFR sonido una 8000 veinte veinte UIT-T GSM-EFR (GSM 06.60) RFC 3551
dinámica GSM-HR-08 sonido una 8000 veinte UIT-T GSM-HR (GSM 06.20) RFC 5993
dinámico (o perfil) RAM sonido diferente 8000 veinte Sonido adaptativo de frecuencia múltiple RFC 4867
dinámico (o perfil) AMR-BM sonido diferente 16000 veinte Audio AMR-WB (UIT-T G.722.2) RFC 4867
dinámico (o perfil) AMR-WB+ sonido 1, 2 o vacío 72000 13.3-40 Sonido AMR-WB+ RFC 4352
dinámico (o perfil) vorbis sonido diferente diferente sonido vorbis RFC 5215
dinámico (o perfil) opus sonido 12 48000 [Nota 3] 2.5-60 veinte audio de la obra RFC 7587
dinámico (o perfil) velocista sonido una 8000, 16000, 32000 veinte sonido de voz RFC 5574
dinámica mpa-robusto sonido 12 90000 24-72 Sonido MP3 tolerante a pérdidas RFC 5219 (anteriormente RFC 3119 )
dinámico (o perfil) MP4A-LATM sonido 90000 u otros Audio MPEG-4 RFC 6416 (anteriormente RFC 3016 )
dinámico (o perfil) MP4V-ES video 90000 u otros MPEG-4 visuales RFC 6416 (anteriormente RFC 3016 )
dinámico (o perfil) mpeg4-genérico sonido/vídeo 90000 u otro Flujos elementales MPEG-4 RFC 3640
dinámica VP8 video 90000 vídeo vp8 draft-ietf-payload-vp8
dinámica VP9 video 90000 vídeo vp9 draft-uberti-payload-vp9
dinámica L8 sonido diferente diferente ningún veinte Compensación de audio de 8 bits PCM lineal 128 RFC 3551 Sección 4.5.10 y Tabla 5
dinámica DAT12 sonido diferente diferente ningún 20 (similar a L16) Audio no lineal IEC 61119 de 12 bits RFC 3190 Sección 3
dinámica L16 sonido diferente diferente ningún veinte Audio PCM lineal de 16 bits RFC 3551 sección 4.5.11, RFC 2586
dinámica L20 sonido diferente diferente ningún 20 (similar a L16) Audio PCM lineal de 20 bits RFC 3190 Sección 4
dinámica L24 sonido diferente diferente ningún 20 (similar a L16) Audio PCM lineal de 24 bits RFC 3190 Sección 4
dinámica crudo video 90000 vídeo sin comprimir RFC 4175
dinámica ac3 sonido diferente 32000, 44100, 48000 Sonido Dolby AC-3 RFC 4184
dinámica eac3 sonido diferente 32000, 44100, 48000 Sonido AC-3 mejorado RFC 4598
dinámica t140 texto 1000 Mensajes de texto ( Texto sobre IP ) RFC 4103
dinámica EVRC
EVRC0
EVRC1
sonido 8000 sonido EVRC RFC 4788
dinámica EVRCB
EVRCB0
EVRCB1
sonido 8000 Sonido EVRC-B RFC 4788
dinámica EVRCWB
EVRCWB0
EVRCWB1
sonido 16000 Sonido EVRC-WB RFC 5188
dinámica jpeg2000 video 90000 vídeo jpeg 2000 RFC 5371
dinámica UEMCLIP sonido 8000, 16000 Sonido UEMCLIP RFC 5686
dinámica ATRAC3 sonido 44100 Sonido ATRAC 3 RFC 5584
dinámica ATRAC-X sonido 44100, 48000 Sonido ATRAC 3+ RFC 5584
dinámica ATRAC AVANZADO SIN PÉRDIDAS sonido diferente Sonido ATRAC avanzado sin pérdidas RFC 5584
dinámica VD video 90000 vídeo dv RFC 3189
dinámica BT656 video Vídeo UIT-R BT.656 RFC 3555
dinámica BMPEG video Vídeo MPEG-2 integrado RFC 2343
dinámica SMPTE292M video vídeo SMPTE 292M RFC 3497
dinámica ROJO sonido Copia de seguridad de datos de audio RFC 2198
dinámica VDVI sonido Audio de frecuencia variable DVI4 RFC 3551
dinámica MP1S video Transmisión de video de sistemas MPEG-1 RFC2250
dinámica MP2P video Transmisión de video del programa MPEG-2 RFC2250
dinámica tono sonido diferente tono RFC 4733
dinámica evento telefónico sonido diferente señal DTMF RFC 4733
  1. La "frecuencia de reloj" es la velocidad a la que se incrementa la muesca en el encabezado RTP, para que no sea la misma que la frecuencia de muestreo del códec. Por ejemplo, los códecs suelen utilizar una frecuencia de reloj de 90000 para que sus fotogramas puedan coincidir más estrechamente con la marca de tiempo RTCP NTP, aunque las frecuencias de muestreo de vídeo suelen oscilar entre 1 y 60 muestras por segundo.
  2. Aunque la frecuencia de muestreo para G.722 es 16000, su frecuencia de reloj puede ser 8000 para compatibilidad con versiones anteriores de RFC 1890 , que utiliza incorrectamente este valor [1] .
  3. Debido a que Opus puede cambiar la frecuencia de muestreo de forma dinámica, su frecuencia de reloj se establece en 48000 incluso cuando el códec se está ejecutando con resolución reducida. Las opciones maxplaybackratey sprop-maxcapturerateen SDP se pueden utilizar para indicar una sugerencia/preferencia sobre la frecuencia de muestreo máxima para la codificación/decodificación.

Véase también

Enlaces

  1. 1 2 RFC 3551 , Perfil RTP para conferencias de audio y video con control mínimo , H. Schulzrinne, S. Casner, The Internet Society (julio de 2003).
  2. RFC 2586 - El tipo de contenido Audio/L16 MIME (mayo de 1999). Consultado el 16 de marzo de 2010. Archivado desde el original el 26 de noviembre de 2010.
  3. RFC 3108 - Convenciones para el uso del Protocolo de descripción de sesión (SDP) para conexiones de portador ATM (mayo de 2001). Consultado el 16 de marzo de 2010. Archivado desde el original el 30 de abril de 2010.
  4. RFC 4856 - Registro de tipo de medio de formatos de carga útil en el perfil RTP para conferencias de audio y video - Registro de tipo de medio audio/L16 (marzo de 2007). Consultado el 16 de marzo de 2010. Archivado desde el original el 30 de abril de 2010.
  5. Guía del programador XIL Archivado el 29 de julio de 2014 en Wayback Machine , Capítulo 22 "Códec CellB". Agosto de 1997. Consultado el 19-07-2014.
  6. nv: video en red en el sitio web de Henning Schulzrinne. Archivado el 1 de mayo de 2015 en Wayback Machine . Video en red en el sitio web de la Universidad de Toronto. Archivado el 22 de febrero de 2012 en Wayback Machine . Consultado el 9 de julio de 2009.

Recursos externos