Avión (Unicode)
En el estándar Unicode , un plano es un rango contiguo de 65 536 ( 216 ) puntos de código. Hay 17 planos, numerados del 0 al 16, correspondientes a los posibles valores 00-10 16 de los dos primeros dígitos hexadecimales en el formato de número de posición del código de seis dígitos (U+ hh hhhh ). El último punto de código Unicode es el último punto de código en el plano 16, U+10FFFF. El plano 0 se denomina plano multilingüe básico ( BMP ) y contiene los caracteres más utilizados. Los planos restantes (1-16) se denominan "adicionales" [1] . La versión 14.0 de Unicode utiliza puntos de código para siete aviones, dos de los cuales son para uso privado.
La limitación de 17 planos se debe a la codificación UTF-16 , en la que se pueden codificar 220 ( 1048576 ) posiciones de código (16 planos) y BMP [2] . La codificación UTF-8 se diseñó con un límite mucho mayor de 2 31 ( 2 147 483 648 ) puntos de código ( 32 768 planos) y podría usar 2 21 ( 2 097 152 ) puntos de código (32 planos) incluso con un límite de 4 bytes [3] .
Planos Unicode:
- Plano 0 (0000-FFFF): Plano Básico Multilingüe ( BMP )
- Plano 1 (10000-1FFFF): Plano Multilingüe Suplementario ( SMP )
- Plano 2 ( 20000-2FFFF): Plano Ideográfico Suplementario (SIP )
- Plano 3 ( 30000-3FFFF): Plano Ideográfico Terciario (TIP )
- Planos 4-13 (40000-DFFFF) no utilizados
- Avión 14 (E0000—EFFFF): Avión especial suplementario ( SSP )
- Plano 15 ( F0000-FFFFF) Área de Uso Privado Complementario -A, SPUA - A
- Plano 16 (100000-10FFFF) Área de Uso Privado Complementario -B ( SPUA -B )
Plano básico multilingue
El Plano 0 (Plano Básico Multilingüe , BMP ) está reservado para los caracteres de la mayoría de las escrituras modernas y una gran cantidad de caracteres especiales . La mayor parte de la tabla está ocupada por ideogramas KJK y sílabas coreanas .
En Unicode 14.0, los siguientes bloques se representan en este plano:
|
- reconocimiento óptico de caracteres (2440-245F)
- Letras y números enmarcados (2460-24FF)
- Pseudográficos (2500-257F)
- Elementos de bloque (2580-259F)
- Formas geométricas (25A0—25FF)
- Varios personajes (2600-26FF)
- Dingbats (2700–27BF)
- Símbolos matemáticos varios - A (27C0-27EF)
- Manos adicionales - A (27F0-27FF)
- Braille (2800-28FF)
- Manos adicionales - B (2900-297F)
- Varios símbolos matemáticos - B (2980-29FF)
- Operadores matemáticos adicionales (2A00-2AFF)
- Varios símbolos y flechas (2B00—2BFF)
- Glagolítico (2C00-2C5F)
- Latín ampliado - C (2C60-2C7F)
- Escritura copta (2C80—2CFF)
- Suplemento a la carta georgiana (2D00—2D2F)
- Escritura libia antigua (2D30—2D7F)
- Etíope ampliado (2D80-2DDF)
- Cirílico extendido - A (2DE0—2DFF)
- Puntuación adicional (2E00-2E7F)
- Suplemento a las claves de la KKJ (2E80-2EFF)
- Llaves de Kangxi (2F00—2FDF)
- Caracteres ideográficos explicativos (2FF0-2FFF)
- Símbolos y puntuación CJK (3000-303F)
- Hiraganá (3040-309F)
- Katakana (30A0—30FF)
- Zhuyin fuhao (3100-312F)
- Artículos Hangul compatibles (3130-318F)
- Kambun (3190-319F)
- Zhuyin fuhao extendido (31A0—31BF)
- Características del KKJ (31C0—31EF)
- Extensiones fonéticas de katakana (31F0-31FF)
- Letras y meses enmarcados KJK (3200-32FF)
- Elementos compatibles CJK (3300-33FF)
- Ideogramas unificados CJK - Extensión A (3400-4DBF)
- Hexagramas del Libro de los Cambios (4DC0—4DFF)
- Ideogramas unificados del CJK (4E00-9FFF)
- Silabario y (A000-A48F)
- Teclas de letras y (A490—A4CF)
- Lisu (A4D0—A4FF)
- Vai (A500—A63F)
- Cirílico extendido - B (A640—A69F)
- Bamum (A6A0—A6FF)
- Símbolos de cambio de tono (A700—A71F)
- Latín ampliado - D (A720-A7FF)
- Sylhet Nagari (A800—A82F)
- Formas comunes de números indios (A830-A83F)
- Escritura cuadrada mongola (A840—A87F)
- Saurashtra (A880—A8DF)
- Devanagari extendido (A8E0—A8FF)
- Kaya-li (A900—A92F)
- Rejilla ( A930 —A95F)
- Elementos Hangul extendidos - A (A960—A97F)
- Javanés (A980—A9DF)
- Birmano extendido - B (A9E0-A9FF)
- Guión Cham (AA00-AA5F)
- Birmano ampliado - A (AA60-AA7F)
- Viet tailandés (AA80—AADF)
- Extensiones Manipuri (AAE0-AAFF)
- Etíope extendido - A (AB00-AB2F)
- Latín ampliado - E (AB30-AB6F)
- Suplemento Cherokee (AB70—ABBF)
- Manipuri (ABC0—ABFF)
- silabario hangul (AC00—D7AF)
- Elementos hangul extendidos - B (D7B0—D7BF)
- Parte superior de pares sustitutos (D800-DB7F)
- Principales pares sustitutos para uso privado (DB80-DBFF)
- Parte inferior de pares sustitutos (DC00-DFFF)
- Área de uso privado (E000-F8FF)
- Ideogramas CJK compatibles (F900-FAFF)
- Formularios de presentación alfabéticos (FB00-FB4F)
- Formas árabes - A (FB50-FDCF, FDF0-FDFF)
- Selectores de variantes (FE00-FE0F)
- Formas verticales (FE10—FE1F)
- Semicaracteres combinados (FE20-FE2F)
- Formularios CJC compatibles (FE30-FE4F)
- Formas variantes pequeñas (FE50-FE6F)
- Formas árabes - B (FE70-FEFF)
- Formularios de ancho medio y ancho completo (FF00-FFEF)
- Caracteres especiales (FFF0-FFFF)
|
Plano multilingüe adicional
El Plano 1 (Plano Multilingüe Suplementario, ing. Plano Multilingüe Suplementario , SMP ) está reservado principalmente para la escritura histórica, pero también incluye símbolos convencionales como los símbolos musicales y matemáticos .
En Unicode 14.0, los siguientes conjuntos de caracteres se representan en este plano:
Plano ideográfico adicional
El Plano 2 (Plano Ideográfico Suplementario, ing. Plano Ideográfico Suplementario , SIP ) está reservado para los jeroglíficos KKJ de uso poco frecuente .
En Unicode 14.0, los siguientes conjuntos de caracteres se representan en este plano:
Plano ideográfico terciario
El Plano 3 ( Plano Ideográfico Terciario , TIP ) contiene caracteres chinos rara vez usados , también se supone que incluye formas históricas de escritura china
.
El plano ideográfico terciario se divide en los siguientes rangos [4] :
- Ideogramas CJK unificados - extensión G (30000-3134F) - ideogramas chinos adicionales raramente usados;
- Zhuanshu (31400-342FF) - jeroglíficos al estilo de "sello pequeño" (xiaozhuan, 小篆) y "sello grande" (dazhuan, 大篆) [5] [4] ;
- Jiaguwen (34400-35BFF) son los caracteres chinos más antiguos de la era Shang ( jiaguwen , 甲骨文), que se encuentran en inscripciones adivinatorias en conchas, cráneos y huesos de animales [6] [4]
En el futuro, también se espera que incluya caracteres Shang y Zhou ( jinwen , 金文) que se encuentran en inscripciones rituales en vasijas de bronce e instrumentos musicales, y conjuntos de caracteres del Período de los Reinos Combatientes [4] .
Avión adicional especializado
Plano 14 (avión adicional especializado, ing. Plano de propósito especial suplementario , SSP ) reservado para caracteres utilizados para un propósito especial.
En Unicode 14.0, los siguientes bloques se representan en este plano:
- Etiquetas (E0000—E007F)
- Suplemento de selectores de variantes (E0100—E01EF)
Áreas de uso privado
Algunos rangos de Unicode están reservados para uso privado y experimentación. Éstos incluyen:
- Área Privada en el Plano Básico Multilingüe (E000-F8FF)
- Planos adicionales 15 (F0000-U+FFFFF) y 16 (100000-10FFFF)
Véase también
Notas
- ↑ Glosario del Consorcio Unicode: Planos complementarios . Consultado el 30 de septiembre de 2018. Archivado desde el original el 24 de septiembre de 2018. (indefinido)
- ↑ Consulte la Tabla 3.5 "Distribución de bits UTF-16" en el estándar Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archivado el 31 de marzo de 2019 en Wayback Machine .
- ↑ Consulte la Tabla 3.6 "Distribución de bits UTF-8" en el estándar Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archivado el 31 de marzo de 2019 en Wayback Machine .
- ↑ 1 2 3 4 Hoja de ruta hacia el TIP ( PDF) (12 de marzo de 2020). Consultado el 17 de marzo de 2020. Archivado desde el original el 29 de febrero de 2020.
- ↑ Propuesta para codificar Small Seal Script en UCS (inglés) (PDF) (20 de junio de 2019). Consultado el 17 de marzo de 2020. Archivado desde el original el 30 de noviembre de 2019.
- ↑ Solicitud de comentarios sobre la codificación de Oracle Bone Script ( PDF) (21 de octubre de 2015). Consultado el 20 de noviembre de 2017. Archivado desde el original el 14 de junio de 2019.
Enlaces
Bloques Unicode _ _ |
---|
Plano Multilingüe Básico (Plano 0, BMP) [U+0000…U+FFFF] |
---|
|
|
|
Plano ideográfico adicional (plano 2, SIP) [U+20000…U+2FFFF] |
---|
|
|
Plano ideográfico terciario (plano 3, TIP) [U+30000…U+3FFFF] |
---|
- Ideogramas unificados CJK - Extensión G
|
|
Planos 4-13 [U+40000…U+DFFFF] |
---|
No involucrado |
|
Avión adicional especializado (avión 14, SSP) [U+E0000…U+EFFFF] |
---|
- Etiquetas
- Selectores de variantes complementarias
|
|
Áreas de Uso Privado (Planos 15 y 16, PUA) [U+F0000…U+10FFFF] |
---|
|
|