Avión (Unicode)

En el estándar Unicode , un plano  es un rango contiguo de 65 536 ( 216 ) puntos de código. Hay 17 planos, numerados del 0 al 16, correspondientes a los posibles valores 00-10 16 de los dos primeros dígitos hexadecimales en el formato de número de posición del código de seis dígitos (U+ hh hhhh ). El último punto de código Unicode es el último punto de código en el plano 16, U+10FFFF. El plano 0 se denomina plano multilingüe básico ( BMP ) y contiene los caracteres más utilizados. Los planos restantes (1-16) se denominan "adicionales" [1] . La versión 14.0 de Unicode utiliza puntos de código para siete aviones, dos de los cuales son para uso privado.

La limitación de 17 planos se debe a la codificación UTF-16 , en la que se pueden codificar 220 ( 1048576 ) posiciones de código (16 planos) y BMP [2] . La codificación UTF-8 se diseñó con un límite mucho mayor de 2 31 ( 2 147 483 648 ) puntos de código ( 32 768 planos) y podría usar 2 21 ( 2 097 152 ) puntos de código (32 planos) incluso con un límite de 4 bytes [3] .

Planos Unicode:

Plano básico multilingue

El Plano 0 (Plano Básico Multilingüe , BMP ) está reservado para los caracteres de la mayoría de las escrituras modernas y una gran cantidad de caracteres especiales .  La mayor parte de la tabla está ocupada por ideogramas KJK y sílabas coreanas .

En Unicode 14.0, los siguientes bloques se representan en este plano:

  • reconocimiento óptico de caracteres (2440-245F)
  • Letras y números enmarcados (2460-24FF)
  • Pseudográficos (2500-257F)
  • Elementos de bloque (2580-259F)
  • Formas geométricas (25A0—25FF)
  • Varios personajes (2600-26FF)
  • Dingbats (2700–27BF)
  • Símbolos matemáticos varios - A (27C0-27EF)
  • Manos adicionales - A (27F0-27FF)
  • Braille (2800-28FF)
  • Manos adicionales - B (2900-297F)
  • Varios símbolos matemáticos - B (2980-29FF)
  • Operadores matemáticos adicionales (2A00-2AFF)
  • Varios símbolos y flechas (2B00—2BFF)
  • Glagolítico (2C00-2C5F)
  • Latín ampliado - C (2C60-2C7F)
  • Escritura copta (2C80—2CFF)
  • Suplemento a la carta georgiana (2D00—2D2F)
  • Escritura libia antigua (2D30—2D7F)
  • Etíope ampliado (2D80-2DDF)
  • Cirílico extendido - A (2DE0—2DFF)
  • Puntuación adicional (2E00-2E7F)
  • Suplemento a las claves de la KKJ (2E80-2EFF)
  • Llaves de Kangxi (2F00—2FDF)
  • Caracteres ideográficos explicativos (2FF0-2FFF)
  • Símbolos y puntuación CJK (3000-303F)
  • Hiraganá (3040-309F)
  • Katakana (30A0—30FF)
  • Zhuyin fuhao (3100-312F)
  • Artículos Hangul compatibles (3130-318F)
  • Kambun (3190-319F)
  • Zhuyin fuhao extendido (31A0—31BF)
  • Características del KKJ (31C0—31EF)
  • Extensiones fonéticas de katakana (31F0-31FF)
  • Letras y meses enmarcados KJK (3200-32FF)
  • Elementos compatibles CJK (3300-33FF)
  • Ideogramas unificados CJK - Extensión A (3400-4DBF)
  • Hexagramas del Libro de los Cambios (4DC0—4DFF)
  • Ideogramas unificados del CJK (4E00-9FFF)
  • Silabario y (A000-A48F)
  • Teclas de letras y (A490—A4CF)
  • Lisu (A4D0—A4FF)
  • Vai (A500—A63F)
  • Cirílico extendido - B (A640—A69F)
  • Bamum (A6A0—A6FF)
  • Símbolos de cambio de tono (A700—A71F)
  • Latín ampliado - D (A720-A7FF)
  • Sylhet Nagari (A800—A82F)
  • Formas comunes de números indios (A830-A83F)
  • Escritura cuadrada mongola (A840—A87F)
  • Saurashtra (A880—A8DF)
  • Devanagari extendido (A8E0—A8FF)
  • Kaya-li (A900—A92F)
  • Rejilla ( A930 —A95F)
  • Elementos Hangul extendidos - A (A960—A97F)
  • Javanés (A980—A9DF)
  • Birmano extendido - B (A9E0-A9FF)
  • Guión Cham (AA00-AA5F)
  • Birmano ampliado - A (AA60-AA7F)
  • Viet tailandés (AA80—AADF)
  • Extensiones Manipuri (AAE0-AAFF)
  • Etíope extendido - A (AB00-AB2F)
  • Latín ampliado - E (AB30-AB6F)
  • Suplemento Cherokee (AB70—ABBF)
  • Manipuri (ABC0—ABFF)
  • silabario hangul (AC00—D7AF)
  • Elementos hangul extendidos - B (D7B0—D7BF)
  • Parte superior de pares sustitutos (D800-DB7F)
  • Principales pares sustitutos para uso privado (DB80-DBFF)
  • Parte inferior de pares sustitutos (DC00-DFFF)
  • Área de uso privado (E000-F8FF)
  • Ideogramas CJK compatibles (F900-FAFF)
  • Formularios de presentación alfabéticos (FB00-FB4F)
  • Formas árabes - A (FB50-FDCF, FDF0-FDFF)
  • Selectores de variantes (FE00-FE0F)
  • Formas verticales (FE10—FE1F)
  • Semicaracteres combinados (FE20-FE2F)
  • Formularios CJC compatibles (FE30-FE4F)
  • Formas variantes pequeñas (FE50-FE6F)
  • Formas árabes - B (FE70-FEFF)
  • Formularios de ancho medio y ancho completo (FF00-FFEF)
  • Caracteres especiales (FFF0-FFFF)

Plano multilingüe adicional

El Plano 1 (Plano Multilingüe Suplementario, ing.  Plano Multilingüe Suplementario , SMP ) está reservado principalmente para la escritura histórica, pero también incluye símbolos convencionales como los símbolos musicales y matemáticos .

En Unicode 14.0, los siguientes conjuntos de caracteres se representan en este plano:

  • Sílabas B lineales (10000-1007F)
  • Ideogramas B lineales (10080-100FF)
  • Números egeos (10100-1013F)
  • Números griegos antiguos (10140-1018F)
  • Símbolos Antiguos (10190-101CF)
  • Disco de Festo (101D0—101FF)
  • Escritura licia (10280-1029F)
  • Cario ( 102A0—102DF )
  • Números coptos epactos (102E0-102FF)
  • Cursiva antigua ( 10300-1032F )
  • Escritura gótica (10330-1034F)
  • Escritura pérmica antigua (10350-1037F)
  • Escritura ugarítica (10380-1039F)
  • Escritura persa antigua (103A0-103DF)
  • Carta de Deseret (10400-1044F)
  • Alfabeto Shaw (10450-1047F)
  • Escritura somalí (10480-104AF)
  • Osage (104B0—104FF)
  • Guión elbasan (10500-1052F)
  • Guión Agvan (10530-1056F)
  • Carta Vitkut (10570-105BF)
  • Lineal A (10600-1077F)
  • Latín extendido - F (10780-107BF)
  • Escritura chipriota (10800-1083F)
  • Arameo imperial (10840-1085F)
  • Carta de Palmyrene (10860-1087F)
  • Carta nabatea (10880-108AF)
  • Hatran (108E0—108FF)
  • Escritura fenicia (10900-1091F)
  • Escritura lidia (10920-1093F)
  • Jeroglíficos meroíticos (10980-1099F)
  • Cursiva meroítica (109A0-109FF)
  • Jarosthi (10A00—10A5F)
  • Escritura antigua de Arabia del Sur (10A60—10A7F)
  • Escritura antigua del norte de Arabia (10A80-109FF)
  • Escritura maniquea (10AC0—10AFF)
  • Escritura avéstica (10B00—10B3F)
  • Escritura epigráfica parta (10B40-10B5F)
  • Escritura epigráfica Pahlavi (10B60-10B7F)
  • Salterio Pahlavi ( 10B80—10BAF )
  • Escritura rúnica turca antigua (10C00—10C4F)
  • runas húngaras (10C00—10C4F)
  • Hanifi (10D00—10D3F)
  • Números Rumi (10E60—10E7F)
  • Escritura yazidí ( 10E80—10EBF )
  • Antiguo guión sogdiano (10F00—10F2F)
  • Escritura sogdiana (10F30—10F6F)
  • Antigua escritura uigur (10F70—10FAF)
  • Guión khwarezmian (10FB0—10FBF)
  • Letra elimaica (10FE0—10FFF)
  • Brahmi (11000-1107F)
  • Kaithi (11080-110CF)
  • Sorang sompeng (110D0—110FF)
  • Chakma (11100-1114F)
  • Mahajani (11150-1117F)
  • Charada (11180-111DF)
  • Números arcaicos cingaleses (111E0-111FF)
  • Hojiki (11200-1124F)
  • Multani (11280-112AF)
  • Judabadi (112B0—112FF)
  • Grantha (11300-1137F)
  • Neva (11400-1147F)
  • Tirhuta (11480-114DF)
  • Siddhamatrika (11580-115FF)
  • Modi (11600-1165F)
  • Suplemento de la escritura mongola antigua (11660-1167F)
  • Takri (11680-116CF)
  • Ahom (11700-1174F)
  • Dogra (11800-1184F)
  • Varang-kshiti (118A0-118FF)
  • Inmersiones akuru (11900-1195F)
  • Nandinagari (119A0-119FF)
  • Guión cuadrado de Zanabazar (11A00—11A4F)
  • Soyombo (11A50—11AAF)
  • Silabario canadiense extendido - A (11AB0-11ABF)
  • Po Chin Ho (11AC0—11AFF)
  • Bhaikshukas (11C00-11C6F)
  • Marchen (11C70—11CBF)
  • Gondi Masarama (11D00—11D5F)
  • Gunjal Gondi (11D60—11DAF)
  • Escritura Makassar (11EE0—11EFF)
  • Suplemento Fox (11FB0—11FBF)
  • Suplemento tamil (11FC0-11FFF)
  • Cuneiforme (12000-123FF)
  • Números cuneiformes y puntuación (12400-1247F)
  • Cuneiforme dinástica temprana (12480-1254F)
  • Escritura chipriota -minoica (12F90-12FFF)
  • Jeroglíficos egipcios (13000-1342F)
  • Caracteres de control de formato de jeroglíficos egipcios (13430-1343F)
  • Jeroglíficos de Anatolia (14400-1467F)
  • Adición de Bamum (16800-16A3F)
  • Señor ( 16A40—16A6F )
  • Tangsa (16A70—16ACF)
  • Bajo (16AD0—16AFF)
  • Pahaú (16B00—16B8F)
  • Medefidrina (16E40-16E9F)
  • Miao (16FE0—16FFF)
  • Caracteres ideográficos y puntuación (16F00-16F9F)
  • Escritura tangut (17000-187FF)
  • Elementos de la escritura Tangut (18800-18AFF)
  • Escritura khitan pequeña (18B00—18CFF)
  • Suplemento al guión Tangut (18D00-18D8F)
  • Kana extendido - B (1AFF0—1AFFF)
  • Suplemento Kana (1B000—180FF)
  • Kana extendido - A (1B100—1B12F)
  • Extensión kana menor (1B130—1B16F)
  • Nu Shu (bloque Unicode) (1B170—1B2FF)
  • Taquigrafía Duploier (1BC00-18C9F)
  • Caracteres de formato abreviado (1BCA0-1BCAF)
  • Notación musical Znamenny (1CF00—1CFCF)
  • Símbolos musicales bizantinos (1D000—1D0FF)
  • Símbolos musicales (1D100—1D1FF)
  • Notación griega antigua (1D200—1D24F)
  • Números mayas (1D2E0—1D2FF)
  • Símbolos del "Canon del Gran Secreto" (1D300-1D35F)
  • Números de palos de conteo (1D360—1D37F)
  • Letras y números matemáticos (1D400-1D7FF)
  • Escritura de letreros ( 1D800-1DAAF )
  • Latín ampliado - G (1DF00-1DFFF)
  • Suplemento glagolítico (1E000—1E02F)
  • Nyekeng Puecim Hmong (1E100—1E14F)
  • Totó (1E290—1E2BF)
  • Wancho (1E2C0—1E2FF)
  • Etíope extendido - B (1E7E0—1E7FF)
  • Kikakui (1E800—1E8DF)
  • Adán ( 1E900—1E95F )
  • Números indios siyak (1EC70—1ECBF)
  • Números siyak otomanos (1ED00–1ED4F)
  • Símbolos del alfabeto matemático árabe (1EE00-1EEFF)
  • Dados Mahjong (1F000—1F02F)
  • Huesos de dominó (1F030—1F09F)
  • Jugando a las cartas (1F0A0—1F0FF)
  • Suplemento de letras y números enmarcados (1F100-1F1FF)
  • Suplemento de caracteres ideográficos enmarcados (1F200–1F2FF)
  • Varios símbolos y pictogramas (1F300-1F5FF)
  • Emoticones (1F600—1F64F)
  • Caracteres ornamentales (1F650-1F67F)
  • Símbolos de transporte y carta (1F680-1F6FF)
  • Símbolos alquímicos (1F700-1F77F)
  • Formas geométricas extendidas (1F780-1F7FF)
  • Manos adicionales - C (1F800-1F8FF)
  • Símbolos y pictogramas adicionales (1F900-1F9FF)
  • Símbolos de ajedrez (1FA00-1FA6F)
  • Símbolos y Pictogramas Extendidos - A (1FA70-1FAFF)
  • Símbolos para informática heredada (1FB00-1FBFF)

Plano ideográfico adicional

El Plano 2 (Plano Ideográfico Suplementario, ing.  Plano Ideográfico Suplementario , SIP ) está reservado para los jeroglíficos KKJ de uso poco frecuente .

En Unicode 14.0, los siguientes conjuntos de caracteres se representan en este plano:

Plano ideográfico terciario

El Plano 3 ( Plano Ideográfico Terciario , TIP ) contiene caracteres chinos rara vez usados , también se supone que incluye formas históricas de escritura china . 

El plano ideográfico terciario se divide en los siguientes rangos [4] :

En el futuro, también se espera que incluya caracteres Shang y Zhou ( jinwen , 金文) que se encuentran en inscripciones rituales en vasijas de bronce e instrumentos musicales, y conjuntos de caracteres del Período de los Reinos Combatientes [4] .

Avión adicional especializado

Plano 14 (avión adicional especializado, ing.  Plano de propósito especial suplementario , SSP ) reservado para caracteres utilizados para un propósito especial.

En Unicode 14.0, los siguientes bloques se representan en este plano:

Áreas de uso privado

Algunos rangos de Unicode están reservados para uso privado y experimentación. Éstos incluyen:

Véase también

Notas

  1. Glosario del Consorcio Unicode: Planos complementarios . Consultado el 30 de septiembre de 2018. Archivado desde el original el 24 de septiembre de 2018.
  2. Consulte la Tabla 3.5 "Distribución de bits UTF-16" en el estándar Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archivado el 31 de marzo de 2019 en Wayback Machine .
  3. Consulte la Tabla 3.6 "Distribución de bits UTF-8" en el estándar Unicode https://www.unicode.org/versions/Unicode6.0.0/UnicodeStandard-6.0.pdf Archivado el 31 de marzo de 2019 en Wayback Machine .
  4. 1 2 3 4 Hoja de ruta hacia el TIP  ( PDF) (12 de marzo de 2020). Consultado el 17 de marzo de 2020. Archivado desde el original el 29 de febrero de 2020.
  5. Propuesta para codificar Small Seal Script en UCS  (inglés) (PDF) (20 de junio de 2019). Consultado el 17 de marzo de 2020. Archivado desde el original el 30 de noviembre de 2019.
  6. Solicitud de comentarios sobre la codificación de Oracle Bone Script  ( PDF) (21 de octubre de 2015). Consultado el 20 de noviembre de 2017. Archivado desde el original el 14 de junio de 2019.

Enlaces