Símbolo combinado

En tipografía digital , los caracteres combinables  son caracteres diseñados para modificar otros caracteres. Los caracteres combinables más comunes en latín son diacríticos combinables (incluidos los acentos combinables ).

Unicode también contiene muchos caracteres precompuestos, por lo que en muchos casos se pueden usar signos diacríticos combinables y caracteres precompuestos a elección del usuario o de la aplicación. Esto lleva al requisito de realizar la normalización Unicode antes de comparar dos cadenas Unicode y diseñar cuidadosamente los convertidores de codificación para asignar correctamente todas las representaciones válidas de caracteres Unicode a la codificación heredada para evitar la pérdida de datos.

En Unicode, el bloque principal para diacríticos combinables de idiomas europeos y el Alfabeto Fonético Internacional es U+0300…U+036F . La combinación de signos diacríticos también aparece en muchos otros bloques Unicode. En Unicode, los signos diacríticos siempre se colocan después del carácter base (a diferencia de algunos conjuntos de caracteres combinables más antiguos, como ANSEL ), lo que permite agregar múltiples signos diacríticos a un solo carácter, aunque a partir de 2010, pocas aplicaciones admiten la visualización correcta de tales combinaciones.

Texto Zalgo

Los caracteres combinados también se utilizan para crear lo que se conoce como "texto Zalgo"  : texto que parece distorsionado debido al uso excesivo de signos diacríticos. Esto hace que el texto se expanda verticalmente, superponiéndose a otro texto [1] .

Ejemplo

p̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈y̎͑̉͋͑͂̾̐̿͑̈̎͑̉͋͑͂̾̐̿͑̈͌͌͗̏̔̓̓̐̈̈͌̈̈͌͗̏̔̓̓̐̈̈͌͗̏̔̓̓̐̈y͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛r̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙͋̆̏̔͛ỳ̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗͋̆̏̔͛ỳ̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗y̓̒̾̂̀̈y͛̈̌̉͂̉̓̊̓͋̈ỳ̌̍̉̆̈̊͋̀͐͂̀̃̄̒̋͒̈̄̐̈̈y̅̿̌̌̆̆y̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿̿y̎͒̌̓̎̊͋͛ẙ̅̃̎͒̌̓̎̊͋͛ẙ̅̃͛̄̽̒̋̋͛̄̽̒̋̋y̔̑̎̾̽̔y̍͛̿̈y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑̔͋̄̎͑y̿͋̍̈̎̑̿̈y͗̋̎̓̐̆̾̈y̒̿y̾̈̀͛̈̾̈̀͛̈y̓̽̃͒̀̆̀̓̽̃͒̀̆̀y̓̽̃͒̀̆̀ R

Rangos en Unicode

Unicode contiene los siguientes bloques específicamente para diacríticos combinables:

Clase de combinabilidad canónica

Una de las características de un carácter en Unicode es la clase de combinabilidad canónica, que acepta solo valores numéricos [2] .

Sentido Título completo en inglés traducción rusa Descripción
0 No_reordenado No determinado Rótulos no combinables y enmarcados; también muchos signos de vocales y consonantes, incluso si son combinables
una cubrir signo de superposición Caracteres superpuestos a una letra o símbolo base
7 Nuktá Nuqta Nukta: un signo en los sistemas de escritura derivados de Brahmi
ocho Kana_Voicing Signos kana sonoros Signos sonoros en kana - dakuten y handakuten
9 Virama Virama Virama es un signo en sistemas de escritura derivados de Brahmi.
10-199 Ccc10—Ccc199 Clases de combinabilidad canónica 10-199 Clases de posiciones fijas
200 Adjunto_abajo_izquierda Signo de contacto abajo a la izquierda
202 Adjunto a continuación Signo de contacto a continuación
204
208
210
212
214 Adjunto_arriba Señal de contacto desde arriba
216 Adjunto_arriba_a la derecha Signo de contacto arriba a la derecha
218 Abajo_izquierda Firmar abajo a la izquierda
220 Abajo firmar desde abajo
222 Abajo_Derecha Signo inferior derecho
224 Izquierda firmar a la izquierda
226 Derecha señal derecha
228 Arriba_Izquierda Signo superior izquierdo
230 Arriba firmar desde arriba
232 Arriba_Derecha Señal arriba a la derecha
233 Doble_abajo doble signo debajo
234 doble_arriba doble señal en la parte superior
240 Iota_Subíndice iota interlineal subíndice griego iota solamente

Véase también

Notas

  1. ¿Cómo funciona el texto de Zalgo? . desbordamiento de pila . Consultado el 11 de abril de 2019. Archivado desde el original el 27 de mayo de 2019.
  2. Anexo estándar Unicode n.° 44: valores de clase de combinación canónica . Consultado el 6 de junio de 2019. Archivado desde el original el 8 de junio de 2019.

Enlaces