En tipografía digital , los caracteres combinables son caracteres diseñados para modificar otros caracteres. Los caracteres combinables más comunes en latín son diacríticos combinables (incluidos los acentos combinables ).
Unicode también contiene muchos caracteres precompuestos, por lo que en muchos casos se pueden usar signos diacríticos combinables y caracteres precompuestos a elección del usuario o de la aplicación. Esto lleva al requisito de realizar la normalización Unicode antes de comparar dos cadenas Unicode y diseñar cuidadosamente los convertidores de codificación para asignar correctamente todas las representaciones válidas de caracteres Unicode a la codificación heredada para evitar la pérdida de datos.
En Unicode, el bloque principal para diacríticos combinables de idiomas europeos y el Alfabeto Fonético Internacional es U+0300…U+036F . La combinación de signos diacríticos también aparece en muchos otros bloques Unicode. En Unicode, los signos diacríticos siempre se colocan después del carácter base (a diferencia de algunos conjuntos de caracteres combinables más antiguos, como ANSEL ), lo que permite agregar múltiples signos diacríticos a un solo carácter, aunque a partir de 2010, pocas aplicaciones admiten la visualización correcta de tales combinaciones.
Los caracteres combinados también se utilizan para crear lo que se conoce como "texto Zalgo" : texto que parece distorsionado debido al uso excesivo de signos diacríticos. Esto hace que el texto se expanda verticalmente, superponiéndose a otro texto [1] .
Ejemplop̴̢̧̡̧̨̨̨̡̧̢̢̢̢̡̡̢̨̡̧̢̛̛͈͕̩̱̼̲͚̼̻͉̱̤͔̞̤̝̠̗͍̯̰̹̺̺̘͎̝̦̱̤̩͉̼͕̳̹͕͙̘̘̝̘̦̜͇̞͇̰̙̘͙̞̖̝̰̘̰̫̰͉͉͚̥͉̝̣̥̠̳̘͕̖̹̪̘̦̝̗͖̭̺̪̱͓̝̻͈̟̲̳̞̫̥̞̝̹̜̱̺̹͕̟̖̰̫̟͇̭͇̩͖̘̩̺̱̥̯̮̜̰̘̹̼̲̬̣̞̬̥͖͇͎̤̠̠̜̮̱̱̩͙̥͔̯͕̘͍̳͚̝̼͍̱̳̼͓̱̟̫̭͓̬̘̻̟̜̮̹͍̳̙̟̙̝̦͇̣̤̮̘͉̭͙̩͓̯̥̳̳̠̻̭̭͕̝̮̞̠̺͈̮̦̥̺̩͉̞͔̗̬̣̣̬͔̦̩̬̘̟̹͎͎̤̖̻̱͍͍̝͔̠̼͔̦͚̦͍̤̭̝͖͈̥̱͉͉̟̲̫̻̤͓̮̖̜̱̖͍̦̺̦͍̩̱͔͆̈y̎͑̉͋͑͂̾̐̿͑̈̎͑̉͋͑͂̾̐̿͑̈͌͌͗̏̔̓̓̐̈̈͌̈̈͌͗̏̔̓̓̐̈̈͌͗̏̔̓̓̐̈y͒̅̂̈ẙ̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛̊̔̄̾͐̃͋͋̐̈̒̂̆͌͐͐͛r̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙͋̆̏̔͛ỳ̷̨̧̡̧̨̡̛̛̛̛̛̰̙͔̯͚͔̠͓͙̭̼̱̫̹̪̪̞̤̪͔̻͓̪̥̣̫̪̬̰̘͙̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗͋̆̏̔͛ỳ̀̒̊̆̊̅͌͌̓̊̌̍͊͒͊͆̎̀̅̏̃̆̅͒͒͑͒͗y̓̒̾̂̀̈y͛̈̌̉͂̉̓̊̓͋̈ỳ̌̍̉̆̈̊͋̀͐͂̀̃̄̒̋͒̈̄̐̈̈y̅̿̌̌̆̆y̅̿̌̌̆̆y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y͛̒̃̔̋̆̊̐̀̐͊̉͗͑̂͒͐̿y̽̚̚͘̚̚̕͘͘͘̕̚̚͜͜͠͝͠͠͠͝͠͠͠͝͝ѝ̴̡̡̢̛̟͚͉̲̞͓͍͚̱͉͖͕̙̮͎̳̣̰͙̞͍͊̐͐̂̃͛̽̈ẏ̒͌̓̿̑̑̽̀̉y̑̏̚͝͝͝͝ͅṃ̸̡̡̢̛̛̛͉̗̪͚͔̹̜̣̱̜̠͎̥̘͎̟̥̬̘ȳ̂̌͌͑͛̾͒̑̈̋̌̉̾͑͛̒̓͗̈y̿̿y̎͒̌̓̎̊͋͛ẙ̅̃̎͒̌̓̎̊͋͛ẙ̅̃͛̄̽̒̋̋͛̄̽̒̋̋y̔̑̎̾̽̔y̍͛̿̈y̅̿̌̔̈y̅̄͐̈y̔͋̄̎͑̔͋̄̎͑y̿͋̍̈̎̑̿̈y͗̋̎̓̐̆̾̈y̒̿y̾̈̀͛̈̾̈̀͛̈y̓̽̃͒̀̆̀̓̽̃͒̀̆̀y̓̽̃͒̀̆̀ R
Unicode contiene los siguientes bloques específicamente para diacríticos combinables:
Una de las características de un carácter en Unicode es la clase de combinabilidad canónica, que acepta solo valores numéricos [2] .
Sentido | Título completo en inglés | traducción rusa | Descripción |
---|---|---|---|
0 | No_reordenado | No determinado | Rótulos no combinables y enmarcados; también muchos signos de vocales y consonantes, incluso si son combinables |
una | cubrir | signo de superposición | Caracteres superpuestos a una letra o símbolo base |
7 | Nuktá | Nuqta | Nukta: un signo en los sistemas de escritura derivados de Brahmi |
ocho | Kana_Voicing | Signos kana sonoros | Signos sonoros en kana - dakuten y handakuten |
9 | Virama | Virama | Virama es un signo en sistemas de escritura derivados de Brahmi. |
10-199 | Ccc10—Ccc199 | Clases de combinabilidad canónica 10-199 | Clases de posiciones fijas |
200 | Adjunto_abajo_izquierda | Signo de contacto abajo a la izquierda | |
202 | Adjunto a continuación | Signo de contacto a continuación | |
204 | — | ||
208 | — | ||
210 | — | ||
212 | — | ||
214 | Adjunto_arriba | Señal de contacto desde arriba | |
216 | Adjunto_arriba_a la derecha | Signo de contacto arriba a la derecha | |
218 | Abajo_izquierda | Firmar abajo a la izquierda | |
220 | Abajo | firmar desde abajo | |
222 | Abajo_Derecha | Signo inferior derecho | |
224 | Izquierda | firmar a la izquierda | |
226 | Derecha | señal derecha | |
228 | Arriba_Izquierda | Signo superior izquierdo | |
230 | Arriba | firmar desde arriba | |
232 | Arriba_Derecha | Señal arriba a la derecha | |
233 | Doble_abajo | doble signo debajo | |
234 | doble_arriba | doble señal en la parte superior | |
240 | Iota_Subíndice | iota interlineal | subíndice griego iota solamente |