KOI-8

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 21 de noviembre de 2019; las comprobaciones requieren 8 ediciones .

KOI-8 ( código para intercambio e información , 8 bits), KOI8 es una página de códigos compatible con ASCII  de ocho bits . Diseñado para codificar letras de alfabetos cirílicos . Fue ampliamente utilizado como la codificación rusa principal en los sistemas operativos compatibles con Unix y en el correo electrónico , pero más cerca de 2010 , con la difusión de Unicode , está cayendo gradualmente en desuso.

También hay una versión de siete bits de la codificación que no es totalmente compatible con ASCII- KOI-7 . KOI-7 y KOI-8 se describen en el ahora desaparecido GOST 19768-74.

Los desarrolladores de KOI-8 colocaron los caracteres del alfabeto ruso en la parte superior de la tabla de códigos de tal manera que las posiciones de los caracteres cirílicos corresponden a sus contrapartes fonéticas en el alfabeto inglés de la parte inferior de la tabla. Esto significa que si en el texto escrito en KOI-8, para cada carácter, se elimina un bit de la izquierda, entonces se obtendrá un texto relativamente legible, similar a la transliteración . Por ejemplo, las palabras "Texto en ruso" se convertirán en "rUSSKIJ tEKST". Debido a esto, los caracteres cirílicos no están en orden alfabético.

Hay varias variantes de codificación KOI-8 para varios alfabetos cirílicos que amplían ciertos códigos (el rango total de 192-255 con 32 letras rusas en dos casos permanece sin cambios en todas las variantes). El alfabeto ruso se describe en la codificación KOI8-R , el ucraniano en KOI8-U y el tayiko en KOI8-T.

En la década de 1990, KOI8-R se convirtió en el estándar de facto para codificar el cirílico ruso en sistemas operativos y correo electrónico similares a UNIX . El autor de esta codificación ( RFC 1489 ),  Andrey Chernov , trabajó en la empresa Demos ( red Relcom ) a principios de la década de 1990 y participó directamente en el lanzamiento y ajuste del primer canal de Internet entre Rusia y los países occidentales . KOI-8 se convirtió en la primera codificación estandarizada rusa en Internet.

El IETF ha aprobado varios RFC sobre opciones de codificación KOI-8:

IANA ha registrado codificaciones en su lista.

El estándar RFC 1489 exige la presencia de caracteres gráficos de "caja" ( pseudográficos ), sin embargo, este requisito rara vez se cumple.

En Microsoft Windows, KOI8-R tiene asignado el código de página 20866, KOI8-U es 21866.

El comienzo de la tabla de codificación ( latín ) corresponde completamente a la codificación ASCII .

En las siguientes tablas, los números debajo de las letras indican el código hexadecimal Unicode de la letra .

Codificación KOI8-R (ruso)

.0 .una .2 .3 .cuatro .5 .6 .7 .ocho .9 .A .B .C .D .MI .F
 
ocho.
 

2500

2502
┌250C
_

2510

2514

2518
251C

2524

252C

2534

253C

2580

2584

2588
▌258C
_

2590
 
9.
 

2591

2592

2593

2320

25A0

2219

221A

2248

2264

2265
 
A0

2321
°
B0
²B2
_
B7
_
÷
F7
 
UNA.
 

2550

2551

2552
yo
451

2553

2554

2555

2556

2557
#
2558

2559

255A
╛255B
_
╜255C
_
255D
255E
 
b.
 
╟255F
_

2560

2561
Yo
401

2562

2563

2564

2565

2566

2567

2568

2569
256A

256B
256C
©
A9
 
C.
 
tu 44E
un
430
b
431
446
_
434
_
mi
435
F
444
g433
_
x
445
y
438
439 _
a
43A
l43B
_
metro
43C
norte 43D
sobre
43E
 
D.
 
norte 43F
yo
44F
pág
. 440
de
441
t442 _
en
443
436
_
en
432
44C
_
44B _
437 _
448
_
y 44D
w449
_
hora
447
b44A
_
 
MI.
 
Yu
42E
un
410
B
411
426 _
D
414
415
_
F
424
G
413
X425
_
y
418
Y
419
K
41A
L
41B
METRO
41C
H
41D
Acerca
de 41E
 
F.
 
P
41F
soy
42F
$
420
C
421
T
422
423 _
F
416
B
412
segundo 42c
S
42B
417
_
SH
428
E
42D
Shch
429
Capítulo
427
b
42A

Otras opciones

Solo se muestran las filas de la tabla que no coinciden, ya que todo lo demás coincide.

Codificación KOI8-U (ruso-ucraniano)

.0 .una .2 .3 .cuatro .5 .6 .7 .ocho .9 .A .B .C .D .MI .F
 
UNA.
 

2550

2551

2552
yo
451
$
454

2554
yo
456
457
_

2557
#
2558

2559

255A
╛255B
_
491
_
255D
255E
 
b.
 
╟255F
_

2560

2561
Yo
401
Є
404

2563
yo
406
£
407

2566

2567

2568

2569
256A
490
_
256C
©
A9

Codificación KOI8-RU (ruso-bielorruso-ucraniano)

.0 .una .2 .3 .cuatro .5 .6 .7 .ocho .9 .A .B .C .D .MI .F
 
UNA.
 

2550

2551

2552
yo
451
$
454

2554
yo
456
457
_

2557
#
2558

2559

255A
╛255B
_
491
_
¢
45E
255E
 
b.
 
╟255F
_

2560

2561
Yo
401
Є
404

2563
yo
406
£
407

2566

2567

2568

2569
256A
490
_
Î
40E
©
A9

Codificación KOI8-C (Asia Central)

.0 .una .2 .3 .cuatro .5 .6 .7 .ocho .9 .A .B .C .D .MI .F
ocho.
- 493
497
_
49B
_
49D
_

norte 4A3

- 4AF

- 4B1
4B3
_

¥ 4B7

Nº 4B9

h 4BB

2580
4D9
_

Σ 4E3
4E9
_
ӯ
4E
9. 492
_
496
_
K
49A
49C
_

¥ 4A2

- 4AE
4B0
_

- 4B2

- 4B6

- 4B8
4BA_
_

2321
4D8
_
Ӣ
4E2

Ψ 4E8
4EE
_
UNA.  
A0
$
452
-453
_
yo
451
$
454
*
455
yo
456
457
_
$
458
459
_
45A
_
45B
_
45C
_
491
_
¢
45E
45F
_
b.
2116

402 €
403
_
Yo
401
Є
404
S
405
yo
406
£
407
£
408
£
409
Њ40A
_
£
40B
40C
_
490
_
Î
40E
40F
_

Codificación KOI8-O, KOI8-S (eslavo, ortografía antigua)

040790}}
.0 .una .2 .3 .cuatro .5 .6 .7 .ocho .9 .A .B .C .D .MI .F
203A}} 045A
045C
_
ћ
045B
045F
_
Î 040E
©
00A9

Codificación ISO-IR-111, KOI8-E

.0 .una .2 .3 .cuatro .5 .6 .7 .ocho .9 .A .B .C .D .MI .F
 
UNA.
 
 
00A0
$ 0452
- 0453
mi 0451
0454
_
* 0455
yo
0456
0457
_
$ 0458
0459
_
045A
ћ
045B
045C
_
­
00AD
¢
045E
045F
_
 
b.
 

2116
0402
0403
_
Yo
0401
Є
0404
S
0405
yo
0406
£
0407
£
0408
0409
_
040A
_
£ 040B
040C
¤00A4
_
Î 040E
P040F
_

Codificación KOI8-Unificado, KOI8-F

La codificación KOI8-Unified (KOI8-F) fue propuesta por Fingertip Software [1] .

.0 .una .2 .3 .cuatro .5 .6 .7 .ocho .9 .A .B .C .D .MI .F
 
ocho.
 

2500

2502
┌250C
_

2510

2514

2518
251C

2524

252C

2534

253C

2580

2584

2588
▌258C
_

2590
 
9.
 

2591
2018 _
2019 _
201C _
201D _

2022

2013

2014
©
00A9

2122
 
00A0
»
00BB
®
00AE
«
00AB
00B7
_
¤00A4
_
 
UNA.
 
 
00A0
$ 0452
- 0453
mi 0451
0454
_
* 0455
yo
0456
0457
_
$ 0458
0459
_
045A
ћ
045B
045C
_
0491
_
¢
045E
045F
_
 
b.
 

2116
0402
0403
_
Yo
0401
Є
0404
S
0405
yo
0406
£
0407
£
0408
0409
_
040A
_
£ 040B
040C
0490
_
Î 040E
P040F
_

Variantes no cirílicas de KOI-8

En algunos países de CMEA , se crearon modificaciones de KOI-8 para variantes nacionales del alfabeto latino . La idea básica era la misma: al "cortar" el octavo bit, el texto debería permanecer más o menos claro.

Notas

  1. KOI8 unificado // Sitio del software Fingertip

Enlaces