La distancia de unicidad (en criptología) es el número de caracteres de texto cifrado en el que la entropía de información condicional de la clave (y, en consecuencia, del texto sin formato ) es igual a cero, y la clave en sí misma se determina de forma única.
Alcanzar la distancia de unicidad aún no significa que la clave (o el texto sin formato) se pueda encontrar en la práctica, ya que la definición no tiene en cuenta la computabilidad práctica de la clave, sino que solo postula que se puede encontrar, por ejemplo, utilizando métodos exhaustivos . buscar _
Definamos la función de confiabilidad de la clave a través de la entropía de información condicional de la clave y los símbolos de texto cifrado que son interceptados por el criptoanalista :
Tal número de caracteres interceptados , en el que y se denomina distancia de unicidad.
La derivación de la fórmula de distancia de unicidad es posible para algunos criptosistemas "buenos", en los que la entropía de la información del texto cifrado tiene ciertas propiedades de "linealidad":
donde es el número total de caracteres en el texto cifrado del mensaje, es el alfabeto del texto cifrado, por simplicidad, igual al texto sin formato y la clave de cifrado la última expresión es una "linealización" de la expresiónLuego, a partir de las expresiones para la entropía de información conjunta:
Entonces, de acuerdo con la definición de la distancia de unicidad como :
La expresión se denomina redundancia de fuente . Si la redundancia de la fuente es cero, es decir, es imposible determinar a partir del texto sin formato si es correcto o no (no hay sumas de verificación ni firmas en él), entonces la distancia de unicidad se vuelve igual a infinito y el criptosistema se vuelve absolutamente seguro.
Para el idioma ruso, la redundancia es de 3,5 bits por carácter. Si se usa un cifrado monoalfabético , entonces el número de claves posibles en él es igual a , y la entropía de la clave (con una elección equiprobable) de un bit .
Entonces, la distancia de unicidad para un texto ruso encriptado con un cifrado de sustitución simple es:
Es decir, si un criptoanalista intercepta más de 35 caracteres del texto cifrado, lo más probable es que esto le permita (por ejemplo, mediante una búsqueda exhaustiva) restaurar el texto sin formato original. Si se interceptan menos caracteres, la recuperación del texto será ambigua (puede haber varias versiones diferentes del texto sin formato).