Frecuencia (o frecuencia relativa ): la relación entre el número de instancias de un objeto determinado y el número total de instancias de todos los objetos en un conjunto determinado. A veces, el número de instancias de un objeto dado se conoce como la frecuencia absoluta de ese objeto. En lingüística y lexicoestadística , las palabras, letras, frases se entienden como tales objetos, en criptografía e informática , también combinaciones de letras y cualquier símbolo. Un conjunto puede significar cualquier texto, una colección de textos (corpus) o incluso un idioma.
El cálculo de la frecuencia de las palabras se realiza según la fórmula :
donde Freq x es la frecuencia de la palabra “x”, Q x es el número de usos de la palabra “x”, Q all es el número total de usos de la palabra. En la mayoría de los casos, la frecuencia se expresa como un porcentaje. En los diccionarios , la frecuencia de las palabras se puede reflejar en marcas: comunes, poco frecuentes, etc.
La frecuencia de las letras se determina de manera similar. La mayor frecuencia de consonantes en un segmento dado del texto (por ejemplo, en poemas) es uno de los signos de aliteración (junto con las características posicionales). Las altas tasas de frecuencia de las vocales en el texto indican indirectamente asonancia . El análisis de frecuencia se utiliza en criptografía para identificar las letras más frecuentes de un idioma en particular.
La frecuencia de palabras y letras fue la herramienta más importante del criptoanálisis en la era anterior a la ubicuidad de los cifrados en bloque .
No confunda los términos frecuencia y frecuencia .
Estadísticas de frecuencia de letras en el idioma ruso (sobre el material de la NKRYA ): [1]
carta | rango | usos | frecuencia | |
---|---|---|---|---|
a | 3 | 40487008 | 8,01% | |
b | 21 | 8051767 | 1,59% | |
en | 9 | 22930719 | 4,54% | |
GRAMO | 19 | 8564640 | 1,70% | |
d | 13 | 15052118 | 2,98% | |
mi | 2 | 42691213 | 8,45% | |
yo | 33 | 184928 | 0,04% | |
y | 25 | 4746916 | 0.94% | |
h | veinte | 8329904 | 1,65% | |
y | cuatro | 37153142 | 7,35% | |
el | 23 | 6106262 | 1,21% | |
a | once | 17653469 | 3,49% | |
yo | diez | 22230174 | 4,40% | |
metro | 12 | 16203060 | 3,21% | |
norte | 5 | 33838881 | 6,70% | |
sobre | una | 55414481 | 10,97% | |
PAGS | catorce | 14201572 | 2,81% | |
R | ocho | 23916825 | 4,73% | |
Con | 7 | 27627040 | 5,47% | |
t | 6 | 31620970 | 6,26% | |
a | quince | 13245712 | 2,62% | |
F | 31 | 1335747 | 0,26% | |
X | 24 | 4904176 | 0.97% | |
C | 28 | 2438807 | 0,48% | |
h | 22 | 7300193 | 1,44% | |
w | 26 | 3678738 | 0,73% | |
sch | 29 | 1822476 | 0,36% | |
b | 32 | 185452 | 0,04% | |
s | 17 | 9595941 | 1,90% | |
b | Dieciocho | 8784613 | 1,74% | |
oh | treinta | 1610107 | 0,32% | |
Yu | 27 | 3220715 | 0,64% | |
yo | dieciséis | 10139085 | 2,01% |