El coeficiente de Joyne es un coeficiente en lingüística que muestra cuán universal o, por el contrario, cuán especializado es el uso de una palabra en particular en textos de varios temas. Si la palabra se usa solo en textos de un tema determinado, el coeficiente de Joyne está cerca de 0, pero si la frecuencia de uso de la palabra es aproximadamente la misma en cualquier texto, el coeficiente está cerca de 100.
El coeficiente de Joyne se define mediante la fórmula [1] [2]
donde es el número de segmentos temáticos en que se dividen los textos estudiados;
es la frecuencia promedio de una palabra en todos los segmentos;
— desviación estándar de frecuencias para segmentos individuales.
Para calcular el coeficiente de Join, los textos en estudio se dividen en segmentos de diferentes temas de aproximadamente el mismo volumen (al compilar diccionarios de frecuencia, generalmente se asignan 100 segmentos). Para cada segmento se calcula la frecuencia de uso de una determinada palabra, es decir, el número de usos de palabras dividido por el volumen total del segmento. Para la serie de frecuencias obtenida , se calcula la desviación estándar , luego de lo cual los valores obtenidos se sustituyen en la fórmula.
Deje que los textos estudiados se dividan en 4 segmentos, cada uno con un tamaño de 1 millón de palabras. Cierta palabra, por ejemplo, "coeficiente" aparece en estos segmentos 10, 11, 8 y 3 veces, respectivamente. Entonces = 10, = 11, = 9, = 3 usos por millón. Significar
Desviación Estándar
Entonces el coeficiente Join