La lexicoestadística (de " léxico " y " estadística ") es un método estadístico utilizado en lingüística para determinar el grado de relación entre lenguas . Consiste en comparar la parte más estable del fondo léxico y determinar el número de palabras que tienen un origen común en lenguas afines . La lexicoestadística es uno de los principales métodos para construir una clasificación genética de las lenguas [1] [2] .
Para establecer el grado de similitudes y diferencias léxicas entre idiomas en términos porcentuales, se utiliza una lista Swadesh de 100 palabras [1] . Esta lista incluye palabras relacionadas con el llamado vocabulario básico, que es el más resistente a los cambios históricos en todos los idiomas del mundo . Cuanto mayor es el porcentaje de palabras coincidentes en los idiomas, más estrechamente relacionadas están. Entonces, por ejemplo, el análisis de las listas de palabras de los idiomas eslavos arroja alrededor del 80-85% de las coincidencias [3] .
Los datos de la lexicoestadística se utilizan en la glotocronología como base para determinar el tiempo de separación de las lenguas afines [1] [3] . Usado en un sentido amplio, el término "lexicoestadística" es sinónimo del término "glotocronología" (más precisamente, "glotocronología lexicoestadística") [2] [4] [5] .
![]() |
---|