La sistemática del lenguaje es una disciplina auxiliar que ayuda a organizar los objetos estudiados por la lingüística : lenguas, dialectos y grupos de lenguas . El resultado de tal ordenación también se denomina taxonomía de las lenguas .
La taxonomía de las lenguas se basa en la clasificación genética de las lenguas : el agrupamiento evolutivo-genético es natural, no artificial, es bastante objetivo y estable (en contraste con la afiliación de área que cambia a menudo rápidamente). El objetivo de la sistemática lingüística es crear un único sistema coherente de idiomas del mundo basado en la asignación de un sistema de niveles taxonómicos lingüísticos y nombres correspondientes, construido de acuerdo con ciertas reglas ( nomenclatura lingüística ). Los términos " sistemática " y " taxonomía " a menudo se usan indistintamente.
Los siguientes principios son característicos de la sistemática lingüística:
La unidad de todo el sistema y la comparabilidad de las unidades del mismo nivel deben estar aseguradas por criterios comunes para la atribución de objetos a un nivel u otro. Esto se aplica tanto a los niveles superiores (familias y grupos) como a los niveles inferiores (idiomas y dialectos). En una taxonomía unificada, los criterios para asignar objetos al mismo nivel deben cumplir los siguientes requisitos: aplicabilidad a cualquier objeto y consistencia (o falta de ambigüedad) de asignar un objeto a una clase particular.
Sistema unificado de niveles taxonómicos (rangos) . Los lingüistas solo pueden envidiar el sistema armonioso de taxones y rangos en biología . Aunque en lingüística hay muchos términos para diferentes niveles taxonómicos (familia, grupo, rama, a veces phylum, phylum, stock), pero su uso varía mucho según el autor, el lenguaje de descripción y la situación específica. En el marco de la sistemática, estos niveles taxonómicos se ordenan y utilizan de acuerdo con ciertas reglas.
Sistema de nominación unificado . A diferencia de la biología, donde hay un sistema coherente de nominación en latín usando un nombre binario para la unidad base, en lingüística no hay nada de eso y difícilmente puede surgir. Por lo tanto, lo principal que puede hacer la taxonomía es, en primer lugar, ordenar los nombres de los idiomas en el idioma de descripción, eligiendo el nombre principal para cada idioma y grupo de idiomas; en segundo lugar, como un medio adicional para la designación inequívoca de idiomas, independientemente del idioma de descripción, indique para cada uno su propio nombre .
Uso de datos lexicoestadísticos . Para determinar el nivel de taxa en una clasificación existente (o para construir una clasificación donde aún no existe) y asignar un objeto a un determinado nivel, se utiliza el criterio de mantener el vocabulario básico; y no solo para construir los niveles superiores de la clasificación (lo cual es trivial), sino también para distinguir entre idiomas individuales. El porcentaje de coincidencias se calcula a partir de la lista Swadesh estándar de 100 palabras . El énfasis se pone deliberadamente en el porcentaje de coincidencias (aunque el tiempo de decaimiento se puede dar como referencia), ya que no hay unanimidad entre los comparatistas sobre este tema, y el porcentaje relativo de coincidencias, en lugar de los tiempos de decaimiento absolutos, es suficiente para construir una taxonomía de las lenguas.
Los principales niveles taxonómicos superiores de la taxonomía son: familia , rama , grupo . Si es necesario, se puede aumentar el número de niveles agregando prefijos arriba y abajo ; por ejemplo: subfamilia , supergrupo . Ocasionalmente, el término zona también se puede usar , a menudo para denotar agrupaciones no genéticas sino areales o parafiléticas , véanse, por ejemplo, las clasificaciones de lenguas bantú o austronesias .
La familia es el nivel básico en el que se basa toda taxonomía. Una familia es un grupo de idiomas claramente relacionados pero bastante distantes que tienen al menos el 15 por ciento de coincidencias en la lista base (una variante de 100 palabras de la lista Swadesh ). Consulte la Lista de familias de Eurasia o la Descripción general de las familias de África para ver ejemplos .
Para cada familia, la lista de ramas, grupos, etc., se determina teniendo en cuenta los agrupamientos tradicionalmente distinguidos, el grado de proximidad entre ellos y el tiempo de desintegración en componentes. Al mismo tiempo, las ramas y grupos de diferentes familias no tienen que tener el mismo nivel de profundidad, solo es importante su orden relativo dentro de una familia.
Por ejemplo, para la familia indoeuropea , se puede distinguir el siguiente conjunto de ramas: anatolia , tocaria , celta , baltoeslava , indoirania , germánica , ítalo - romana , greco-macedonia , armenia , albanesa y una serie de Lenguas antiguas, condicionalmente unidas en la zona paleo-balcánica .
La tabla muestra ejemplos de construcción de taxonomía con uso estricto de niveles taxonómicos. Si para los idiomas indoeuropeos se pueden omitir algunos niveles, entonces para los conocidos por su austronesio ramificado ni siquiera son suficientes.
Nivel | Idioma 1 | Idioma 2 |
---|---|---|
macrofamilia , phyla | — | — |
una familia | indoeuropeo | austronesio |
subfamilia | "Europeo" | Malayo-Polinesio |
superrama | Polinesio malayo central oriental | |
zona | malayo-polinesio oriental | |
subzona | oceánico | |
rama | Balto-eslavo | oceánico central oriental |
subdelegación | Pacífico central (Fiyi-Polinesia) | |
Grupo | eslavo | Grupo de Fiyi-Polinesia Oriental |
subgrupo | eslavo oriental | polinesio |
sub-subgrupo | nuclear-polinesia | |
microgrupo | samoano | |
idioma | ruso | tokelau |
criterios de selección . Cuando se formalizan los niveles taxonómicos de los niveles inferiores (es decir, lengua y dialecto), se añaden problemas de otro tipo, además de los puramente clasificatorios. El uso mismo del criterio de similitud estructural para la selección de idiomas y dialectos individuales puede encontrar muchas objeciones. Muchos lingüistas se han acostumbrado al hecho de que los conceptos de "lenguaje" y "dialecto" son demasiado vagos y su distinción es más responsabilidad de la sociolingüística . Sin embargo, para las necesidades de la sistemática, se requiere una definición inequívoca y universal de lengua y dialecto. Para ello, los criterios de asignación de modismos a uno o varios idiomas deben cumplir los mismos requisitos: aplicabilidad a cualquier objeto (universalidad) y consistencia (o unambigüedad) de referir un objeto a una determinada clase. Es obvio que con la ayuda de criterios sociolingüísticos no será posible sistematizar sin ambigüedades todos los idiomas (para más detalles, consulte el artículo Idioma o dialecto ).
Por lo tanto, en la sistemática del lenguaje se utiliza una escala con cuatro niveles de similitud: lengua - adverbio - dialecto - dialecto , desarrollada sobre una base empírica [2] .
Según esta escala, si dos modismos tienen un porcentaje de coincidencias en una lista base de 100 palabras < 89 (correspondiente a un tiempo de descomposición, según la fórmula de Swadesh-Starostin , > 1100 años atrás), entonces los modismos son idiomas diferentes . Si el porcentaje de coincidencias es > 97 (tiempo de descomposición < 560 años), entonces los modismos son dialectos del mismo idioma. Para el intervalo restante (89-97), se propone un nivel intermedio de lenguas muy próximas/dialectos lejanos, para lo cual se utiliza como denominación el término “ adverbio ” en los casos en que el modismo correspondiente se considera tradicionalmente como componente de otro idioma. Cuando dicho idioma se considera un idioma separado, el nivel taxonómico "lenguaje" se mantiene detrás de él, y la asociación en la que entra y corresponde en términos de proximidad a un solo idioma se denomina " grupo ".
El uso de los niveles de los niveles inferiores se ilustra claramente en la tabla. Al mismo tiempo, a menudo sucede que uno o más modismos en un grupo se consideran idiomas, mientras que otros no lo son, aunque se encuentran en el mismo nivel de inteligibilidad mutua/similitud estructural. Un ejemplo es el grupo Vainakh , que incluye las lenguas chechena , ingush y el dialecto Akkin-Orstkhoi .
niveles |
ejemplos | |
a) |
b) | |
Nivel 1 [89-95% de coincidencia entre componentes] generalmente corresponde a a) un idioma independiente (poco inteligible entre sí con otros idiomas), o b) un grupo ( cluster ) de idiomas estrechamente relacionados. |
||
Nivel 2 [95-99] corresponde a a ) adverbios (grupos de dialectos) o b ) lenguas individuales estrechamente relacionadas (parcialmente mutuamente inteligibles). |
idioma bielorruso , dialecto del sur de Rusia, dialectos del centro de Rusia, dialecto del norte de Rusia ; | |
El nivel 3 [99-100] corresponde al individuo dialectos (con buen entendimiento mutuo). |
||
El nivel 4 corresponde a dialectos individuales (con diferencias estructurales muy pequeñas). |
Moscú, |
Nota : Los nombres subrayados se expanden en las siguientes filas de la tabla .
Los niveles indicados a su vez se correlacionan con el grado de inteligibilidad mutua, lo que es especialmente útil cuando se desconoce el porcentaje de superposición entre idiomas.
La asignación de idiomas y dialectos puede no coincidir con el enfoque tradicional. Por ejemplo:
A pesar de que la familia es el nivel base superior en la taxonomía, también tiene en cuenta información sobre relaciones más profundas. Pero los términos para los niveles superiores no se prestan a una formalización tan rigurosa como los inferiores.
En los trabajos de lingüistas predominantemente occidentales (ver, por ejemplo, [Kaufman 1994: 32; Wurm 1994: 93; Voegelin 1977: 2-3]) también se usan otros términos:
Ejemplos de directorios construidos en base a taxonomía o similar:
Idioma e idiomas | |
---|---|
|