corpus coránico del árabe | |
---|---|
URL | corpus.quran.com |
Comercial | Licencia Pública General GNU |
tipo de sitio | corpus de textos |
Idiomas) | árabe / inglés |
ubicación del servidor | Gran Bretaña |
Dueño | Universidad de Leeds |
Comienzo del trabajo | 2009 |
Estado actual | trabaja y se desarrolla |
El corpus coránico árabe es un corpus electrónico en línea de textos coránicos que se puede buscar y contiene 77.430 palabras árabes . El objetivo del proyecto es proporcionar datos morfológicos y sintácticos para los investigadores que deseen estudiar el árabe clásico [1] [2] [3] [4] [5] .
El análisis de texto gramatical ayuda a los usuarios a descubrir los significados previstos de cada verso y oración. Cada palabra del texto del Corán se atribuye con una indicación de su parte del discurso y varias características morfológicas. A diferencia de otros corpus árabes, la gramática utilizada por el corpus coránico es la gramática árabe tradicional Irab (إعراب). El corpus coránico del árabe es un proyecto de investigación dirigido por el científico informático Kays Dukes de la Universidad de Leeds [4] y forma parte del proyecto de estudio del idioma árabe en la Escuela de Informática dirigido por Eric Atwell [6] .
El corpus anotado incluye [1] [7] :
El marcado de parte del discurso asigna a cada palabra del corpus una etiqueta de parte del discurso y características morfológicas , por ejemplo, una indicación de si la palabra dada es un sustantivo o un verbo , si está en masculino o femenino . En la primera etapa del proyecto, se utilizó el marcado parcial automático. Las características de cada una de las 77.430 palabras del Corán luego son refinadas paso a paso por dos anotadores, y los refinamientos continúan hasta el día de hoy.
La investigación lingüística que utiliza el corpus coránico incluye la enseñanza de un modelo Markov oculto de marcado de parte del discurso árabe [8] , categorización automática de capítulos del Corán [9] y análisis de texto prosódico [10] .
Además, el proyecto prevé una traducción literal del Corán basada en fuentes inglesas aceptadas en lugar de una nueva traducción del Corán [4] .
idioma árabe • العربية | |||||||
---|---|---|---|---|---|---|---|
Reseñas | |||||||
Escritura | |||||||
alfabeto arabe |
| ||||||
Letras | |||||||
periodización | |||||||
Variedades |
| ||||||
Académico | |||||||
Caligrafía |
| ||||||
Lingüística |
Lenguaje del cuerpo | |
---|---|
corpus ingleses |
|
corpus en ruso |
|
Corporación en otros idiomas |
|
Organizaciones |