Corpus Nacional Escocés

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 22 de noviembre de 2017; las comprobaciones requieren 2 ediciones .

Scottish Corpus of Text and Speech ( Scottish Corpus of Text and Speech ) es el Corpus Nacional de la lengua escocesa (germánica) , creado en 2004 por un grupo de expertos: miembros del English Language Project y del Stella Project de la School of Critical Estudios en la Universidad de Glasgow .

Antecedentes de la creación de "LOS ESCOCESES"

En los últimos años, se han producido cambios significativos en la situación política de Escocia. El nuevo movimiento político revivió el interés por los idiomas y la cultura locales. En Escocia, el patrimonio lingüístico es brillante, aislado de los demás. La situación del idioma moderno aquí es muy rica, porque el escocés, el inglés, el gaélico y muchas otras comunidades lingüísticas coexisten aquí. Sin embargo, cuestiones como la preservación del idioma escocés, las características distintivas del inglés escocés o el uso de idiomas no autóctonos como el chino o el urdu no cuentan con suficientes datos y respuestas inequívocas. Y esta falta de información crea problemas significativos para quienes trabajan en el campo de la educación o simplemente están interesados ​​en este tema.

Las tecnologías modernas han hecho posible almacenar y analizar grandes cantidades de información. Y "THE SCOTS" es el primer proyecto a gran escala dedicado exclusivamente a las lenguas de Escocia. Proporciona un gran corpus electrónico de textos escritos y hablados para los idiomas de este país. El corpus existe desde noviembre de 2004 y, después de actualizaciones y adiciones periódicas, en mayo de 2007 el número de palabras en el sitio alcanzó los 4 millones. Se espera que para aquellos interesados ​​en la diversidad lingüística de Escocia, THE SCOTS proporcione respuestas a todas sus preguntas. El corpus tiene la oportunidad de explorar los idiomas de Escocia de nuevas maneras y cerrar las brechas que existen actualmente en nuestro conocimiento de ellos.

Los escoceses

En cuanto al estuche en sí, da la impresión de ser un estuche moderno, extremadamente conveniente, fácil de usar, en constante evolución y capaz de responder muchas preguntas. Entonces, por ejemplo, cualquiera que tenga algún tipo de comentario puede enviar sus deseos a los creadores por correo electrónico, donde ellos, a su vez, pueden considerarlos y hacer los ajustes necesarios.

Composición del Cuerpo

El Scottish Corpus actualmente contiene más de 1.100 textos escritos y hablados, con un total de más de 4.000.000 de palabras. El 80% son textos escritos, el 20% son textos orales, que nos son proporcionados en forma de transcripción ortográfica, sincronizada con la fuente de sonido o video.

Una de las funciones del corpus es mostrar textos completos cuando sea posible, lo que hace que el corpus sea notablemente más poblado. En algunos casos, debido al permiso de derechos de autor, es posible que solo se muestre una parte del texto. En "LOS ESCOCESES" la información presentada está tomada de fuentes desde 1945 hasta la actualidad. SCOTS se esfuerza por lograr la equidad para una amplia gama de textos, textos en diferentes idiomas, géneros y registros; presentar hablantes o escritores en la máxima medida por género, edad, género, características profesionales y geográficas.

Tipos de búsqueda

Hay tres métodos de búsqueda diferentes. Aquellos usuarios que estén interesados ​​en información estadística, como la frecuencia relativa de ciertas palabras en diferentes géneros, pueden utilizar los datos escoceses en esta dirección. Dependiendo de la cantidad de información solicitada, puede elegir un tipo de búsqueda rápida, estándar o avanzada.

Búsqueda rápida

La búsqueda rápida es la forma más fácil de encontrar la frecuencia de uso de la palabra que le interesa en varios archivos de audio y documentos de texto. Como resultado, obtiene la frecuencia de la palabra y el formato de los archivos en los que se utiliza.

Búsqueda estándar

La búsqueda estándar le permite realizar algunos tipos de búsquedas simples y también le permite ver todos los documentos en el corpus.

Búsqueda avanzada

La búsqueda avanzada proporciona una gama más amplia de opciones que la estándar. Aquí está la información estadística principal, el concordanciador y los mapas en los que se muestran los resultados. La búsqueda avanzada se divide por criterios de búsqueda, que se pueden configurar para limitar la búsqueda de palabras en textos de un modo particular (discurso oral o escrito), género (correspondencia, ficción, entrevistas) o con un determinado conjunto de criterios (conversaciones). después de 2000, artículos científicos profesionales, etc.). Por lo tanto, los resultados de diferentes consultas de búsqueda pueden ser consistentes entre sí.

Notas

Cuando realice una búsqueda mediante la búsqueda rápida o estándar, accederá a una página de resultados con dos partes principales: un resumen de los resultados de la búsqueda y una lista de documentos.

Compiladores

Además de la Universidad de Glasgow, en el proyecto participaron especialistas de las siguientes organizaciones:

Acceso

Actualmente, solo la búsqueda de corpus es gratuita.

Literatura

Enlaces