Lema (lingüística)

Lemma ( inglés  lemma ) es la forma inicial del diccionario de la palabra [1] . En ruso, para sustantivos y adjetivos, esta es la forma nominativa singular, para verbos y formas verbales, es la forma infinitiva. Concepto básico en el campo de la lingüística de corpus y procesamiento automático del lenguaje natural . El proceso de reducción automática de palabras de texto a lemas se llama lematización .

Por ejemplo, la frase " Temprano en la mañana, la madre de Mila lavó el marco con jabón " después de la lematización se verá así: mañana, temprano, mamá, Mila, lavado, marco, jabón .

Lema en lingüística de corpus

En lingüística de corpus, una búsqueda por lema da contextos con la mención de todas las formas de palabra de un lexema dado . Por ejemplo, la búsqueda en el lema cat devolverá contextos que contienen cat, cat, cat, cats, cats , etc. Este tipo de búsqueda contrasta con la búsqueda en forma de palabra : en este caso, la búsqueda en la forma de palabra cat devolverá contextos que contienen exactamente esta forma gramatical del número singular del caso dativo [2] .

Lema en Recuperación de Información y SEO

Notas

  1. Bolshakova E. I., Vorontsov K. V., Efremova N. E., Klyshinsky E. S., Lukashevich N. V., Sapin A. S. Procesamiento automático de texto en lenguaje natural y análisis de datos: libro de texto. subsidio _ - M. : NRU HSE, 2017. Copia archivada del 21 de enero de 2022 en Wayback Machine
  2. Descripción de búsqueda de lemas  (inglés)  ? . motor de dibujo Consultado el 31 de marzo de 2021. Archivado desde el original el 3 de marzo de 2021.
  3. ¿Lematización en SEO  (ruso)  ? .

Literatura