Lemma ( inglés lemma ) es la forma inicial del diccionario de la palabra [1] . En ruso, para sustantivos y adjetivos, esta es la forma nominativa singular, para verbos y formas verbales, es la forma infinitiva. Concepto básico en el campo de la lingüística de corpus y procesamiento automático del lenguaje natural . El proceso de reducción automática de palabras de texto a lemas se llama lematización .
Por ejemplo, la frase " Temprano en la mañana, la madre de Mila lavó el marco con jabón " después de la lematización se verá así: mañana, temprano, mamá, Mila, lavado, marco, jabón .
En lingüística de corpus, una búsqueda por lema da contextos con la mención de todas las formas de palabra de un lexema dado . Por ejemplo, la búsqueda en el lema cat devolverá contextos que contienen cat, cat, cat, cats, cats , etc. Este tipo de búsqueda contrasta con la búsqueda en forma de palabra : en este caso, la búsqueda en la forma de palabra cat devolverá contextos que contienen exactamente esta forma gramatical del número singular del caso dativo [2] .