El análisis superficial ( eng. análisis superficial, fragmentación, análisis ligero ) es un método de análisis de oraciones en el que las partes constituyentes de una oración (sustantivos, verbos, adjetivos, etc.) se identifican primero y luego se vinculan en elementos de orden superior que tienen significado gramatical ( grupos o sintagmas nominales, grupos de verbos, etc.).
Mientras que los algoritmos simples de análisis de superficies vinculan las partes constituyentes mediante patrones de búsqueda elementales (por ejemplo, expresiones regulares ), los enfoques basados en el aprendizaje automático ( clasificadores , modelado de temas , etc.) pueden tener en cuenta la información contextual y formar fragmentos que reflejen mejor los vínculos semánticos entre los palabras principales [1] . Por lo tanto, estos métodos mejorados resuelven el problema de que una combinación de constituyentes elementales puede tener diferentes significados al más alto nivel según el contexto de la oración.
Similar al análisis léxico en los lenguajes informáticos, esta técnica se usa ampliamente en el procesamiento del lenguaje natural .
Llamada Hipótesis de la Estructura Superficial , se utiliza para explicar por qué los estudiantes de un segundo idioma a menudo no analizan oraciones complejas correctamente [2] .