La vinculación de entidades nombradas (del inglés. Named Entity Linking , NEL ) es una tarea que consiste en determinar la identidad de las entidades mencionadas en el texto. Considere, por ejemplo, la oración "Iré a Kirov este fin de semana". La esencia de vincular, en este caso, será correlacionar la palabra "Kirov" con la ciudad de Kirov, y no con una persona llamada Kirov, ni con ninguna otra cosa. NEL se diferencia del reconocimiento de entidad nombrada (NER) en que NER determina el tipo de entidad a la que se hace referencia (persona, ubicación geográfica, organización, etc.), pero no asocia la entidad con ninguna entidad en particular.
La vinculación de entidades nombradas requiere una base de conocimiento que contenga las entidades (o conceptos) con las que se pueden vincular las referencias. Una solución popular para vincular entidades en texto de código abierto son las bases de conocimiento basadas en Wikipedia [1] [2] , en las que cada página es una entidad con nombre. Los NEL que usan entidades de Wikipedia a veces se denominan wikificaciones . La base de conocimiento también puede obtenerse automáticamente del texto de capacitación [3] o construirse manualmente [4] .
Las referencias a entidades nombradas pueden ser sustancialmente ambiguas, cualquier método de vinculación debe ser capaz de resolver esta ambigüedad. Se han intentado muchos enfoques para resolver este problema. Milne y Witten propusieron una solución fructífera a este problema y se basó en el aprendizaje supervisado utilizando el texto del enlace de wikipedia como datos de entrenamiento. [5] Kulkarni y otros utilizaron la propiedad común de documentos relacionados para referirse a entidades de tipos fuertemente relacionados. [6] La lista de sistemas de vinculación de entidades nombradas de última generación incluye AIDA, [7] AGDISTIS, [8] Babelfy [9] y TagMe. [diez]
La vinculación de entidades nombradas se utiliza para mejorar la calidad de los sistemas de recuperación de información [1] y para mejorar la calidad de las bibliotecas digitales. [11] [12] NEL es también la clave para construir la búsqueda semántica [13] . Por ejemplo, NEL se ha aplicado con éxito para validar el resultado de los métodos de reconocimiento de entidades nombradas utilizando el supuesto de que cada texto tiene un alcance y contexto específicos y, por lo tanto, las entidades mencionadas en este texto deben tener una relación semántica entre sí [14] . La medición de proximidad semántica se puede utilizar para filtrar errores en la identificación de entidades fuera de contexto, incluso cuando son posibles múltiples interpretaciones para una sola mención.
La NEL ( campañas de evaluación de vinculación de entidades ) está organizada por el Instituto Nacional de Estándares y Tecnología ( NIST ) de EE. UU. en el contexto de la tarea Población de base de conocimiento de la Conferencia de análisis de texto.