Las palabras vacías , o palabras irrelevantes , son un término de la teoría de la recuperación de información mediante palabras clave .
Las palabras vacías se pueden dividir en generales y dependientes .
Los comunes incluyen preposiciones , sufijos , participios , interjecciones , números , partículas , etc. Las palabras irrelevantes comunes siempre se excluyen de la consulta de búsqueda (excepto para buscar por coincidencia estricta de la frase de búsqueda), también se ignoran cuando se crea un índice invertido . Se cree que cada una de las palabras vacías comunes se encuentra en casi todos los documentos de la colección .
Las palabras vacías dependientes dependen de la frase de búsqueda. La idea es tener en cuenta la ausencia de palabras simples de la consulta y palabras vacías dependientes de la consulta de una manera diferente en el documento encontrado.
Por ejemplo, al buscar Pushkin Alexander Sergeevich , tiene sentido mostrar todos los documentos que contengan:
Pero apenas tiene sentido mostrar documentos que contienen solo:
Es decir, en esta consulta, las palabras ruidosas son Alexander y Sergeevich .
Las palabras vacías dependientes difieren en que deben tenerse en cuenta en la consulta de búsqueda solo si hay palabras clave significativas en el documento buscado.
Optimización de motores de búsqueda | |
---|---|
Excepciones | |
Marketing |
|
Mercadotecnia de búsqueda |
|
Correo no deseado |
|
Enlaces |
|
Otro |
|