Relevancia (recuperación de información)

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 10 de mayo de 2018; las comprobaciones requieren 11 ediciones .

Relevancia ( Relevancia inglesa   - relevancia , relevancia ) en la recuperación de información  : la correspondencia de la intención (intención de búsqueda) incrustada en la solicitud y los resultados del motor de búsqueda obtenidos como resultado de esta solicitud. El usuario que ingresa una consulta en un motor de búsqueda espera que los resultados coincidan con la intención que puso en la consulta, en otras palabras, recibirá un resultado relevante.

Hay varios enfoques para evaluar la relevancia. La relevancia del contenido es la correspondencia de las respuestas a una solicitud de información, determinada de manera informal [1] . La relevancia formal es una correspondencia determinada por la comparación de la imagen de la consulta de búsqueda con la imagen de búsqueda de la respuesta según un cierto algoritmo [1] .

Uno de los métodos comunes para evaluar la relevancia es el método TF-IDF . Su significado se reduce a que cuanto mayor sea la frecuencia local del término (consulta) en el documento (TF) y mayor sea la "rareza" (es decir, menos frecuente que aparezca en otros documentos) del término en el colección (IDF), mayor será el peso de esta respuesta en relación con el término, es decir, la respuesta se dará antes en los resultados de búsqueda para este término. El autor del método es Gerard Salton , desarrollado posteriormente  por Karen Spark Jones [2] .

Pertinencia ( lat.  pertineo - tocar, relacionar ) - la correspondencia de los resultados encontrados por el sistema de recuperación de información con las necesidades de información del usuario, independientemente de cuán completa y precisa sea esta necesidad de información expresada en el texto de la solicitud de información. En otras palabras, esta es la relación entre la cantidad de información útil y la cantidad total de información recibida [1] .

Factores que afectan la relevancia

Los factores que afectan la relevancia generalmente se dividen en externos e internos . Los externos incluyen la masa de referencia, los internos, los componentes técnicos y el contenido.

Peso del enlace. Cuantos más enlaces temáticos y de calidad conduzcan a las páginas del recurso, más probable será el valor del recurso para el usuario.  

Componentes técnicos. Un gran grupo de parámetros mediante los cuales el motor de búsqueda evalúa tanto el sitio como un todo y las páginas individuales (por ejemplo, la presencia de metaetiquetas, la ausencia de errores en el marcado HTML, etc.).

Contenido. El factor clave del que depende la relevancia de la página y la conversión . El contenido del sitio debe ser único y “para personas”.

Véase también

Notas

  1. 1 2 3 Dictionary of Cybernetics / Editado por el académico V. S. Mikhalevich . - 2do. - Kyiv: Edición principal de la Enciclopedia soviética ucraniana que lleva el nombre de M. P. Bazhan, 1989. - 751 p. - (C48). — 50.000 copias.  - ISBN 5-88500-008-5 .
  2. Jones KS Una interpretación estadística de la especificidad del término y su aplicación en la recuperación  // Journal of Documentation: journal. - Universidad MCB: Prensa de la Universidad MCB, 2004. - V. 60 , No. 5 . - S. 493-502 .

Literatura

Enlaces