Lenguaje de recuperación de información
El lenguaje de recuperación de información (IPL) es un lenguaje artificial que representa un conjunto de herramientas para describir la estructura formal y de contenido para la búsqueda (por indexación ) a pedido del usuario .
Estructura
En ILP, se pueden distinguir el alfabeto , el vocabulario y la gramática .
- Alfabeto : un conjunto de caracteres específicos para escribir palabras y expresiones. En muchos idiomas, los símbolos del lenguaje natural se utilizan para esto : cirílico, alfabeto latino, números arábigos y romanos, signos de puntuación.
- Vocabulario : la totalidad de todas las palabras utilizadas en el idioma: unidades léxicas.
- Gramática - las reglas para componer expresiones. La gramática en muchas ISL es formal y en algunas no lo hay en absoluto.
Las relaciones paradigmáticas, es decir, las relaciones semánticas entre unidades léxicas, sirven para organizar las unidades léxicas en la construcción del vocabulario. Estas relaciones se establecen y fijan en el diccionario de la lengua, en función de las necesidades de recuperación de la información.
Tipos y tipos de IIP
Método de especificación de unidades léxicas
- Los idiomas controlados son idiomas cuyo vocabulario se define y controla mediante diccionarios y tablas. Estos incluyen varios sistemas de clasificación ( UDC , LBC , clasificación Dewey ).
- El lenguaje de los encabezamientos de materia . En base a la clasificación jerárquica se construyen catálogos sistemáticos. Con base en el lenguaje de los encabezamientos de materia, se construyen catálogos de materias. Catálogos alfabéticos - búsqueda manual.
- Descriptor IPN , así como el idioma de las palabras clave - búsqueda automática.
- Sin control: el diccionario no establece el vocabulario, sino que se construye sobre la base de la elección de los términos del lenguaje natural. Dichos PIP se han utilizado ampliamente en los últimos años.
El orden de escritura de las unidades léxicas
- Las lenguas no coordinadas son aquellas que no permiten la coordinación de sus unidades léxicas (no existe conexión entre ellas) ni en el proceso de indexación ni en el proceso de búsqueda. (el sistema de ordenación de los libros en el fondo de la biblioteca, según los números de inventario ).
- Los ISL coordinados son idiomas en los que las unidades léxicas están vinculadas, coordinadas entre sí, ya sea en el proceso de indexación o en el proceso de uso.
- Precoordinado: los vínculos entre las unidades léxicas se establecen antes de la búsqueda.
- Post-coordinado: cuando los enlaces entre unidades léxicas se establecen solo durante la búsqueda.
Enlaces