Web semántica

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 22 de marzo de 2022; las comprobaciones requieren 2 ediciones .

La red semántica  es un modelo de información del área temática , tiene la forma de un grafo dirigido . Los vértices del gráfico corresponden a los objetos del área temática, y los arcos (aristas) definen la relación entre ellos. Los objetos pueden ser: conceptos , eventos , propiedades, procesos [1] . Así, la web semántica es una de las formas de representar el conocimiento .

El nombre combina términos de dos ciencias: la semántica en lingüística estudia el significado de las unidades del lenguaje, y una red en matemáticas es una especie de gráfico  : un conjunto de vértices conectados por arcos (aristas), a los que se les asigna un número determinado. En la red semántica, el papel de los nodos lo juegan los conceptos de la base de conocimiento, y los arcos (además, dirigidos) definen la relación entre ellos. Así, la red semántica refleja la semántica del área temática en forma de conceptos y relaciones.

Es erróneo equiparar los conceptos de "Red Semántica" ( ing.  Red Semántica ) y " Web Semántica " ( ing.  Web Semántica ). Aunque estos conceptos no son equivalentes, están relacionados (ver más abajo ).

Historia

La idea de sistematización sobre la base de cualquier relación semántica fue propuesta por científicos de la ciencia temprana. Un ejemplo de esto es la clasificación biológica de Carl Linnaeus de 1735. Considerada como una red semántica, esta clasificación utiliza una relación de subconjunto, AKO moderno (del inglés "A Kind Of", "variedad").

Los progenitores de las redes semánticas modernas pueden considerarse gráficos existenciales propuestos por Charles Pierce en 1909 . Se utilizaron para representar declaraciones lógicas en forma de diagramas especiales. Peirce llamó a este método "la lógica del futuro".

Una dirección importante en el estudio de las redes fue el trabajo del psicólogo alemán Otto Selz en 1913 y 1922. En ellos, para organizar las estructuras de conceptos y asociaciones, así como para estudiar los métodos de herencia de propiedades, utilizó grafos y relaciones semánticas. Los investigadores M. Anderson (1973), D. Norman (1975) y otros utilizaron estos trabajos para modelar la memoria humana y las propiedades intelectuales.

Las redes informáticas semánticas fueron desarrolladas en detalle por Richard Richens  en 1956 como parte del proyecto de traducción automática del Cambridge Language Learning Center . El proceso de traducción automática se divide en 2 partes: traducción del texto de origen a una forma intermedia de representación, y luego esta forma intermedia se traduce al idioma deseado. Las redes semánticas eran solo una forma intermedia. En 1961 apareció Masterman en el que , entre otras cosas, definió un vocabulario básico para 15.000 conceptos. Estos estudios fueron continuados por Robert Simmons (1966), J. Wilkes (1972) y otros científicos.  

Los trabajos sobre redes semánticas a menudo se refieren al trabajo del psicólogo estadounidense Ross Quillian sobre " memoria semántica " [2] .

Estructura

Las matemáticas te permiten describir la mayoría de los fenómenos del mundo que te rodea en forma de enunciados lógicos. Las redes semánticas se originaron como un intento de visualizar fórmulas matemáticas. La principal representación de la web semántica es el grafo . Sin embargo, no olvide que detrás de la imagen gráfica ciertamente hay una estricta notación matemática y que ambas formas muestran lo mismo.

Representación gráfica

La principal forma de representación de la red semántica es un grafo. Los conceptos de la red semántica están escritos en óvalos o rectángulos y están conectados por flechas con leyendas: arcos (ver Fig.). Esta es la forma más conveniente percibida por una persona. Sus deficiencias aparecen cuando comenzamos a construir redes más complejas o tratamos de tener en cuenta las características del lenguaje natural. Los esquemas de redes semánticas, sobre los que se indican las direcciones de las relaciones de navegación, se denominan mapas de conocimiento, y su totalidad, que permite cubrir grandes secciones de la red semántica, se denomina atlas de conocimiento.

Notación matemática

En matemáticas , un gráfico está representado por un conjunto de vértices V y un conjunto de relaciones entre ellos E. Usando el aparato de lógica matemática, concluimos que cada vértice corresponde a un elemento del conjunto de objetos, y el arco corresponde a un predicado .

Notación lingüística

En lingüística, las relaciones se registran en diccionarios y tesauros . En los diccionarios, en las definiciones por género y diferencia específica, el concepto genérico ocupa un lugar determinado. En los tesauros, en el artículo de cada término, se pueden indicar todas las posibles conexiones con otros términos relacionados. De tales tesauros es necesario distinguir los tesauros de recuperación de información con listas de palabras clave en artículos que están destinados al funcionamiento de motores de búsqueda de descriptores.

Clasificación de las redes semánticas

Para todas las redes semánticas es válida la división según la aridad y el número de tipos de relaciones.

Además de los gráficos conceptuales, existen otras modificaciones de las redes semánticas, esta es otra base para la clasificación ( por implementación ). Consulte la sección correspondiente a continuación para obtener más detalles .

Relaciones semánticas

El número de tipos de relaciones en la red semántica está determinado por su creador, en función de objetivos específicos. En el mundo real, su número tiende a infinito. Cada relación es, de hecho, un predicado, simple o compuesto. La velocidad de trabajo con la base de conocimientos depende de la eficiencia con la que se implementen los programas para procesar las relaciones necesarias.

Jerárquico

La mayoría de las veces existe la necesidad de describir las relaciones entre elementos, conjuntos y partes de objetos. La relación entre un objeto y un conjunto, que denota que el objeto pertenece a este conjunto, se denomina relación de clasificación ( ISA ). Se dice que un conjunto (clase) clasifica sus instancias . [3] (ejemplo: "Globo es un perro" = Globo es un objeto de tipo perro ). A veces, esta relación también se denomina MemberOf, InstanceOf o similar. La comunicación ISA asume que las propiedades de un objeto se heredan de un conjunto. La relación inversa a ISA se usa para denotar ejemplos, por lo que se llama "Ejemplo", o en ruso "Ejemplo". Las relaciones jerárquicas forman una estructura de árbol .

A menudo, en las redes semánticas, se requiere definir la relación de sinonimia y antonimia . Estas conexiones se duplican explícitamente en la propia red o están determinadas por el componente algorítmico.

Auxiliar

En las redes semánticas, también se utilizan a menudo las siguientes relaciones :

Esta lista puede continuar indefinidamente: en el mundo real, la cantidad de relaciones es enorme. Por ejemplo, la relación “cosas completamente distintas” o similar se puede utilizar entre conceptos: Не_имеют_отношения_друг_к_другу(Солнце, Кухонный_чайник).

Características del uso de algunos tipos de relaciones

En la red semántica, los conceptos pueden ser tanto instancias de objetos como sus conjuntos. El uso de las mismas relaciones para los elementos y las colecciones puede generar confusión. Errores similares en el funcionamiento de algunos de los primeros sistemas fueron descritos en el artículo de Drew McDermottLa inteligencia artificial se enfrenta a la estupidez natural

Veamos cuatro oraciones:

  1. Pavel tiene un padre llamado Alexei.
  2. Para Pablo hay un padre entre muchos hombres.
  3. Hay una persona para quien Alexei es padre.
  4. Cada persona tiene un padre de muchos hombres.

Para una persona, el significado de estas frases es claro, y muchos sin dudarlo pondrían en los cuatro casos la relación es padre . Sin embargo, esto es un error: en el primer caso, de hecho, se describe la relación entre dos instancias, pero en el segundo y tercero, entre una instancia y un conjunto, y en el cuarto, una relación entre representantes de dos conjuntos. En notación matemática, se ve así, respectivamente, para las oraciones 1-4:

I. ∃ pavel & ∃ alexey: padre (alexey, paul); IIa. ∃ pablo → ∃ x ∈ hombres : padre(x, pablo); IIb. ∃ alexey → ∃ y ∈ personas : padre(alexey, y); tercero ∀ y ∈ personas → ∃ x ∈ hombres : padre(x, y);

Vemos que los casos IIa y IIb difieren solo en el orden de las variables en el predicado, pero esto puede desempeñar un papel importante para la corrección de la red. En el ejemplo, solo se enumeran 4 tipos de relaciones, pero hay nueve para una red binaria. Se diferencian en los cuantificadores ∃ y ∀, así como en el orden de las variables.

Gráficamente, para distinguir todos estos casos, se utilizan formas especiales de marcar las relaciones en el gráfico: por ejemplo, las relaciones del primer tipo no se modifican, el segundo tipo se delinea con un marco rectangular de puntos, el tercero es un guión y el cuarto es un guión-punto. O simplemente puede escribir el índice de tipo de relación al lado.

La confusión más común surge sobre la relación ISA . Por lo tanto, en muchas obras modernas se acepta que ISA denota la relación entre una instancia y un conjunto (el caso anterior IIb): Murka ISA cat . En este caso no se utiliza un solo cuadro. Si se requiere definir una relación de equivalencia (caso I), se puede introducir una relación especial para esto (aunque para la web semántica hay poca necesidad de ello). ISA puede usarse para indicar la ocurrencia de elementos de un conjunto en otro (caso III), pero no se recomienda. Para denotar subconjuntos, se usa otra relación especial: AKO . La diferencia entre ISA in a box y AKO es que este último también se encarga de heredar las propiedades de los propios conjuntos, y no solo de los elementos.

Uso de redes semánticas

Semantización

La semantización es el proceso de cambio de textos en el que se distinguen relaciones semánticas sin cambiar su contenido. Wikipedia tiene proyectos para semantizar artículos y el árbol de categorías.

La Web Semántica

El concepto de organización del hipertexto se asemeja a una red semántica binaria homogénea , pero hay una diferencia significativa:

  1. La conexión que realiza un hipervínculo no tiene semántica, es decir, no describe el significado de esta conexión. El propósito de la red semántica es describir las relaciones de los objetos y no información adicional sobre el tema. Una persona puede averiguar por qué se necesita este o aquel hipervínculo, pero esta conexión no está clara para la computadora.
  2. Las páginas con hipervínculos son documentos que describen, por regla general, la situación del problema en su conjunto. En una web semántica, los vértices (qué relaciones vinculan) representan conceptos u objetos del mundo real .

Un intento de crear una web semántica basada en la World Wide Web se ha denominado Web Semántica . Este concepto implica el uso de RDF (un lenguaje de marcado basado en XML ) y tiene como objetivo dar a los enlaces un significado que los sistemas informáticos puedan entender. Esto convertirá a Internet en una base de conocimiento distribuida a escala global.

Software

Véase también

Notas

  1. Roussopoulos ND Un modelo de red semántica de bases de datos.  — TR No 104, Departamento de Ciencias de la Computación, Universidad de Toronto, 1976.
  2. Quillian, MR (1968). memoria semántica. Procesamiento de información semántica, 227-270.
  3. Conceptos básicos . Consultado el 15 de abril de 2007. Archivado desde el original el 25 de enero de 2007.