Representación del conocimiento

La representación del conocimiento  es un tema que surge en la cognición (la ciencia del pensamiento) y la informática , así como en el estudio de temas relacionados con la inteligencia artificial . En la ciencia cognitiva, se ocupa de cómo las personas almacenan y procesan la información. En informática - con la selección de representaciones de conocimientos , información y hechos específicos y generalizados para la acumulación y procesamiento de información en una computadora . La tarea principal de la inteligencia artificial (IA) es aprender a almacenar conocimiento de tal manera que los programas puedan procesarlo de manera significativa y lograr algo similar a la inteligencia humana .

El término "representación del conocimiento" se refiere con mayor frecuencia a métodos de representación del conocimiento orientados hacia el procesamiento automático por parte de computadoras modernas y, en particular, representaciones que consisten en objetos explícitos ("clase de todos los elefantes", "Clyde es un individuo") y de juicios . o afirmaciones sobre ellos ('Clyde es un elefante', 'todos los elefantes son grises'). Representar el conocimiento de esta forma explícita permite a las computadoras sacar inferencias deductivas del conocimiento previamente almacenado ("Clyde es gris").

Representación del conocimiento en IA

Los investigadores de IA utilizan teorías de representación del conocimiento de la ciencia cognitiva. Técnicas como los marcos , las reglas de inferencia y las redes semánticas llegaron a la IA a partir de las teorías del procesamiento de la información humana. Dado que el conocimiento se utiliza para lograr un comportamiento inteligente, el objetivo fundamental de la disciplina de representación del conocimiento es encontrar formas de representación que posibiliten el proceso de inferencia, es decir, la creación de conocimiento a partir del conocimiento.

Algunas preguntas que surgen en la representación del conocimiento desde una perspectiva de IA son:

Ha habido muy poca discusión rigurosa y de arriba hacia abajo sobre los problemas de representación del conocimiento, y la investigación en esta área realmente no ha progresado en los últimos años. Existen problemas bien conocidos como la "activación de propagación" (la tarea de navegar en una red de nodos), la categorización (esto se debe a la herencia selectiva; por ejemplo, un vehículo todo terreno puede considerarse una especialización (caso especial) de un automóvil, pero hereda solo algunas características) y clasificación . Por ejemplo, un tomate puede considerarse tanto una baya como una verdura.

La resolución de problemas complejos a menudo se puede simplificar mediante la elección correcta del método de representación del conocimiento. Un determinado método puede hacer fácilmente representable cualquier campo de conocimiento. Por ejemplo, el sistema experto de diagnóstico MYCIN utilizó un esquema de representación de conocimiento basado en reglas. La elección incorrecta del método de presentación dificulta el procesamiento. Como analogía, se pueden tomar cálculos en notación indoárabe o romana . La división longitudinal es más fácil en el primer caso y más difícil en el segundo. Asimismo, no existe una forma de presentación que se pueda utilizar en todas las tareas, o que haga que todas las tareas sean igualmente sencillas.

Historia

Para estructurar la información, así como para organizar bases de conocimiento y sistemas expertos, se han propuesto varias formas de representar el conocimiento. Uno de ellos es la presentación de datos e información dentro del modelo lógico de bases de conocimiento.

En la década de 1960 y principios de la de 1980, se propusieron y probaron numerosos métodos de representación del conocimiento con diversos grados de éxito, como los sistemas heurísticos de pregunta y respuesta , las redes neuronales , la demostración de teoremas y los sistemas expertos . Sus principales áreas de aplicación en ese momento eran los diagnósticos médicos ( MYCIN ) y los juegos (como el ajedrez ).

En la década de 1980 surgieron los lenguajes informáticos formales para la representación del conocimiento. Los principales proyectos de esa época intentaron codificar (colocar en sus bases de conocimiento) enormes conjuntos de conocimiento universal. Por ejemplo, en el proyecto Cyc se procesó una gran enciclopedia, y no se codificó la información almacenada en ella en sí, sino los conocimientos que el lector necesitaría para comprender dicha enciclopedia: la física ingenua, los conceptos de tiempo, causalidad y motivación, objetos típicos y sus clases. El proyecto Cyc está siendo desarrollado por Cycorp, Inc. ; la mayoría (pero no toda) de su base de datos está disponible gratuitamente.

Este trabajo ha llevado a una evaluación más precisa de la complejidad de la tarea de representación del conocimiento. Al mismo tiempo, se crearon bases de información lingüística mucho más grandes en la lingüística matemática y, junto con un gran aumento en la velocidad y la memoria de las computadoras, hicieron más real una representación más profunda del conocimiento.

También se han desarrollado varios lenguajes de programación que se centran en la representación del conocimiento. El prólogo (desarrollado en 1972, [1] pero ganó popularidad mucho más tarde) describe proposiciones y lógica básica, y puede inferir de premisas conocidas. El lenguaje KL-ONE (década de 1980) está aún más dirigido a representar el conocimiento .

En el campo de los documentos electrónicos se han desarrollado lenguajes que expresan explícitamente la estructura de los documentos almacenados, como SGML (y posteriormente XML ). Han facilitado las tareas de búsqueda y extracción de información , que en los últimos tiempos se asocian cada vez más a la tarea de representación del conocimiento. Existe un gran interés en la tecnología de la Web Semántica , en la que se utilizan lenguajes de representación del conocimiento basados ​​en XML, como RDF , Topic Map, y otros, para aumentar la disponibilidad de la información almacenada en la web para los sistemas informáticos.

Conexiones y estructuras

Los hipervínculos se utilizan ampliamente en la actualidad , pero el concepto estrechamente relacionado de enlace semántico ( en:semantic link ) aún no se ha generalizado. Las tablas matemáticas se han utilizado desde la época de Babilonia . Posteriormente, estas tablas se usaron para representar los resultados de operaciones lógicas, por ejemplo, las tablas de verdad se usaron para estudiar y modelar la lógica booleana . Los procesadores de tablas también son un ejemplo de una representación tabular del conocimiento. Los árboles son otro método de representación del conocimiento , que se puede utilizar para mostrar las relaciones entre los conceptos fundamentales y sus derivados.

Un enfoque relativamente nuevo para la gestión del conocimiento son las representaciones visuales, como las desarrolladas por TheBrain Technologies Corp. "plex". Brindan al usuario una forma de visualizar cómo un pensamiento o idea se relaciona con otras ideas, permitiéndole pasar de un pensamiento a otro en busca de la información requerida. Este enfoque está siendo desarrollado por varias empresas. Otras herramientas de búsqueda visual son de Convera , Entopia , Inc. , Epeople Inc. e Inxight Software Inc.

Almacenamiento y procesamiento del conocimiento

Uno de los desafíos en la representación del conocimiento es cómo almacenar y procesar el conocimiento en los sistemas de información de manera formal para que las máquinas puedan usarlo para lograr sus objetivos. Los ejemplos de aplicación son los sistemas expertos , la traducción automática , el mantenimiento computarizado y los sistemas de recuperación y recuperación de información (incluidas las interfaces de usuario de bases de datos).

Redes semánticas

Las redes semánticas se pueden utilizar para representar el conocimiento. Cada nodo de una red de este tipo representa un concepto y los arcos se utilizan para definir las relaciones entre los conceptos.

Uno de los paradigmas de representación del conocimiento más expresivos y detallados basados ​​en redes semánticas es MultiNet (acrónimo de Multilayered Extended Semantic Networks ) . 

Marcos

A partir de la década de 1960 , se utilizó la noción de marco de conocimiento, o simplemente marco . Cada cuadro tiene su propio nombre y conjunto de atributos , o ranuras que contienen valores; por ejemplo, el marco de una casa podría contener ranuras para el color , el número de pisos , etc.

El uso de marcos en sistemas expertos es un ejemplo de programación orientada a objetos con herencia de propiedades , que se describe mediante la relación "es-a" ("es"). Sin embargo, ha habido muchas controversias en el uso del enlace "es-un" : Ronald Brachman escribió un artículo titulado "Qué es y no es ES-A", en el que 29 semánticas diferentes del enlace "es-un" fueron encontrado en proyectos cuyos esquemas de representación del conocimiento incluían la conexión "es-a". Otras conexiones incluyen, por ejemplo, " has-part " ("tiene su parte").

Las estructuras marco son adecuadas para representar el conocimiento en forma de esquemas y patrones cognitivos estereotipados. Los elementos de tales patrones tienen diferentes pesos, y se asignan pesos más altos a aquellos elementos que coinciden con el esquema cognitivo actual ( esquema ). El patrón se activa bajo ciertas condiciones: si una persona ve un pájaro grande, siempre que su "esquema marino" esté actualmente activo, pero su "esquema terrestre" no lo está, lo clasifica más como un águila marina que como un dorado terrestre. águila.

Las representaciones de marcos están centradas en objetos en el mismo sentido que la web semántica : todos los hechos y propiedades asociados con un concepto se encuentran en un solo lugar, por lo que no es necesario gastar recursos buscando en la base de datos.

Un guión  es un tipo de marco que describe una secuencia de eventos a lo largo del tiempo; un ejemplo típico es una descripción de ir a un restaurante . Los eventos aquí incluyen esperar un asiento, leer el menú, hacer un pedido, etc.

Varias soluciones, dependiendo de su expresividad semántica , pueden organizarse en el llamado espectro semántico . 

Lenguaje y notación

Algunas personas creen que es mejor representar el conocimiento tal como es en la mente humana , que es la única mente en funcionamiento conocida hasta la fecha , o representar el conocimiento en forma de lenguaje natural . El Dr. Richard Ballard, por ejemplo, ha desarrollado un " sistema semántico basado en teorías " que es independiente del lenguaje, que infiere propósito y razonamiento en los mismos conceptos y teorías que los humanos. La fórmula que subyace a esta semántica es: Conocimiento=Teoría+Información. Las aplicaciones y los sistemas de bases de datos más comunes se basan en idiomas. Desafortunadamente, no sabemos cómo se representa el conocimiento en la mente humana, o cómo manipular los lenguajes naturales de la misma manera que lo hacen los humanos. Una pista es que los primates saben cómo usar interfaces de usuario de apuntar y hacer clic ; así la interfaz gestual parece ser parte de nuestro aparato cognitivo, una modalidad que no está ligada al lenguaje hablado y que existe en animales distintos a los humanos .

Por ello, se han propuesto diversos lenguajes y notaciones artificiales para representar el conocimiento . Por lo general, se basan en la lógica y las matemáticas y tienen una gramática fácil de leer para facilitar el procesamiento de la máquina . Suelen caer en el amplio dominio de las ontologías .

Notación

La última moda en los lenguajes de representación del conocimiento es utilizar XML como sintaxis de bajo nivel. Esto da como resultado que las máquinas puedan analizar y generar fácilmente estos lenguajes de representación de conocimiento, a expensas de la legibilidad humana.

La lógica de primer orden y el lenguaje Prolog son ampliamente utilizados como base matemática de estos sistemas para evitar una complejidad excesiva. Sin embargo, incluso los sistemas simples basados ​​en esta lógica simple pueden usarse para representar datos que son muy superiores a las capacidades de procesamiento de los sistemas informáticos actuales: las razones se revelan en la teoría de la computabilidad .

Ejemplos de notación:

  • DATR es un ejemplo de representación del conocimiento léxico
  • RDF es una notación simple para representar relaciones entre objetos .
Idiomas

Los lenguajes se dividen en artificiales y naturales.

Los lenguajes naturales fueron formados y están siendo formados por comunidades nacionales o profesionales de personas. El conocimiento se transfiere de una persona a otra después de su traducción a un idioma que es entendido por la persona que es la fuente del conocimiento y la persona que es el receptor del conocimiento.

Se han creado y se están creando lenguajes artificiales para conectar humanos con máquinas.

Ejemplos de lenguajes artificiales que se utilizan predominantemente para representar conocimientos:

Métodos y formalismos

Métodos y formalismos de representación del conocimiento es  el nombre del apartado I.2.4 del Sistema de Clasificación Informática ACM . 

Esta sección se encuentra en:

  • Categoría superior, I Metodologías computacionales , y
  • Categoría de segundo nivel, I.2 Inteligencia Artificial .

Incluye los siguientes temas:

  1. marcos y guiones
  2. lógica modal
  3. Lógica de primer orden
  4. Sistemas relacionales
  5. Idiomas de presentación
  6. Vistas (procedimiento y basadas en reglas)
  7. Redes semánticas
  8. Lógica temporal
  9. Prólogo del lenguaje
  10. programación lógica
  11. Base de conocimientos
  12. Sistemas expertos
  13. Modelado cognitivo
  14. Gestión convergente

Véase también

Notas

  1. Temas de IA . Consultado el 13 de abril de 2007. Archivado desde el original el 29 de enero de 2007.

Literatura

  • Joseph Giarratano, Gary Riley. Capítulo 2. Representación del Conocimiento (en PDF) // Sistemas Expertos: Principios de Desarrollo y Programación = Sistemas Expertos: Principios y Programación. - 4ª ed. - M. : "Williams" , 2006. - S. 1152. - ISBN 978-5-8459-1156-8 .
  • Amaravadi, CS, "Gestión del conocimiento para el conocimiento administrativo", Expert Systems, 25(2), pp 53-61, mayo de 2005.
  • Ronald J. Brachman ; Lo que ES-A es y no es. un análisis de enlaces taxonómicos en redes semánticas; Computadora IEEE, 16(10); octubre de 1983 [1]
  • Jean-Luc Hainaut, Jean-Marc Hick, Vincent Englebert, Jean Henrard, Didier Roland: comprensión de las implementaciones de las relaciones IS-A. ER 1996: 42-57 [2]
  • Hermann Helbig: Representación del conocimiento y la semántica del lenguaje natural , Springer, Berlín, Heidelberg, Nueva York 2006
  • Arthur B. Markman: Representación del conocimiento Lawrence Erlbaum Associates, 1998
  • Michael Negnevitsky: Inteligencia artificial, una guía para sistemas inteligentes , Pearson Education Limited, 2002
  • John F. Sowa: Representación del conocimiento : fundamentos lógicos, filosóficos y computacionales. Brooks/Cole: Nueva York, 2000
  • Adrian Walker, Michael McCord, John F. Sowa y Walter G. Wilson: Knowledge Systems and Prolog , segunda edición, Addison-Wesley, 1990
  • Subbotin S. O. Tratamiento de datos de conocimiento en los sistemas de inteligencia de pieza y mejora de la solución: Manual. - Zaporizhzhya: ZNTU, 2008. - 341 p.

Enlaces