Ciclo
La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la
versión revisada el 26 de agosto de 2018; las comprobaciones requieren
12 ediciones .
Cyc ( escrito en latín, pronunciado Cyc ) es un proyecto para crear una voluminosa base de conocimiento ontológico que permita a los programas resolver problemas complejos del campo de la inteligencia artificial basada en la inferencia lógica y el uso del sentido común .
Resumen
El proyecto fue iniciado por Douglas Lenat en 1984 en Microelectronics and Computer Technology Corporation . El nombre "Cyc" (derivado de la enciclopedia inglesa : "cyc") es una marca registrada de Cycorp, Inc en Austin , operada por Lenat y creada para desarrollar Cyc. La base de conocimientos es propiedad de la empresa, pero una pequeña parte de la base, destinada a establecer un vocabulario común para los programas de razonamiento automático, se publicó como OpenCyc bajo una licencia abierta . Posteriormente, Cyc se puso a disposición de los investigadores de IA bajo una licencia de investigación especial de ResearchCyc .
Ejemplos típicos de conocimiento en la base de datos son: "Cada árbol es una planta" y "Las plantas son mortales". Si pregunta "¿mueren los árboles?", el motor de inferencia puede sacar la conclusión obvia y dar la respuesta correcta. La Base de conocimientos (Base de conocimientos en inglés o KB) contiene más de un millón de declaraciones, reglas e ideas de uso común ingresadas allí por personas. Están formulados en el lenguaje CycL , que se basa en el cálculo de predicados y tiene una sintaxis similar a Lisp . Los usuarios de habla inglesa bromean diciendo que son "ciclistas" (del inglés cyclist - un ciclista).
La mayor parte del trabajo actual en el proyecto Cyc todavía se trata de ingeniería del conocimiento : describir manualmente hechos sobre el mundo que nos rodea e implementar mecanismos de inferencia eficientes basados en este conocimiento. Sin embargo, se está trabajando para permitir que el sistema Cyc se comunique de forma independiente con los usuarios en lenguaje natural y para acelerar el proceso de reposición de la base mediante el aprendizaje automático .
Descripción de la base de conocimientos, terminología
Los conceptos en Cyc se llaman constantes . Los nombres constantes comienzan con los caracteres opcionales "#$" y distinguen entre mayúsculas y minúsculas. Hay constantes para:
- elementos individuales denominados individual , como #$BillClinton o #$France.
- colecciones ( Colecciones ) como #$Tree-ThePlant (que contiene todos los árboles) o #$EquivalenceRelation (que contiene todas las relaciones de equivalencia ). Un miembro de una colección se llama una instancia de esa colección.
- Verdad Funciones que se pueden aplicar a uno o más conceptos y devuelven verdadero o falso . Por ejemplo, #$siblings es una relación de hermanos que es verdadera solo si dos de sus argumentos son hermanos. Por convención, las constantes de la función de verdad comienzan con una letra minúscula. Las funciones de verdad se pueden dividir en conectores lógicos (como #$y, #$o, #$no, #$implica), cuantificadores (#$paratodo, #$existe, etc.) y predicados .
- Funciones , que forman nuevos términos a partir de los datos. Por ejemplo, si pasa un tipo (o colección) de plantas como argumento a la función #$FruitFn, devolverá una colección de sus frutos. Por convención, los nombres de constantes de función comienzan con una letra mayúscula y terminan con la cadena "Fn".
Los predicados más importantes son #$isa y #$genls. La primera es una declaración de que un elemento es una instancia de una colección y la segunda es que una colección es una subcolección de otra colección. Los hechos acerca de los conceptos se declaran usando sentencias especiales de CycL . Los predicados se escriben entre paréntesis antes de sus argumentos:
(#$isa #$BillClinton #$PresidentedeEstadosUnidos)
significa que "Bill Clinton es uno de los presidentes de los Estados Unidos", y la declaración
(#$genls #$Tree-ThePlant #$Plant)
dice "Todos los árboles son plantas".
(#$ciudadcapital #$Francia #$París)
significa "París es la capital de Francia".
Las declaraciones también pueden contener variables, líneas que comienzan con un "?". Estas declaraciones se llaman "reglas". Una de las reglas más importantes con respecto al predicado #$isa dice:
(#$implica
(#$y
(#$isa ?OBJ ?SUBSET)
(#$genls ?SUBSET ?SUPERSET))
(#$isa ?OBJ ?SUPERCONJUNTO))
lo que significa "si OBJ es una instancia de la colección SUBSET , y SUBSET a su vez es una subcolección de SUPERSET, entonces OBJ también es una instancia de la colección SUPERSET". Otro ejemplo típico:
(#$relationAllExists #$biologicalMother #$ChordataPhylum #$FemaleAnimal)
lo que significa que cualquier instancia de la colección #$ChordataPhylum (es decir, cualquier cordado ) está asociada con un animal hembra (una instancia de #$FemaleAnimal) que es su madre (como se describe en el predicado #$BiologicalMother).
La base de conocimiento de Cyc se divide en microteorías (Mt), colecciones de conceptos y hechos pertenecientes a un área específica de conocimiento. A diferencia de una base de conocimiento completa, cualquier microteoría debe estar libre de contradicciones. Cada microteoría tiene un nombre que es una constante ordinaria; por convención, las constantes de microteoría contienen la cadena "Mt". Un ejemplo es #$MathMt, una microteoría que contiene conocimientos matemáticos. Las microteorías se pueden heredar unas de otras y están organizadas en una jerarquía: una de las especializaciones de #$MathMt es #$GeometryGMt, una microteoría sobre geometría.
ciclo abierto
La última versión de OpenCyc, 1.0, se lanzó en julio de 2006. OpenCyc 1.0 incluye una ontología Cyc completa que contiene cientos de miles de expresiones, millones de declaraciones que vinculan términos entre sí. La base de conocimiento contiene 47 000 conceptos y 306 000 hechos y se puede ver en el sitio web de OpenCyc. La primera versión de OpenCyc se lanzó en mayo de 2001 con solo 6.000 conceptos y 60.000 hechos. La base de conocimientos se publica bajo la licencia de Apache . Cycorp tiene la intención de lanzar OpenCyc bajo licencias paralelas menos restrictivas para satisfacer las necesidades de sus usuarios. El intérprete CycL y SubL (un programa que le permite ver y modificar la base de datos y sacar conclusiones) se libera de forma gratuita, pero solo en forma binaria, sin código fuente. Se ejecuta tanto en GNU/Linux como en Microsoft Windows .
ResearchCyc
En julio de 2006, Cycorp lanzó ResearchCyc 1.0, una versión gratuita (pero de código cerrado) de Cyc dirigida a la comunidad investigadora. (ResearchCyc estuvo en versión beta a lo largo de 2004 y se lanzó a prueba beta en febrero de 2005). Además de la información taxonómica de OpenCyc, ResearchCyc incluye significativamente más conocimiento semántico (es decir, hechos adicionales) sobre los conceptos en su base de conocimiento e incluye un gran léxico, herramientas para analizar y generar inglés , interfaces escritas en Java para editar conocimiento y crear consultas a la base de datos.
Cycorp ha expresado públicamente su intención de publicar todos los términos y relaciones taxonómicas contenidas en ResearchCyc como parte de OpenCyc, y esto se ha hecho en la versión 1.0. Uno de los objetivos declarados es crear un vocabulario semántico completamente libre y sin restricciones para su uso en la Web Semántica . La taxonomía de OpenCyc está disponible en formato Owl en el sitio web del proyecto OpenCyc.
Críticas al proyecto Cyc
Cyc ha sido descrito como "uno de los esfuerzos más controvertidos en la historia de la inteligencia artificial" (Bertino et al. p. 275), por lo que inevitablemente ha recibido una buena cantidad de críticas.
- Excesiva complejidad del sistema -sin duda necesaria por ambiciones enciclopédicas- y, en consecuencia, la complejidad de añadir (manualmente) datos al sistema;
- Problemas de escalabilidad debido a la cosificación generalizada, especialmente como constantes;
- El uso insatisfactorio del concepto de materia y la distinción relacionada entre propiedades intrínsecas y extrínsecas;
- Falta de mediciones de rendimiento sensatas o comparaciones de la eficiencia del motor de inferencia Cyc;
- La incompletitud actual del sistema tanto en amplitud como en profundidad, y la dificultad asociada para medir su integridad;
- falta de documentación;
- La falta de material de capacitación en línea actualizado dificulta que los recién llegados aprendan el sistema;
- A pesar de su nombre, el sistema OpenCyc no es completamente abierto: los usuarios pueden editar los datos, pero los desarrolladores no pueden ampliar el código. [una]
Estos temas han sido discutidos en varios lugares desde el lanzamiento del proyecto. Doug Lenat y otros han publicado muchos argumentos en defensa de su proyecto.
Véase también
Bibliografía
- Elisa Bertino, Gian Piero Zarri, Bárbara Catania, Gian Pierro Zarri. Sistemas de bases de datos inteligentes (neopr.) . — Addison-Wesley Professional , 2001.
- Matuszek, Cynthia, M. Witbrock , R. Kahlert, J. Cabral, D. Schneider, P. Shah y D. Lenat . Buscando el sentido común: poblando Cyc desde la Web . En Actas de la Vigésima Conferencia Nacional sobre Inteligencia Artificial, Pittsburgh, Pensilvania, julio de 2005. [1]
- Shepard, Blake, C. Matuszek, C. B. Fraser, W. Wechtenhiser, D. Crabbe, Z. Gungordu, J. Jantos, T. Hughes, L. Lefkowitz, M. Witbrock, D. Lenat, E. Larson. Un enfoque basado en el conocimiento para la seguridad de la red: aplicación de Cyc en el dominio de la evaluación de riesgos de la red . En Actas de la Decimoséptima Conferencia sobre Aplicaciones Innovadoras de Inteligencia Artificial, Pittsburgh, Pensilvania, julio de 2005. [2]
- Ramachandran, Deepak, P. Reagan, K. Goolsbey. ResearchCyc de primer orden: expresividad y eficiencia en una ontología de sentido común . En Documentos del Taller AAAI sobre Contextos y Ontologías: Teoría, Práctica y Aplicaciones. Pittsburgh, Pensilvania, julio de 2005. [3]
- Cabral, John, R. C. Kahlert, C. Matuszek, M. Witbrock, B. Summers. Convertir el metaconocimiento semántico en sesgo inductivo . En Actas de la 15ª Conferencia Internacional sobre Programación Lógica Inductiva, Bonn, Alemania, agosto de 2005. [4]
- Schneider, Dave, C. Matuszek, P. Shah, R. Kahlert, D. Baxter, J. Cabral, M. Witbrock, D. Lenat. Recopilación y gestión de hechos para el análisis de inteligencia . En Actas de la Conferencia Internacional sobre Análisis de Inteligencia de 2005, McLean, Virginia, mayo de 2005. [5]
- Forbus, Kenneth, L. Birnbaum, E. Wagner, J. Baker y M. Witbrock . Combinando analogía, recuperación de información inteligente e integración de conocimiento para el análisis: un informe preliminar . En Actas de la Conferencia Internacional sobre Análisis de Inteligencia de 2005, McLean, Virginia, mayo de 2005. [6]
- Deaton, Chris, B. Shepard, C. Klein, C. Mayans, B. Summers, A. Brusseau, M. Witbrock . La Base Integral de Conocimientos sobre Terrorismo en Cyc. En Actas de la Conferencia Internacional sobre Análisis de Inteligencia de 2005, McLean, Virginia, mayo de 2005. [7]
- Rodé, Benjamín. Hacia un Modelo de Recuperación de Patrones en Datos Relacionales . En Actas de la Conferencia Internacional sobre Análisis de Inteligencia de 2005, McLean, Virginia, mayo de 2005. [8]
- Siegel, Nick, B. Shepard, J. Cabral, M. Witbrock. Generación de hipótesis y ensamblaje de evidencia para análisis de inteligencia: aplicación Nooscape de Cycorp . En Actas de la Conferencia Internacional sobre Análisis de Inteligencia de 2005, McLean, Virginia, mayo de 2005. [9]
- Curtis, Jon, G. Matthews, D. Baxter. Sobre el uso efectivo de Cyc en un sistema de respuesta a preguntas en documentos del Taller IJCAI sobre conocimiento y razonamiento para responder preguntas, Edimburgo, Escocia: 2005. [10]
- Witbrock, Michael, C. Matuszek, A. Brusseau, R. C. Kahlert, C. B. Fraser, D. Lenat. El conocimiento engendra conocimiento: pasos hacia la adquisición asistida de conocimientos en Cyc en artículos del Simposio de primavera de la AAAI de 2005 sobre recopilación de conocimientos de contribuyentes voluntarios (KCVC), págs. 99–105. Stanford, California, marzo de 2005. [11]
- Belasco, Alan, J. Curtis, R. C. Kahlert, C. Klein, C. Mayans, R. Reagan. Representar las brechas de conocimiento de manera efectiva . En D. Karagiannis, U. Reimer (Eds.): Aspectos prácticos de la gestión del conocimiento, Actas de PAKM 2004, Viena, Austria, 2 y 3 de diciembre de 2004, Springer-Verlag, Berlín Heidelberg. [12]
- Siegel, Nick, G. Matthews, J. Masters, R. Kahlert, M. Witbrock y K. Pittman. Arquitecturas de agentes: combinación de las fortalezas de la ingeniería de software y los sistemas cognitivos en artículos del taller AAAI sobre arquitecturas de agentes inteligentes: combinación de las fortalezas de la ingeniería de software y los sistemas cognitivos, Informe técnico WS-04-07, págs. 74–79. Menlo Park, California: AAAI Press, 2004. [13]
- Witbrock, Michael, K. Panton, S. L. Reed, D. Schneider, B. Aldag, M. Reimers y S. Bertolo. Anotación OWL automatizada asistida por una gran base de conocimiento en Notas del taller del Taller de 2004 sobre marcado de conocimiento y anotación semántica en la 3ra Conferencia Internacional de Web Semántica ISWC2004, Hiroshima, Japón, noviembre de 2004, págs. 71–80. [catorce]
- Masters, James y Z. Gungordu. Integración de fuente de conocimiento estructurado: un informe de progreso . En Integration of Knowledge Intensive Multiagent Systems, Cambridge, Massachusetts, EE. UU., 2003. [15]
- O'Hara, Tom, N. Salay, M. Witbrock, et al. Criterios de inducción para mapeos léxicos de sustantivos masivos usando la base de conocimiento de Cyc y su extensión a WordNet . En Actas del Quinto Taller Internacional sobre Semántica Computacional, Tilburg, 2003. [16]
- Witbrock, Michael, D. Baxter, J. Curtis, et al. Un Sistema de Diálogo Interactivo para la Adquisición de Conocimiento en Cic . En Actas de la Décimo Octava Conferencia Internacional Conjunta sobre Inteligencia Artificial, Acapulco, México, 2003. [17]
- Panton, Kathy, P. Miraglia, N. Salay, et al. Formación de conocimiento y diálogo utilizando el conjunto de herramientas KRAKEN . En Decimoctava Conferencia Nacional sobre Inteligencia Artificial, Edmonton, Canadá, 2002. [18]
- Maestros, James. Integración de Fuentes de Conocimiento Estructurado y sus aplicaciones a la fusión de información . En Actas de la Quinta Conferencia Internacional sobre Fusión de Información, Annapolis, MD, julio de 2002. [19]
- Reed, Stephen y D. Lenat. Mapeo de ontologías en Cyc . En AAAI 2002 Conference Workshop on Ontology For The Semantic Web, Edmonton, Canadá, julio de 2002. [20]
- D. Lenat y R. V. Guha. Construyendo Grandes Sistemas Basados en el Conocimiento: Representación e Inferencia en el Proyecto Cyc . — Addison-Wesley , 1990.
- La máquina de pensar ficticia SAL 9000 hace referencia explícita a una base de datos enciclopédica para entender por qué su creador usó el nombre "Phoenix" para una simulación de diagnóstico que ayudaría a reiniciar su dispositivo gemelo, el HAL 9000 , en la saga de 2001 .
- La máquina de pensar ficticia KARR (Knight Rider) accede explícitamente a una base de datos durante una prueba de los deseos humanos básicos (episodio "La confianza no se oxida").
Notas
- ↑ Volkel M., Krotzsch M., Vrandecic D., Haller H., Studer R. Wikipedia semántica Archivado el 31 de diciembre de 2019 en Wayback Machine . En Actas de la 15ª Conferencia Internacional sobre la World Wide Web. WWW '06. ACM Press, Nueva York, NY. Edimburgo, Escocia, 23-26 de mayo de 2006. - pp. 585-594
Enlaces
diccionarios y enciclopedias |
|
---|