WordNet es una base de datos léxica en inglés desarrollada en la Universidad de Princeton y lanzada con el software adjunto bajo una licencia libre sin copyleft . Es un diccionario - tesauro electrónico y un conjunto de redes semánticas para el idioma inglés.
El diccionario consta de cuatro redes para las principales partes significativas del discurso: sustantivos, verbos, adjetivos y adverbios. La unidad básica de vocabulario en WordNet no es una sola palabra, sino una serie de sinónimos, el llamado " synset " , que combina las palabras de la red con un significado similar en un nodo de la red semántica. Para facilitar el uso del diccionario por parte de una persona, cada synset se complementa con una definición y ejemplos del uso de palabras en contexto. Una palabra o frase puede aparecer en más de un synset y tener más de una categoría de parte del discurso . Cada synset contiene una lista de sinónimos o frases sinónimas y punteros que describen la relación entre este y otros synsets. Las palabras que tienen varios significados se incluyen en varios synsets y se pueden asignar a varias clases sintácticas y léxicas.
Synsets en WordNet están vinculados por varias relaciones semánticas:
WordNet también describe otros tipos de enlaces. Entre ellos, la hiponimia juega un papel especial: permite organizar synsets en forma de redes semánticas. Para diferentes partes del discurso, las relaciones genéricas pueden tener características adicionales y diferir en alcance.
WordNet es de uso gratuito con fines comerciales y científicos. Para trabajar con él existen varios programas, muchas interfaces y APIs implementadas en la mayoría de lenguajes posibles, además de utilizar el protocolo DICT , el programa GoldenDict , y otros. Además, los paquetes de WordNet están presentes en algunos repositorios de software para GNU y Linux y sus distribuciones.