Indexación aleatoria

La indexación aleatoria  es un método de reducción de dimensionalidad y uno de los enfoques de la semántica distributiva , basado en la creencia de que las variantes de alta dimensión del modelo de espacio vectorial son de poca utilidad en la práctica y que los modelos no deben aumentar la dimensión cuando los objetos (términos, documentos ) que no se hayan visto antes, etc.) Se supone que un modelo con dimensiones más altas se puede proyectar en un espacio con otras más pequeñas - sin perjuicio de la métrica L2, si las dimensiones finales se eligen correctamente, que es la principal aproximación a las proyecciones aleatorias como método de reducción de dimensionalidad, formulado como el lema de Johnson - Lindenstrauss .

LSH es similar. La indexación aleatoria como una representación de los objetos del lenguaje natural se propone por primera vez en el artículo de Pentti Kanerva sobre memoria distribuida dispersa y puede describirse como una construcción incremental de proyecciones aleatorias.

También se puede demostrar que la indexación aleatoria es una variante de las proyecciones aleatorias para construir espacios euclidianos.