Análisis de datos topológicos

El análisis de datos topológicos  es una nueva área de investigación teórica para problemas de minería de datos y visión por computadora .

Preguntas principales:

  1. Cómo obtener estructuras de alta dimensión a partir de representaciones de baja dimensión;
  2. Cómo las unidades discretas se suman a las estructuras globales.

El cerebro humano construye fácilmente una idea de la estructura general a partir de datos particulares de baja dimensión. Por ejemplo, no le resulta difícil obtener la forma tridimensional de un objeto a partir de imágenes planas en cada ojo. La creación de una estructura común también se lleva a cabo mediante la combinación de fragmentos discretos en el tiempo en una imagen continua . Así, por ejemplo, una imagen de televisión es técnicamente una serie de puntos individuales que, sin embargo, se perciben como una única escena.

El método principal de análisis de datos topológicos:

  1. Reemplazo de un conjunto de elementos de datos con alguna familia de complejos simpliciales de acuerdo con el parámetro de proximidad.
  2. Análisis de estos complejos topológicos mediante la topología algebraica , y en concreto mediante la nueva teoría de la homología persistente .
  3. Recodificación de la homología estable de un conjunto de datos en una versión parametrizada de los números de Betti , denominada código de barras .

Nube de puntos

Los datos a menudo se representan mediante un conjunto de puntos en el espacio euclidiano En , cuya forma refleja el fenómeno descrito por los datos.

Los objetos tridimensionales reales se pueden representar como una nube de puntos . Por ejemplo, los puntos individuales se marcan con un láser y su conjunto no estructurado sirve como una representación informática del objeto. Una nube de puntos es cualquier conjunto (posiblemente ruidoso) de puntos en E n o proyecciones de puntos en una dimensión inferior.

En gráficos y estadísticas por computadora , existen varios métodos para construir preimágenes a partir de proyecciones. El análisis de datos topológicos está diseñado para espacios de gran dimensión o demasiado curvos para poder crear proyecciones planas a partir de ellos.

Para transformar una nube de puntos en un espacio métrico en un objeto integral, se utilizan los puntos como vértices de la gráfica , a cuyas aristas se les asignan distancias, luego la gráfica se convierte en un complejo simplicial y se estudia mediante topología algebraica.

Véase también

Enlaces