Mapa autoorganizado de Kohonen

El mapa autoorganizado de Kohonen ( English  Self-organizing map  - SOM) es una red neuronal no supervisada que realiza la tarea de visualización y agrupamiento . La idea de una red fue propuesta por el científico finlandés T. Kohonen . Es un método para proyectar un espacio multidimensional en un espacio con una dimensión más baja (la mayoría de las veces, bidimensional), también se usa para resolver problemas de modelado, pronóstico, identificación de conjuntos de características independientes, búsqueda de patrones en grandes conjuntos de datos. , desarrollo de juegos de computadora, cuantificación de colores a su número limitado de índices en la paleta de colores: al imprimir en una impresora y antes en una PC o en decodificadores con una pantalla con un número reducido de colores, para archivadores [uso general] o códecs de vídeo, etc. Es una de las versiones de las redes neuronales de Kohonen .

Historia

El método fue propuesto por el científico finlandés Teuvo Kohonen en 1984. Hay muchas modificaciones del modelo original.

Estructura de la red

Un mapa autoorganizado se compone de componentes llamados nodos o neuronas. Su número lo establece el analista . Cada uno de los nodos está descrito por dos vectores. El primero es el llamado. un vector de peso m que tiene la misma dimensión que la entrada. El segundo es el vector r , que son las coordenadas del nodo en el mapa. El mapa de Kohonen se muestra visualmente mediante celdas rectangulares o hexagonales; este último se usa con más frecuencia, ya que en este caso las distancias entre los centros de las celdas adyacentes son las mismas, lo que aumenta la precisión de la visualización del mapa.

Inicialmente se conoce la dimensión de los datos de entrada, de alguna manera se construye la versión inicial del mapa. Durante el proceso de aprendizaje, los vectores de peso de los nodos se aproximan a los datos de entrada. Para cada observación (muestra), se selecciona el nodo más similar en términos de vector de peso y el valor de su vector de peso se aproxima a la observación. Además, los vectores de peso de varios nodos ubicados cerca se acercan a la observación, por lo que si dos observaciones eran similares en el conjunto de datos de entrada, los nodos cercanos les corresponderán en el mapa. El proceso de aprendizaje cíclico, iterando sobre los datos de entrada, finaliza cuando el mapa alcanza un error aceptable (predeterminado por el analista), o después de un número específico de iteraciones. Por lo tanto, como resultado del entrenamiento, el mapa de Kohonen clasifica los datos de entrada en grupos y muestra visualmente los datos de entrada multidimensionales en un plano bidimensional, distribuyendo vectores de características cercanas en las celdas vecinas y coloreándolos según los parámetros analizados de las neuronas.

Como resultado del algoritmo se obtienen los siguientes mapas:

Operación de red

Algoritmo

Hay tres formas más comunes de establecer los pesos iniciales de los nodos:

Sea  el número de iteración (la inicialización corresponde al número 0).

, para any , donde  es el vector de peso del nodo . Si hay varios nodos que cumplen la condición, la BMU se selecciona aleatoriamente de entre ellos. La función determina la "medida de vecindario" de los nodos y el cambio en los vectores de peso. Debería refinar gradualmente sus valores, primero en un mayor número de nodos y más fuertes, luego en uno más pequeño y más débil. A menudo se utiliza una función gaussiana como función de vecindad: donde  es un factor de entrenamiento que disminuye monótonamente con cada iteración posterior (es decir, determina la aproximación del valor de los vectores de peso de la BMU y sus vecinos a la observación; cuanto mayor es el paso, menor es el refinamiento); ,  - coordenadas de nodos y en el mapa;  — el factor que reduce el número de vecinos con iteraciones disminuye monótonamente. Los parámetros y su carácter de disminución son establecidos por el analista. Una forma más fácil de definir una función de vecindad: , si está en la vecindad de un radio predeterminado por el analista, y 0 en caso contrario. La función es igual para la BMU y disminuye con la distancia desde la BMU. Cambie el vector de pesos según la fórmula: Que. los vectores de peso de todos los nodos que son vecinos de la BMU se aproximan a la observación en consideración. Por ejemplo, como la media aritmética de las distancias entre las observaciones y los vectores de peso de sus correspondientes UMB: , donde N es el número de elementos del conjunto de datos de entrada.

Características del modelo

Resistencia a datos ruidosos, aprendizaje rápido y sin supervisión, capacidad para simplificar datos de entrada multivariados con visualización. [2]

Los mapas de Kohonen autoorganizados se pueden utilizar para el análisis de conglomerados solo si se conoce de antemano el número de conglomerados [2] .

Una desventaja importante es que el resultado final del trabajo de las redes neuronales depende de la configuración inicial de la red. Por otro lado, las redes neuronales teóricamente pueden aproximarse a cualquier función continua, lo que permite al investigador no hacer hipótesis sobre el modelo de antemano [2] .

Véase también

Notas

  1. Chubukova, 2000 , pág. 140.
  2. 1 2 3 Manzhula, 2011 .

Literatura

Enlaces