Aprender sin un maestro

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 11 de julio de 2021; las comprobaciones requieren 3 ediciones .

El aprendizaje no supervisado (autoaprendizaje, aprendizaje espontáneo, aprendizaje no supervisado en inglés  ) es uno de los métodos de aprendizaje automático , en el que el sistema bajo prueba aprende espontáneamente a realizar la tarea sin la intervención del experimentador. Desde el punto de vista de la cibernética , este es uno de los tipos de experimento cibernético . Por regla general, esto solo es adecuado para tareas en las que se conocen las descripciones de un conjunto de objetos (muestra de entrenamiento), y se requiere para detectar relaciones internas, dependencias y patrones que existen entre los objetos.

El aprendizaje no supervisado a menudo se contrasta con el aprendizaje supervisado , cuando se fuerza una "respuesta correcta" para cada objeto de aprendizaje y se requiere encontrar una relación entre los estímulos y las respuestas del sistema.

Conexión con la fisiología

A pesar de los numerosos avances aplicados, el aprendizaje supervisado ha sido criticado por su inverosimilitud biológica. Es difícil imaginar un mecanismo de aprendizaje en el cerebro que compare los valores de salida deseados y reales, corrigiéndolos con retroalimentación. Si permitimos tal mecanismo en el cerebro, ¿de dónde vienen los resultados deseados? El aprendizaje no supervisado es un modelo mucho más plausible para el aprendizaje en un sistema biológico. Desarrollado por Kohonen y muchos otros, no necesita un vector objetivo para los resultados y, por lo tanto, no requiere comparación con respuestas ideales predefinidas [1] .

El concepto de "aprender sin maestro" en la teoría del reconocimiento de patrones

Para construir una teoría y alejarse del experimento cibernético en varias teorías, se intenta formalizar matemáticamente el experimento con aprendizaje no supervisado. Hay muchas subespecies diferentes de configuración y definición de esta formalización, una de las cuales se refleja en la teoría del reconocimiento de patrones .

Tal desviación del experimento y la construcción de una teoría están asociadas con diferentes opiniones de especialistas en sus puntos de vista. Las diferencias, en particular, surgen al responder a la pregunta: “¿Es posible tener principios uniformes para una adecuada descripción de imágenes de distinta naturaleza, o tal descripción es cada vez tarea de especialistas en conocimientos específicos?”.

En el primer caso, la formulación debe estar dirigida a identificar los principios generales para utilizar información a priori en la elaboración de una adecuada descripción de las imágenes. Es importante que aquí la información a priori sobre imágenes de diferente naturaleza sea diferente, pero el principio de su contabilidad es el mismo. En el segundo caso, el problema de obtener una descripción queda fuera del alcance del enunciado general, y la teoría de las máquinas que aprenden a reconocer imágenes desde el punto de vista de la teoría estadística de aprender a reconocer imágenes puede reducirse a la problema de minimizar el riesgo promedio en una clase especial de reglas de decisión [2] .

En la teoría del reconocimiento de patrones , existen principalmente tres enfoques para este problema [3] :

Tipos de datos de entrada

Tareas a resolver

Un esquema experimental de aprendizaje no supervisado se usa a menudo en la teoría del reconocimiento de patrones , el aprendizaje automático . Al mismo tiempo, según el enfoque, se formaliza en uno u otro concepto matemático. Y solo en la teoría de las redes neuronales artificiales , el problema se resuelve de forma experimental, utilizando uno u otro tipo de redes neuronales. En este caso, por regla general, el modelo resultante puede no tener una interpretación, lo que a veces se denomina desventajas de las redes neuronales. Sin embargo, los resultados no son peores y, si se desea, se pueden interpretar utilizando métodos especiales.

Problemas de agrupamiento

Un experimento de aprendizaje no supervisado para resolver un problema de reconocimiento de patrones se puede formular como un problema de análisis de conglomerados . La muestra de objetos se divide en subconjuntos que no se superponen, denominados conglomerados , de modo que cada conglomerado consta de objetos similares y los objetos de diferentes conglomerados difieren significativamente. La información inicial se presenta en forma de matriz de distancia.

Métodos de solución

La agrupación puede desempeñar un papel auxiliar en la resolución de problemas de clasificación y regresión. Para hacer esto, primero debe dividir la muestra en conglomerados, luego aplicar un método muy simple a cada conglomerado, por ejemplo, aproximar la dependencia objetivo con una constante.

Métodos de solución

Problemas de generalización

Al igual que en el caso de los experimentos de discriminación , que pueden formularse matemáticamente como agrupamiento , al generalizar conceptos, se puede investigar la generalización espontánea , en la que los criterios de similitud no se introducen desde el exterior o no son impuestos por el experimentador.

Al mismo tiempo, en un experimento de “generalización pura”, se requiere un modelo del cerebro o perceptrón para pasar de una respuesta selectiva a un estímulo (por ejemplo, un cuadrado ubicado en el lado izquierdo de la retina) a un estímulo similar. que no activa ninguna de las mismas terminaciones sensoriales (cuadrado en el lado derecho de la retina). Una generalización de tipo más débil incluye, por ejemplo, el requisito de que las respuestas del sistema se extiendan a elementos de una clase de estímulos similares que no están necesariamente separados del estímulo previamente mostrado (o escuchado o percibido por el tacto).

Tareas de detección de anomalías

Los métodos de aprendizaje no supervisados ​​son comunes para resolver problemas de detección de anomalías, es decir, aquellas secciones de datos en las que el comportamiento del objeto difiere significativamente del comportamiento típico (esperado). [cuatro]

Problemas de encontrar reglas de asociación

La información inicial se presenta en forma de descripciones indicativas. La tarea es encontrar tales conjuntos de características y tales valores de estas características, que se encuentran con especial frecuencia (no por casualidad) en las descripciones de características de los objetos.

Problemas de reducción de dimensiones

La información inicial se presenta en forma de descripciones de características y el número de características puede ser bastante grande. El reto es representar estos datos en un espacio de menores dimensiones, minimizando al máximo la pérdida de información.

Métodos de solución

Tareas de visualización de datos

Algunos métodos de agrupamiento y reducción de dimensionalidad construyen representaciones de muestra en un espacio bidimensional. Esto le permite mostrar datos multidimensionales en forma de gráficos planos y analizarlos visualmente, lo que contribuye a una mejor comprensión de los datos y la esencia misma del problema que se está resolviendo.

Métodos de solución

Algunas aplicaciones

Véase también

Notas

  1. Wasserman, F. Tecnología de neurocomputadoras: teoría y práctica. — M.: Mir, 1992
  2. Vapnik V. N., Chervonenkis A. Ya., Teoría del reconocimiento de patrones. Problemas estadísticos del aprendizaje, 1974
  3. Tu J., Gonzalez R. Principios de reconocimiento de patrones, M. 1978
  4. Chandola, V. Detección de anomalías: una encuesta  // Encuestas informáticas ACM (CSUR). - 2009. - T. 41 , N º 3 . - S. 1-58 . Archivado desde el original el 28 de junio de 2020.

Literatura

Enlaces