El aprendizaje no supervisado (autoaprendizaje, aprendizaje espontáneo, aprendizaje no supervisado en inglés ) es uno de los métodos de aprendizaje automático , en el que el sistema bajo prueba aprende espontáneamente a realizar la tarea sin la intervención del experimentador. Desde el punto de vista de la cibernética , este es uno de los tipos de experimento cibernético . Por regla general, esto solo es adecuado para tareas en las que se conocen las descripciones de un conjunto de objetos (muestra de entrenamiento), y se requiere para detectar relaciones internas, dependencias y patrones que existen entre los objetos.
El aprendizaje no supervisado a menudo se contrasta con el aprendizaje supervisado , cuando se fuerza una "respuesta correcta" para cada objeto de aprendizaje y se requiere encontrar una relación entre los estímulos y las respuestas del sistema.
A pesar de los numerosos avances aplicados, el aprendizaje supervisado ha sido criticado por su inverosimilitud biológica. Es difícil imaginar un mecanismo de aprendizaje en el cerebro que compare los valores de salida deseados y reales, corrigiéndolos con retroalimentación. Si permitimos tal mecanismo en el cerebro, ¿de dónde vienen los resultados deseados? El aprendizaje no supervisado es un modelo mucho más plausible para el aprendizaje en un sistema biológico. Desarrollado por Kohonen y muchos otros, no necesita un vector objetivo para los resultados y, por lo tanto, no requiere comparación con respuestas ideales predefinidas [1] .
Para construir una teoría y alejarse del experimento cibernético en varias teorías, se intenta formalizar matemáticamente el experimento con aprendizaje no supervisado. Hay muchas subespecies diferentes de configuración y definición de esta formalización, una de las cuales se refleja en la teoría del reconocimiento de patrones .
Tal desviación del experimento y la construcción de una teoría están asociadas con diferentes opiniones de especialistas en sus puntos de vista. Las diferencias, en particular, surgen al responder a la pregunta: “¿Es posible tener principios uniformes para una adecuada descripción de imágenes de distinta naturaleza, o tal descripción es cada vez tarea de especialistas en conocimientos específicos?”.
En el primer caso, la formulación debe estar dirigida a identificar los principios generales para utilizar información a priori en la elaboración de una adecuada descripción de las imágenes. Es importante que aquí la información a priori sobre imágenes de diferente naturaleza sea diferente, pero el principio de su contabilidad es el mismo. En el segundo caso, el problema de obtener una descripción queda fuera del alcance del enunciado general, y la teoría de las máquinas que aprenden a reconocer imágenes desde el punto de vista de la teoría estadística de aprender a reconocer imágenes puede reducirse a la problema de minimizar el riesgo promedio en una clase especial de reglas de decisión [2] .
En la teoría del reconocimiento de patrones , existen principalmente tres enfoques para este problema [3] :
Un esquema experimental de aprendizaje no supervisado se usa a menudo en la teoría del reconocimiento de patrones , el aprendizaje automático . Al mismo tiempo, según el enfoque, se formaliza en uno u otro concepto matemático. Y solo en la teoría de las redes neuronales artificiales , el problema se resuelve de forma experimental, utilizando uno u otro tipo de redes neuronales. En este caso, por regla general, el modelo resultante puede no tener una interpretación, lo que a veces se denomina desventajas de las redes neuronales. Sin embargo, los resultados no son peores y, si se desea, se pueden interpretar utilizando métodos especiales.
Un experimento de aprendizaje no supervisado para resolver un problema de reconocimiento de patrones se puede formular como un problema de análisis de conglomerados . La muestra de objetos se divide en subconjuntos que no se superponen, denominados conglomerados , de modo que cada conglomerado consta de objetos similares y los objetos de diferentes conglomerados difieren significativamente. La información inicial se presenta en forma de matriz de distancia.
Métodos de soluciónLa agrupación puede desempeñar un papel auxiliar en la resolución de problemas de clasificación y regresión. Para hacer esto, primero debe dividir la muestra en conglomerados, luego aplicar un método muy simple a cada conglomerado, por ejemplo, aproximar la dependencia objetivo con una constante.
Métodos de soluciónAl igual que en el caso de los experimentos de discriminación , que pueden formularse matemáticamente como agrupamiento , al generalizar conceptos, se puede investigar la generalización espontánea , en la que los criterios de similitud no se introducen desde el exterior o no son impuestos por el experimentador.
Al mismo tiempo, en un experimento de “generalización pura”, se requiere un modelo del cerebro o perceptrón para pasar de una respuesta selectiva a un estímulo (por ejemplo, un cuadrado ubicado en el lado izquierdo de la retina) a un estímulo similar. que no activa ninguna de las mismas terminaciones sensoriales (cuadrado en el lado derecho de la retina). Una generalización de tipo más débil incluye, por ejemplo, el requisito de que las respuestas del sistema se extiendan a elementos de una clase de estímulos similares que no están necesariamente separados del estímulo previamente mostrado (o escuchado o percibido por el tacto).
Los métodos de aprendizaje no supervisados son comunes para resolver problemas de detección de anomalías, es decir, aquellas secciones de datos en las que el comportamiento del objeto difiere significativamente del comportamiento típico (esperado). [cuatro]
La información inicial se presenta en forma de descripciones indicativas. La tarea es encontrar tales conjuntos de características y tales valores de estas características, que se encuentran con especial frecuencia (no por casualidad) en las descripciones de características de los objetos.
La información inicial se presenta en forma de descripciones de características y el número de características puede ser bastante grande. El reto es representar estos datos en un espacio de menores dimensiones, minimizando al máximo la pérdida de información.
Métodos de soluciónAlgunos métodos de agrupamiento y reducción de dimensionalidad construyen representaciones de muestra en un espacio bidimensional. Esto le permite mostrar datos multidimensionales en forma de gráficos planos y analizarlos visualmente, lo que contribuye a una mejor comprensión de los datos y la esencia misma del problema que se está resolviendo.
Métodos de soluciónAprendizaje automático y minería de datos | |
---|---|
Tareas | |
Aprendiendo con un maestro | |
análisis de conglomerados | |
Reducción de dimensionalidad | |
Pronóstico estructural | |
Detección de anomalías | |
Graficar modelos probabilísticos | |
Redes neuronales | |
Aprendizaje reforzado |
|
Teoría | |
revistas y congresos |
|