El aprendizaje supervisado es uno de los métodos de aprendizaje automático , durante el cual el sistema bajo prueba se ve obligado a aprender utilizando ejemplos de estímulo-respuesta. Desde el punto de vista de la cibernética , es uno de los tipos de experimento cibernético . Puede haber alguna relación entre las entradas y las salidas de referencia (estímulo-respuesta), pero esto se desconoce. Solo se conoce un conjunto finito de precedentes : pares de estímulo-respuesta, llamado muestra de entrenamiento . A partir de estos datos, se requiere restaurar la dependencia (construir un modelo de relaciones estímulo-respuesta adecuado para el pronóstico), es decir, construir un algoritmo capaz de dar una respuesta bastante precisa para cualquier objeto. Para medir la precisión de las respuestas, así como en el aprendizaje mediante ejemplos , se puede introducir un funcional de calidad .
Este experimento es un caso especial de un experimento cibernético con retroalimentación. Establecer este experimento presupone la existencia de un sistema experimental, un método de entrenamiento y un método para probar el sistema o medir las características.
El sistema experimental, a su vez, está compuesto por el sistema probado (usado), el espacio de estímulos recibidos del medio externo y el sistema de control de refuerzo (regulador de parámetros internos). Como sistema de control de refuerzo, se puede utilizar un dispositivo de control automático (por ejemplo, un termostato) o un operador humano (maestro), capaz de responder a las reacciones del sistema probado y los estímulos ambientales aplicando reglas de refuerzo especiales que cambian el estado. de la memoria del sistema.
Hay dos opciones: (1) cuando la respuesta del sistema bajo prueba no cambia el estado del ambiente, y (2) cuando la respuesta del sistema cambia los estímulos del ambiente. Estos esquemas indican la similitud fundamental de tal sistema general con el sistema nervioso biológico.
Esta distinción permite una mirada más profunda a las diferencias entre las diferentes formas de aprendizaje, ya que la línea entre el aprendizaje supervisado y no supervisado es más sutil. Además, tal diferencia permitió mostrar ciertas limitaciones para las redes neuronales artificiales para sistemas controlados por S y R (ver Teorema de la convergencia del perceptrón ).
Aprendizaje automático y minería de datos | |
---|---|
Tareas | |
Aprendiendo con un maestro | |
análisis de conglomerados | |
Reducción de dimensionalidad | |
Pronóstico estructural | |
Detección de anomalías | |
Graficar modelos probabilísticos | |
Redes neuronales | |
Aprendizaje reforzado |
|
Teoría | |
revistas y congresos |
|