Aprendiendo con un maestro

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 12 de abril de 2020; la verificación requiere 1 edición .

El aprendizaje supervisado es uno de los métodos de aprendizaje automático  , durante el cual el sistema bajo prueba se ve obligado a aprender utilizando ejemplos de estímulo-respuesta. Desde el punto de vista de la cibernética , es uno de los tipos de experimento cibernético . Puede haber alguna relación entre las entradas y las salidas de referencia (estímulo-respuesta), pero esto se desconoce. Solo se conoce un conjunto finito de precedentes  : pares de estímulo-respuesta, llamado muestra de entrenamiento . A partir de estos datos, se requiere restaurar la dependencia (construir un modelo de relaciones estímulo-respuesta adecuado para el pronóstico), es decir, construir un algoritmo capaz de dar una respuesta bastante precisa para cualquier objeto. Para medir la precisión de las respuestas, así como en el aprendizaje mediante ejemplos , se puede introducir un funcional de calidad .

El principio de la creación de este experimento

Este experimento es un caso especial de un experimento cibernético con retroalimentación. Establecer este experimento presupone la existencia de un sistema experimental, un método de entrenamiento y un método para probar el sistema o medir las características.

El sistema experimental, a su vez, está compuesto por el sistema probado (usado), el espacio de estímulos recibidos del medio externo y el sistema de control de refuerzo (regulador de parámetros internos). Como sistema de control de refuerzo, se puede utilizar un dispositivo de control automático (por ejemplo, un termostato) o un operador humano (maestro), capaz de responder a las reacciones del sistema probado y los estímulos ambientales aplicando reglas de refuerzo especiales que cambian el estado. de la memoria del sistema.

Hay dos opciones: (1) cuando la respuesta del sistema bajo prueba no cambia el estado del ambiente, y (2) cuando la respuesta del sistema cambia los estímulos del ambiente. Estos esquemas indican la similitud fundamental de tal sistema general con el sistema nervioso biológico.

Tipología de tareas de aprendizaje supervisado

Tipos de datos de entrada

Tipos de respuesta

Tipos degenerados de sistemas de control de refuerzo ("maestros")

Esta distinción permite una mirada más profunda a las diferencias entre las diferentes formas de aprendizaje, ya que la línea entre el aprendizaje supervisado y no supervisado es más sutil. Además, tal diferencia permitió mostrar ciertas limitaciones para las redes neuronales artificiales para sistemas controlados por S y R (ver Teorema de la convergencia del perceptrón ).

Véase también

Literatura