Tarea de clasificación

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 14 de agosto de 2019; las comprobaciones requieren 6 ediciones .

La tarea de clasificación  es una tarea en la que hay muchos objetos ( situaciones ) divididos, de alguna manera, en clases . Se da un conjunto finito de objetos para los cuales se sabe a qué clases pertenecen. Este conjunto se llama muestra . Se desconoce la afiliación de clase del resto de los objetos. Se requiere construir un algoritmo capaz de clasificar (ver más abajo) un objeto arbitrario del conjunto inicial .

Clasificar un objeto significa indicar el número (o nombre) de la clase a la que pertenece el objeto dado.

Clasificación de objetos : el número o nombre de la clase, emitido por el algoritmo de clasificación como resultado de su aplicación a este objeto en particular.

En estadística matemática , los problemas de clasificación también se denominan problemas de análisis discriminante . En el aprendizaje automático , el problema de clasificación se resuelve, en particular, utilizando los métodos de las redes neuronales artificiales al configurar un experimento en forma de entrenamiento con un maestro .

También hay otras formas de preparar un experimento: aprendizaje no supervisado , pero se utilizan para resolver un problema diferente: agrupamiento o taxonomía . En estos problemas, no se especifica la división de los objetos de muestra de entrenamiento en clases, y se requiere clasificar los objetos solo en función de su similitud entre sí. En algunos campos aplicados, e incluso en la propia estadística matemática, debido a la proximidad de los problemas, los problemas de agrupamiento a menudo no se distinguen de los problemas de clasificación.

Algunos algoritmos para resolver problemas de clasificación combinan el aprendizaje supervisado con el aprendizaje no supervisado , por ejemplo, una versión de las redes neuronales de Kohonen  son las redes de cuantificación de vectores supervisados.

Enunciado matemático del problema

Sea un conjunto de descripciones de objetos, sea un conjunto de números (o nombres) de clases. Existe una dependencia de destino desconocida : el mapeo , cuyos valores solo se conocen en los objetos de la muestra de entrenamiento final . Se requiere construir un algoritmo capaz de clasificar un objeto arbitrario .

Enunciado probabilístico del problema

El enunciado probabilístico del problema se considera más general. Se supone que el conjunto de pares "objeto, clase" es un espacio de probabilidad con una medida de probabilidad desconocida . Hay un conjunto finito de entrenamiento de observaciones generadas de acuerdo con la medida de probabilidad  . Se requiere construir un algoritmo capaz de clasificar un objeto arbitrario .  

Espacio de funciones

Un signo es un mapeo , donde  es el conjunto de valores admisibles de un signo. Si se dan características , entonces el vector se denomina descripción de características del objeto . Las descripciones indicativas se pueden identificar con los propios objetos. En este caso, el conjunto se denomina espacio de características .

Dependiendo del conjunto, los letreros se dividen en los siguientes tipos:

A menudo existen problemas aplicados con diferentes tipos de características, no todos los métodos son adecuados para su solución.

Tipología de problemas de clasificación

Tipos de datos de entrada

La clasificación de señales e imágenes también se denomina reconocimiento de patrones .

Tipos de clase

Véase también

Enlaces

Literatura