Característica (aprendizaje automático)

En el aprendizaje automático y el reconocimiento de patrones, una característica es una propiedad individual medible o característica de un fenómeno observado [1] . La selección de características informativas, distintivas e independientes es un paso crítico para algoritmos eficientes en reconocimiento de patrones , clasificación y regresión . Las características suelen ser numéricas, pero las características estructurales, como cadenas y gráficos , se utilizan en el reconocimiento de patrones sintácticos . El concepto de "característica" está relacionado con las variables explicativas utilizadas en técnicas estadísticas como la regresión lineal .

Clasificación

El conjunto de características numéricas se describe convenientemente mediante un vector de características. Un ejemplo de lograr una clasificación de dos características a partir de un vector de características (asociado con un perceptrón ) consiste en calcular el producto punto del vector de características y el vector de peso, comparar el resultado con un valor de umbral y decidir a qué clase pertenece el objeto. en base a esa comparación.

Los algoritmos de clasificación que se basan en vectores de características incluyen la clasificación del vecino más cercano , redes neuronales y técnicas estadísticas como el enfoque bayesiano .

Ejemplos

En el reconocimiento de caracteres, las características pueden incluir histogramas , incluido el número de puntos negros a lo largo de las direcciones horizontal y vertical, el número de vacíos internos, el énfasis del trazo y muchos otros.

En el reconocimiento de voz, las funciones para el reconocimiento de fonemas pueden incluir figura de ruido, duración de los sonidos, volumen relativo, coincidencia de filtros y más.

En los algoritmos de detección de spam , las características pueden incluir la presencia o ausencia de algunos encabezados de correo electrónico, la estructura del correo electrónico, el idioma, la frecuencia de ciertos términos, la corrección gramatical del texto.

En la visión por computadora , hay una gran cantidad de características posibles , como bordes y objetos.

Extensiones

En el reconocimiento de patrones y el aprendizaje automático, un vector de características es un vector n-dimensional de características numéricas que representa algún objeto. Muchos algoritmos en el aprendizaje automático requieren una representación numérica de los objetos, ya que dichas representaciones facilitan el procesamiento y el análisis estadístico. Cuando se trabaja con imágenes, una función puede corresponder a puntos de imagen (píxeles), mientras que las funciones de texto pueden corresponder a la frecuencia de uso de términos en el texto. Los vectores de características son equivalentes a los vectores de variables explicativas que se utilizan en procedimientos estadísticos como la regresión lineal . Los vectores de características a menudo se combinan con pesos usando el producto escalar para construir una función de predicción lineal , que se usa para determinar la puntuación de la predicción.

El espacio vectorial asociado con estos vectores a menudo se denomina espacio de características . Se pueden utilizar varias técnicas de reducción de dimensionalidad para reducir la dimensión del espacio de características .

Las características de nivel superior pueden derivarse de características ya conocidas y agregarse al vector de características. Por ejemplo, para el estudio de enfermedades es útil el atributo “edad”, que se puede definir como edad = “año de muerte” menos “año de nacimiento” . Este proceso se conoce como creación de funciones [2] [3] . La construcción de funciones es la aplicación de un conjunto de operadores de construcción a un conjunto de funciones existentes, lo que da como resultado la construcción de nuevas funciones. Ejemplos de tales operadores de construcción incluyen pruebas de igualdad {=, ≠}, operadores aritméticos {+,−,×, /}, operadores de matriz {max(S), min(S), promedio(S)} y operadores más complejos, por ejemplo, count(S,C) [4] , que cuenta el número de características en el vector de características S que satisfacen alguna condición C, o, por ejemplo, la distancia a otra clase de reconocimiento generalizada por algún dispositivo. La construcción de características se considera una herramienta poderosa tanto para aumentar la precisión como para mejorar la comprensión de la estructura, especialmente en problemas de alta dimensión [5] . Las aplicaciones incluyen el estudio de enfermedades y el reconocimiento de emociones en conversaciones [6] .

Selección y selección

El conjunto inicial de características sin procesar puede ser redundante y demasiado grande para procesar. Por lo tanto, un paso preliminar en muchas aplicaciones de aprendizaje automático y reconocimiento de patrones consiste en seleccionar un subconjunto de funciones o construir un nuevo conjunto de funciones reducido para proporcionar aprendizaje para mejorar la generalidad y la interpretabilidad.

El aislamiento o selección de características es una combinación de arte y ciencia. Los sistemas para hacer esto se conocen como sistemas de ingeniería de características . La extracción y selección de características requiere experimentar con muchas posibilidades, así como la capacidad de combinar técnicas automatizadas con la intuición y el conocimiento de un especialista limitado en este campo. La automatización de este proceso se denomina aprendizaje de funciones , donde la máquina no solo usa las funciones para aprender a sí misma, sino que también aprende nuevas funciones.

Véase también

Notas

  1. Obispo, 2006 .
  2. Liu, Motoda, 1998 .
  3. Piramuthu, Sikora, 2009 , pág. 3401-3406.
  4. Bloedorn y Michalski 1998 , p. 30-37.
  5. Breiman, Friedman, Olshen, Stone, 1984 .
  6. Sidorova, Badía, 2009 .

Literatura

Lecturas adicionales