Clasificación binaria

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 3 de agosto de 2020; la verificación requiere 1 edición .

La clasificación binaria , binaria o dicotómica es la tarea de clasificar los elementos de un conjunto dado en dos grupos (prediciendo a qué grupo pertenece cada elemento del conjunto) en base a la regla de clasificación . Los contextos en los que se requiere decidir si un objeto tiene alguna propiedad cualitativa , algunas características específicas o alguna clasificación binaria típica incluyen:

La clasificación binaria es una dicotomización aplicada con fines prácticos. En muchos problemas prácticos de clasificación binaria, los dos grupos no son simétricos; en lugar de la precisión general, las proporciones relativas de los tipos de error son importantes . Por ejemplo, en las pruebas de laboratorio, un falso positivo (detección de una enfermedad que en realidad no existe) se considera distinguible de un falso negativo (no detección de una enfermedad que el paciente realmente tiene).

Clasificación binaria estadística

La clasificación estadística es una tarea estudiada en el aprendizaje automático . Es un tipo de aprendizaje supervisado , un método de aprendizaje automático donde las categorías están predefinidas y se utilizan para seleccionar una categoría para una nueva observación probabilística. Si solo hay dos categorías, el problema se conoce como clasificación binaria estadística.

Algunos métodos comúnmente utilizados para la clasificación binaria son:

Cada clasificador funciona mejor solo en un área seleccionada, según la cantidad de observaciones, la dimensión del vector de características , el ruido en los datos y muchos otros factores. Por ejemplo, los clasificadores de bosques aleatorios funcionan mejor que las máquinas de vectores de soporte para nubes de puntos 3D [1] [2] .

Puntuación de clasificación binaria

Hay muchas métricas que se pueden usar para medir el rendimiento de un clasificador o predictor. Diferentes campos tienen diferentes beneficios para métricas específicas debido a diferentes propósitos. Por ejemplo, la sensibilidad y la especificidad se utilizan a menudo en medicina , mientras que la precisión y el recuerdo se favorecen la recuperación de información . Una diferencia importante en las métricas es si es independiente de la prevalencia (con qué frecuencia se presenta cada categoría en la población) o dependiente, y ambos tipos son útiles, pero tienen propiedades muy diferentes.

Dada una clasificación de un conjunto de datos, hay cuatro combinaciones básicas de una categoría válida y una categoría asignada:

  1. clasificaciones positivas asignadas correctamente TP
  2. clasificaciones negativas asignadas correctamente TN
  3. clasificaciones positivas falsamente asignadas FP
  4. clasificaciones negativas falsamente asignadas FN

Se pueden ubicar en una tabla de contingencia con columnas correspondientes a valores reales: condicionalmente positivo ( ing. condición positiva , CP) o condicionalmente negativo ( ing. condición negativa , CN), y filas correspondientes a valores de clasificación: la prueba resultado es positivo o negativo. Hay ocho razones básicas que se pueden calcular a partir de la tabla, que se dividen en cuatro pares complementarios (la suma de cada par es 1). Se obtienen dividiendo cada uno de los cuatro números por la suma de la fila o columna, lo que arroja ocho números que pueden denominarse "fila de verdaderos positivos" o "columna de falsos negativos", aunque existen términos de uso común. También hay dos pares de razones de columna y dos pares de razones de fila, y puedes obtener cuatro de ellos eligiendo una razón de cada par, siendo los otros cuatro números sus complementos.   

La columna de participación contiene la proporción de verdaderos positivos ( ing.  Tasa de verdaderos positivos , TPR, también llamada sensibilidad o recuperación , la adición es la proporción de resultados falsos negativos , ing.  Tasa de falsos negativos , FNR) y el proporción de resultados negativos verdaderos ( ing.  True Negative Rate , TNR, también llamada especificidad , ( ing.  Specificity , SPC, complement - la proporción de falsos positivos , ing.  False Positive Rate , FPR) Son proporcionales a la población con una condición (respectivamente, sin condición) para la cual la prueba es verdadera (o la prueba es falsa) y no dependen de la prevalencia.

La fila de fracción es el valor predictivo positivo ( Positive Predictive Value , PPV, también llamado precisión , el complemento es la proporción de falsos rechazos , False Discovery Rate , FDR) y el valor predictivo negativo ( eng  .. Valor predictivo negativo , NPV, suma - la proporción de pases falsos, ing. Tasa de omisiones falsas , FOR). Son proporcionales a la población con un resultado de prueba dado verdadero (o resultado falso) y dependen de la prevalencia.    

En las pruebas de laboratorio, los principales índices utilizados son la columna de proporción verdadera, la proporción de verdaderos positivos y la proporción de verdaderos negativos, donde se conocen como sensibilidad y especificidad . A la hora de extraer información, las principales relaciones son la tasa de verdaderos positivos (fila y columna) - el valor predictivo negativo y la tasa de verdaderos positivos - donde estos se conocen como precisión y recuperación .

Es posible tomar las razones de pares complementarios de razones, lo que da cuatro razones de verosimilitud (dos valores de la columna de proporciones, dos valores de la fila de proporciones). Esto se hace principalmente para las proporciones de columna, lo que proporciona proporciones de probabilidad en las pruebas de laboratorio . Tomando la razón en uno de estos grupos, obtenemos la razón de probabilidades de la prueba diagnóstica final ( Diagnóstico Odds Ratio , DOR) .  Este valor también se puede definir directamente como . Esto tiene una interpretación útil como razón de probabilidades y es independiente de la prevalencia.

Hay varias otras métricas, la más simple de las cuales es Fraction Correct (FC), que mide la proporción de todos los casos que se clasifican correctamente .  La suma de 1 de este valor es la proporción de incorrecta ( Fracción inglesa incorrecta , FiC). La medida F combina precisión y recuperación en un número eligiendo un peso, en el caso más simple igual al peso como en una medida F equilibrada (medida F1 ). Algunas métricas provienen de los coeficientes de regresión - marcados e informativos y su media geométrica , el coeficiente de correlación de Matthews . Otras métricas incluyen la estadística J de Youden , el coeficiente de incertidumbre , el coeficiente Phi y el kappa de Cohen.  

Conversión de valores continuos a binarios

Las pruebas cuyos resultados son valores continuos, como la mayoría de los valores de análisis de sangre , se pueden convertir artificialmente en binarios definiendo un valor de corte . El resultado de la prueba se define como positivo o negativo , según los resultados de la comparación de los valores resultantes y de corte.

Sin embargo, esta conversión da como resultado una pérdida de información porque el resultado de la clasificación binaria no indica cuánto más altos o más bajos son los valores de corte. Al convertir un valor continuo que está cerca del valor de corte, el valor predictivo positivo o negativo resultante es generalmente más alto que el valor predictivo obtenido directamente del valor continuo. En tales casos, un resultado de prueba positivo o negativo brinda una certeza inaceptablemente alta, mientras que el valor en sí está realmente en la región de incertidumbre. Por ejemplo, la concentración de gonadotropina coriónica humana (hCG) en la orina tiene un valor continuo. Una prueba de embarazo en orina con un punto de corte de 50 mIU/ml con una concentración real de hCG de 52 mIU/ml puede mostrar un “resultado positivo”. Por otro lado, un resultado de prueba alejado del punto de corte suele tener un valor predictivo positivo o negativo que es menor que el valor predictivo obtenido a partir de un valor continuo. Por ejemplo, un valor de hCG de 200 000 mIU/mL indica un grado muy alto de embarazo, pero la conversión a resultados binarios da un resultado de prueba "positivo" de solo 52 mIU/mL.

Véase también

Notas

  1. Zhang, Zakhor, 2014 .
  2. Lu, Rasmussen, 2012 .

Literatura