Tabla de volcanes (estadísticas)

En estadística, un diagrama de volcán es un tipo de diagrama de dispersión que se usa para detectar rápidamente cambios en grandes conjuntos de datos de valores repetidos. El eje Y indica significación estadística, el X - el rango de diferencia. El gráfico Volcano es popular en ómicas como la genómica , la proteómica y la metabolómica, donde a menudo se usan valores repetibles y las diferencias significativas deben identificarse rápidamente. El gráfico Volcano combina la medida de la significación estadística (valor p) y el rango de diferencias, lo que le permite identificar visualmente rápidamente estos valores (genes, etc.) a través de una amplia gama de diferencias con indicadores estadísticamente significativos.

Los gráficos de volcanes consisten en el logaritmo negativo de la diferencia estadísticamente significativa en el eje y (generalmente en base 10). Estos puntos en el gráfico con un valor P bajo tienden hacia arriba. El eje x es el logaritmo de la diferencia entre los dos valores. El logaritmo de diferencias muestra diferencias equidistantes en ambas direcciones desde el centro. La formación de un diagrama de esta manera da como resultado dos regiones de interés en el diagrama: los puntos que se encuentran en la parte superior del diagrama y los que se encuentran lejos unos de otros. El gráfico presenta valores que muestran una gran dispersión en el rango de diferencias (izquierda o derecha del centro) y significancia estadística (aumentando hacia la parte superior)

Se puede agregar información adicional coloreando los puntos según la tercera dimensión de los datos (por ejemplo, la intensidad de la señal). Este diagrama también se utiliza en la visualización gráfica del análisis de la importancia de los microarreglos .

La idea de un gráfico de volcán se puede generalizar para aplicar a otras medidas, donde el eje x corresponde a la medida de la fuerza de la señal estadística y el eje y corresponde a la medida de la significancia estadística de la señal. Por ejemplo, en asociaciones genéticas, un grupo de control, como una búsqueda de asociación de todo el genoma, en el diagrama, un punto representa un polimorfismo de un solo nucleótido. El valor x puede ser un rango , el eje y puede ser -log10 valores p del chi-cuadrado. [una]

Enlaces

  1. ↑ Diagrama de volcán. BioData.wiki  (enlace no disponible)