Valor p

Valor p ( valor p en inglés  ) , nivel de significación p, criterio p : la probabilidad de obtener para un modelo probabilístico dado de la distribución de valores de una variable aleatoria el mismo o más valor extremo de las estadísticas (media aritmética , mediana, etc.), en comparación con lo observado anteriormente, siempre que la hipótesis nula sea cierta.

Una característica de los valores de P es su inestabilidad en muestras equivalentes , lo que puede convertirse en un obstáculo para la reproducibilidad de los resultados experimentales [1] [2] [3] . Las alternativas al uso de valores P incluyen métodos como las estadísticas de puntuación y el coeficiente de Bayes [4] [5] [6] .

Definición formal y procedimiento de prueba

Sea  una estadística utilizada para probar alguna hipótesis nula . Se supone que si la hipótesis nula es verdadera, entonces se conoce la distribución de esta estadística. Denote la función de distribución . El valor p se define con mayor frecuencia (cuando se prueba una alternativa de mano derecha) como:

Al marcar la alternativa para zurdos,

En el caso de una prueba de dos colas, el valor p es:

Si p(t) es menor que el nivel de significación dado, entonces se rechaza la hipótesis nula a favor de la alternativa. En caso contrario, no se rechaza.

La ventaja de este enfoque es que se puede ver en qué nivel de significancia se rechazará la hipótesis nula y en cuál se aceptará, es decir, se puede ver el nivel de confiabilidad de las inferencias estadísticas, más precisamente, la probabilidad de error al rechazar la hipótesis nula. A cualquier nivel de significancia mayor que la hipótesis nula se rechaza, y a valores menores no lo es.

Crítica

El uso de valores p para probar hipótesis nulas en ciencias médicas y naturales ha sido criticado por muchos expertos. Se observa que su uso a menudo conduce a errores de primer tipo ( falsos positivos ) [7] . En particular, la revista Psicología Social Básica y Aplicada (BASP) en 2015 prohibió por completo la publicación de artículos que utilizan valores p . Los editores de la revista explicaron esto diciendo que no es muy difícil realizar un estudio en el que se obtenga una p < 0,05, y valores de p tan bajos con demasiada frecuencia se convierten en una excusa para estudios de baja calidad [8] .

Interpretación errónea de los valores P

Se cree ampliamente que los valores P a menudo se malinterpretan y se usan incorrectamente [9] [10] [11] . Una práctica que ha sido objeto de críticas particulares es aceptar una hipótesis alternativa para cualquier valor de P nominalmente inferior a 0,05 sin otra evidencia de apoyo. Si bien los valores P son útiles para evaluar cuán inconsistentes son los datos con un modelo estadístico dado, los factores contextuales como "diseño del estudio, calidad de la medición, evidencia externa del fenómeno en estudio y la solidez de los supuestos subyacentes al análisis de datos" deben también ser considerado [11] . Otro problema es que el valor P a menudo se malinterpreta como la probabilidad de que la hipótesis nula sea verdadera [11] [12] . Algunos expertos han propuesto reemplazar los valores P con métricas de evidencia alternativas [11] como el intervalo de confianza [13] [14] , la razón de verosimilitud [15] [16] o el coeficiente bayesiano [17] [18] [19] , pero la aguda discusión sobre la posibilidad de utilizar dichas alternativas [20] [21] . Otros han propuesto eliminar los umbrales de significancia fijos e interpretar los valores P como valores continuos que caracterizan la cantidad de evidencia contra la probabilidad de la hipótesis nula [22] [23] .

Véase también

Notas

  1. Cumming, 2008 .
  2. Nuzo, 2014 .
  3. Halsey, Curran-Everett, Vowler et al., 2015 .
  4. Cumming, 2010 .
  5. Taroni, Biedermann, Bozza, 2016 .
  6. Goodman, 2016 .
  7. Douglas H. Johnson. La insignificancia de las pruebas de significación estadística  //  Journal of Wildlife Management . - Wiley-VCH , 1999. - vol. 3 , núm. 63 . - Pág. 763-772 .
  8. Chris Woolston. Revista de psicología prohíbe los valores P  (inglés)  // Nature News. — 2015-03-05. — vol. 519 , edición. 7541 . - Pág. 9-9 . -doi : 10.1038/ 519009f .
  9. Científicos perturbados por la pérdida de la herramienta Stat para filtrar el fudge de investigación de Fact // Scientific American  : revista  . - Springer Nature , 2015. - 16 de abril.  
  10. Goodman S.N. Hacia estadísticas médicas basadas en evidencia.  1: La falacia del valor P  // Annals of Internal Medicine : diario. - 1999. - vol. 130 , núm. 12 _ - Pág. 995-1004 . -doi : 10.7326 / 0003-4819-130-12-199906150-00008 . —PMID 10383371 .
  11. 1 2 3 4 Wasserstein, Ronald L.; Lazar, Nicole A.La declaración de la ASA sobre los valores p: contexto, proceso y propósito  //  The American Statistician : diario. - 2016. - Vol. 70 . - pág. 129-133 . -doi : 10.1080 / 00031305.2016.1154108 .
  12. Colquhoun, David. Una investigación sobre la tasa de falso descubrimiento y la mala interpretación de los valores de p  //  Royal Society Open Science : diario. - 2014. - Vol. 1 . — Pág. 140216 . -doi : 10.1098 / rsos.140216 .
  13. Lee, Dong Kyu. Alternativas al valor P: intervalo de confianza y tamaño del efecto  (inglés)  // Korean Journal of Anesthesiology  : diario. - 2017. - 7 de marzo ( vol. 69 , núm. 6 ). - Pág. 555-562 . — ISSN 2005-6419 . -doi : 10.4097 / kjae.2016.69.6.555 . — PMID 27924194 .
  14. Ranstam, J. Por qué el cultivo del valor P es malo y los intervalos de confianza una mejor alternativa  //  Osteoartritis y cartílago : diario. - 2012. - Agosto ( vol. 20 , no. 8 ). - P. 805-808 . -doi : 10.1016/ j.joca.2012.04.001 .
  15. Perneger, Thomas V. Tamizar la evidencia: los cocientes de probabilidad son alternativas a los valores de P  // BMJ  : British Medical Journal  : revista. - 2001. - 12 de mayo ( vol. 322 , núm. 7295 ). Pág. 1184 . ISSN 0959-8138 . PMID 11379590 .
  16. Royall, Richard. El paradigma de probabilidad para la evidencia estadística // La naturaleza de la evidencia científica  . - Pág. 119-152. doi : 10.7208 /chicago/9780226789583.003.0005 .
  17. Schimmack, Ulrich Sustitución de los valores de p por factores de Bayes: una cura milagrosa para la crisis de replicabilidad en la ciencia psicológica . Índice de replicabilidad (30 de abril de 2015). Recuperado: 7 de marzo de 2017.
  18. Marden, John I. Prueba de hipótesis: de los valores de p a los factores de Bayes  //  Revista de la Asociación Estadounidense de Estadística  : revista. - 2000. - Diciembre ( vol. 95 , no. 452 ). — Pág. 1316 . -doi : 10.2307/ 2669779 .
  19. Stern, Hal S. Una prueba con cualquier otro nombre: valores, factores de Bayes e inferencia estadística  // Investigación conductual  multivariante : diario. - 2016. - 16 febrero ( vol. 51 , núm. 1 ). - Pág. 23-29 . -doi : 10.1080/ 00273171.2015.1099032 . —PMID 26881954 .
  20. Murtaugh, Paul A. En defensa de los valores p  (indefinidos)  // Ecología. - 2014. - marzo ( vol. 95 , no. 3 ). - S. 611-617 . -doi : 10.1890/ 13-0590.1 .
  21. Aschwanden, Christie Los estadísticos encontraron una cosa en la que pueden estar de acuerdo: es hora de dejar de abusar de los valores P. FiveThirtyEight (7 de marzo de 2016).
  22. Amrhein, Valentín; Korner-Nievergelt, Francis; Roth, Tobías. La tierra es plana (p > 0,05): umbrales de significación y la crisis de la investigación irreplicable //  PeerJ   : diario. - 2017. - Vol. 5 . — P.e3544 . -doi : 10.7717/ peerj.3544 .
  23. Amrhein, Valentín; Groenlandia, Sander. Eliminar, en lugar de redefinir, significación estadística  //  Nature Human Behavior: revista. - 2017. - Vol. 1 . — Pág. 0224 . -doi : 10.1038/ s41562-017-0224-0 .

Literatura

Enlaces