Elegir un modelo estadístico

La selección de modelos  es la tarea de seleccionar un modelo estadístico de un conjunto de modelos candidatos dados los datos disponibles. En el caso más simple, se considera un conjunto de datos existente. Sin embargo, la tarea puede implicar el diseño de experimentos , por lo que la recopilación de datos está relacionada con la tarea de selección del modelo. Dados los modelos candidatos con el mismo poder predictivo o explicativo, es probable que el modelo más simple sea la mejor opción ( la navaja de Occam ).

Konishi y Kitagawa [1] afirman: "La mayoría de los problemas de inferencia estadística pueden considerarse problemas relacionados con el modelado estadístico". Al mismo tiempo, Cox [2] dijo: "Cómo se lleva a cabo la traducción del problema en cuestión al modelo estadístico es la parte más crítica del análisis".

La selección de modelos también puede referirse a la tarea de seleccionar múltiples modelos representativos de un gran conjunto de modelos computacionales con el fin de tomar decisiones u optimizar bajo incertidumbre.

Introducción

En sus formas más simples, la selección de modelos es una de las tareas fundamentales de la investigación científica . La definición de un principio que explica un conjunto de observaciones a menudo se vincula directamente con un modelo matemático para predecir esas observaciones. Por ejemplo, cuando Galileo realizó sus experimentos con un plano inclinado , demostró que el movimiento de la bola sigue la parábola predicha en su modelo.

Con el número infinito de posibles mecanismos y procesos que pueden proporcionar los datos, ¿cómo se puede empezar a elegir el mejor modelo? El enfoque matemático por lo general toma una decisión entre un conjunto de modelos candidatos. Este conjunto debe ser elegido por el investigador. A menudo se utilizan modelos simples como los polinomios , al menos al principio. Burnham y Andersen [3] enfatizan en su libro la importancia de elegir modelos basados ​​en principios científicos, como la comprensión de procesos o mecanismos fenomenológicos (por ejemplo, reacciones químicas) para los datos.

Una vez que se ha seleccionado un conjunto de modelos candidatos, el análisis estadístico permite seleccionar el mejor de estos modelos. Lo que significa la palabra mejor es una pregunta discutible. Una buena técnica de selección de modelos equilibrará la adecuación y la simplicidad del modelo. Es posible que los modelos más complejos se ajusten mejor a los datos (por ejemplo, un polinomio de quinto grado puede representar exactamente seis puntos), pero los parámetros adicionales pueden no ser útiles (quizás los seis puntos se distribuyen aleatoriamente a lo largo de una línea recta). El ajuste de un modelo generalmente se determina utilizando , o una aproximación a, la razón de verosimilitud , lo que da como resultado una prueba de chi-cuadrado . La complejidad generalmente se mide contando el número de parámetros del modelo .

Las técnicas de selección de modelos se pueden considerar como estimaciones de alguna cantidad física, como la probabilidad de que un modelo produzca los datos disponibles. El sesgo y la varianza son indicadores importantes de la calidad de un predictor. A menudo, también se considera un indicador de desempeño .

Un ejemplo estándar de selección de modelo es el ajuste de curvas , donde, dado un conjunto de puntos y otra información general (por ejemplo, cuando los puntos son el resultado de una muestra de variables aleatorias independientes ), debemos seleccionar una curva que describa la función que genera los puntos.

Métodos para seleccionar un conjunto de candidatos en un modelo

Criterios

Si nos limitamos de antemano a considerar sólo modelos autorregresivos (AR), es decir, suponemos que el proceso Xt sigue el modelo AR(k) con un orden k verdadero desconocido, entonces durante mucho tiempo k se utilizó para determinar k en tales situaciones [4]

Más preferido es el comúnmente utilizado actualmente [4]

Algo más tarde se sugirió [4]

Usado con frecuencia

También se utilizan los siguientes criterios

Véase también

Notas

  1. Konishi, Kitagawa, 2008 , pág. 75.
  2. Cox, 2006 , pág. 197.
  3. Burnham, Anderson, 2002 .
  4. 1 2 3 4 Criterios de información . Consultado el 30 de diciembre de 2018. Archivado desde el original el 14 de abril de 2018.
  5. Malvas, 1973 , p. 661-675.

Literatura