Distribución previa conjugada

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 26 de junio de 2016; las comprobaciones requieren 2 ediciones .

La distribución previa conjugada ( ing.  conjugate prior ) y la familia conjugada de distribuciones son uno de los conceptos básicos en la estadística bayesiana .

Considere el problema de encontrar la distribución de un parámetro (considerado como una variable aleatoria ) de acuerdo con la observación disponible . Por el teorema de Bayes , la distribución posterior se calcula a partir de la distribución previa con una densidad de probabilidad y una función de probabilidad utilizando la fórmula:

Si la distribución posterior pertenece a la misma familia de distribuciones de probabilidad que la distribución anterior (es decir, tiene la misma forma, pero con diferentes parámetros), entonces esta familia de distribuciones se denomina conjugada a la familia de funciones de verosimilitud . En este caso, la distribución se denomina distribución previa conjugada a la familia de funciones de verosimilitud .

El conocimiento de familias de distribuciones conjugadas simplifica enormemente el cálculo de probabilidades a posteriori en estadística bayesiana , ya que permite reemplazar el cálculo de integrales engorrosas en la fórmula de Bayes con manipulaciones algebraicas simples sobre los parámetros de distribuciones.

Ejemplo

Para una variable aleatoria distribuida según la ley de Bernoulli (lanzar una moneda) con un parámetro desconocido (probabilidad de éxito), la distribución previa conjugada suele ser la distribución beta con una densidad de probabilidad:

donde y se eligen para reflejar la información o creencia a priori disponible sobre la distribución del parámetro q (elegir = 1 y = 1 dará una distribución uniforme), y Β ( ,  ) es la función beta que sirve aquí para normalizar la probabilidad.

Los parámetros y a menudo se denominan hiperparámetros (parámetros de distribución previa) para distinguirlos de los parámetros de la función de verosimilitud (en este caso, q ).

Si tomamos una muestra de n valores de esta variable aleatoria, y entre ellos hay s aciertos y f fracasos, entonces la distribución posterior del parámetro q será:

Esta distribución posterior también resulta estar distribuida según la distribución beta .

Tabla de familias conjugadas de distribuciones

Las siguientes tablas muestran cómo cambian los parámetros de la distribución posterior después de una muestra de n observaciones independientes distribuidas equitativamente . La segunda columna es el parámetro de la función de verosimilitud, con respecto al cual se construye la familia de distribuciones conjugadas.

Funciones de verosimilitud distribuidas discretamente

función de probabilidad Parámetro Familia conjugada de distribuciones Hiperparámetros de distribución previa Hiperparámetros de la distribución posterior
Bernoulli pags Beta
Binomio pags Beta
binomio negativo pags Beta
veneno λ Gama
veneno λ Gama [una]
multinomial p (vector de probabilidad) Dirichlet
Geométrico p 0 (probabilidad) Beta

Funciones de verosimilitud distribuidas continuamente

función de probabilidad Parámetro Familia conjugada de distribuciones Hiperparámetros de distribución previa Hiperparámetros de la distribución posterior
Uniforme Pareto
Exponencial λ Gama [2]
Normal
con varianza conocida σ 2
m Normal
Normal
con τ conocido  = 1/ σ 2
m Normal
Normal
con media conocida μ
σ2 _ Chi-cuadrado inverso escalado
Normal
con media conocida μ
τ (= 1/σ 2 ) Gama [2]
Normal
con media conocida μ
σ2 _ Distribución gamma inversa
Pareto k Gama
Pareto x metro Pareto proporcionado _
Gamma
con α conocido [1]
β (escala inversa) Gama

Notas

  1. 1 2 Parametrización de la distribución gamma con parámetros: θ = 1/ β y k = α .
  2. 1 2 tasa_beta

Literatura