En teoría de probabilidad y estadística matemática , la distribución de Dirichlet (llamada así por Johann Peter Gustav Lejeune-Dirichlet ), a menudo denominada Dir( α ), es una familia de distribuciones de probabilidad multidimensionales continuas de números reales no negativos parametrizados por el vector α . La distribución de Dirichlet es una generalización de la distribución Beta al caso multivariado. Es decir, su función de densidad de probabilidad devuelve la probabilidad de confianza de que la probabilidad de cada uno de los K eventos mutuamente excluyentes sea igual , dado que cada evento se ha observado una vez.
La función de densidad de probabilidad para una distribución de Dirichlet de orden K es [1] :
donde , , y es una función beta multidimensional , donde
Let y luego [1]
El modo de distribución es el vector x ( x 1 , …, x K ) con
La distribución de Dirichlet es la conjugada anterior a la distribución multinomial , a saber: si
donde β i es el número de ocurrencias de i en una muestra de n puntos de una distribución discreta en {1, …, K } definida a través de X , entonces
Esta relación se utiliza en las estadísticas bayesianas para estimar los parámetros latentes, X , de una distribución de probabilidad discreta dado un conjunto de n muestras. Obviamente, si el anterior se denota como Dir( α ), entonces Dir( α + β ) es la distribución posterior después de una serie de observaciones con histograma β .
Si por
independientemente, entoncesy
Aunque X i no son independientes entre sí, pueden generarse a partir de un conjunto de variables aleatorias gamma independientes . Desafortunadamente, dado que la suma se pierde en el proceso de formación de X = ( X 1 , …, X K ), se vuelve imposible restaurar los valores iniciales de las variables aleatorias gamma solo a partir de estos valores. Sin embargo, debido a que es más fácil trabajar con variables aleatorias independientes, esta transformación de parámetros puede ser útil para probar las propiedades de la distribución de Dirichlet.
El método para construir un vector aleatorio para una distribución de Dirichlet de dimensión K con parámetros se deriva directamente de esta conexión. Primero, obtenemos K muestras aleatorias independientes de distribuciones gamma , cada una de las cuales tiene una densidad
y luego poner
Como ejemplo del uso de la distribución de Dirichlet, podemos proponer un problema en el que se requiere cortar hilos (cada uno con una longitud inicial de 1.0) en K partes con diferentes longitudes para que todas las partes tengan una longitud promedio dada, pero con el posibilidad de alguna variación en las longitudes relativas de las partes. Los valores α / α 0 determinan las longitudes promedio de las partes de hilo resultantes de la distribución. La dispersión alrededor de la media es inversamente proporcional a α 0 .