Teoría de Dempster-Schafer

La teoría de Dempster-Schafer es una teoría matemática de la evidencia ([SH76]) basada en funciones de creencia y razonamiento plausible , que se utilizan para combinar piezas separadas de información (evidencia) para calcular la probabilidad de un evento. La teoría fue desarrollada por Arthur P. Dempster y Glenn Schafer .

Considere dos posibles jugadores

El primer juego es un lanzamiento de moneda, donde se hacen apuestas sobre si saldrá cara o cruz. Ahora imagina un segundo juego en el que se hacen apuestas sobre el resultado de una pelea entre el mejor boxeador del mundo y el mejor luchador del mundo. Supongamos que ignoramos las artes marciales, y nos resulta muy difícil decidir por quién apostar.

Mucha gente tendrá menos confianza en la situación del segundo juego, en el que se desconocen las probabilidades, que en el primer juego, donde es fácil ver que la probabilidad de cada resultado es la mitad. En el caso del segundo juego, la teoría bayesiana asignará la mitad de la probabilidad a cada resultado, independientemente de la información que haga que uno de los resultados sea más probable que el otro. La teoría de Dempster-Schafer permite determinar el grado de confianza del jugador con respecto a las probabilidades asignadas a varios resultados.

Formalización

Sea el conjunto universal , el conjunto de todos los enunciados bajo consideración. El conjunto exponencial, , es la colección de todos los subconjuntos del conjunto , incluido el conjunto vacío . Por ejemplo, si: $X$ $P(X)$ $X$ $\conjunto vacio$

$X=\izquierda\{a,b\derecha\}$

después

${\displaystyle P(X)=\left\{\emptyset ,\left\{a\right\},\left\{b\right\},X\right\))$

Por definición, la masa del conjunto vacío es cero:

$m(\emptyset)=0$

Las masas de los elementos restantes del conjunto exponencial se normalizan a una suma unitaria:

$1=\sum_{A\in P(X)}m(A)$

La masa de un elemento del conjunto exponencial expresa la proporción de toda la evidencia relevante y disponible que respalda la afirmación de que un determinado elemento pertenece pero no pertenece a ningún subconjunto de . La cantidad se refiere solo al conjunto y no crea declaraciones adicionales sobre los otros subconjuntos , cada uno de los cuales, por definición, tiene su propia masa. ${\ estilo de visualización m (A)}$ $A$ $X$ $A$ $A$ ${\ estilo de visualización m (A)}$ $A$ $A$

En base a las masas asignadas, es posible determinar los límites superior e inferior del rango de posibilidades. Este intervalo contiene el valor exacto de la probabilidad del subconjunto en consideración (en el sentido clásico), y está limitado por dos medidas continuas no aditivas llamadas creencia ( o apoyo ) y plausibilidad ( plausibilidad ) :

$bel(A)\leq P(A)\leq pl(A)$

La confianza del conjunto se define como la suma de todas las masas de los subconjuntos propios del conjunto en consideración: $bel(A)$ $A$

$bel(A)=\sum_B\mid B\subseteq A}m(B)$

La verosimilitud es la suma de las masas de todos los conjuntos que intersecan con el conjunto considerado : ${\ estilo de visualización pl (A)}$ $B$ $A$

$pl(A)=\sum _{B\mid B\cap A\neq \emptyset}m(B)$

Estas dos medidas están relacionadas entre sí de la siguiente manera:

$pl(A)=1-bel({\overline {A)))$

De lo anterior se deduce que basta con conocer al menos una de las medidas (masa, confianza o verosimilitud) para calcular las dos restantes.

Considere el problema de combinar dos conjuntos independientes de masas asignadas. La regla de unión original, conocida como regla de combinación de Dempster , es una generalización de la regla de Bayes. Esta regla enfatiza el acuerdo entre múltiples fuentes e ignora todas las pruebas contradictorias a través de la normalización. La legalidad del uso de esta regla se cuestiona seriamente en caso de inconsistencias significativas entre las fuentes de información.

En realidad, la unión (llamada masa añadida ) se calcula a partir de dos conjuntos de masas y de la siguiente manera: $m_1$ $m_2$

$m_{1,2}(\emptyset)=0$

$m_{1,2}(A)={\frac {1}{1-K}}\sum_B\cap C=A\neq \emptyset }m_{1}(B)m_{2 }(C)$

dónde:

$K=\sum_{B\cap C=\emptyset}m_{1}(B)m_{2}(C)$

$k$ es una medida del conflicto entre dos conjuntos de masas. El factor de normalización, , corresponde a ignorar por completo las inconsistencias y asignar un conjunto vacío a cualquier masa correspondiente a un conflicto. Por lo tanto, esta operación conduce a resultados contradictorios en caso de conflicto significativo bajo ciertas circunstancias. ${\ estilo de visualización 1-K}$

Discusión

Credibilidad y credibilidad

El enfoque de Shafer nos permite interpretar la confianza y la probabilidad como los límites del intervalo del valor posible de la verdad de la hipótesis:

confianza ≤ alguna medida de verdad ≤ plausibilidad .

Se asume que:

Confianza en la hipótesis = {suma de masas de evidencia que respaldan inequívocamente la hipótesis}. Probabilidad = 1 − {suma de las masas de todas las pruebas que contradicen la hipótesis}.

Por ejemplo, digamos que tenemos la hipótesis de que "el gato en la caja está muerto". Si para ella la confianza es 0.5 y la probabilidad es 0.8, entonces esto significa que tenemos evidencia (con un peso total de 0.5) que indica inequívocamente que el gato está muerto; pero también hay evidencia (con un peso total de 0,2) que indica inequívocamente que el gato está vivo (probabilidad “el gato está muerto” = 1 − 0,2 = 0,8). La masa restante (que complementa 0,5 y 0,2 a 1,0), que también es la brecha entre la probabilidad de 0,8 y la confianza de 0,5, corresponde a la "incertidumbre" (hipótesis "universal"), la presencia de evidencia de que definitivamente hay una gato en la caja, pero sin decir nada sobre si está vivo o muerto.

En total, el intervalo [0,5; 0.8] caracteriza la incertidumbre de la verdad de la hipótesis inicial, con base en la evidencia disponible.

Hipótesis	Peso	Confianza	Plausibilidad
Cero (sin gato)	0	0	0
Viva	0.2	0.2	0.5
Muerto	0.5	0.5	0.8
Universal (ya sea vivo o muerto)	0.3	1.0	1.0

El peso de la hipótesis "nula" se establece en 0 por definición (corresponde a casos de "no decisión" o una contradicción irresoluble entre las pruebas). Esto lleva al hecho de que la confianza en la hipótesis "nula" es 0, y la probabilidad de la hipótesis "universal" es 1. Dado que la masa de la hipótesis "universal" se calcula a partir de las masas de los "vivos" y " hipótesis muertas”, entonces su confianza es automáticamente igual a 1, y la probabilidad de la hipótesis nula es 0.

Tomemos un ejemplo un poco más complejo que demuestra las características de la confianza y la plausibilidad. Supongamos que usamos un conjunto de detectores para registrar una sola señal de fuego distante, que puede ser de tres colores (rojo, amarillo o verde):

Hipótesis	Peso	Confianza	Plausibilidad
Cero	0	0	0
Rojo	0.35	0.35	0,56
Amarillo	0.25	0.25	0,45
Verde	0.15	0.15	0.34
rojo o amarillo	0.06	0,66	0.85
rojo o verde	0.05	0,55	0.75
amarillo o verde	0.04	0.44	0,65
Universal	0.10	1.00	1.00

donde, por ejemplo:

Confianza (Rojo o Amarillo) = Masa (Hipótesis Nula) + Masa (Rojo) + Masa (Amarillo) + Masa (Rojo o Amarillo) = 0 + 0.35 + 0.25 + 0.06 = 0.66 Probabilidad (rojo o amarillo) = 1 − Confianza (negación roja o amarilla) = 1 − Confianza (verde) = 1 − Masa (hipótesis nula) − Masa (verde) = 1 − 0 − 0,15 = 0,85

Los eventos de este conjunto no deben ser considerados como la intersección de eventos en el espacio de probabilidad, ya que están dados en el espacio de masa. Es más correcto considerar el evento "Rojo o Amarillo" como la unión de los eventos "Rojo" y "Amarillo", y (ver los axiomas de la teoría de la probabilidad) P(Rojo o Amarillo) ≥ P(Amarillo), y P (Universal) = 1, donde la hipótesis "Universal" corresponde a 'Rojo', 'Amarillo' o 'Verde'. En TDS, la masa de la hipótesis "Universal" corresponde a una evidencia que no se puede atribuir a ninguna otra hipótesis; es decir, evidencia que afirma que hubo algún tipo de señal, pero no habla en absoluto sobre su color.

En este ejemplo, a la evidencia "Roja o Verde" se le asigna una masa de 0,05. Dicha evidencia podría obtenerse, por ejemplo, de personas con ceguera roja/verde. TDS nos permite considerar dicha evidencia de manera equilibrada.

Literatura

[DE68] Dempster, Arthur P.; Una generalización de la inferencia bayesiana , Journal of the Royal Statistical Society, Serie B, vol. 30, págs. 205–247, 1968
[SH76] Shafer, Glenn; Una teoría matemática de la evidencia , Princeton University Press, 1976
[SH02] Shafer, Glenn; Teoría de Dempster-Shafer , 2002
Dempster, AP Probabilidades superiores e inferiores inducidas por un mapeo multivaluado // The Annals of Mathematical Statistics. - 1967. - vol. 38 , núm. 2 . — págs. 325–339 . doi : 10.1214 / aoms/1177698950 .
Fine, Terrence L. Reseña: Glenn Shafer, Una teoría matemática de la evidencia // Bull . amer Matemáticas. Soc.. - 1977. - Vol. 83 , núm. 4 . — pág. 667–672 . -doi : 10.1090 / s0002-9904-1977-14338-3 .
Jøsang, A. y Simon, P. La regla de Dempster vista por bolitas de colores // Inteligencia computacional. - 2012. - vol. 28 , núm. 4 . - Pág. 453-474 . -doi : 10.1111 / j.1467-8640.2012.00421.x .
Jøsang, A., Diaz, J. y Rifqi, M. Fusión acumulativa y promediada de creencias // Fusión de información. - 2010. - Vol. 11 , núm. 2 . — P. 192–200 . -doi : 10.1016/ j.inffus.2009.05.005 .
Pearl, J. Sobre intervalos de probabilidad // Revista internacional de razonamiento aproximado. - 1988. - vol. 2 , núm. 3 . — pág. 211–216 . - doi : 10.1016/0888-613X(88)90117-X .
Pearl, J. Razonamiento con funciones de creencias: un análisis de compatibilidad // The International Journal of Aproximate Reasoning. - 1990. - vol. 4 , núm. 5/6 . — págs. 363–389 . - doi : 10.1016/0888-613X(90)90013-R .