Juego con información incompleta

El juego bayesiano o juego de información incompleta en la teoría de juegos se caracteriza por información incompleta sobre los oponentes ( sus posibles estrategias y pagos), mientras que los jugadores tienen creencias sobre esta incertidumbre . Un juego bayesiano puede transformarse en un juego de información completa pero imperfecta si se supone una distribución previa común. A diferencia de la información incompleta, la información imperfecta incluye el conocimiento de las estrategias y pagos de los oponentes, pero la historia del juego (las acciones previas de los oponentes) no está disponible para todos los participantes.

John Harsanyi describió los juegos bayesianos de la siguiente manera [1] . Además de los participantes reales en el juego, aparece el jugador virtual " Nature ". La naturaleza dota a cada uno de los participantes reales de una variable aleatoria cuyos valores se denominan tipos . Se conoce la distribución ( densidad o función de probabilidad ) de tipos para cada uno de los jugadores. Al comienzo del juego, la naturaleza "elige" los tipos de jugadores. El tipo, en particular, define la función de pago del participante. Así, la información incompleta en un juego bayesiano es la ignorancia de al menos un jugador del tipo de algún otro participante. Los jugadores tienen creencias sobre los tipos de oponentes; la fe es una distribución de probabilidad sobre un conjunto de tipos posibles. A medida que avanza el juego, las creencias se actualizan según el teorema de Bayes .

Definición

El juego se define de la siguiente manera: , donde $G=\langle N,\Omega,\langle A_{i},u_{i},T_{i},\tau_{i},p_{i},C_{i}\rangle_{i} \in N}\rangle$

$norte$ - muchos jugadores.
$\Omega$ - muchos estados de la naturaleza. Un ejemplo de estado de naturaleza: el orden de la baraja en un juego de cartas.
$Ai}$ es el conjunto de acciones del jugador . deja _ $i$ ${\displaystyle A=A_{1}\times A_{2}\times \dotsb \times A_{N))$
$T_{yo}$ es un conjunto de tipos de jugadores . El tipo está determinado por la regla . $i$ ${\displaystyle \tau _{i}\colon \Omega \rightarrow T_{i))$
${\displaystyle C_{i}\subseteq A_{i}\times T_{i))$ define las acciones disponibles para un jugador que tenga algún tipo de . $i$ $T_{yo}$
$u_{i}\colon \Omega \times A\rightarrow R$ Función de pago del jugador . Más formalmente, sea , y . $i$ $L=\{(\omega ,a_{1},\dotsc ,a_{N})\mid \omega \in \Omega ,\forall i,(a_{i},\tau _{i}( \omega ))\en C_{i}\}$ $u_{i}\dos puntos L\rightarrow R$
$Pi}$ la distribución de probabilidad de cada jugador , es decir, cada jugador evalúa de forma diferente las probabilidades de los estados de la naturaleza; durante el juego no lo conocen. $\Omega$ $i$

Una estrategia pura debe satisfacer para todos . La estrategia de cada jugador depende únicamente de su tipo, ya que los tipos de otros jugadores están ocultos para él. El pago esperado del jugador con este perfil estratégico es . ${\displaystyle s_{i}\dos puntos T_{i}\rightarrow A_{i))$ ${\ estilo de visualización (s_ {i} (t_ {i}), t_ {i}) \ en C_ {i))$ $t_{yo}$ $i$ $u_{i}(S)=E_{\omega \sim p_{i}}[u_{i}(\omega ,s_{1}(\tau _{1}(\omega )),\dotsc ,s_{N}(\tau _{N}(\omega )))]$

Sea el conjunto de estrategias puras, $Si}$ $S_{i}=\{s_{i}\colon T_{i}\rightarrow A_{i}\mid (s_{i}(t_{i}),t_{i})\in C_{i },\para todos t_{i}\}.$

El equilibrio bayesiano de un juego se define como el equilibrio de Nash de un juego (quizás en estrategias mixtas) . Si el juego es finito, siempre existe el equilibrio bayesiano. $GRAMO$ ${\hat {G}}=\langle N,{\hat {A}}=S_{1}\times S_{2}\times \dotsb \times S_{N},{\hat {u} }=u\ángulo$ $GRAMO$

Ejemplos

El dilema del sheriff

El sheriff se enfrenta al sospechoso. Ambos deben decidir simultáneamente si disparar o no.

El sospechoso tiene dos tipos posibles: "criminal" y "respetuoso de la ley". El sheriff tiene un solo tipo. El sospechoso conoce su tipo, pero el sheriff no. Por lo tanto, hay información incompleta en el juego, pertenece a la clase bayesiana. Según el sheriff, con probabilidad p , el sospechoso es un criminal, con probabilidad 1-p , un ciudadano respetuoso de la ley. Los valores p y 1-p son conocidos por ambos jugadores, ya que se supone una distribución previa común. Esto es lo que hace posible transformar este juego en un juego de información completa pero imperfecta.

El sheriff preferiría disparar si el sospechoso dispara y evitar disparar de lo contrario (incluso si el sospechoso es un criminal). El criminal se inclina a disparar (incluso si el sheriff no dispara), mientras que el ciudadano respetuoso de la ley quiere evitar el conflicto de cualquier forma (incluso si el sheriff dispara). Las matrices de pago dependen del tipo de sospechoso:

Tipo = "Cumplimiento de la ley"		acción del alguacil
Tipo = "Cumplimiento de la ley"		Fuego	No dispares
Acción del sospechoso	Fuego	-3, -1	-12
Acción del sospechoso	No dispares	-2, -1	0, 0

Tipo = "Delincuente"		acción del alguacil
Tipo = "Delincuente"		Fuego	No dispares
Acción del sospechoso	Fuego	0, 0	2, -2
Acción del sospechoso	No dispares	-2, -1	-1.1

Si ambos tienen conocimiento común sobre la racionalidad de los jugadores (el jugador 1 es racional; el jugador 1 sabe que el jugador 2 es racional; el jugador 1 sabe que el jugador 2 sabe que el jugador 1 es racional, etc. hasta el infinito) el juego procederá de acuerdo con el siguiente escenario de equilibrio (equilibrio bayesiano perfecto) [2] [3] :

Cuando el sospechoso es del tipo respetuoso de la ley, la estrategia dominante para él es no disparar; cuando es del tipo criminal, la estrategia dominante es disparar. Las estrategias fuertemente dominadas pueden excluirse de la consideración. Entonces, si el sheriff dispara, obtiene 0 con probabilidad p y -1 con probabilidad 1-p. Su pago esperado es p-1. Si el sheriff no dispara, tiene derecho a -2 con probabilidad p y 0 con probabilidad 1-p; el pago esperado es -2p. El sheriff siempre disparará cuando p-1 > -2p, es decir, cuando p > 1/3.

Véase también

Notas

↑ Harsanyi, John C., 1967/1968. "Juegos con información incompleta jugados por jugadores bayesianos, I-III". Management Science 14 (3): 159-183 (Parte I), 14 (5): 320-334 (Parte II), 14 (7): 486-502 (Parte III).
↑ Coursera._ _ _ Coursera _ Recuperado: 16 junio 2016.
↑ Hu, Yuhuang; Loo, Chu Kiong. Un modelo generalizado de toma de decisiones inspirado en la cuántica para agentes inteligentes // The Scientific World Journal : diario. - 2014. - 17 de marzo ( vol. 2014 ). - ISSN 1537-744X . -doi : 10.1155 / 2014/240983 . —PMID 24778580 .

Literatura

Gibbons, Robert. Teoría de juegos para economistas aplicados (neopr.) . - Prensa de la Universidad de Princeton , 1992. - S. 144-152.
Levin, Jonathan Juegos con información incompleta (2002). Recuperado: 25 Agosto 2016. (indefinido)

Teoría de juego
Conceptos básicos	Conocimiento mutuo y común Jugador Jerarquía de creencias Amplificación irracional Estrategia ( dominancia ) inducción inversa
tipos de juegos	Simultáneo , secuencial y repetitivo No cooperativo y cooperativo Con información completa , incompleta , perfecta e imperfecta En forma normal y extendida Antagonista Diferencial estocástico Batalla de los sexos Cacería de venados
Conceptos de solución	Dominio del riesgo Equilibrio correlacionado El equilibrio de una mano temblorosa equilibrio de Nash Equilibrio perfecto en subjuegos racionalizabilidad Equilibrio secuencial fuerte equilibrio Saldo propio Estrategia evolutivamente estable Epsilon-equilibrio Eficiencia de Pareto Núcleo
Ejemplos de juegos	El dilema del prisionero La faena del bar "El Farol" Modelo Bertrand modelo de Cournot modelo stackelberg Orlyanka La tragedia de los recursos compartidos halcones y palomas
Teoría de juegos epistémicos Diseño del mecanismo División justa