Juego con información incompleta

El juego bayesiano o juego de información incompleta en la teoría de juegos se caracteriza por  información incompleta sobre los oponentes ( sus posibles estrategias y pagos), mientras que los jugadores tienen creencias sobre esta incertidumbre . Un juego bayesiano puede transformarse en un juego de información completa pero imperfecta si se supone una distribución previa común. A diferencia de la información incompleta, la información imperfecta incluye el conocimiento de las estrategias y pagos de los oponentes, pero la historia del juego (las acciones previas de los oponentes) no está disponible para todos los participantes.  

John Harsanyi describió los juegos bayesianos de la siguiente manera [1] . Además de los participantes reales en el juego, aparece el jugador virtual " Nature ". La naturaleza dota a cada uno de los participantes reales de una variable aleatoria cuyos valores se denominan tipos . Se conoce la distribución ( densidad o función de probabilidad ) de tipos para cada uno de los jugadores. Al comienzo del juego, la naturaleza "elige" los tipos de jugadores. El tipo, en particular, define la función de pago del participante. Así, la información incompleta en un juego bayesiano es la ignorancia de al menos un jugador del tipo de algún otro participante. Los jugadores tienen creencias sobre los tipos de oponentes; la fe es una distribución de probabilidad sobre un conjunto de tipos posibles. A medida que avanza el juego, las creencias se actualizan según el teorema de Bayes .

Definición

El juego se define de la siguiente manera: , donde

  1. - muchos jugadores.
  2. - muchos estados de la naturaleza. Un ejemplo de estado de naturaleza: el orden de la baraja en un juego de cartas.
  3. es el conjunto de acciones del jugador . deja _
  4. es un conjunto de tipos de jugadores . El tipo está determinado por la regla .
  5. define las acciones disponibles para un jugador que tenga algún tipo de .
  6. Función de pago del jugador . Más formalmente, sea , y .
  7. la distribución de probabilidad de cada jugador , es decir, cada jugador evalúa de forma diferente las probabilidades de los estados de la naturaleza; durante el juego no lo conocen.

Una estrategia pura debe satisfacer para todos . La estrategia de cada jugador depende únicamente de su tipo, ya que los tipos de otros jugadores están ocultos para él. El pago esperado del jugador con este perfil estratégico es .

Sea el conjunto de estrategias puras,

El equilibrio bayesiano de un juego se define como el equilibrio de Nash de un juego (quizás en estrategias mixtas) . Si el juego es finito, siempre existe el equilibrio bayesiano.

Ejemplos

El dilema del sheriff

El sheriff se enfrenta al sospechoso. Ambos deben decidir simultáneamente si disparar o no.

El sospechoso tiene dos tipos posibles: "criminal" y "respetuoso de la ley". El sheriff tiene un solo tipo. El sospechoso conoce su tipo, pero el sheriff no. Por lo tanto, hay información incompleta en el juego, pertenece a la clase bayesiana. Según el sheriff, con probabilidad p , el sospechoso es un criminal, con probabilidad 1-p , un ciudadano respetuoso de la ley. Los valores p y 1-p son conocidos por ambos jugadores, ya que se supone una distribución previa común. Esto es lo que hace posible transformar este juego en un juego de información completa pero imperfecta.

El sheriff preferiría disparar si el sospechoso dispara y evitar disparar de lo contrario (incluso si el sospechoso es un criminal). El criminal se inclina a disparar (incluso si el sheriff no dispara), mientras que el ciudadano respetuoso de la ley quiere evitar el conflicto de cualquier forma (incluso si el sheriff dispara). Las matrices de pago dependen del tipo de sospechoso:

 
Tipo = "Cumplimiento de la ley" acción del alguacil
Fuego No dispares
Acción del sospechoso Fuego -3, -1 -12
No dispares -2, -1 0, 0
 
Tipo = "Delincuente" acción del alguacil
Fuego No dispares
Acción del sospechoso Fuego 0, 0 2, -2
No dispares -2, -1 -1.1

Si ambos tienen conocimiento común sobre la racionalidad de los jugadores (el jugador 1 es racional; el jugador 1 sabe que el jugador 2 es racional; el jugador 1 sabe que el jugador 2 sabe que el jugador 1 es racional, etc. hasta el infinito) el juego procederá de acuerdo con el siguiente escenario de equilibrio (equilibrio bayesiano perfecto) [2] [3] :

Cuando el sospechoso es del tipo respetuoso de la ley, la estrategia dominante para él es no disparar; cuando es del tipo criminal, la estrategia dominante es disparar. Las estrategias fuertemente dominadas pueden excluirse de la consideración. Entonces, si el sheriff dispara, obtiene 0 con probabilidad p y -1 con probabilidad 1-p. Su pago esperado es p-1. Si el sheriff no dispara, tiene derecho a -2 con probabilidad p y 0 con probabilidad 1-p; el pago esperado es -2p. El sheriff siempre disparará cuando p-1 > -2p, es decir, cuando p > 1/3.

Véase también

Notas

  1. Harsanyi, John C., 1967/1968. "Juegos con información incompleta jugados por jugadores bayesianos, I-III". Management Science 14 (3): 159-183 (Parte I), 14 (5): 320-334 (Parte II), 14 (7): 486-502 (Parte III).
  2. Coursera._  _ _ Coursera _ Recuperado: 16 junio 2016.
  3. Hu, Yuhuang; Loo, Chu Kiong. Un modelo generalizado de toma de decisiones inspirado en la cuántica para agentes inteligentes  //  The Scientific World Journal : diario. - 2014. - 17 de marzo ( vol. 2014 ). - ISSN 1537-744X . -doi : 10.1155 / 2014/240983 . —PMID 24778580 .

Literatura