El juego bayesiano o juego de información incompleta en la teoría de juegos se caracteriza por información incompleta sobre los oponentes ( sus posibles estrategias y pagos), mientras que los jugadores tienen creencias sobre esta incertidumbre . Un juego bayesiano puede transformarse en un juego de información completa pero imperfecta si se supone una distribución previa común. A diferencia de la información incompleta, la información imperfecta incluye el conocimiento de las estrategias y pagos de los oponentes, pero la historia del juego (las acciones previas de los oponentes) no está disponible para todos los participantes.
John Harsanyi describió los juegos bayesianos de la siguiente manera [1] . Además de los participantes reales en el juego, aparece el jugador virtual " Nature ". La naturaleza dota a cada uno de los participantes reales de una variable aleatoria cuyos valores se denominan tipos . Se conoce la distribución ( densidad o función de probabilidad ) de tipos para cada uno de los jugadores. Al comienzo del juego, la naturaleza "elige" los tipos de jugadores. El tipo, en particular, define la función de pago del participante. Así, la información incompleta en un juego bayesiano es la ignorancia de al menos un jugador del tipo de algún otro participante. Los jugadores tienen creencias sobre los tipos de oponentes; la fe es una distribución de probabilidad sobre un conjunto de tipos posibles. A medida que avanza el juego, las creencias se actualizan según el teorema de Bayes .
El juego se define de la siguiente manera: , donde
Una estrategia pura debe satisfacer para todos . La estrategia de cada jugador depende únicamente de su tipo, ya que los tipos de otros jugadores están ocultos para él. El pago esperado del jugador con este perfil estratégico es .
Sea el conjunto de estrategias puras,
El equilibrio bayesiano de un juego se define como el equilibrio de Nash de un juego (quizás en estrategias mixtas) . Si el juego es finito, siempre existe el equilibrio bayesiano.
El sheriff se enfrenta al sospechoso. Ambos deben decidir simultáneamente si disparar o no.
El sospechoso tiene dos tipos posibles: "criminal" y "respetuoso de la ley". El sheriff tiene un solo tipo. El sospechoso conoce su tipo, pero el sheriff no. Por lo tanto, hay información incompleta en el juego, pertenece a la clase bayesiana. Según el sheriff, con probabilidad p , el sospechoso es un criminal, con probabilidad 1-p , un ciudadano respetuoso de la ley. Los valores p y 1-p son conocidos por ambos jugadores, ya que se supone una distribución previa común. Esto es lo que hace posible transformar este juego en un juego de información completa pero imperfecta.
El sheriff preferiría disparar si el sospechoso dispara y evitar disparar de lo contrario (incluso si el sospechoso es un criminal). El criminal se inclina a disparar (incluso si el sheriff no dispara), mientras que el ciudadano respetuoso de la ley quiere evitar el conflicto de cualquier forma (incluso si el sheriff dispara). Las matrices de pago dependen del tipo de sospechoso:
Tipo = "Cumplimiento de la ley" | acción del alguacil | ||
---|---|---|---|
Fuego | No dispares | ||
Acción del sospechoso | Fuego | -3, -1 | -12 |
No dispares | -2, -1 | 0, 0 |
Tipo = "Delincuente" | acción del alguacil | ||
---|---|---|---|
Fuego | No dispares | ||
Acción del sospechoso | Fuego | 0, 0 | 2, -2 |
No dispares | -2, -1 | -1.1 |
Si ambos tienen conocimiento común sobre la racionalidad de los jugadores (el jugador 1 es racional; el jugador 1 sabe que el jugador 2 es racional; el jugador 1 sabe que el jugador 2 sabe que el jugador 1 es racional, etc. hasta el infinito) el juego procederá de acuerdo con el siguiente escenario de equilibrio (equilibrio bayesiano perfecto) [2] [3] :
Cuando el sospechoso es del tipo respetuoso de la ley, la estrategia dominante para él es no disparar; cuando es del tipo criminal, la estrategia dominante es disparar. Las estrategias fuertemente dominadas pueden excluirse de la consideración. Entonces, si el sheriff dispara, obtiene 0 con probabilidad p y -1 con probabilidad 1-p. Su pago esperado es p-1. Si el sheriff no dispara, tiene derecho a -2 con probabilidad p y 0 con probabilidad 1-p; el pago esperado es -2p. El sheriff siempre disparará cuando p-1 > -2p, es decir, cuando p > 1/3.
Teoría de juego | |
---|---|
Conceptos básicos |
|
tipos de juegos |
|
Conceptos de solución | |
Ejemplos de juegos | |