equilibrio de Nash | |
---|---|
El concepto de decisión en la teoría de juegos | |
Conjuntos de decisiones relacionados | |
superconjuntos |
Racionalizabilidad Equilibrio correlacionado ε-equilibrio |
subconjuntos |
Equilibrio perfecto en subjuegos Equilibrio de mano temblorosa Estrategia evolutivamente estable Equilibrio fuerte |
Datos | |
Paternidad literaria | Juan Nash |
Solicitud | Todos los juegos no cooperativos |
El equilibrio de Nash es el concepto de decisión , uno de los conceptos clave de la teoría de juegos . Este es el nombre de un conjunto de estrategias en un juego para dos o más jugadores en el que ningún participante puede aumentar el pago cambiando su estrategia si los otros participantes no cambian sus estrategias [1] . John Nash demostró la existencia de tal equilibrio en estrategias mixtas en cualquier juego finito.
Este concepto fue utilizado por primera vez por Antoine Auguste Cournot . Mostró cómo encontrar lo que llamamos el equilibrio de Nash en el juego de Cournot . Nash fue el primero en demostrar que tales equilibrios deben existir para todos los juegos finitos con cualquier número de jugadores. Esto se hizo en su disertación sobre juegos no cooperativos en 1950.
Antes de Nash, John von Neumann y Oskar Morgenstern (1947) probaron esto solo para juegos de suma cero de 2 jugadores.
Suponga que es un juego de n jugadores no cooperativo en forma normal, donde S es el conjunto de estrategias puras y H es el conjunto de pagos. Cuando cada jugador elige una estrategia en el perfil de estrategia, el jugador i gana Tenga en cuenta que el pago depende de todo el perfil de estrategia: no solo de la estrategia elegida por el jugador i , sino también de otras estrategias , es decir, todas las estrategias para . El perfil de estrategia es un equilibrio de Nash si cambiar su estrategia de a no es rentable para ningún jugador , es decir, para cualquier
Un juego puede tener un equilibrio de Nash en estrategias puras o en estrategias mixtas (es decir, elegir una estrategia pura estocásticamente a una frecuencia fija). Nash demostró que si se permiten estrategias mixtas , habrá al menos un equilibrio de Nash en cada juego de n jugadores.
En la teoría sociológica de la elección racional , se enfatiza por separado que el estado estable de la sociedad (equilibrio social) puede diferir del óptimo (óptimo social). Estos estados subóptimos, pero estables, se denominan equilibrio de Nash en sociología.
Actor B | |||
---|---|---|---|
una | 2 | ||
Actor A | una | A: +1, B: +1 | A: -1, B: +2 |
2 | A: +2, B: -1 | A: 0, B: 0 |
La tabla de la izquierda muestra la estructura de acción en términos de teoría de juegos , elaborada para dos actores ( actores ). Cada actor tiene dos opciones de acción, indicadas por los números 1 y 2. Los coeficientes de recompensa que reciben al elegir ciertas opciones de acción se indican en las celdas correspondientes de la tabla. Suponga que ambos actores están usando actualmente la acción 2 y sus recompensas son respectivamente cero. Al elegir la acción 1, el actor A empeorará su propia situación en una posición (A: −1, B: +2). De manera similar, el actor B que elige la opción 1 por su cuenta, mientras que el actor A continúa usando la opción 2, solo empeorará su situación (A: +2, B: -1). Así, a pesar de que ambos actores entienden que la situación sería óptima para ellos cuando ambos utilizan la acción 1 (recompensa - A: +1, B: +1), ninguno de los dos tiene un motivo para cambiar la situación, y el equilibrio resulta de la ausencia de tales motivos. Si el sistema ya está en un estado óptimo (cuando ambos actores han elegido la acción 1), ambos siempre estarán tentados de comenzar a usar la acción 2, lo que les reportará una recompensa a expensas del otro jugador. Este ejemplo ilustra la posibilidad de dos estados sociales: estable pero subóptimo (ambos actores usan la opción 2); así como el segundo óptimo, pero inestable (ambos actores usan la opción 1). [2]
Para explicar varios fenómenos en la teoría política , a menudo se utiliza el concepto de núcleo , que es una versión más débil del equilibrio de Nash. Un núcleo es un conjunto de estados, en cada uno de los cuales ningún grupo de actores capaces de construir un nuevo estado (ausente en el núcleo dado) mejorará su situación en comparación con su estado en el núcleo dado. [2]
Hay dos empresas No. 1 y No. 2 en la industria Cada una de las empresas puede establecer dos niveles de precios: "alto" y "bajo". Si ambas empresas eligen precios altos, cada una obtendrá una ganancia de 3 millones. Si ambas eligen precios bajos, cada una recibirá 2 millones. Sin embargo, si una elige precios altos y la otra baja, la segunda recibirá 4 millones, y el primero sólo 1 millón La variante más ventajosa en total es la elección simultánea de precios altos (suma = 6 millones). Sin embargo, este estado (en ausencia de un cartel ) es inestable debido a la oportunidad de ganancia relativa que se abre para una empresa que se desvía de esta estrategia. Por lo tanto, es más probable que ambas empresas elijan precios bajos. Aunque esta opción no da la ganancia total máxima (suma = 4 millones), excluye la ganancia relativa del competidor, que podría obtener al desviarse de la estrategia mutuamente óptima. Esta situación se denomina "equilibrio de Nash" [3] .
En el modelo de oligopolio de Stackelberg , para dos empresas que participan en un juego no cooperativo, se puede suponer que existen dos estrategias: 1. Duopolista de Cournot (K) y duopolista de Stackelberg (S), es decir, un estratega S. Por lo tanto, las siguientes estrategias son posibles para dos jugadores:
(K1;K2) (K1;S2);(K2;S1);(S1;S2). Como se deduce de la construcción del modelo de beneficio al elegir una estrategia S: , y al elegir una estrategia K: , está claro que el pago máximo del primer jugador se realiza en la situación (S1;K2), y el segundo ( K1;S2). Dado que estas situaciones son incompatibles, es decir, no se pueden realizar simultáneamente, ambos jugadores no pueden obtener el pago máximo al mismo tiempo. En este caso, el comportamiento óptimo de ambos jugadores será la elección de la estrategia S, ya que en este caso la estrategia S es mejor que la estrategia K en cuanto al mínimo pago posible. En este caso, la elección (S1;S2) es el equilibrio de Nash. Una desviación unilateral de esta estrategia reduce automáticamente el pago de cualquiera de los jugadores, mientras que el pago total en este tipo de equilibrio es menor que el pago total al elegir la estrategia (K1;K2) de ambos jugadores. Sin embargo, bajo las condiciones de este modelo, en ausencia de intercambio de información entre los jugadores, la desviación del equilibrio de Nash no se realizará debido al mayor riesgo de que el segundo jugador pueda aprovechar la situación y no elegir la estrategia K.
Concepto de Destrucción Mutua Asegurada . Ninguna de las partes que poseen armas nucleares puede iniciar un conflicto con impunidad o desarmarse unilateralmente.
Teoría de juego | |
---|---|
Conceptos básicos |
|
tipos de juegos |
|
Conceptos de solución | |
Ejemplos de juegos | |