El precio de la estabilidad

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 9 de marzo de 2022; las comprobaciones requieren 16 ediciones .

El precio de la estabilidad ( precio inglés  de estabilidad , PoS) para el juego  es la relación entre el valor óptimo de la función objetivo en uno de sus estados de equilibrio y el resultado óptimo. El precio de la estabilidad tiene sentido para los juegos que tienen un mayor poder o condiciones de juego que afectan la posición de los jugadores de alguna manera y pueden ayudarlos a converger al equilibrio de Nash . Al medir la efectividad del equilibrio de Nash en cualquier juego, tiene sentido considerar el precio de la anarquía ( Eng.  Price of Anarchy , PoA).

Ejemplos

PoS se puede expresar de la siguiente manera:

Aquí  , es el valor del mejor equilibrio de Nash y  es el valor de la solución óptima.

En el juego del dilema del prisionero a continuación , los jugadores no siempre cooperarán entre sí, incluso si es lo mejor para ellos, ya que solo hay un equilibrio ( ,  ), tenemos .

El dilema del prisionero
(2.2) (0.3)
(3.0) (1.1)

Este ejemplo es una versión del juego de la batalla de los sexos . Tiene dos puntos de equilibrio, ( ,  ) y ( ,  ) con valores 3 y 15, respectivamente. El valor óptimo es 15. Entonces , while .

Batalla de los sexos
(2.1) (0.0)
(0.0) (5.10)

Antecedentes e hitos

El precio de la estabilidad fue estudiado por primera vez por A. Shultzan y N. Mozes, y el término mismo apareció en los trabajos de E. Anshelevich. Demostraron que el equilibrio de Nash siempre existe en estrategias puras, y el costo de estabilidad de este juego no excede el número armónico n-ésimo en gráficos dirigidos. Para gráficos no dirigidos, Anshelevich et al., presentaron un límite de estabilidad duro de 4/3 para el caso de una fuente y dos jugadores. Yen Lee demostró que para tales gráficos con diferentes destinos para todos los jugadores, con los que todos los jugadores deben tener una conexión, el precio de un flujo de juego estable para construir una red Shapley es donde  está la cantidad de jugadores. Por otro lado, el costo de la anarquía para el juego es de aproximadamente .

Juegos de creación de redes

Condiciones de juego

Los juegos de creación de redes tienen una razón natural para el precio de la estabilidad. En estos juegos, el precio de la anarquía puede ser mucho menor que el precio de la estabilidad.

Un ejemplo del siguiente juego:

El precio de la anarquía

El precio de la anarquía puede ser . Un ejemplo del siguiente juego de creación de redes.

Hay 2 saldos diferentes en este juego. Si todos comparten el arco , entonces el costo social es . Además, este equilibrio es óptimo. Sin embargo, la división por todos los arcos también es un equilibrio de Nash. Cualquier agente tiene un precio en la estrategia de equilibrio, y cambiarlo a otro arco eleva su precio a .

El límite inferior del precio de estabilidad

Aquí hay un juego patológico con el mismo comportamiento, pero al precio de la estabilidad. Hay jugadores, cada uno de los cuales comienza en la parte superior e intenta conectarlo a la parte superior . Digamos que los precios de los arcos sin etiqueta son 0.

La estrategia óptima para todos los jugadores es compartir el arco , lo que resulta en un costo social . Sin embargo, solo hay una estrategia de equilibrio de Nash para este juego. En el caso de la optimización, cada jugador paga y el jugador 1 puede reducir su precio cambiando al arco . Si esto sucede, resulta rentable para el jugador 2 cambiar al arco , y así sucesivamente. Eventualmente, los agentes alcanzarán un equilibrio de Nash pagando su propio arco por separado. Tal distribución tiene un costo social , donde es el número armónico th , que es igual a . Aunque este valor no tiene límite, el costo de la estabilidad es exponencialmente mejor que el costo de la anarquía en este juego.

Límite superior del precio de estabilidad

Por definición, los juegos de construcción de redes son juegos de desbordamiento , por lo que permiten una función potencial .

Teorema. [Teorema 19.13 del libro 1] Suponga que hay constantes y tales que para cualquier estrategia

Entonces el precio de la estabilidad es menor.

Prueba. El mínimo global de la función es un equilibrio de Nash, de modo que

El precio social se definió como la suma de los precios sobre los arcos, de modo que

Trivialmente obtenemos y los cálculos anteriores dan , por lo que podemos invocar el teorema para el límite superior del costo de estabilidad.

Véase también

Notas

Literatura

  1. Vijay V. Vazirani, Noam Nisan, Tim Roughgarden, Eva Tardos. Teoría de juegos algorítmicos . - Cambridge, Reino Unido: Cambridge University Press, 2007. - ISBN 0-521-87282-0 .
  2. L. Agussurja, H. C. Lau. El precio de la estabilidad en los juegos de programación egoísta // Inteligencia web y sistemas de agentes: una revista internacional. - 2009. - T. 9 , núm. 4 .
  3. Jian Li. Un límite superior en el precio de la estabilidad para juegos de diseño de red Shapely no dirigidos // Cartas de procesamiento de información. - 2009. - T. 109 , núm. 15 _ - S. 876-878 .