El precio de la anarquía ( en inglés Price of Anarchy , PoA ) [1] es un concepto en economía y teoría de juegos que mide cuánto se degrada la eficiencia de un sistema debido al comportamiento egoísta de sus agentes.
El costo de la anarquía es un concepto general que se puede extender a diferentes sistemas y conceptos de eficiencia. Por ejemplo, considere un sistema de transporte en una ciudad donde muchos agentes intentan viajar desde algún punto de inicio hasta algún punto final. Sea eficiencia en este caso el tiempo promedio en que el agente llega al destino. En una solución "centralizada", la autoridad central puede decirle a cada agente qué ruta debe tomar el agente para minimizar el tiempo promedio de viaje. En la versión "descentralizada", cada agente elige la ruta a su discreción. El precio de la anarquía refleja la relación de los tiempos de viaje promedio para estos dos casos.
Por lo general, el sistema se modela como un juego y la eficiencia es una función del resultado del juego (por ejemplo, latencia máxima de la red, congestión del tráfico, beneficio social en las subastas, etc.). Se pueden usar varios conceptos de equilibrio para modelar el comportamiento egoísta de los agentes, y entre ellos, el concepto más general es el equilibrio de Nash . Diferentes variaciones del equilibrio de Nash conducen a variaciones en el concepto de costo de la anarquía, como el costo de la anarquía pura (para equilibrios deterministas), el costo de la anarquía mixta (para equilibrios aleatorios) y el costo de la anarquía de Bayes-Nash (para juegos con información incompleta). Conceptos distintos al equilibrio de Nash conducen a opciones como el precio de la inmersión [2] .
El término "precio de la anarquía" fue utilizado por primera vez por Elias Koutsoupias y Christos Papadimitriou [1] , pero la idea de medir la ineficiencia del equilibrio es más antigua [3] . El concepto en su forma actual pretendía ser análogo al "factor de aproximación" en un algoritmo de aproximación o al "nivel de competitividad" en un algoritmo en línea . El término está en línea con la tendencia moderna de análisis de juegos utilizando lentes algorítmicos ( Teoría de juegos algorítmicos ).
Considere un juego definido por un conjunto de jugadores , conjuntos de estrategias para cada jugador y una función de utilidad (que también se denomina conjunto de resultados). Podemos definir una medida de la efectividad de cada resultado, que llamaremos función de beneficio . Los candidatos naturales incluyen la suma de las utilidades de los jugadores (utilidades objetivo), la utilidad mínima (equidad o igualitarismo objetivo) ..., o cualquier función que tenga sentido para el juego particular que se analiza y que deba maximizarse.
Podemos definir un subconjunto como el conjunto de estrategias en equilibrio (por ejemplo, el conjunto de equilibrios de Nash ). El costo de la anarquía se define entonces como la relación entre la solución "centralizada" óptima y el "peor equilibrio":
Si, en lugar del "bien" que queremos maximizar, la función de medida de la eficiencia es la "función de costo" que queremos minimizar (como los retrasos en la red), usamos (siguiendo las convenciones adoptadas en los algoritmos de aproximación):
Un concepto relacionado es el Precio de la Estabilidad ( PoS ) , que mide la relación entre el "mejor equilibrio" y la solución óptimamente "centralizada":
o en el caso de funciones de costo:
Lo sabemos por definición. Se espera que la pérdida de eficiencia debida a las restricciones de la teoría de juegos se encuentre entre PoS y PoA.
Ambos valores, PoS y PoA, se calcularon para diferentes tipos de juegos. A continuación se dan algunos ejemplos.
Considere un juego de 2x2 llamado Prisoner 's Dilemma, dado por la siguiente matriz de costos:
Cooperar | traicionar | |
---|---|---|
Cooperar | 1 ; una | 7 ; 0 |
traicionar | 0 ; 7 | 5 ; 5 |
y deja que la función de precio sea Ahora el precio mínimo será cuando ambos jugadores cooperen y el precio resultante será . Sin embargo , el equilibrio de Nash se observa solo cuando ambos traicionan, en cuyo caso el precio es . Entonces el valor del PoA de este juego será igual a .
Dado que el juego tiene un equilibrio de Nash único, el valor PoS es PoA, que también es 5.
Un ejemplo más natural es uno de los problemas de programación de trabajos . Hay jugadores y cada uno de ellos tiene un trabajo por hacer. Pueden elegir una de las máquinas para hacer el trabajo. El costo de la anarquía compara una situación en la que la elección de las máquinas se determina centralmente y una situación en la que cada jugador elige un automóvil de tal manera que complete su trabajo más rápido.
Cada máquina tiene una velocidad Cada trabajo tiene un peso El jugador elige una máquina para realizar su trabajo. Así, las estrategias de cada jugador serán Definir la carga en la máquina como:
El precio para el jugador es igual , es decir, es igual a la carga de la máquina que elige el jugador. Consideraremos la función de precio igualitario , que aquí se denomina período de procesamiento.
Consideraremos dos conceptos de equilibrio: la estrategia de Nash pura y la estrategia de Nash mixta . Es claro que un PoA mixto es un PoA puro, ya que cualquier equilibrio de Nash puro es también un equilibrio de Nash mixto (la desigualdad puede resultar estricta, por cuando,ejemplo ). Lo primero que tenemos que hacer es mostrar la existencia de un equilibrio de Nash puro.
Declaración _ Para cualquier juego de distribución de puestos, existe al menos una estrategia pura de equilibrio de Nash.
prueba _ Necesitamos obtener un conjunto socialmente óptimo de estrategias . Esto puede significar simplemente un conjunto de estrategias para las cuales el tiempo de procesamiento es mínimo. Sin embargo, esto no es suficiente. Puede haber varios conjuntos de estrategias que den como resultado varias distribuciones de carga diferentes (todas con la misma carga máxima). Además, nos limitaremos al hecho de que hay una segunda carga más baja. Nuevamente, esto conduce a muchas distribuciones de carga posibles, y repetimos el proceso hasta que obtengamos la mejor carga (es decir, la más pequeña), donde solo puede haber una distribución de carga (la única hasta una permutación). Esto también se puede llamar el vector lexicográficamente más pequeño de descargas ordenadas.
Afirmamos que se trata de un equilibrio de Nash en estrategia pura. Probaremos por contradicción. Supongamos que algún jugador puede mejorar su rendimiento moviéndose de una máquina a otra . Esto significa que la carga de la máquina aumentada después de la transición sigue siendo menor que la carga de la máquina antes de la transición. Dado que la carga en la máquina debería disminuir como resultado de la transición y ninguna otra máquina se ve afectada, lo que significa que la nueva configuración garantiza una reducción en la -ésima carga más grande en la distribución. Esto, sin embargo, viola el supuesto de minimalidad lexicográfica . QED
Declaración _ Para cualquier juego de distribución de trabajo, el PoA de estrategia pura no excede .
prueba _ Es fácil acotar desde arriba el bien obtenido como cualquier estrategia mixta de equilibrio de Nash , mediante la fórmula
Considere para mayor claridad cualquier conjunto de estrategias puras , entonces está claro que
Dado que lo anterior también es válido para el óptimo social, la comparación de las proporciones prueba la afirmación. QED
Considere una red de carreteras en la que debe viajar un número fijo de conductores desde un punto de inicio común hasta un punto final común. Suponga que cada conductor elige una ruta de manera egoísta y que el tiempo de viaje depende linealmente del número de conductores que eligen la ruta.
Podemos formalizar estas condiciones como un problema de selección de rutas en un grafo conexo dirigido en el que queremos enviar una unidad de flujo desde un nodo fuente a un nodo sumidero (imaginemos que el flujo consta de las rutas elegidas de diferentes conductores). En particular, deje que el flujo sea una función que asigna un número real no negativo a cada borde y considere un conjunto de funciones lineales que asignan el flujo a través del borde al retraso del borde. Definamos también el bien social del flujo como
Considere el ejemplo de la figura: si no se dispone de un camino punteado, se obtiene un equilibrio de Nash en estrategias mixtas cuando cada jugador elige la ruta superior y la ruta inferior con la misma probabilidad. Este equilibrio tiene un costo social de 1.5 y toma 1.5 unidades de tiempo para que cada conductor pase de a . Con la esperanza de mejorar el paso por la red, el legislador puede decidir abrir una vía punteada a los conductores con poco retraso. En este caso, el equilibrio de Nash solo puede ocurrir si algún conductor usa la nueva carretera, por lo que el costo social aumenta en 2 y ahora le toma 2 unidades de tiempo a cada conductor viajar de a .
Por lo tanto, se obtiene un resultado inusual: la prohibición legislativa del uso de una carretera más rápida en algunos casos puede tener un resultado positivo.
El problema de enrutamiento presentado en la paradoja de Braes se puede generalizar a muchos flujos diferentes en el mismo gráfico al mismo tiempo.
Definición (Flujo Generalizado) . Deje que , y se defina de la misma manera que arriba, y suponga que deseamos pasar valores a través de cada par diferente de nodos en . El flujo se define como la distribución de números reales no negativos a cada camino que pasa de a , con restricciones
El flujo que pasa a través de un borde de gráfico particular se define como
Por brevedad, escribiremos si está claro por el contexto.
Definición (Flujo de equilibrio de Nash) . Un flujo es un flujo de equilibrio de Nash si y solo si y de a
Esta definición está muy relacionada con lo que hablamos cuando una estrategia mixta mantiene un equilibrio de Nash en juegos en forma normal.
Definición de (Flujo Condicional Bueno) . Sean y dos flujos asociados con los conjuntos y . En lo que sigue, omitiremos el índice para facilitar la notación. Imagine retrasos fijos generados por funciones en un gráfico: el bien condicional con respecto a se define como
hecho 1 . Si hay un flujo de equilibrio de Nash y cualquier otro flujo , .
Prueba (de conversar) . Supongamos que . Por definición,
.Como y están relacionados con los mismos conjuntos , sabemos que
Por lo tanto, debe haber un par y dos caminos de a tales que , , y
En otras palabras, un flujo solo puede obtener un beneficio menor que si dos caminos tienen precios diferentes y si redirige algún flujo de un camino de alto costo a un camino de menor costo. Es claro que esta situación es incompatible con el supuesto de que se trata de un flujo de equilibrio de Nash. QED
Tenga en cuenta que el Hecho 1 no implica ninguna estructura de conjuntos en particular .
hecho 2 . Si se dan dos números reales y , .
prueba _ Esta es otra forma de expresar la desigualdad correcta . QED
teorema _ El PoA de la estrategia pura para cualquier problema de enrutamiento generalizado con retrasos lineales es igual a .
prueba _ Tenga en cuenta que este teorema es equivalente a decir que todo flujo de equilibrio de Nash , , donde es cualquier otro flujo. Por definición
Usando el hecho 2 obtenemos
porque el
Podemos concluir que , y probar el enunciado con la ayuda del Hecho 1. que se requería probar.
Tenga en cuenta que en la prueba hicimos un uso extensivo de la suposición de que las funciones en son lineales. De hecho, se sostienen hechos más generales.
teorema _ Dado un problema de enrutamiento generalizado en un gráfico y funciones de retardo de grado polinomial con coeficientes no negativos, PoA es una estrategia pura .
Tenga en cuenta que PoA puede crecer como . Considere el ejemplo que se muestra en la figura, donde asumimos un flujo unitario: los flujos de equilibrio de Nash tienen un bien social de 1. Sin embargo, el mejor bien se logra cuando , en este caso,
El valor se acerca a cero a medida que se acerca al infinito.
Teoría de juego | |
---|---|
Conceptos básicos |
|
tipos de juegos |
|
Conceptos de solución | |
Ejemplos de juegos | |