La paradoja de Monty Hall es uno de los problemas más conocidos de la teoría de la probabilidad, cuya solución, a primera vista, contradice el sentido común. Esta tarea no es una paradoja en el sentido estricto de la palabra, ya que no contiene una contradicción, se llama paradoja, porque su solución puede parecer inesperada. Además, a muchas personas les resulta difícil tomar la decisión correcta incluso después de habérselo dicho [1] .
El problema fue publicado por primera vez [2] [3] (junto con la solución) en 1975 en The American Statistician por el profesor de la Universidad de California Steve Selvin. Se hizo popular después de aparecer en la revista Parade en 1990 [4] .
El problema se formula como una descripción de un juego basado en el juego de televisión estadounidense "Let's Make a Deal", y lleva el nombre del presentador de este programa. La formulación más común de este problema, publicada en 1990 en Parade Magazine , es la siguiente:
Imagina que te has convertido en participante de un juego en el que tienes que elegir una de tres puertas. Detrás de una de las puertas hay un coche , detrás de las otras dos puertas hay cabras . Eliges una de las puertas, por ejemplo, la número 1, luego el anfitrión, que sabe dónde está el auto y dónde están las cabras, abre una de las puertas restantes, por ejemplo, la número 3, detrás de la cual hay una cabra. Después de eso, te pregunta: ¿te gustaría cambiar tu elección y elegir la puerta número 2? ¿Aumentarán sus posibilidades de ganar un automóvil si acepta la oferta del anfitrión y cambia su elección?
Después de la publicación, quedó claro de inmediato que el problema se formuló incorrectamente: no se estipularon todas las condiciones. Por ejemplo, el facilitador puede seguir la estrategia del “Monty infernal”: ofrecer cambiar la elección si y solo si el jugador ha elegido un automóvil en el primer movimiento. Obviamente, cambiar la elección inicial conducirá a una pérdida garantizada en tal situación (ver más abajo).
El más popular es el problema con una condición adicional [5] : el participante del juego conoce de antemano las siguientes reglas :
El siguiente texto discute el problema de Monty Hall en esta formulación.
puerta 1 | puerta 2 | puerta 3 | Resultado si cambia la selección | Resultado si no cambia la selección |
---|---|---|---|---|
Auto | Cabra | Cabra | Cabra | Auto |
Cabra | Auto | Cabra | Auto | Cabra |
Cabra | Cabra | Auto | Auto | Cabra |
Para la estrategia ganadora, lo siguiente es importante: si cambia la elección de la puerta después de las acciones del líder, entonces gana si inicialmente eligió la puerta perdedora. Esto sucederá con una probabilidad de 2 ⁄ 3 , ya que inicialmente hay 2 formas de 3 para elegir la puerta perdedora.
Pero a menudo, al resolver este problema, argumentan algo como esto: el anfitrión siempre elimina una puerta perdida al final, y luego las probabilidades de que aparezca un automóvil detrás de dos no abiertas se vuelven iguales a ½ , independientemente de la elección inicial. Pero esto no es cierto: aunque efectivamente hay dos posibilidades de elección, estas posibilidades (teniendo en cuenta el trasfondo) no son igualmente probables. Esto es cierto porque inicialmente todas las puertas tenían las mismas posibilidades de ganar, pero luego tenían diferentes probabilidades de ser eliminadas.
Para la mayoría de las personas, esta conclusión contradice la percepción intuitiva de la situación, y debido a la discrepancia resultante entre la conclusión lógica y la respuesta a la que se inclina la opinión intuitiva, el problema se denomina paradoja de Monty Hall .
Tenga en cuenta que la primera elección de puerta del jugador afecta a las dos puertas restantes que elige Monty.
La situación con las puertas se vuelve aún más obvia si imaginamos que no hay 3 puertas, sino, digamos, 1000, y después de la elección del jugador, el presentador elimina 998 más, dejando 2 puertas: la que eligió el jugador y uno más Parece más obvio que las probabilidades de encontrar un premio detrás de estas puertas son diferentes, y no iguales a ½ . Si cambiamos la puerta, perdemos solo si elegimos la puerta del premio desde el principio, cuya probabilidad es 1:1000. Ganamos al cambiar la puerta si nuestra elección inicial fue incorrecta , y la probabilidad de esto es 999 de 1000. En el caso de 3 puertas, la lógica se conserva, pero la probabilidad de ganar al cambiar la decisión es 2 ⁄ 3 , respectivamente , y no 999 ⁄ 1000 .
Otra forma de razonar es reemplazar la condición por una equivalente. Imagina que en lugar de que el jugador haga la elección inicial (que sea siempre la puerta número 1) y luego abra la puerta con la cabra entre las restantes (es decir, siempre entre los números 2 y 3), el jugador necesita adivinar la puerta. en el primer intento, pero se le dice previamente, que puede haber un carro detrás de la puerta No. 1 con una probabilidad inicial (33%), y entre las puertas restantes se indica para cuál de las puertas del carro definitivamente no hay carro (0%). En consecuencia, la última puerta siempre supondrá el 67%, siendo preferible la estrategia de elegirla.
Un razonamiento aún más visual es que conociendo de antemano las condiciones completas del juego (que se ofrecerá cambiar la elección) y aceptando estas condiciones de antemano, el jugador realmente elige por primera vez una puerta detrás de la cual, en su opinión, no hay premio (y puede cometer un error con una probabilidad de 1 ⁄ 3 ). Al mismo tiempo, indirectamente, señala las dos puertas restantes, una de las cuales, en su opinión, tiene un premio, que da la oportunidad de ganar 2 ⁄ 3 . Esto es equivalente a un juego en el que el facilitador desde el principio le ofrecería una vez al jugador que excluyera una puerta "extra" y le garantizaría que abriría las dos restantes.
Cuarta opción: si el jugador ha elegido un automóvil (la probabilidad de esto es ⅓ ), Monty definitivamente ofrecerá un turno y lo llevará a una cabra. Y si el jugador eligió una cabra (probabilidad ⅔ ) - entonces al automóvil. Por lo tanto, las probabilidades posteriores son ⅓ si no cambian y ⅔ si cambian. Y la apertura igualmente probable de las puertas izquierda y derecha, si el jugador señaló el automóvil, no permite extraer información del hecho de que la puerta izquierda o derecha está abierta.
La versión clásica de la paradoja de Monty Hall establece que el anfitrión pedirá al jugador que cambie la puerta, sin importar si eligió el auto o no. Pero también es posible un comportamiento más complejo del huésped. Esta tabla describe brevemente varios comportamientos. A menos que se indique lo contrario, es igualmente probable que los premios estén ubicados fuera de las puertas, el presentador sabe dónde está el automóvil y, si hay una opción, elige con la misma probabilidad entre dos cabras. Si el anfitrión influye en las probabilidades en lugar de seguir un procedimiento rígido, entonces el objetivo es mantener el automóvil alejado del sujeto. El objetivo del sujeto, respectivamente, es recogerlo.
Comportamiento del anfitrión | Resultado |
---|---|
"Infernal Monty": El presentador se ofrece a cambiar si la puerta es correcta [4] . | Con una probabilidad de ⅔ no habrá oferta, y el tema se quedará con la cabra. Con una probabilidad de ⅓ , habrá una oferta y el cambio siempre dará una cabra. |
"Angelic Monty": la conductora se ofrece a cambiar si la puerta está mal [6] . | Con una probabilidad de ⅓ no habrá oferta y el sujeto se quedará con el coche. Con una probabilidad de ⅔ , habrá una oferta y el turno siempre dará un automóvil. |
"Monty ignorante" o "Monty Buch": el anfitrión cae sin darse cuenta, la puerta se abre y resulta que no hay un automóvil detrás. En otras palabras, el anfitrión mismo no sabe qué hay detrás de las puertas, abre la puerta completamente al azar y solo por casualidad no había ningún automóvil detrás [7] [8] [9] . | Con una probabilidad de ⅓ , el Monty caído abrirá el auto, una pérdida. Con una probabilidad de ⅔ , seguirá una oferta y el cambio dará una ganancia en la mitad de los casos. Así es como se organiza el programa estadounidense "Deal or No Deal"; sin embargo, el propio jugador abre una puerta al azar y, si no hay un automóvil detrás, el presentador se ofrece a cambiarlo. |
El anfitrión elige una de las cabras y la abre si el jugador ha elegido una puerta diferente. | Con una probabilidad de ⅓ no habrá oferta, una pérdida. Con una probabilidad de ⅔ , seguirá una oferta y el cambio dará una ganancia en la mitad de los casos. |
El anfitrión siempre abre la cabra. Si se elige un carro, la cabra izquierda abre con probabilidad p y la cabra derecha con probabilidad q =1− p . [8] [9] [10] | Si el líder abrió la puerta de la izquierda, el turno da una victoria con probabilidad . Si es correcto - . Sin embargo, el sujeto no puede influir en la probabilidad de que se abra la puerta correcta; independientemente de su elección, esto sucederá con probabilidad . |
Lo mismo, p = q = ½ (caso clásico). | El cambio da una ganancia con una probabilidad de ⅔ . |
Lo mismo, p = 1, q = 0 ("Impotente Monty": un presentador cansado se para en la puerta izquierda y abre la cabra que está más cerca). | Si el líder abrió la puerta correcta (la probabilidad de esto es ⅓ ), el cambio da una victoria garantizada. Si se deja, lo que sucede en ⅔ de los casos, la probabilidad es ½ . |
El anfitrión no sabe lo que hay detrás de las puertas. Elige una de las dos puertas restantes, consulta en secreto con un compañero y se ofrece a cambiar si hay una cabra. Es decir, abre la cabra siempre si se elige un automóvil, y con probabilidad ½ en caso contrario. [once] | Similar a la opción de Monty Buch: con una probabilidad de ⅓ , el socio secreto dirá que hay un automóvil, no habrá oferta, pérdida. Con una probabilidad de ⅔ habrá una oferta, y el cambio dará una ganancia en la ½ de los casos. |
Caso general: el juego se repite muchas veces, la probabilidad de esconder el auto detrás de una u otra puerta, así como abrir tal o cual puerta es arbitraria, pero el anfitrión sabe dónde está el auto y siempre ofrece un cambio abriendo una de las cabras. [12] [13] | Equilibrio de Nash : es la paradoja de Monty Hall en su forma clásica la que es más beneficiosa para el anfitrión: el automóvil se esconde detrás de cualquiera de las puertas con una probabilidad de ⅓ ; si hay una opción, abra cualquier cabra al azar. La probabilidad de ganar es ⅔ . |
Lo mismo, pero es posible que el anfitrión no abra la puerta en absoluto. | Equilibrio de Nash : es beneficioso para el anfitrión no abrir la puerta, la probabilidad de ganar es ⅓ . |
El problema fue propuesto por Martin Gardner en 1959.
Tres prisioneros, A, B y C, son puestos en confinamiento solitario y sentenciados a muerte. El gobernador elige al azar a uno de ellos y lo perdona. El guardia que custodia a los prisioneros sabe quién es indultado, pero no tiene derecho a decirlo. El recluso A le pide al guardia que le diga el nombre de ese (otro) recluso que definitivamente será ejecutado: “ Si indultan a B, díganme que ejecutarán a C. Si indultan a C, díganme que ejecutarán a B. indultado Yo, tiro una moneda y digo el nombre de B o C " .
El guardia le dice al prisionero A que el prisionero B será ejecutado. El preso A se alegra de escuchar esto, porque cree que ahora la probabilidad de que sobreviva es de ½ y no de ⅓ como era antes. El preso A le dice en secreto al preso C que B será ejecutado. El recluso C también está feliz de escuchar esto, ya que todavía cree que la probabilidad de supervivencia del recluso A es ⅓ y su probabilidad de supervivencia ha aumentado a 2 ⁄ 3 . ¿Cómo puede ser esto?
Aquellos familiarizados con la paradoja de Monty Hall ahora saben que C tiene razón y A está mal.
Entonces, la frase "Ejecutar B" deja las opciones 1 y 4, es decir, 2 ⁄ 3 posibilidades de que C sea indultado y ⅓ de que A.
La gente piensa que la probabilidad es ½ porque están ignorando la esencia de la pregunta que el preso A le hace al guardia. Si el guardia pudiera responder a la pregunta "¿Será ejecutado el preso B?", entonces si la respuesta fuera afirmativa, la probabilidad de ejecución de A disminuiría de 2 ⁄ 3 a ½ .
La cuestión puede abordarse de otra manera: si se perdona a A, el guardia dirá cualquier nombre al azar; si A es ejecutado, el guardia dirá quién será ejecutado junto con A. Entonces, la pregunta no le dará a A ninguna oportunidad adicional de perdón.