Momento markoviano

En matemáticas , la teoría del punto de parada o tiempo de Markov está relacionada con el problema del tiempo para realizar una determinada acción con el fin de maximizar la recompensa esperada o minimizar el costo esperado. El problema del punto de parada se puede encontrar en los campos de la estadística , la economía y las matemáticas financieras (asociadas con el precio de las opciones estadounidenses ). El ejemplo más notable relacionado con el momento de la parada es el problema de la novia exigente . El problema del momento de frenado a menudo se puede escribir en la forma de la ecuación de Bellman y, por lo tanto, a menudo se resuelve mediante programación dinámica .

Definición

Caso de tiempo discreto

Por regla general, el problema del momento de parada está asociado a dos objetos:

  1. Una secuencia de variables aleatorias cuya distribución conjunta se supone conocida
  2. Una secuencia de funciones "gratificantes" que dependen de los valores observados de variables aleatorias en 1.:

Dados estos objetos, el problema es este:

Caso de tiempo continuo

Considere la amplificación de procesos definidos en un espacio de probabilidad filtrado y asuma que esto es una adaptación del filtrado. El problema del tiempo de parada es encontrar el tiempo de parada que maximiza el pago esperado .

donde se llama el valor de la función . Podría importar aquí .

Una redacción más específica es la siguiente. Consideramos un proceso de Markov fuerte adaptado definido en un espacio de probabilidad filtrado donde denota la probabilidad de medición, donde el proceso aleatorio comienza con . Teniendo en cuenta las funciones continuas y en el problema del tiempo de parada

Esto a veces se denomina formulación MLS (Meyer, Lagrange y Supremum, respectivamente). [una]

Métodos de solución

Hay dos enfoques para resolver el problema del punto de parada. Cuando el proceso subyacente (o la amplificación del proceso) se describe por su distribución de dimensión finita incondicional, entonces el método de solución apropiado es el enfoque Martingale, llamado así porque utiliza la teoría Martingale , siendo el concepto más importante el desarrollo de Snell . En el caso discreto, si el horizonte de planificación es finito, el problema se puede resolver fácilmente mediante programación dinámica .

Cuando el proceso subyacente está definido por una familia de funciones de transición (condicionales) que conducen a una familia de transiciones probabilísticas de Markov, a menudo se pueden usar las poderosas herramientas analíticas de la teoría del proceso de Markov y este enfoque se denomina método de Markov. La solución suele obtenerse resolviendo problemas asociados con fronteras libres (problemas de Stefan).

Salto Difusión Resultado

Sea la difusión de Levy de la ecuación diferencial estocástica

donde  es un movimiento browniano bidimensional , esta es una medida aleatoria de Poisson compensada bidimensional , , y funciones tales que existe una solución única . Sea un conjunto abierto (área de solvencia) y

tiempo de quiebra. Problema de parada óptima:

Resulta que bajo ciertas condiciones de regularidad, [2] la siguiente verificación del teorema contiene:

Si la función satisface

entonces para todos . Además, si

Entonces para todos y  es el tiempo de parada

Estas condiciones se pueden escribir en una forma más compacta (desigualdad integral-variacional):

Ejemplos

Lanzamiento de moneda

(Por ejemplo, donde converge)

Tienes una moneda y la lanzas repetidamente. Cada vez antes de tirarlo, puedes dejar de tirarlo y recibir un pago (en dólares, digamos) por el número promedio de caras que veas.

Desea la cantidad máxima que se le pagaría al elegir una regla de detención. Si x i (donde i ≥ 1) forma una secuencia de variables aleatorias independientes distribuidas idénticamente con la distribución de Bernoulli

y si

luego en la secuencia habrá objetos relacionados con este problema.

Vender una casa

(Por ejemplo, donde no necesariamente converge)

Tienes una casa y te gustaría venderla. Todos los días te ofrecen por tu casa, y pagas por publicidad continua. Si vende su casa diariamente , ganará donde .

Quiere maximizar la cantidad que gana eligiendo una regla de parada.

En este ejemplo, la secuencia ( ) es la secuencia de ofertas para su casa, y la secuencia de características "recompensas" determina cuánto ganará.

Problema de la novia quisquillosa

(Por ejemplo, dónde  está la secuencia final)

Estás observando una secuencia de objetos que se pueden ordenar de mejor a peor. Desea elegir una regla de parada que maximice sus posibilidades de elegir la mejor característica.

Por ejemplo, si ( quizás n es un número grande) son los rangos de las funciones, y esta es la posibilidad de que elija la mejor función si deja de rechazar intencionalmente las funciones en el paso i, entonces esas son las secuencias asociadas con este problema. Este problema fue resuelto a principios de la década de 1960 por varias personas. Un algoritmo de parada óptimo más moderno (algoritmo de Bruce) proporciona una solución elegante al problema de la secretaria y varias modificaciones a este problema.

Teoría de la búsqueda

Los economistas han estudiado una serie de problemas de tiempo de parada óptimos similares al "problema de la secretaria" y comúnmente se refieren a este tipo de análisis como "teoría de búsqueda". La teoría de la búsqueda se centra particularmente en la búsqueda de un empleado de un trabajo bien remunerado o en la búsqueda de un consumidor de un producto económico.

Comercio de opciones

En la negociación de opciones en los mercados financieros , el titular de una opción estadounidense puede ejercer el derecho a comprar (o vender) el activo subyacente a un precio específico en cualquier momento antes o al vencimiento. Por lo tanto, la valoración de las opciones americanas es esencialmente un problema de parada óptima. Considere el modelo clásico de Black-Scholes y sea la tasa de interés libre de riesgo y la tasa de dividendos y la volatilidad de las acciones. El precio de las acciones sigue el movimiento browniano geométrico

Según la medida del riesgo.

Cuando el parámetro es infinito, el problema de parada óptimo

donde es la función de pago para la opción de compra y para la opción de apuesta. Desigualdad variacional

para todos donde sea el límite del ejercicio físico. La solución es conocida [3]

Por otro lado, cuando el límite de tiempo es finito, el problema está relacionado con el problema de frontera libre bidimensional sin una solución de forma cerrada conocida. Sin embargo, se pueden utilizar varios métodos numéricos. Consulte Black-Scholes Model#American Options para ver varios métodos de valoración aquí, y Fugit para un cálculo de tiempo óptimo para entrenar basado en un árbol discreto.

Véase también

Enlaces

  1. Peskir, Goran; Shiryaev, AlbertoProblemas de detención óptima y de límite libre  (sin especificar) . - 2006. - T. Lecciones de Matemáticas. ETH Zúrich . - ISBN 978-3-7643-2419-3 . -doi :/ 978-3-7643-7390-0 .
  2. Øksendal, B.; Sulem, AS Control estocástico aplicado de difusiones de salto  (neopr.) . - 2007. - ISBN 978-3-540-69825-8 . -doi : 10.1007 / 978-3-540-69826-5 .
  3. Karatzas, Ioannis; ShreveSteven E.Métodos de Finanzas Matemáticas  (indefinido) . - 1998. - T. 39 . - ISBN 978-0-387-94839-3 . -doi : 10.1007/ b98840.