En matemáticas , la teoría del punto de parada o tiempo de Markov está relacionada con el problema del tiempo para realizar una determinada acción con el fin de maximizar la recompensa esperada o minimizar el costo esperado. El problema del punto de parada se puede encontrar en los campos de la estadística , la economía y las matemáticas financieras (asociadas con el precio de las opciones estadounidenses ). El ejemplo más notable relacionado con el momento de la parada es el problema de la novia exigente . El problema del momento de frenado a menudo se puede escribir en la forma de la ecuación de Bellman y, por lo tanto, a menudo se resuelve mediante programación dinámica .
Por regla general, el problema del momento de parada está asociado a dos objetos:
Dados estos objetos, el problema es este:
Considere la amplificación de procesos definidos en un espacio de probabilidad filtrado y asuma que esto es una adaptación del filtrado. El problema del tiempo de parada es encontrar el tiempo de parada que maximiza el pago esperado .
donde se llama el valor de la función . Podría importar aquí .
Una redacción más específica es la siguiente. Consideramos un proceso de Markov fuerte adaptado definido en un espacio de probabilidad filtrado donde denota la probabilidad de medición, donde el proceso aleatorio comienza con . Teniendo en cuenta las funciones continuas y en el problema del tiempo de parada
Esto a veces se denomina formulación MLS (Meyer, Lagrange y Supremum, respectivamente). [una]
Hay dos enfoques para resolver el problema del punto de parada. Cuando el proceso subyacente (o la amplificación del proceso) se describe por su distribución de dimensión finita incondicional, entonces el método de solución apropiado es el enfoque Martingale, llamado así porque utiliza la teoría Martingale , siendo el concepto más importante el desarrollo de Snell . En el caso discreto, si el horizonte de planificación es finito, el problema se puede resolver fácilmente mediante programación dinámica .
Cuando el proceso subyacente está definido por una familia de funciones de transición (condicionales) que conducen a una familia de transiciones probabilísticas de Markov, a menudo se pueden usar las poderosas herramientas analíticas de la teoría del proceso de Markov y este enfoque se denomina método de Markov. La solución suele obtenerse resolviendo problemas asociados con fronteras libres (problemas de Stefan).
Sea la difusión de Levy de la ecuación diferencial estocástica
donde es un movimiento browniano bidimensional , esta es una medida aleatoria de Poisson compensada bidimensional , , y funciones tales que existe una solución única . Sea un conjunto abierto (área de solvencia) y
tiempo de quiebra. Problema de parada óptima:
Resulta que bajo ciertas condiciones de regularidad, [2] la siguiente verificación del teorema contiene:
Si la función satisface
entonces para todos . Además, si
Entonces para todos y es el tiempo de parada
Estas condiciones se pueden escribir en una forma más compacta (desigualdad integral-variacional):
(Por ejemplo, donde converge)
Tienes una moneda y la lanzas repetidamente. Cada vez antes de tirarlo, puedes dejar de tirarlo y recibir un pago (en dólares, digamos) por el número promedio de caras que veas.
Desea la cantidad máxima que se le pagaría al elegir una regla de detención. Si x i (donde i ≥ 1) forma una secuencia de variables aleatorias independientes distribuidas idénticamente con la distribución de Bernoulli
y si
luego en la secuencia habrá objetos relacionados con este problema.
(Por ejemplo, donde no necesariamente converge)
Tienes una casa y te gustaría venderla. Todos los días te ofrecen por tu casa, y pagas por publicidad continua. Si vende su casa diariamente , ganará donde .
Quiere maximizar la cantidad que gana eligiendo una regla de parada.
En este ejemplo, la secuencia ( ) es la secuencia de ofertas para su casa, y la secuencia de características "recompensas" determina cuánto ganará.
(Por ejemplo, dónde está la secuencia final)
Estás observando una secuencia de objetos que se pueden ordenar de mejor a peor. Desea elegir una regla de parada que maximice sus posibilidades de elegir la mejor característica.
Por ejemplo, si ( quizás n es un número grande) son los rangos de las funciones, y esta es la posibilidad de que elija la mejor función si deja de rechazar intencionalmente las funciones en el paso i, entonces esas son las secuencias asociadas con este problema. Este problema fue resuelto a principios de la década de 1960 por varias personas. Un algoritmo de parada óptimo más moderno (algoritmo de Bruce) proporciona una solución elegante al problema de la secretaria y varias modificaciones a este problema.
Los economistas han estudiado una serie de problemas de tiempo de parada óptimos similares al "problema de la secretaria" y comúnmente se refieren a este tipo de análisis como "teoría de búsqueda". La teoría de la búsqueda se centra particularmente en la búsqueda de un empleado de un trabajo bien remunerado o en la búsqueda de un consumidor de un producto económico.
En la negociación de opciones en los mercados financieros , el titular de una opción estadounidense puede ejercer el derecho a comprar (o vender) el activo subyacente a un precio específico en cualquier momento antes o al vencimiento. Por lo tanto, la valoración de las opciones americanas es esencialmente un problema de parada óptima. Considere el modelo clásico de Black-Scholes y sea la tasa de interés libre de riesgo y la tasa de dividendos y la volatilidad de las acciones. El precio de las acciones sigue el movimiento browniano geométrico
Según la medida del riesgo.
Cuando el parámetro es infinito, el problema de parada óptimo
donde es la función de pago para la opción de compra y para la opción de apuesta. Desigualdad variacional
para todos donde sea el límite del ejercicio físico. La solución es conocida [3]
Por otro lado, cuando el límite de tiempo es finito, el problema está relacionado con el problema de frontera libre bidimensional sin una solución de forma cerrada conocida. Sin embargo, se pueden utilizar varios métodos numéricos. Consulte Black-Scholes Model#American Options para ver varios métodos de valoración aquí, y Fugit para un cálculo de tiempo óptimo para entrenar basado en un árbol discreto.