Algoritmo de Frank-Wulf

El algoritmo de Frank-Wulff [1] es un algoritmo iterativo de optimización de primer orden para la optimización convexa con restricciones . El algoritmo también se conoce como método de gradiente condicional [2] , método de gradiente reducido y algoritmo de combinación convexa . El método fue propuesto originalmente por Marguerite Frank y Philip Wolf en 1956 [3] . En cada iteración, el algoritmo de Frank-Wulff considera una aproximación lineal de la función objetivo y se mueve en la dirección de minimizar esta función lineal (en el mismo conjunto de soluciones factibles).

Planteamiento del problema

Supongamos que es un conjunto convexo compacto en un espacio vectorial y es una función de valor real diferenciable y convexa de . El algoritmo de Frank-Wulff resuelve el problema de optimización

Minimizar proporcionado _

Algoritmo

Inicialización: Sea y sea un punto en . Paso 1. Subtarea de búsqueda de dirección: Find , resolviendo el problema Minimizar bajo condiciones (Interpretación: minimizamos la aproximación lineal del problema obtenida por la aproximación de Taylor de primer orden de la función cerca de ). Paso 2. Determinación del tamaño del paso: Sea , o, alternativamente, encuentre , que se minimiza bajo la condición . Paso 3. Recálculo: Establezca y vaya al paso 1.

Propiedades

Mientras que los métodos de la competencia, como el descenso de gradiente para la optimización restringida, requieren que cada iteración se proyecte en un conjunto de valores permitidos, el algoritmo de Frank-Wulf solo necesita resolver un problema de programación lineal en el mismo conjunto en cada iteración, por lo que la solución siempre permanece en el conjunto de soluciones factibles.

La convergencia del algoritmo de Frank-Wulf es generalmente sublineal: el error de la función objetivo con respecto al valor óptimo es después de k iteraciones, siempre que el gradiente sea Lipschitz continuo en alguna norma. La misma convergencia se puede mostrar si los subproblemas se resuelven solo aproximadamente [4] .

Las iteraciones del algoritmo siempre se pueden representar como una combinación convexa no densa de puntos extremos del conjunto de soluciones factibles, lo que ha ayudado a la popularidad del algoritmo para problemas de optimización codiciosos dispersos en aprendizaje automático y procesamiento de señales [5] , como así como para encontrar flujos de costo mínimo en las redes de transporte [6] .

Si el conjunto de soluciones factibles está dado por un conjunto de desigualdades lineales, entonces el subproblema resuelto en cada iteración se convierte en un problema de programación lineal .

Aunque la tasa de convergencia del caso más desfavorable para el caso general no se puede mejorar, se pueden obtener tasas de convergencia más altas para problemas especiales como los problemas estrictamente convexos [7] .

Límites inferiores del valor de una solución y análisis primal-dual

Como la función es convexa , para dos puntos cualesquiera tenemos:

Esto también es válido para la solución óptima (desconocida) . eso es El mejor límite inferior considerando un punto viene dado por la fórmula

Este último problema se resuelve en cada iteración del algoritmo de Frank-Wulff, por lo que la solución al subproblema de encontrar la dirección en la i-ésima iteración se puede usar para determinar límites inferiores crecientes en cada iteración asignando y

Estos límites inferiores sobre el valor óptimo desconocido son muy importantes en la práctica, ya que pueden usarse como criterio para detener el algoritmo y dar un indicador efectivo de la calidad de la aproximación en cada iteración, ya que siempre .

Se ha demostrado que la brecha de dualidad , que es la diferencia entre y el límite inferior , disminuye al mismo ritmo, es decir

Notas

  1. ↑ El algoritmo fue desarrollado por Margarita Frank y Philip Wolf, por lo que el nombre Algoritmo Frank-Wulf , que es ampliamente utilizado en la literatura rusa , es erróneo.
  2. Levitin, Polyak, 1966 , p. 787-823.
  3. Frank y Wolfe, 1956 , pág. 95–110.
  4. Dunn y Harshbarger 1978 , pág. 432.
  5. Clarkson, 2010 , pág. 1–30.
  6. Fukushima, 1984 , pág. 169–177.
  7. Bertsekas, 1999 , pág. 215.

Literatura

Enlace

Véase también