El método del gradiente proximal [1] es una generalización de la proyección utilizada para resolver problemas de programación convexa no diferenciables .
Muchos problemas interesantes se pueden formular como problemas de programación convexa de la forma
donde son funciones convexas , definidas como mapeos , donde algunas de las funciones no son diferenciables, lo que excluye las técnicas habituales de optimización suave, como el método de descenso más pronunciado o el método de gradiente conjugado , etc., se pueden usar métodos de gradiente proximal en su lugar. Estos métodos funcionan por división para que las funciones se utilicen individualmente, lo que permite el desarrollo de algoritmos más fáciles de implementar. Se denominan proximales ( ing. proximal , más cercano), ya que cada función no suave entre ellas está involucrada en el proceso a través del operador de proximidad. Algoritmo iterativo de filtrado de umbral suave [2] , la proyección de Landweber , la proyección de gradientes , las proyecciones alternas , el método de direcciones alternas de multiplicadores , el método de desdoblamientos alternos de Bragman son casos especiales de algoritmos proximales [3] . Para obtener una discusión sobre los métodos de gradiente proximal desde la perspectiva de la teoría del aprendizaje estadístico y las aplicaciones de esta teoría, consulte Métodos de gradiente proximal para el aprendizaje automático .
Sea el espacio euclidiano bidimensional el dominio de la función . Supongamos que es un subconjunto convexo no vacío del conjunto . Entonces la función indicadora del conjunto se define como
-la norma se define comoLa distancia de a se define como
Si es cerrado y convexo, la proyección al conjunto es el único punto tal que .
La subdiferencial de una función en un punto viene dada por la expresión
Un algoritmo de optimización convexo ampliamente utilizado es la proyección a conjuntos convexos . Este algoritmo se utiliza para detectar/sintetizar una señal que satisface varias restricciones convexas simultáneamente. Sea una función indicadora en un conjunto convexo cerrado no vacío que modela una restricción. Esto reduce el problema al problema de la factibilidad convexa (accesibilidad), en el que se necesita encontrar una solución contenida en la intersección de todos los conjuntos convexos . En el método de proyección a conjuntos convexos, cada conjunto está asociado a su proyector . Así, en cada iteración se recalcula según la fórmula
Sin embargo, más allá de tales tareas, los proyectores no son adecuados y se requieren operadores de una forma más general. Entre las diversas generalizaciones existentes de la noción de un proyector convexo, los operadores de proximidad son los más adecuados para tales fines.
El operador de proximidad de una función convexaen un puntose define como la única solución
y se denota como .
Tenga en cuenta que en el caso cuando es la función indicadora de algún conjunto convexo
lo que muestra que el operador de proximidad es de hecho una generalización del proyector.
El operador de proximidad de la función se describe mediante la inclusión
Si es diferenciable, entonces la ecuación anterior se reduce a
Los casos particulares de métodos de gradiente proximal son