Una matriz pseudo-inversa es una generalización del concepto de matriz inversa en álgebra lineal . La pseudo-inversa de una matriz se denota por .
El concepto de operadores integradores pseudoinversos fue introducido por primera vez en 1903 por Fredholm . La más conocida es la pseudoconversión de Moore-Penrose, que fue descrita de forma independiente por Eliakim Moore [1] en 1920 y Roger Penrose [2] en 1955 ; la afirmación de que existe una matriz pseudoinversa y es única para cualquier matriz sobre los números reales y complejos se denomina teorema de Moore-Penrose .
Una inversa generalizada esuna pseudo-inversión que satisface condiciones más estrictas . La pseudo-inversión puede entenderse como la solución del problema de mejor aproximación (por el método de mínimos cuadrados con la variante de regularización limitante) para el correspondiente sistema de ecuaciones lineales . La matriz pseudo-inversa se puede calcular utilizando la descomposición en valores singulares de la matriz.
se denomina matriz pseudo-inversa para una matriz si cumple los siguientes criterios:
Aquí está la matriz conjugada hermítica M (para matrices sobre el campo de los números reales ).
Existe una forma equivalente de especificar una matriz pseudo-inversa en términos del límite de inversas ( regularización de Tikhonov ):
,donde es la matriz identidad. Este límite existe aunque no esté definido.
Si las columnas de una matriz son linealmente dependientes , entonces la matriz es invertible. En este caso, la matriz pseudo-inversa viene dada por la fórmula:
.Si las columnas son linealmente independientes (lo cual es cierto para matrices cuadradas no singulares), entonces la pseudoinversión es la misma que la inversión:
.Si y son tales que el producto está definido y:
después
.La pseudo-reversión se puede aplicar tanto a escalares como a vectores. Esto implica que se tratan como matrices de la dimensión apropiada. El pseudo-inverso de un escalar es cero si es cero, y el inverso de lo contrario:
El pseudo-inverso para el vector cero es el vector cero transpuesto. El pseudo-inverso para un vector distinto de cero es el vector transpuesto conjugado dividido por el cuadrado de su longitud:
Para probarlo, basta comprobar que estas cantidades satisfacen la definición de pseudoinversos.
Si existe, entonces de la igualdad:
debería
lo que da lugar al concepto de pseudo-reversión
.Sea el rango de una matriz de tamaño . Entonces se puede representar como , donde B es una matriz de tamaño con columnas linealmente independientes y es una matriz de tamaño con filas linealmente independientes. Después:
.Si tiene un rango de línea completa, es decir , entonces se puede elegir la matriz de identidad y la fórmula se reduce a . De manera similar, si tiene un rango de columna completa, es decir, , entonces .
La forma computacional más simple de obtener una matriz pseudo-inversa es usar una descomposición en valores singulares .
Si es una descomposición en valores singulares , entonces . Para una matriz diagonal como , la pseudoinversa se obtiene reemplazando cada elemento distinto de cero en la diagonal con su inversa.
Existen enfoques optimizados para calcular la pseudoinversa para matrices de bloques.
A veces, el volumen de cálculos para encontrar una matriz pseudo-inversa se puede reducir si se conoce la pseudo-inversa para alguna matriz similar. En particular, si una matriz similar difiere de la inicial en una columna o fila modificada, agregada o eliminada, existen algoritmos acumulativos que pueden utilizar la relación entre matrices.
La pseudo-inversión está estrechamente relacionada con el método de mínimos cuadrados (LSM) para un sistema de ecuaciones lineales [3] .
En este método, el problema de resolver el sistema dado se reemplaza por el problema de minimizar la norma euclidiana al cuadrado de la discrepancia . En la práctica, LSM generalmente se usa cuando el sistema original es inconsistente, pero a continuación consideraremos el caso cuando este sistema es compatible.
La solución general de un sistema no homogéneo se puede representar como la suma de una solución particular de un sistema no homogéneo y la solución general del sistema homogéneo correspondiente .
Lema: Si existe, entonces la solución general es siempre representable como la suma de la solución pseudoinversa del sistema no homogéneo y la solución del sistema homogéneo:
Prueba:
. |
Aquí el vector es arbitrario (hasta la dimensión). Los otros dos términos tienen una matriz pseudo-inversa . Reescribiéndola en la forma , traemos la expresión a la forma:
El primer término es una solución pseudo-inversa. En términos del método de los mínimos cuadrados, es , que da la norma euclidiana mínima para el residuo. El siguiente término da una solución al sistema homogéneo , porque es el operador de proyección sobre la imagen del operador y, en consecuencia, es el operador de proyección sobre el núcleo del operador .