Relación de Rayleigh

En matemáticas , para una matriz hermítica compleja dada y un vector distinto de cero , la relación de Rayleigh [1] se define de la siguiente manera [2] [3] :

Para matrices reales, la condición para que una matriz sea hermítica se reduce a su simetría , y la conjugación hermítica de vectores se convierte en una transposición ordinaria . Tenga en cuenta que para cualquier constante real . Recuerde que una matriz hermítica (así como una real simétrica) tiene valores propios reales . Se puede demostrar que para una matriz, la relación de Rayleigh alcanza su valor mínimo (el valor propio más pequeño de la matriz ) cuando es igual a (el vector propio correspondiente). De manera similar, se puede demostrar que y . La relación de Rayleigh se utiliza en el teorema minimax de Courant-Fisher para obtener todos los valores de los valores propios [4] . También se utiliza en algoritmos para encontrar valores propios de matriz para obtener una aproximación de valor propio a partir de una aproximación de vector propio. Es decir, la relación es la base para las iteraciones con la relación de Rayleigh [5] [6] .

El conjunto de valores de la relación de Rayleigh se denomina imagen numérica de la matriz [7] [8] .

Un caso especial de matrices de covarianza

La matriz de covarianza M para una muestra estadística multivariada A (matriz de observaciones) se puede representar como un producto A' A [9] [10] . Al ser una matriz real simétrica, M tiene valores propios no negativos y vectores propios ortogonales (o reducibles a ortogonales).

Primero, que los autovalores no sean negativos:

Y, en segundo lugar, que los vectores propios son ortogonales entre sí:

(si los valores propios son diferentes, en el caso de los mismos valores, puede encontrar una base ortogonal).

Demostremos ahora que la relación de Rayleigh toma un valor máximo en el vector correspondiente al valor propio más grande. Expandamos un vector arbitrario en términos de la base de los vectores propios v i :

, donde es la proyección de x sobre

Así, la igualdad

puede reescribirse de la siguiente forma:

Dado que los vectores propios son ortogonales, la última igualdad se convierte en

La última igualdad muestra que la razón de Rayleigh es la suma de los cosenos al cuadrado de los ángulos entre el vector y cada uno de los vectores propios , multiplicada por el valor propio correspondiente.

Si un vector maximiza , entonces todos los vectores obtenidos de la multiplicación por un escalar ( for ) también maximizan R . Por lo tanto, el problema puede reducirse a encontrar el máximo bajo la condición .

Como todos los autovalores son no negativos, el problema se reduce a encontrar el máximo de una función convexa , y se puede demostrar que se alcanza en y (los autovalores se ordenan de forma descendente).

Por lo tanto, la relación de Rayleigh alcanza su máximo en el vector propio correspondiente al valor propio máximo.

Mismo resultado usando multiplicadores de Lagrange

El mismo resultado se puede obtener usando multiplicadores de Lagrange . El problema es encontrar los puntos críticos de la función.

,

en un valor constante Es decir, necesitas encontrar los puntos críticos de la función

donde es el multiplicador de Lagrange. Para puntos estacionarios de la función , la igualdad

y

Así, los vectores propios de la matriz M son puntos críticos de la relación de Rayleigh, y sus valores propios son los valores estacionarios correspondientes.

Esta propiedad es la base del análisis de componentes principales y la correlación canónica .

Uso en la teoría de Sturm-Liouville

La teoría de Sturm-Liouville consiste en el estudio del operador lineal

con producto escalar

,

donde las funciones satisfacen algunas condiciones de contorno específicas en los puntos ayb . La relación de Rayleigh aquí toma la forma

A veces, esta relación se representa de forma equivalente utilizando la integración por partes [11] :

Generalización

Para cualquier par de matrices definidas positivas simétricas reales y un vector distinto de cero , la relación de Rayleigh generalizada se define como

La relación de Rayleigh generalizada se puede reducir a la relación de Rayleigh transformando , donde es la descomposición de la matriz de Cholesky .

Véase también

Notas

  1. también conocida como la relación Rayleigh-Ritz , llamada así por Walter Ritz y Lord Rayleigh .
  2. Horn, R. A. y C. A. Johnson. 1985. Análisis matricial . Prensa de la Universidad de Cambridge. páginas. 176–180.
  3. Parlet BN El problema de valores propios simétricos , SIAM, Clásicos en Matemáticas Aplicadas, 1998
  4. Beckenbach, 1965 , §26 Teorema minimax de Fischer.
  5. Parlett, 1983 , §4.6 Iteraciones con la relación de Rayleigh, p. 87).
  6. Verbitsky, 2000 , §4.3 Iteraciones inversas, p. 115.
  7. Gevorgian .
  8. Prasolov, 2008 , 2.2 El núcleo y la imagen del operador. Espacio factorial., pág. 114.
  9. Korshunov, 2008 , Introducción.
  10. ACTA, 2005 .
  11. Habermann, 1987 .

Literatura