Matriz diagonalizable

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 22 de noviembre de 2021; la verificación requiere 1 edición .

En álgebra lineal, se dice que una matriz cuadrada A es diagonalizable si es similar a una matriz diagonal , es decir, si existe una matriz P no singular tal que P −1 AP es una matriz diagonal. Si V es un espacio vectorial de dimensión finita , entonces se dice que una aplicación lineal T : V → V es diagonalizable si existe una base ordenada en V tal que T representada como una matriz diagonal. La diagonalización es el proceso de encontrar la matriz diagonal correspondiente para una matriz diagonalizable o mapeo lineal. [1] Una matriz cuadrada que no se puede diagonalizar se llama defectuosa .

Las matrices diagonalizables y las aplicaciones son interesantes porque las matrices diagonales son fáciles de trabajar: se conocen los valores propios y los vectores , la exponenciación se realiza elevando los elementos diagonales a una potencia y el determinante es el producto de los elementos diagonales. Desde un punto de vista geométrico, una matriz diagonalizable es un escalado no uniforme: en cada dirección, el estiramiento se produce en el caso general con un coeficiente diferente según el número de la diagonal.

Características

El hecho fundamental sobre aplicaciones y matrices diagonalizables se expresa en las siguientes declaraciones.

Una matriz A de n × n sobre un campo F es diagonalizable si y solo si la suma de las dimensiones de los subespacios propios es igual a n , lo cual es cierto si y solo si existe una base F n que consta de los vectores propios A . Si se encuentra tal base, se puede crear una matriz P en la que las columnas son los vectores base y P −1 AP es una matriz diagonal. Los valores de la diagonal de esta matriz son los valores propios de A.
Una aplicación lineal T : V → V es diagonalizable si y solo si la suma de las dimensiones de sus espacios propios es igual a dim( V ), lo cual es cierto si y solo si existe una base V que consta de los vectores propios de T . Con respecto a esta base , T se representará como una matriz diagonal. Los elementos diagonales de dicha matriz son iguales a los valores propios de T .

Una matriz o aplicación lineal es diagonalizable sobre un campo F si y solo si el polinomio mínimo es un producto de factores lineales sobre el campo F. En otras palabras, una matriz es diagonalizable si y solo si todos los divisores del polinomio mínimo son lineales.

La siguiente condición (suficiente pero no necesaria) suele ser útil.

Una matriz A de n × n es diagonalizable sobre un campo F si tiene n valores propios distintos en F , es decir, si su polinomio característico tiene n raíces distintas en F ; lo contrario puede no ser cierto. Considere la matriz

{\begin{bmatriz}-1&3&-1\\-3&5&-1\\-3&3&1\end{bmatriz)),

que tiene valores propios 1, 2, 2 (no todos son distintos) y reducible a forma diagonal (la matriz es similar a A )

{\begin{bmatriz}1&0&0\\0&2&0\\0&0&2\end{bmatriz));

matriz de transición a otra base P :

{\begin{bmatrix}1&1&-1\\1&1&0\\1&0&3\end{bmatrix}}.

Por lo tanto, lo contrario puede no ser válido si A tiene un subespacio propio de dimensión mayor que 1. En este ejemplo, el subespacio propio de A para el valor propio 2 tiene dimensión 2.

Una aplicación lineal T : V → V para n = dim( V ) es diagonalizable si tiene n valores propios distintos, es decir, si el polinomio característico tiene n raíces distintas en F .

Sea A una matriz sobre F. Si A es diagonalizable, entonces cualquier potencia de A es diagonalizable. Si A es invertible, F es algebraicamente cerrado, A n es diagonalizable para algún n que no es múltiplo de la característica F , entonces A es diagonalizable.

Sobre C , casi cualquier matriz es diagonalizable. Más precisamente, el conjunto de matrices complejas n × n que no son diagonalizables sobre C , cuando se considera como un subconjunto n × n de C , tiene la medida de Lebesgue cero . También se puede decir que las matrices diagonalizables forman un subconjunto denso en el marco de la topología de Zariski : el complemento de este subconjunto se encuentra en el conjunto en el que se desvanece el discriminante del polinomio característico, es decir, en la hipersuperficie. Este no es el caso de R.

La descomposición de Jordan-Chevalley representa al operador como la suma de las partes diagonalizable y nilpotente . Por lo tanto, una matriz es diagonalizable si y solo si la parte nilpotente es cero. En otras palabras, una matriz es diagonalizable si cada bloque de la forma de Jordan no tiene una parte nilpotente.

Diagonalización

Si la matriz A se puede diagonalizar, es decir,

P^{-1}AP={\begin{pmatrix}\lambda _{1}\\&\lambda _{2}\\&&\ddots \\&&&\lambda _{n}\end{pmatrix }},

después

AP=P{\begin{pmatrix}\lambda _{1}\\&\lambda _{2}\\&&\ddots \\&&&\lambda _{n}\end{pmatrix)).

Escribimos P como una matriz de bloques con vectores columna ${\vec {\alfa}}_{i}$

P={\begin{pmatrix}{\vec {\alpha }}_{1}&{\vec {\alpha }}_{2}&\cdots &{\vec {\alpha }}_{ n}\end{matrix}},

entonces la ecuación anterior se puede reescribir como

A{\vec {\alpha }}_{i}=\lambda _{i}{\vec {\alpha }}_{i}\qquad (i=1,2,\cdots,n).

Los vectores columna de P son los vectores propios derechos de A , los elementos diagonales correspondientes son los valores propios. La invertibilidad de P también implica que los vectores propios son linealmente independientes y forman una base en F n . Esta es una condición necesaria y suficiente para la diagonalizabilidad. Los vectores fila P −1 son los vectores propios izquierdos de A .

Si A es una matriz hermitiana , entonces se pueden elegir los vectores propios de A para que formen una base ortogonal en Cn . En estas condiciones, P será una matriz unitaria y P −1 es igual al conjugado hermitiano de P .

En la práctica, la diagonalización de matrices se realiza en una computadora. Hay una serie de algoritmos que permiten llevar a cabo este proceso.

Diagonalización de un conjunto de matrices

Se dice que un conjunto de matrices es conjuntamente diagonalizable si existe una única matriz invertible P tal que P −1 AP es una matriz diagonal para cada A del conjunto. El siguiente teorema caracteriza matrices diagonalizables conjuntamente: un conjunto de matrices es un conjunto de matrices conmutables diagonalizables si y solo si es diagonalizable conjuntamente. [2]

El conjunto de todas las matrices n × n diagonalizables sobre C para n > 1 no es diagonalizable conjuntamente. Por ejemplo, matrices

{\begin{bmatrix}1&0\\0&0\end{bmatrix}}\quad {\text{y}}\quad {\begin{bmatrix}1&1\\0&0\end{bmatrix}}

son diagonalizables, pero no conjuntamente, ya que no conmutan.

Un conjunto consiste en conmutar matrices normales si y sólo si está conjuntamente diagonalizado por una matriz unitaria, es decir, existe una matriz unitaria U tal que U*AU es diagonal para cualquier matriz A del conjunto.

Ejemplos

Matrices diagonalizables

Las involuciones son diagonalizables sobre números reales (y sobre cualquier campo cuya característica no sea igual a 2), y ±1 se ubican en la diagonal.
Los endomorfismos de orden finito son diagonalizables sobre C (o sobre otro campo algebraicamente cerrado, y la característica del campo no es divisor del orden del endomorfismo), las raíces de unidad estarán situadas en la diagonal . El polinomio mínimo es separable porque las raíces de la unidad son distintas.
Los proyectores son diagonalizables, con 1 y 0 en la diagonal.
Las matrices simétricas reales son diagonalizables por matrices ortogonales. Considere una matriz real A , Q T AQ es diagonal para alguna matriz ortogonal Q . De manera más general, las matrices son diagonalizables por matrices unitarias si y solo si son normales. En el caso de una matriz simétrica real A = A T , por lo tanto AA T = A T A . Ejemplos de matrices normales son las matrices simétricas reales (o asimétricas ) y las matrices hermitianas .

Matrices no diagonalizables

En general, la matriz de rotación no es diagonalizable sobre los números reales, pero todas las matrices de rotación son diagonalizables sobre el campo de los números complejos. Incluso si la matriz no es diagonalizable, es posible reducirla a la "mejor forma posible" y crear una matriz con las mismas propiedades, que contenga valores propios en la diagonal principal y unos o ceros en la diagonal superior. es decir. Forma normal de Jordan .

Algunas matrices no son diagonalizables sobre ningún campo, entre ellas se pueden especificar matrices nilpotentes distintas de cero . Esto sucede si la multiplicidad algebraica y geométrica del valor propio no coinciden. Considerar

C={\begin{bmatrix}0&1\\0&0\end{bmatrix}}.

Esta matriz no se puede diagonalizar: no existe una matriz U para la cual U −1 CU sea una matriz diagonal. C tiene un valor propio (cero) de multiplicidad algebraica 2 y multiplicidad geométrica 1.

Algunas matrices reales no se pueden diagonalizar sobre números reales. Considere la matriz

B={\begin{bmatrix}0&1\\-1&0\end{bmatrix}}.

La matriz B no tiene valores propios reales, por lo que no existe una matriz Q real para la cual Q −1 BQ sea diagonal. Pero sobre el campo de los números complejos, podemos diagonalizar B . Si consideramos

Q={\begin{bmatrix}1&{\textrm {i}}\\{\textrm {i}}&1\end{bmatrix}}),

entonces Q −1 BQ es diagonal.

Tenga en cuenta que los ejemplos anteriores muestran que la suma de matrices diagonalizables no siempre es diagonalizable.

Cómo diagonalizar una matriz

Considere la matriz

A={\begin{bmatrix}1&2&0\\0&3&0\\2&-4&2\end{bmatrix}}.

Esta matriz tiene valores propios

{\ Displaystyle \ lambda _ {1} = 3, \ quad \ lambda _ {2} = 2, \ quad \ lambda _ {3} = 1.}

A es una matriz de 3x3 con 3 valores propios distintos; por lo tanto, es diagonalizable. Tenga en cuenta que si una matriz n × n tiene exactamente n valores propios distintos, entonces es diagonalizable.

Los autovalores aparecerán en la forma diagonalizada A , por lo que al encontrar los autovalores, la matriz A se diagonaliza. Los vectores propios se pueden utilizar para diagonalizar A.

Los vectores propios de A son

v_{1}={\begin{bmatrix}-1\\-1\\2\end{bmatrix)),\quad v_{2}={\begin{bmatrix}0\\0\\1 \end{bmatrix}},\quad v_{3}={\begin{bmatrix}-1\\0\\2\end{bmatrix}}.

Se puede comprobar que $Av_{k}=\lambda_{k}v_{k}.$

Sea P una matriz en la que los vectores propios dados son las columnas.

P={\begin{bmatrix}-1&0&-1\\-1&0&0\\2&1&2\end{bmatrix}}.

Tenga en cuenta que no hay un orden distinguido para las columnas de P ; cambiar el orden de los vectores propios en P solo cambiará el orden de los valores propios en la forma diagonal A. [3]

La matriz P diagonaliza A , lo cual es fácil de ver:

P^{-1}AP={\begin{bmatrix}-1&1&0\\2&0&1\\-1&1&0\end{bmatrix}}{\begin{bmatrix}1&2&0\\0&3&0\\2&-4&2\end{ bmatrix}}{\begin{bmatrix}-1&0&-1\\0&0&-1\\2&1&2\end{bmatrix}}={\begin{bmatrix}3&0&0\\0&2&0\\0&0&1\end{bmatrix}}.

Esto se deduce del hecho de que para cualquier base estándar , $e_{1},e_{2},e_{3}$

P^{-1}APe_{k}=P^{-1}Av_{k}=P^{-1}\lambda_{k}v_{k}=\lambda_{k}e_{ k},

donde hemos aprovechado lo que es la columna k-ésima de , por lo tanto . Tenga en cuenta que los valores propios aparecieron en la matriz diagonal. $Pe_{k}=v_{k}$ $PAGS$ ${\displaystyle P^{-1}v_{k}=e_{k))$ $\lambda_k$

Aplicación

La diagonalización se puede utilizar para calcular eficientemente las potencias de una matriz A si la matriz es diagonalizable. consigamos eso

P^{-1}AP=D\Rightarrow PP^{-1}APP^{-1}=PDP^{-1}\Rightarrow A=PDP^{-1},

donde es una matriz diagonal. Entonces por la asociatividad del producto de matrices $D$

{\begin{alineado}A^{k}&=(PDP^{-1})^{k}=(PDP^{-1})\cdot (PDP^{-1})\cdots ( PDP^{-1})\\&=PD(P^{-1}P)D(P^{-1}P)\cdots (P^{-1}P)DP^{-1}\\ &=PD^{k}P^{-1}\end{alineado}}.

El último producto es fácil de calcular porque contiene las potencias de la matriz diagonal. Este enfoque se puede generalizar al exponente matricial y otras funciones matriciales , ya que se pueden representar como series de potencias.

Un caso especial de aplicación

Considere la siguiente matriz:

M={\begin{bmatrix}a&b-a\\0&b\end{bmatrix}}.

Calcular diferentes potencias de M conduce a un patrón interesante:

M^{2}={\begin{bmatriz}a^{2}&b^{2}-a^{2}\\0&b^{2}\end{bmatriz)),\quad M^{ 3}={\begin{bmatriz}a^{3}&b^{3}-a^{3}\\0&b^{3}\end{bmatriz)),\quad M^{4}={\begin {bmatriz}a^{4}&b^{4}-a^{4}\\0&b^{4}\end{bmatriz}},\quad \ldots

Este fenómeno se puede explicar utilizando la diagonalización de M . Necesitamos una base R 2 que consista en vectores propios M . Una de las bases es

\mathbf {u} ={\begin{bmatrix}1\\0\end{bmatrix}}=\mathbf {e} _{1},\quad \mathbf {v} ={\begin{bmatrix} 1\\1\end{bmatriz}}=\mathbf {e} _{1}+\mathbf {e} _{2},

donde e i denota la base estándar de R n . El cambio inverso de la base viene dado por las expresiones

\mathbf {e} _{1}=\mathbf {u} ,\qquad \mathbf {e} _{2}=\mathbf {v} -\mathbf {u} .

Los cálculos muestran que

M\mathbf {u} =a\mathbf {u} ,\qquad M\mathbf {v} =b\mathbf {v} .

Por lo tanto , a y b son valores propios correspondientes a u y v . Por la linealidad del producto de matrices, obtenemos

M^{n}\mathbf {u} =a^{n}\,\mathbf {u} ,\qquad M^{n}\mathbf {v} =b^{n}\,\mathbf { v} .

Volviendo a la base estándar, obtenemos que

M^{n}\mathbf {e} _{1}=M^{n}\mathbf {u} =a^{n}\mathbf {e}_{1},

M^{n}\mathbf {e} _{2}=M^{n}(\mathbf {v} -\mathbf {u} )=b^{n}\mathbf {v} -a^ {n}\mathbf {u} =(b^{n}-a^{n})\mathbf {e} _{1}+b^{n}\mathbf {e} _{2}.

La forma matricial de las relaciones descritas anteriormente tiene la forma

M^{n}={\begin{bmatriz}a^{n}&b^{n}-a^{n}\\0&b^{n}\end{bmatriz)),

lo que explica el patrón antes mencionado.

Aplicaciones en mecánica cuántica

En mecánica cuántica y química cuántica , la diagonalización de matrices es uno de los procedimientos más utilizados en los cálculos. La razón principal es que la ecuación de Schrödinger independiente del tiempo es una ecuación de valor propio y, en casi todas las aplicaciones físicas, en un espacio de dimensión infinita ( Hilbert ). En enfoques aproximados, el espacio de Hilbert se reemplaza por un espacio de dimensión finita, después de lo cual la ecuación de Schrödinger se puede reformular como un problema de encontrar los valores propios de una matriz simétrica real (o hermitiana compleja). Este enfoque se basa en el principio variacional .

Notas

↑ Cuerno y Johnson 1985
↑ Horn & Johnson 1985, págs. 51–53
↑ Antón, H.; Rorres, C. Álgebra Lineal Elemental (Versión Aplicaciones) (Inglés) . — 8o. - John Wiley & Sons , 2000. - ISBN 978-0-471-17052-5 .

Cuerno, Roger A.; Johnson, Charles R. Análisis matricial (indefinido) . - Prensa de la Universidad de Cambridge , 1985. - ISBN 978-0-521-38632-6 .