Una importante cuestión fundamental de la teoría de la discretización es la cuestión del volumen de una descripción discreta de las señales, es decir, el número de funciones básicas utilizadas para representar:
.Para encontrar la base óptima, debe determinar la clase de señales para las que se busca y también establecer la precisión de recuperación para esta clase. En el enfoque estadístico de la descripción de las señales, la base dimensional óptima para representar las realizaciones de señales individuales suele considerarse la base en la que la tasa de error, promediada sobre el conjunto de realizaciones, es mínima. En este caso, las condiciones necesarias y suficientes para el mínimo de la norma de error de representar la señal como una suma de funciones básicas están determinadas por el teorema de Karhunen-Loev.
El valor mínimo de la norma de error en la representación de señales en un intervalo de longitud se logra utilizando como base las funciones propias del operador, cuyo núcleo es la función de correlación de señales :
,correspondientes a los valores propios más grandes. En este caso, la tasa de error es:
.Tal descomposición es la descomposición de Karhunen-Loeve [1] [2] .
In the theory of random processes, the Karhunen-Loeve theorem (named after Kari Karhunen and Michel Loeve ) is a representation of a random process as an infinite linear combination of orthogonal functions , similar to the representation of Fourier series - a sequential representation of functions en un intervalo acotado. Unlike Fourier series, where the coefficients are real numbers and the representation basis consists of sinusoidal functions (that is, sine and cosine functions with different frequencies), the coefficients in the Karhunen-Loeve theorem are random variables, and the representation basis depends on the proceso.
Un proceso aleatorio centrado { X t } t ∈ [ a , b ] (donde centrar significa que las expectativas matemáticas E( X t ) existen y son iguales a cero para todos los valores del parámetro t de [ a , b ]) , que satisface la condición técnica de continuidad, admite descomposición de la siguiente forma:
donde Z k son variables aleatorias mutuamente no correlacionadas y funciones e k son funciones reales continuas en [ a , b ] ortogonales en L ² [ a , b ]. En el caso de un proceso no centrado, se obtiene una expansión similar al expandir la función de expectativa en la base e k .
Si el proceso es gaussiano , entonces las variables aleatorias Z k también son gaussianas y son independientes . Este resultado generaliza las transformaciones de Karhunen-Loeve . Un ejemplo importante de un proceso estocástico centrado en el intervalo [0,1] es el proceso de Wiener , y el teorema de Karhunen-Loeve se puede utilizar para obtener una representación ortogonal canónica. En este caso, la expansión consta de funciones sinusoidales.
Las descomposiciones anteriores también se conocen como descomposiciones de Karhunen-Loeve o descomposición (versión empírica, es decir, con coeficientes de los datos numéricos originales), como análisis de componentes principales , descomposición ortogonal propia o transformada de Hotelling .
Formulemos el resultado en términos de procesos estocásticos de valores complejos. Los resultados se pueden aplicar a procesos de valores reales sin modificación, recordando que el complejo conjugado de un número real es igual a sí mismo.
Para elementos aleatorios X e Y , el producto escalar se define mediante la fórmula
donde * denota la operación de conjugación compleja .
El producto escalar está bien definido si ambos y tienen segundos momentos finitos o, de manera equivalente, si ambos son integrables al cuadrado . Tenga en cuenta que el producto escalar está relacionado con la covarianza y la correlación . En particular, para variables aleatorias con una media de cero, la covarianza y el producto escalar son los mismos. Función de autocovarianza
Si el proceso { X t } t está centrado, entonces
para todo t . Así, la autocovarianza de K XX es igual a la autocorrelación de R XX :
Tenga en cuenta que si { X t } t está centrado y t 1 , ≤ t 2 , …, ≤ t N son puntos en el intervalo [ a , b ], por lo tanto
teorema _ Considere un proceso estocástico centrado indexado en un intervalo con una función de covarianza . Supongamos que la función de covarianza es continua en el conjunto de variables . Entonces es un núcleo definido positivo y, según el teorema de Mercer, el operador integral en (cerca de la medida de Lebesgue en ) tiene una base ortonormal de vectores propios. Sean vectores propios correspondientes a valores propios distintos de cero y
Entonces son variables aleatorias ortogonales centradas y
la serie converge en el cuadrado medio y también uniformemente en . Además
donde es el valor propio correspondiente al vector propio .
En la formulación del teorema, la integral en la definición puede entenderse como el límite en promedio de las sumas de Cauchy de variables aleatorias
dónde
Dado que el límite cuadrático medio de las variables aleatorias conjuntas gaussianas es gaussiana y las variables aleatorias conjuntas gaussianas (centradas) son independientes si y solo si son ortogonales, también podemos concluir:
teorema _ Las variables aleatorias tienen una distribución gaussiana y son independientes si el proceso inicial { X t } t también es gaussiano.
En el caso gaussiano, dado que las variables aleatorias son independientes, podemos estar seguros de que:
casi seguro
Nótese que, generalizando el teorema de Mercer, podemos sustituir el intervalo por otros espacios compactos , y la medida de Lebesgue on por una medida de Borel soportada en .
El proceso de Wiener en la teoría de procesos aleatorios es un modelo matemático del movimiento browniano o caminata aleatoria con tiempo continuo. Aquí lo definimos como un proceso gaussiano centrado B ( t ) con función de covarianza
Es fácil ver que los vectores propios de covarianza son
y los valores propios correspondientes
Esto nos permite obtener la siguiente representación del proceso de Wiener:
teorema _ Existe una secuencia { W i } i de variables aleatorias gaussianas independientes con media cero y varianza unitaria tal que
La convergencia es uniforme en t en la norma L² tal que
uniformemente en t .
Se ha sugerido que el proyecto SETI debería usar transformadas de Karhunen-Loeve para detectar señales con un espectro muy amplio. De manera similar, los sistemas de óptica adaptativa a veces usan funciones de Karhunen-Loeve para recuperar información sobre la fase del frente de onda. (Dai 1996, JOSA A).