La aproximación de curva [1] [2] es el proceso de construcción de una curva o función matemática que mejor se aproxima a puntos dados [3] con posibles restricciones en la curva [4] . Para construir tal aproximación, ya sea interpolación [5] , donde se requiere el paso exacto de la curva por los puntos, o suavizado [6] [7] , cuando la función de “suavizado” pasa aproximadamente por los puntos. Una sección relacionada es el análisis de regresión [8] [9] , que se centra principalmente en preguntasinferencia estadística , como cuánta incertidumbre hay en una curva que aproxima los datos con algún error aleatorio. Las curvas construidas se pueden utilizar para visualizar datos [10] [11] , para calcular valores de función en puntos donde el valor no está establecido [12] y para determinar la relación entre dos o más variables [13] . La extrapolación significa utilizar la curva obtenida fuera de los datos obtenidos de la observación [14] y genera cierta incertidumbre [15] porque puede depender del método de ajuste de la curva.
La aproximación que se busca con más frecuencia tiene la forma y = f ( x ) .
Aproximación de puntos dados por funciones lineales y polinomialesEmpecemos las aproximaciones con un polinomio de primer grado:
Esta es una línea recta con pendiente a . Se puede trazar una línea a través de dos puntos cualquiera, de modo que un polinomio de primer grado pase a través de dos puntos cualesquiera con abscisas diferentes .
Si se aumenta el orden de la ecuación a polinomios de segundo grado, se obtiene:
Esta función describe una parábola . Una parábola se puede trazar a través de tres puntos cualesquiera.
Si aumentamos el orden del polinomio al tercer grado, obtenemos:
Tal curva se puede construir para cuatro puntos dados cualesquiera. Además, como regla, es posible construir tal curva si se dan exactamente cuatro restricciones. Cada restricción puede ser un punto, un ángulo o una curvatura (que es el recíproco del radio del círculo en contacto ). Las restricciones de ángulo y curvatura se agregan más comúnmente a los extremos de una curva, y dichas restricciones a menudo se denominan condiciones de contorno . A menudo se utilizan las mismas condiciones de contorno para garantizar una transición suave entre las curvas polinómicas dentro de una spline . También se pueden especificar restricciones de orden superior, como la tasa de cambio de curvatura. Esto, por ejemplo, se puede utilizar en la construcción de cruces de autopistas para calcular la tasa de cambio de las fuerzas que actúan sobre el automóvil (ver tirón ) durante el cruce y calcular la velocidad máxima permitida.
También se puede construir un polinomio de primer grado si se dan un punto y un ángulo, mientras que un polinomio de tercer grado se puede construir para dos puntos, una pendiente dada y una curvatura dada. Son posibles otras combinaciones de restricciones para estos y grados superiores del polinomio.
Si se dan más de n + 1 condiciones (donde n es el grado del polinomio), aún puede intentar construir una curva polinomial que satisfaga esas condiciones. Sin embargo, en el caso general, tal curva no se puede construir (por ejemplo, un polinomio de primer grado sobre tres puntos se puede construir solo si estos puntos son colineales ). Por lo tanto, se necesitan algunos métodos para implementar la aproximación. El método de los mínimos cuadrados es uno de ellos.
Hay varias razones para obtener una solución aproximada cuando simplemente aumentar el grado de un polinomio daría un paso exacto a través de los puntos:
Un grado polinomial superior al necesario para que la curva pase exactamente por los puntos no es deseable por todas las razones enumeradas anteriormente, pero, además, conduce a un número infinito de soluciones. Por ejemplo, un polinomio de primer grado (línea recta) con restricción a un punto en lugar de los dos habituales conduce a un número infinito de soluciones. Esto plantea el problema de cómo comparar y elegir una sola solución, y esto puede ser un problema tanto para los programas como para las personas. Por esta razón, la mejor opción es una potencia lo más baja posible para satisfacer exactamente todas las restricciones, y tal vez incluso una potencia menor si es factible una solución aproximada.
Aproximación de puntos dados por otras funcionesEn algunos casos, también se pueden utilizar otros tipos de curvas, como funciones trigonométricas (p. ej., seno y coseno).
En espectroscopia , los datos se pueden aproximar mediante la distribución normal , la distribución de Cauchy , el contorno de Voigt y funciones relacionadas.
Para el análisis de datos algebraicos, "aproximación" generalmente significa encontrar una curva que minimice la desviación vertical (a lo largo del eje y ) de un punto de la curva (por ejemplo, el método de mínimos cuadrados ). Para aplicaciones de gráficos e imágenes, la aproximación geométrica busca la mejor aproximación visual, lo que generalmente significa tratar de minimizar la distancia a la curva (por ejemplo, mínimos cuadrados completos ) o minimizar las desviaciones en ambas coordenadas. La aproximación geométrica es impopular porque generalmente involucra cálculos no lineales y/o recurrentes, aunque da un resultado estéticamente más aceptable y geométricamente más preciso [16] [17] [18] .
Si la función no se puede dar en la forma , puede intentar aproximarse usando una curva plana .
En algunos casos, se pueden utilizar otros tipos de curvas, como secciones cónicas (arcos circulares, elipses, parábolas e hipérbolas) o funciones trigonométricas (como seno y coseno). Por ejemplo, las trayectorias de objetos bajo la influencia de la gravedad son parábolas (si no se tiene en cuenta la resistencia del aire). Entonces, vincular puntos de trayectoria (experimentales) a una curva parabólica tendría sentido. Las mareas siguen un patrón sinusoidal, por lo que los datos de mareas deben compararse con el seno o la suma de dos senos de periodos diferentes, teniendo en cuenta la influencia tanto de la luna como del sol.
En el caso de una curva paramétrica , es eficiente considerar cada coordenada como una función separada de la longitud de la curva . Si se pueden ordenar los datos de origen, puede usar la longitud del acorde [19] .
Aproximación geométrica de puntos dados por un círculoKoop [20] trató de resolver el problema de encontrar la mejor aproximación visual mediante un círculo de puntos en un plano. El método transforma elegantemente un problema no lineal en uno lineal, que ya se puede resolver sin recurrir a métodos recursivos y, por lo tanto, el resultado se obtiene más rápido que con los enfoques anteriores.
Aproximación geométrica por elipseLa técnica anterior se ha extendido a elipses generales [21] mediante la adición de un paso no lineal, lo que da como resultado un método rápido que encuentra, sin embargo, elipses visualmente atractivas de orientación y ubicación arbitrarias.
Tenga en cuenta que aunque la discusión hasta ahora ha sido sobre curvas planas, la mayoría de los resultados se extienden a superficies en espacios tridimensionales , cada parte de la cual está definida por una cuadrícula de curvas en dos direcciones paramétricas. La superficie puede constar de una o más piezas en ambas direcciones.
Muchos paquetes de procesamiento de datos estadísticos , como R , y paquetes de análisis numérico , como GNU Scientific Library , MLAB , DataMelt , Maple , MATLAB , SciPy y OpenOpt incluyen medios de ajuste de curvas en varios escenarios. También hay programas escritos especialmente para el ajuste de curvas. Se pueden encontrar en los artículos " Paquetes de procesamiento de datos estadísticos " y " Paquetes de análisis numérico ".