Funcion de base radial

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 2 de junio de 2021; la verificación requiere 1 edición .

La función de base radial ( RBF ) es una función de un conjunto de funciones radiales del mismo tipo que se utiliza como función de activación en una capa de una red neuronal artificial o de otra manera, según el contexto. Una función radial  es cualquier función real cuyo valor depende únicamente de la distancia al origen o de la distancia entre algún otro punto llamado centro : . La norma suele ser la distancia euclidiana , aunque se pueden utilizar otras métricas .

Las combinaciones lineales de funciones de base radial también se pueden utilizar para aproximar una función dada . La aproximación puede interpretarse como el tipo más simple de red neuronal ; es en este contexto que las funciones de base radial fueron definidas por primera vez por David Broomhead y David Lowe en 1988 [1] [2] , basándose en el trabajo seminal de Michael Powell de 1977 [3] [4] [5] .

Las funciones de base radial también se utilizan como kernel en las máquinas de vectores de soporte . [6]

Especies

Las funciones de base radial comúnmente utilizadas incluyen ( ):

Aproximación

Para aproximar funciones utilizando funciones de base radial, se suele tomar su combinación lineal de la forma:

,

donde se toma como función de aproximación la suma de las funciones de base radial con centros en los puntos y coeficientes . Los coeficientes se pueden calcular utilizando el método de mínimos cuadrados , ya que la función de ajuste es lineal con respecto a los coeficientes .

Los esquemas de aproximación de este tipo son especialmente útiles. en pronóstico de series de tiempo , control de sistemas no lineales que exhiben un comportamiento caótico bastante simple y modelado 3D en gráficos por computadora .

Redes neuronales basadas en RBF

Combinación lineal:

también se puede interpretar como la red neuronal artificial más simple con una capa, llamada red de funciones de base radial , en la que la función de base radial desempeña el papel de una función de activación. Se puede demostrar que cualquier función continua en un intervalo compacto puede, en principio, interpolarse con precisión arbitraria para .

La aproximación es diferenciable con respecto a . Los coeficientes se pueden calcular utilizando cualquier método iterativo estándar para redes neuronales.

Por lo tanto, las funciones de base radial brindan una herramienta de interpolación flexible, siempre que el conjunto de centros cubra de manera más o menos uniforme el dominio de la función deseada (idealmente, los centros deberían estar equidistantes de sus vecinos más cercanos). Sin embargo, como regla, en los puntos intermedios, la aproximación logra una alta precisión solo si el conjunto de funciones de base radial se complementa con un polinomio ortogonal a cada uno de los RBF.

Notas

  1. Redes de función de base radial Archivado el 23 de abril de 2014.
  2. Broomhead, Lowe, 1988 , pág. 321–355
  3. Michael J. D. Powell; Michael JD Powell. Procedimientos de reinicio para el método del gradiente conjugado  //  Programación matemática : diario. - Springer, 1977. - vol. 12 _ - Pág. 241-254 . -doi : 10.1007/ bf01593790 .
  4. Sahin, Ferat (1997). Un enfoque de función de base radial para un problema de clasificación de imágenes en color en una aplicación industrial en tiempo real (PDF) (M.Sc.). Virginia Tech . pags. 26. Archivado desde el original (PDF) el 26 de octubre de 2015 . Consultado el 02-06-2018 . Las funciones de base radial fueron introducidas por primera vez por Powell para resolver el problema real de interpolación multivariada. Parámetro obsoleto utilizado |deadlink=( ayuda )
  5. Broomhead, Lowe, 1988 , pág. 347: "Nos gustaría agradecer al profesor MJD Powell del Departamento de Matemáticas Aplicadas y Física Teórica de la Universidad de Cambridge por proporcionar el estímulo inicial para este trabajo".
  6. VanderPlas, Jake Introducción a las máquinas de vectores de soporte (enlace no disponible) . [O'Reilly] (6 de mayo de 2015). Consultado el 14 de mayo de 2015. Archivado desde el original el 5 de septiembre de 2015. 

Literatura