Centro geométrico

El centro geométrico de un conjunto discreto de puntos en el espacio euclidiano (en términos estadísticos - muestras) es el punto en el que se minimiza la suma de las distancias a los puntos del conjunto. El centro geométrico generaliza la mediana a una estadística matemática que minimiza las distancias en una muestra de datos unidimensional. Así, el centro geométrico refleja la tendencia central en los espacios de gran dimensión. El concepto también se conoce con los nombres 1-mediana [1] , espacial mediana [2] o punto Torricelli [3] .

El centro geométrico es un importante estimador de desplazamiento en estadística [4] , en el que este concepto se conoce como puntuación L 1 [5] . Encontrar el centro geométrico también es una tarea estándar al colocar objetos , donde se modela la ubicación de los objetos (producción o consumo) para minimizar los costos de transporte [6]

Un caso especial del problema de tres puntos en el plano (es decir, m = 3 y n = 2 en los términos que se describen a continuación) se describe a veces como el problema de Fermat. Surge en la construcción de árboles mínimos de Steiner y fue planteado por primera vez como un problema por Pierre de Fermat y resuelto por Evangelista Torricelli [7] . La solución a este problema ahora se conoce como el punto de Fermat del triángulo [8] . A su vez, la búsqueda del centro geométrico puede generalizarse al problema de minimizar la suma de distancias ponderadas . Este problema se conoce como el problema de Weber porque Alfred Weber discutió este problema en un libro de 1909 sobre la colocación de objetos [2] . Algunas fuentes usan el nombre de problema de Fermat-Weber [9] en su lugar , pero algunas fuentes usan el mismo nombre para el problema no ponderado [10]

Vesolovsky [11] hizo un estudio del problema del centro geométrico. Véase el artículo de Fekete, Michel y Boyer [12] para una discusión sobre la generalización del problema al caso de conjuntos no discretos.

Definición

Formalmente, dado un conjunto que contiene m puntos , donde todos , el centro geométrico se define como

centro geométrico

Tenga en cuenta que aquí arg min significa el valor del argumento en el que se alcanza la suma mínima. Este es el punto para el cual la suma de todas las distancias euclidianas a , es mínima.

Propiedades

Ocasiones especiales

Cálculo

Aunque el concepto de centro geométrico es fácil de entender, su cálculo es difícil. El centroide de un triángulo (es decir, su centro de masa ), definido de manera similar al centro geométrico como la minimización de la suma de las distancias al cuadrado a cada punto, se puede obtener utilizando fórmulas simples: sus coordenadas son la media aritmética de las coordenadas de los puntos. Sin embargo, no se conoce una fórmula tan simple para el centro geométrico. Incluso se ha demostrado que no existe una fórmula explícita ni un algoritmo exacto que utilice únicamente operaciones aritméticas y de base. Por lo tanto, solo hay aproximaciones para resolver este problema [16] .

Sin embargo, es posible calcular una aproximación al centro geométrico utilizando un procedimiento iterativo en el que cada paso da una aproximación más precisa. Procedimientos de este tipo pueden derivarse del hecho de que la suma de distancias a puntos de muestra es una función convexa , ya que la distancia a cada punto de muestra es una función convexa, y la suma de funciones convexas también es una función convexa. Por lo tanto, el procedimiento para reducir la suma de distancias no puede caer en el óptimo local .

Uno de estos enfoques es el algoritmo de Weisfeld ( André Weisfeld ) [17] [18] [19] que es un tipo de método iterativo de mínimos cuadrados ponderados con pesos variables. Este algoritmo establece un conjunto de pesos que son inversamente proporcionales a las distancias a la aproximación actual y calcula una nueva aproximación que es el promedio ponderado de los puntos de muestra de acuerdo con estos pesos. Eso es

El método converge desde casi todas las posiciones iniciales, pero puede fallar si la aproximación termina en uno de los puntos de muestra. El algoritmo se puede modificar de tal manera que converja para todos los puntos de partida [14] .

Bose, Mageshwari y Morin [10] describieron un procedimiento de optimización más sofisticado para encontrar una solución óptima aproximada a un problema dado. Como han demostrado Ne, Parrilo y Starmfils [20] , el problema puede considerarse como un problema de programación semidefinido .

Cohen, Lee, Miller y Pachoki [21] mostraron cómo calcular el centro geométrico con precisión arbitraria en un tiempo casi lineal.

Descripción del centro geométrico

Si el punto y es diferente de todos los puntos muestrales dados x j , entonces y es el centro geométrico si y solo si

Esto es equivalente a

que está estrechamente relacionado con el algoritmo de Weisfeld.

En general, y es un centro geométrico si y sólo si existen vectores u j tales que

donde para x j ≠ y ,

y para x j = y ,

Una formulación equivalente de esta condición

Generalizaciones

El centro geométrico se puede generalizar desde espacios euclidianos a variedades riemannianas generales (e incluso espacios métricos ) usando la misma idea que se usa para definir la media de Fréchet en variedades riemannianas [22] . Sea una variedad de Riemann con una función de distancia , sean pesos que suman 1 y sean observaciones de . Luego definimos el centro geométrico ponderado (o media ponderada de Fréchet) de los puntos de datos

.

Si todos los pesos son iguales, decimos cuál es el centro geométrico.

Notas

  1. El problema más general de la k -mediana pregunta sobre la posición de los k centros minimizando la suma de las distancias desde cada punto del conjunto hasta el centro más cercano.
  2. 1 2 Drezner, Klamroth, Schöbel, Wesolowsky, 2002 .
  3. Cieslik, 2006 .
  4. Lawera, Thompson, 1993 .
  5. 1 2 3 4 Lopuhaä, Rousseeuw, 1991 .
  6. Eiselt, Marianov, 2011 .
  7. Krarup, Vajda, 1997 .
  8. España, 1996 .
  9. Brimberg, 1995 .
  10. 1 2 Bose, Maheshwari, Morin, 2003 .
  11. Wesolowsky, 1993 .
  12. Fekete, Mitchell, Beurer, 2005 .
  13. 1 2 3 Haldane, 1948 .
  14. 12 Vardi, Zhang, 2000 .
  15. Cieslik, 2006 ; Plastería, 2006 . El caso convexo fue probado por primera vez por Giovanni Fagnano .
  16. Bajaj, 1986 ; Bajaj, 1988 . Anteriormente, Cockayne y Melzak Cockayne, Melzak, 1969 demostró que el punto de Steiner para 5 puntos en el plano no se puede construir utilizando un compás y una regla.
  17. Weiszfeld, 1937 .
  18. Kuhn, 1973 .
  19. Chandrasekaran, Tamir, 1989 .
  20. Nie, Parrilo, Sturmfels, 2008 .
  21. Cohen, Lee, Miller, Pachocki, Sidford, 2016 .
  22. Fletcher, Venkatasubramanian, Joshi, 2009 .

Literatura