Distancia de edición de gráfico

La distancia de edición del gráfico es el coeficiente de similitud (o diferencia) entre dos gráficos . El concepto de distancia de edición de gráficos fue formulado matemáticamente por primera vez por Alberto Sanfeliu y King-San Fu en 1983 [1] . La principal aplicación de la distancia de edición de gráficos es la coincidencia de gráficos inexactos , como el reconocimiento de patrones robusto en el aprendizaje automático [2] .

La distancia de edición de gráficos entre dos gráficos está relacionada con la distancia de edición entre filas . Al interpretar los sumideros como gráficos acíclicos dirigidos conectados con un grado máximo de dos, las definiciones clásicas de distancia de edición, como la distancia de Levenshtein [3] , la distancia de Hamming [4] y la distancia de Jaro-Winkler , pueden interpretarse como distancias de edición de gráficos entre gráficos adecuados. De manera similar, la distancia de edición de gráficos es una generalización de la distancia de edición de árboles entre árboles enraizados [5] [6] [7] [8] .

Definiciones y propiedades formales

La definición matemática de la distancia de edición del gráfico depende de la definición de los gráficos para los que se define la distancia. Por ejemplo, depende de si los vértices y los bordes del gráfico están etiquetados y cómo , y también de si el gráfico está dirigido . En general, dado un conjunto de operaciones de edición de gráficos (también conocidas como operaciones de gráficos elementales ), la distancia de edición de gráficos entre dos gráficos y , escrita como , se puede definir como

,

donde significa el conjunto de caminos de transformación a ( isomorfos al gráfico) , y es igual al costo de cada operación de edición .

El conjunto de operaciones gráficas elementales generalmente incluye:

inserción de vértice: se inserta un nuevo vértice etiquetado en el gráfico. Eliminación de vértices: se elimina un vértice (a menudo no relacionado) del gráfico. sustituir un vértice - cambiar la etiqueta (o color) de un vértice dado. inserción de borde: se inserta un nuevo borde coloreado en el gráfico entre un par de vértices. eliminación de aristas — eliminación de una arista entre un par de vértices. Sustitución de borde : cambie la etiqueta (o el color) de un borde dado.

Además, pero más raramente, operaciones como dividir un borde , que inserta un nuevo vértice en un borde (lo que da como resultado dos bordes), y reducir un borde , que elimina un vértice de grado dos entre los bordes (del mismo color) mientras fusionando los dos bordes, se incluyen en uno. Si bien operaciones tan complejas pueden definirse en términos de transformaciones más simples, su uso permite una mejor parametrización de la función de costo cuando el operador es más económico que la suma de sus partes.

Aplicaciones

La distancia de edición de gráficos tiene aplicaciones en el reconocimiento de escritura a mano [9] , el reconocimiento de huellas dactilares [10] y la quimioinformática [11] .

Algoritmos y complejidad

Los algoritmos exactos para calcular la distancia de edición de gráficos entre un par de gráficos generalmente transforman el problema en un problema de encontrar la ruta de transformación mínima entre dos gráficos. El cálculo de la ruta de edición óptima se reduce a la búsqueda de rutas o al problema de la ruta más corta , a menudo implementado como el algoritmo de búsqueda A* .

Además de los algoritmos exactos, se conocen muchos algoritmos de aproximación efectivos [12] [13] .

Aunque los algoritmos anteriores a veces funcionan bien en la práctica, en general el problema de calcular la distancia de edición de un gráfico es NP-completo [14] (una prueba de esto está disponible en la sección 2 en el sitio web de Zeng et al. ) e incluso difícil de aproximar (formalmente, es APX -hard [15] ).

Notas

  1. Sanfeliu, Fu, 1983 , p. 353–363.
  2. Gao, Xiao, Tao, Li, 2010 , pág. 113-129.
  3. Levenstein, 1965 , pág. 845–848.
  4. Hamming, 1950 , pág. 147–160.
  5. Shasha y Zhang 1989 , pág. 1245–1262.
  6. Zhang, 1996 , pág. 205–222.
  7. Bille, 2005 , pág. 22–34.
  8. Demaine, Mozes, Rossman, Weimann, 2010 , pág. A2.
  9. Fischer, Suen, Frinken, Riesen, Bunke, 2013 , pág. 194–203.
  10. Neuhaus, Bunke, 2005 , pág. 191–200.
  11. Birchall, Gillet, Harper, Pickett, 2006 , pág. 557–586.
  12. Neuhaus, Bunke, 2007 .
  13. Riesen, 2016 .
  14. Garey, Johnson, 1979 .
  15. Lin, 1994 , pág. 74–82.

Literatura