Red adversaria generativa

La red antagónica generativa ( GAN  para abreviar) es un algoritmo de aprendizaje automático no supervisado basado en una combinación de dos redes neuronales , una de las cuales (red G) genera muestras (ver Modelo generativo ), y la otra (red D) intenta distinguir las muestras correctas ("genuinas") de las incorrectas (ver Modelo Discriminativo ). Dado que las redes G y D tienen objetivos opuestos (crear muestras y rechazar muestras), surge un juego antagónico entre ellas . La red antagónica generativa fue descrita por Ian Goodfellow de Google en 2014 [1] .

El uso de esta técnica permite, en particular, generar fotografías que el ojo humano percibe como imágenes naturales. Por ejemplo, existe un conocido intento de sintetizar fotografías de gatos, lo que induce a error al experto, que las considera fotografías naturales [2] . Además, GAN se puede utilizar para mejorar la calidad de fotografías borrosas o parcialmente corruptas.

Método

En el sistema GAN, una de las redes (red G, de Generator) genera muestras (consulte Modelo generativo ), y la otra (red D, de Discriminator) intenta distinguir las muestras correctas ("genuinas") de las incorrectas. (ver Modelo Discriminativo ) [1] . Usando un conjunto de variables espaciales latentes , la red generativa intenta moldear un nuevo patrón mezclando varios de los patrones originales. La red discriminatoria está entrenada para distinguir entre muestras genuinas y falsas, y los resultados de la distinción se envían a la entrada de la red generativa para que pueda elegir el mejor conjunto de parámetros latentes, y la red discriminatoria ya no podría distinguir las muestras genuinas de las falsas. Así, el objetivo de la red G es aumentar la tasa de error de la red D, y el objetivo de la red D es, por el contrario, mejorar la precisión del reconocimiento [1] [3] .

La red de discriminación D, analizando muestras de los datos originales y de los falsificados por el generador, logra cierta precisión de discriminación. En este caso, el generador parte de combinaciones aleatorias de parámetros espaciales latentes (ver distribución normal multivariante ), y luego de evaluar las muestras obtenidas por la red D, se aplica el método de retropropagación de error , que mejora la calidad de la generación al corregir la entrada conjunto de parámetros latentes. Gradualmente, las imágenes artificiales a la salida de la red generativa se vuelven cada vez más cualitativas [4] . La red D se implementa como una red neuronal convolucional , mientras que la red G, por el contrario, despliega la imagen en base a parámetros ocultos.

En el proceso de aprendizaje competitivo conjunto, si el sistema está lo suficientemente equilibrado, se alcanza un estado de equilibrio minimax , en el que ambas redes han mejorado significativamente su calidad, y ahora las imágenes generadas se pueden utilizar casi como reales.

La idea del aprendizaje adversarial fue propuesta en 2013 por Li, Gauci y Gross [5] . Este método también se llama "aprendizaje de Turing" [6] porque tiene como objetivo pasar la prueba de Turing .

Explicaciones de métodos populares

El principio de contención en una GAN a menudo se describe a través de metáforas. Por ejemplo, una red generativa se asemeja a un falsificador o falsificador de pinturas, y una red discriminatoria se asemeja a un experto que busca reconocer una falsificación [7] [8] . Otro ejemplo es la imagen de dos boxeadores, uno de los cuales estudió con el maestro, y el segundo se ve obligado a imitar al alumno [9] .

En una popular aplicación de generación de rostros humanos, las fotografías reales actúan como datos auténticos y una red generativa intenta crear rostros artificiales variando las combinaciones de parámetros latentes como el color del cabello, las proporciones faciales, la forma de los ojos, la forma de la nariz, el tamaño de las orejas, la barba y el bigote. , etc d [10] [11]

Los artículos de los investigadores proporcionan ejemplos de implementación de GAN basados ​​en la biblioteca TensorFlow [12] [13] .

Aplicación

Las GAN se usan para obtener imágenes fotorrealistas , por ejemplo, para elementos de diseño industrial , diseño de interiores , ropa, bolsos, maletines, escenas de juegos de computadora, etc. Las GAN también se usan en la red Facebook [14] . Recientemente, las GAN se han utilizado para preparar fotogramas de películas o animaciones [15] . Además, estos sistemas ayudan a recrear un modelo tridimensional de un objeto utilizando imágenes fragmentarias [16] y mejorar las imágenes obtenidas a partir de observaciones astronómicas [17] .

Notas

  1. 1 2 3 Goodfellow, Ian J.; Pouget-Abadie, Jean; Mirza, Mehdi; Xu, Bing; Warde Farley, David; Ozair, Sherjil; Courville, Aaron & Bengio, Yoshua (2014), Generative Adversarial Networks, arΧiv : 1406.2661 [stat.ML]. 
  2. Salimans, Tim; Goodfellow, Ian; Zaremba, Wojciech; Cheung, Vicky; Radford, Alec & Chen, Xi (2016), Técnicas mejoradas para entrenar GAN, arΧiv : 1606.03498 [cs.LG]. 
  3. Luc, Paulina; Couprié, Camille; Chintala, Soumith; Verbeek, Jacob. Segmentación Semántica usando Redes Adversariales  (neopr.)  // NIPS Workshop on Adversarial Training, Dic, Barcelona, ​​España. - 2016. - 25 de noviembre ( vol. 2016 ). -arXiv : 1611.08408 . _
  4. Andrej Karpathy, Pieter Abbeel, Greg Brockman, Peter Chen, Vicki Cheung, Rocky Duan, Ian Goodfellow, Durk Kingma, Jonathan Ho, Rein Houthooft, Tim Salimans, John Schulman, Ilya Sutskever y Wojciech Zaremba, Modelos generativos , OpenAI , < http://openai.com/blog/modelos-generativos/ > . Consultado el 7 de abril de 2016. Archivado el 22 de abril de 2021 en Wayback Machine . 
  5. Li, Wei; Gaucí, Melvin; Gross, Roderich (6 de julio de 2013). “Un enfoque coevolutivo para aprender el comportamiento animal a través de la interacción controlada” . Actas de la 15.ª Conferencia Anual sobre Computación Genética y Evolutiva (GECCO 2013) . Ámsterdam, Países Bajos: ACM. páginas. 223-230.
  6. Li, Wei; Gaucí, Melvin; Bruto, Roderich. Aprendizaje de Turing: un enfoque sin métricas para inferir el comportamiento y su aplicación a los enjambres  //  Swarm Intelligence: revista. - 2016. - 30 agosto ( vol. 10 , n. 3 ). - pág. 211-243 . -doi : 10.1007/ s11721-016-0126-1 .
  7. Falsificadores contra banqueros: jugando con redes antagónicas en Theano . Consultado el 19 de julio de 2017. Archivado desde el original el 20 de agosto de 2017.
  8. Edición de fotos con redes adversarias generativas (Parte 1) . Consultado el 19 de julio de 2017. Archivado desde el original el 20 de agosto de 2017.
  9. Michael Dietz. Sobre la intuición detrás del aprendizaje profundo y las GAN: hacia una comprensión fundamental  (enlace no disponible)
  10. Anders Boesen Lindbo Larsen y Søren Kaae Sønderby Generando rostros con antorcha . Consultado el 19 de julio de 2017. Archivado desde el original el 11 de julio de 2017.
  11. Edición de fotos con redes adversarias generativas (Parte 1) . Consultado el 19 de julio de 2017. Archivado desde el original el 20 de agosto de 2017.
  12. Redes adversarias generativas en TensorFlow Agustinus Kristiadi . Fecha de acceso: 14 de noviembre de 2017. Archivado desde el original el 17 de noviembre de 2017.
  13. Finalización de imágenes con aprendizaje profundo en TensorFlow . Consultado el 14 de noviembre de 2017. Archivado desde el original el 15 de noviembre de 2017.
  14. Greenemeier, Larry ¿Cuándo tendrán sentido común las computadoras? Pregúntale a Facebook . Scientific American (20 de junio de 2016). Consultado el 31 de julio de 2016. Archivado desde el original el 24 de julio de 2016.
  15. Generación de vídeos con Scene Dynamics . web.mit.edu_ _ Consultado el 19 de julio de 2017. Archivado desde el original el 20 de marzo de 2017.
  16. Red antagónica generativa 3D . 3dgan.csail.mit.edu . Consultado el 19 de julio de 2017. Archivado desde el original el 27 de octubre de 2019.
  17. Schawinski, Kevin; Zhang, Ce; Zhang, Hantian; Fowler, Lucas & Santhanam, Gokula Krishnan (2017-02-01), Generative Adversarial Networks recupera características en imágenes astrofísicas de galaxias más allá del límite de desconvolución, arΧiv : 1702.00403 [astro-ph.IM]. 

Enlaces