La red antagónica generativa ( GAN para abreviar) es un algoritmo de aprendizaje automático no supervisado basado en una combinación de dos redes neuronales , una de las cuales (red G) genera muestras (ver Modelo generativo ), y la otra (red D) intenta distinguir las muestras correctas ("genuinas") de las incorrectas (ver Modelo Discriminativo ). Dado que las redes G y D tienen objetivos opuestos (crear muestras y rechazar muestras), surge un juego antagónico entre ellas . La red antagónica generativa fue descrita por Ian Goodfellow de Google en 2014 [1] .
El uso de esta técnica permite, en particular, generar fotografías que el ojo humano percibe como imágenes naturales. Por ejemplo, existe un conocido intento de sintetizar fotografías de gatos, lo que induce a error al experto, que las considera fotografías naturales [2] . Además, GAN se puede utilizar para mejorar la calidad de fotografías borrosas o parcialmente corruptas.
En el sistema GAN, una de las redes (red G, de Generator) genera muestras (consulte Modelo generativo ), y la otra (red D, de Discriminator) intenta distinguir las muestras correctas ("genuinas") de las incorrectas. (ver Modelo Discriminativo ) [1] . Usando un conjunto de variables espaciales latentes , la red generativa intenta moldear un nuevo patrón mezclando varios de los patrones originales. La red discriminatoria está entrenada para distinguir entre muestras genuinas y falsas, y los resultados de la distinción se envían a la entrada de la red generativa para que pueda elegir el mejor conjunto de parámetros latentes, y la red discriminatoria ya no podría distinguir las muestras genuinas de las falsas. Así, el objetivo de la red G es aumentar la tasa de error de la red D, y el objetivo de la red D es, por el contrario, mejorar la precisión del reconocimiento [1] [3] .
La red de discriminación D, analizando muestras de los datos originales y de los falsificados por el generador, logra cierta precisión de discriminación. En este caso, el generador parte de combinaciones aleatorias de parámetros espaciales latentes (ver distribución normal multivariante ), y luego de evaluar las muestras obtenidas por la red D, se aplica el método de retropropagación de error , que mejora la calidad de la generación al corregir la entrada conjunto de parámetros latentes. Gradualmente, las imágenes artificiales a la salida de la red generativa se vuelven cada vez más cualitativas [4] . La red D se implementa como una red neuronal convolucional , mientras que la red G, por el contrario, despliega la imagen en base a parámetros ocultos.
En el proceso de aprendizaje competitivo conjunto, si el sistema está lo suficientemente equilibrado, se alcanza un estado de equilibrio minimax , en el que ambas redes han mejorado significativamente su calidad, y ahora las imágenes generadas se pueden utilizar casi como reales.
La idea del aprendizaje adversarial fue propuesta en 2013 por Li, Gauci y Gross [5] . Este método también se llama "aprendizaje de Turing" [6] porque tiene como objetivo pasar la prueba de Turing .
El principio de contención en una GAN a menudo se describe a través de metáforas. Por ejemplo, una red generativa se asemeja a un falsificador o falsificador de pinturas, y una red discriminatoria se asemeja a un experto que busca reconocer una falsificación [7] [8] . Otro ejemplo es la imagen de dos boxeadores, uno de los cuales estudió con el maestro, y el segundo se ve obligado a imitar al alumno [9] .
En una popular aplicación de generación de rostros humanos, las fotografías reales actúan como datos auténticos y una red generativa intenta crear rostros artificiales variando las combinaciones de parámetros latentes como el color del cabello, las proporciones faciales, la forma de los ojos, la forma de la nariz, el tamaño de las orejas, la barba y el bigote. , etc d [10] [11]
Los artículos de los investigadores proporcionan ejemplos de implementación de GAN basados en la biblioteca TensorFlow [12] [13] .
Las GAN se usan para obtener imágenes fotorrealistas , por ejemplo, para elementos de diseño industrial , diseño de interiores , ropa, bolsos, maletines, escenas de juegos de computadora, etc. Las GAN también se usan en la red Facebook [14] . Recientemente, las GAN se han utilizado para preparar fotogramas de películas o animaciones [15] . Además, estos sistemas ayudan a recrear un modelo tridimensional de un objeto utilizando imágenes fragmentarias [16] y mejorar las imágenes obtenidas a partir de observaciones astronómicas [17] .
Tipos de redes neuronales artificiales | |
---|---|
|
Aprendizaje automático y minería de datos | |
---|---|
Tareas | |
Aprendiendo con un maestro | |
análisis de conglomerados | |
Reducción de dimensionalidad | |
Pronóstico estructural | |
Detección de anomalías | |
Graficar modelos probabilísticos | |
Redes neuronales | |
Aprendizaje reforzado |
|
Teoría | |
revistas y congresos |
|