El flujo óptico es una visualización (en un gráfico visual o en forma de modelo matemático) del movimiento aparente de objetos, superficies o bordes de la escena, como resultado del movimiento del observador (ojos o cámara) en relación con la escena. Los algoritmos basados en el flujo óptico , como la detección de movimiento, la segmentación de objetos, la codificación de movimiento y el recuento de disparidad estéreo, utilizan este movimiento de objetos, superficies y bordes.
Las secuencias de imágenes ordenadas permiten estimar el movimiento ya sea como la velocidad instantánea de la imagen o como un desplazamiento discreto [1] Fleet y Weiss han compilado un tutorial sobre el método de gradiente de estimación de flujo óptico [2] .
John L. Barron, David J. Fleet y Steven Beauchemin llevaron a cabo un análisis de métodos para calcular el flujo óptico. Consideran los métodos tanto en términos de precisión como en términos de la densidad del campo vectorial resultante. [3]
Los métodos basados en el flujo óptico calculan el movimiento entre dos fotogramas tomados a la vez y en cada píxel . Estos métodos se denominan diferenciales ya que se basan en la aproximación de la señal por un segmento de la serie de Taylor ; por lo tanto, utilizan derivadas parciales con respecto a las coordenadas de tiempo y espacio.
En el caso de dimensión 2D+ t (los casos de dimensiones superiores son similares), el píxel en la posición con la intensidad por cuadro se moverá por , y , y se puede escribir la siguiente ecuación:
Suponiendo que el desplazamiento es pequeño y usando la serie de Taylor, obtenemos:
.De estas igualdades se sigue:
o
por lo tanto resulta que
dónde
De este modo:
o
La ecuación resultante contiene dos incógnitas y no se puede resolver de forma única. Esta circunstancia se conoce como problema de apertura . El problema se resuelve imponiendo restricciones adicionales: la regularización .
La investigación del flujo óptico se está llevando a cabo ampliamente en los campos de la compresión de video y el análisis de movimiento. Los algoritmos de flujo óptico no solo determinan el campo de flujo, sino que también utilizan el flujo óptico en el análisis de la esencia tridimensional y la estructura de la escena, así como el movimiento 3D de los objetos y el observador en relación con la escena.
El flujo óptico se utiliza en robótica para el reconocimiento de objetos, el seguimiento de objetos, la detección de movimiento y la navegación de robots.
Además, el flujo óptico se utiliza para estudiar la estructura de los objetos. Dado que la detección de movimiento y la creación de mapas de la estructura del entorno son una parte integral de la visión animal (humana), la implementación de esta habilidad innata por medio de una computadora es una parte integral de la visión artificial.
Imagina un video de cinco fotogramas en el que la pelota se mueve desde la parte inferior izquierda hacia la parte superior derecha. Los métodos para encontrar el movimiento pueden determinar que en un plano bidimensional la pelota se mueve hacia arriba y hacia la derecha, y los vectores que describen este movimiento se pueden obtener a partir de una secuencia de fotogramas. En compresión de video, esta es la descripción correcta de la secuencia de fotogramas. Sin embargo, en el campo de la visión por computadora, sin información adicional, es imposible decir si la pelota se mueve hacia la derecha y el observador está quieto, o si la pelota está en reposo y el observador se mueve hacia la izquierda.
James Gibson consideró los modelos de flujo óptico (invariantes ópticos) como un estímulo de orden superior. Los modelos de flujo óptico en la teoría de Gibson son configuraciones complejas de información óptica registrada por receptores visuales. El flujo óptico contiene toda la información necesaria para nuestra percepción sobre el mundo que nos rodea, los eventos que tienen lugar en él, incluida la información sobre el movimiento (incluido el paralaje de movimiento y el gradiente de expansión óptica). Así, el flujo óptico excluye de la psicología de la percepción la necesidad de utilizar cualquier otra información externa [6] .
La idea de utilizar el flujo óptico para explicar el proceso de formación de una imagen perceptiva se le ocurrió a Gibson durante la Segunda Guerra Mundial durante el trabajo en la creación de simuladores especiales y una película de entrenamiento para la formación de pilotos de la Fuerza Aérea de EE. UU.