La detección de colisiones es un problema computacional de detección de intersecciones entre dos o más objetos. El tema se asocia con mayor frecuencia con su uso en motores de física , animación por computadora y robótica . Además de determinar si dos objetos han colisionado, los sistemas de detección de colisiones pueden calcular el tiempo de impacto e informar una variedad de contactos (conjunto de puntos de intersección) [1] . La respuesta a una colisión (lo que sucede cuando se detecta una colisión) depende del proceso particular que se modele. Los algoritmos de detección de colisiones hacen un amplio uso de conceptos del álgebra lineal y la geometría computacional. Los algoritmos de detección de colisiones son uno de los componentes principales de la física de los juegos de computadora tridimensionales .
El funcionamiento de un modelo físico implica la realización de experimentos físicos, como jugar al billar . La física del choque de bolas de billar está bien descrita por la física del estado sólido y la teoría del impacto perfectamente elástico . Las condiciones iniciales están establecidas por las características físicas absolutamente exactas de la mesa de billar y las bolas, así como por las coordenadas iniciales de las bolas. Dada la aceleración de la bola blanca (presumiblemente el resultado de que un jugador golpee la bola blanca con un taco), queremos calcular las trayectorias exactas de movimiento, velocidad y lugar de parada de todas las bolas usando un programa de computadora. Un motor de física que simule billar constará de varios componentes, uno de los cuales se encargará de calcular con precisión las colisiones entre bolas. Este componente es un ejemplo de una parte inestable del modelo: pequeños errores en los cálculos de colisión darán lugar a cambios significativos en los resultados: las posiciones finales de las bolas en la mesa.
Los juegos de computadora tienen aproximadamente los mismos requisitos para los motores de física, con la excepción de algunas diferencias significativas. Mientras que la simulación de experimentos físicos requiere la creación del aparato matemático más preciso que describa el mundo real, los juegos de computadora necesitan una física que solo parezca creíble, pero al mismo tiempo calculada en tiempo real , aunque sea crudamente. Se permiten compromisos siempre que se adapte al jugador y tenga un realismo visual aceptable. Por lo tanto, el cuerpo que se verifica en caso de colisión, el llamado hitbox , es más simple que un modelo de personaje tridimensional. En particular, en Team Fortress 2 los personajes tienen tres hitboxes:
En World of Tanks (y algunos otros simuladores de vehículos militares) se utiliza un sistema de detección de colisiones más sofisticado . Aquí, en lugar de un hitbox, se utiliza un modelo de colisión poligonal del tanque. Es mucho más tosco que el modelo visual de un vehículo de combate, pero te permite calcular con suficiente precisión el ángulo de impacto en el tanque de un proyectil, lo cual es importante a la hora de calcular la penetración y/o rebote, así como el impacto de proyectiles con pantallas articuladas. En World of Warships se utiliza un sistema de detección de colisiones aún más sofisticado . Aquí, no solo se calcula la colisión de un proyectil con un elemento de barco, sino también el impacto de los efectos del estallido de un proyectil: fragmentos, una onda de choque, teniendo en cuenta la ubicación de los detalles del modelo de colisión.
Los motores de física difieren en la forma en que reaccionan a las colisiones. Algunos usan la flexibilidad de los materiales para calcular la fuerza que resulta de una colisión y afecta el resultado de la colisión en intervalos de tiempo subsiguientes, lo cual es bastante costoso desde el punto de vista computacional. Algunos modelos calculan el tiempo de colisión aproximado mediante interpolación lineal, después de lo cual "hacen retroceder" el estado de la escena en un momento determinado y calculan la colisión en función de las leyes de conservación de la energía.
Algunos utilizan la interpolación lineal iterativa ( método de Newton ) para calcular el tiempo de colisión con una precisión mucho mayor que el resto de los cálculos. El método de detección de colisiones viola el principio de coherencia temporal para poder mejorar la precisión de los intervalos de tiempo sin aumentar la carga global de los recursos informáticos del sistema.
Después de una colisión inelástica , pueden ocurrir estados especiales de deslizamiento o reposo que, por ejemplo, se emulan utilizando restricciones en el motor de física libre Open Dynamics Engine . Las restricciones excluyen la inercia y, como resultado, la inestabilidad. Implementar el descanso en términos de un escenario gráfico evita desplazamientos.
En otras palabras, las implementaciones de modelos físicos generalmente se dividen en dos caminos:
Además de la división en enfoques a posteriori y a priori, casi todos los algoritmos modernos de detección de colisiones se dividen en una jerarquía de algoritmos.
En el caso del enfoque a posteriori, el cálculo del modelo se realiza mediante el cálculo de los estados de la escena en intervalos cortos de tiempo, cada uno de los cuales se verifica en busca de la presencia de objetos que se cruzan o se ubican tan cerca que pueden considerarse que se cruzan . . En cada paso de la simulación, se crea una lista de cuerpos que se cruzan, las posiciones y trayectorias de estos cuerpos se "corregen" teniendo en cuenta el hecho de la colisión. Este enfoque se llama a posteriori, porque de hecho se pierde el momento exacto inmediato de la colisión y se detecta algún tiempo después de que ocurriera (o algún tiempo antes, según el algoritmo).
Con el enfoque a priori, se crea un algoritmo de detección de colisiones que es capaz de predecir la trayectoria de los movimientos de los cuerpos físicos con gran precisión. Este modelo describe las colisiones con gran precisión y, en esencia, los cuerpos físicos nunca se encuentran en un estado de penetración mutua. Este enfoque se denomina a priori, ya que los momentos de colisión de los cuerpos se determinan antes del cambio en la configuración espacial de los objetos en la escena.
Sus principales ventajas se derivan del enfoque a posteriori. El algoritmo no necesita manipular una cantidad significativa de variables físicas: su entrada es una lista simple de cuerpos físicos, el resultado es un subconjunto de cuerpos que se cruzan. El algoritmo no tiene que lidiar con fuerzas de fricción, choques elásticos o, peor aún, inelásticos, y también calcular el cambio en el estado interno de los cuerpos deformables . Además, el algoritmo a posteriori es esencialmente más simple en una dimensión, ya que en el enfoque a priori uno tiene que lidiar con un eje adicional: el tiempo, del cual se salva el enfoque a posteriori.
Por otro lado, los algoritmos a posteriori generan problemas en la etapa de “corregir” las interpenetraciones de cuerpos que se han producido, que no se dan en una escena física real.
Las ventajas del enfoque a priori son la precisión y la estabilidad del modelo. Es difícil (pero teóricamente posible) separar completamente el componente físico del modelo de escena del algoritmo de detección de colisiones. En la mayoría de los casos, salvo en los más sencillos, el problema de predecir el momento de colisión de dos cuerpos a partir de unos datos iniciales no tiene una solución general abstraída del resto del modelo. Se utiliza el método numérico para encontrar la raíz.
Algunos cuerpos están en estado de contacto de reposo, es decir, están formalmente en constante colisión, lo que no conduce a movimientos de repulsión de los cuerpos ni a la interpenetración (por ejemplo, un jarrón sobre una mesa). En todos los casos, un contacto en reposo requiere un enfoque excepcional: si dos cuerpos chocan ("a posteriori") o se deslizan ("a priori") y su movimiento relativo está por debajo de un cierto umbral, la fricción se trata como adherencia y ambos objetos se combinan en una sola rama del escenario gráfico .
Los enfoques obvios para la detección de colisiones para una escena completa con muchos objetos son bastante lentos. Verificar el hecho de una colisión de cada objeto con cada uno es factible, pero extremadamente ineficiente en términos de complejidad computacional para una gran cantidad de objetos. La verificación de objetos con geometría compleja para detectar la presencia de una colisión entre sí mediante un método obvio de verificación de la colisión de caras individuales de cuerpos es muy costosa en sí misma. Por lo tanto, una cantidad significativa de investigación en el campo está dirigida a resolver problemas de rendimiento.
En muchas aplicaciones, la configuración de los cuerpos físicos cambia muy poco durante el período iterativo de tiempo. Muchos objetos en la escena no se mueven en absoluto. Los algoritmos se crean de tal manera que los resultados de los cálculos realizados en la iteración anterior se utilizan en la siguiente, lo que conduce a un aumento del rendimiento.
En el nivel de detección de colisión aproximada, el objetivo es encontrar objetos que puedan cruzarse potencialmente. Estos pares requieren más análisis. Uno de estos algoritmos fue desarrollado por Ming Chieh Lin de la Universidad de California en Berkeley [2] , quien propuso el uso del método de cajas delimitadoras, cuyos vectores de borde son colineales a los vectores base del sistema de coordenadas cartesianas, para todo N cuerpos de escena. Más tarde, estos cuadros delimitadores se conocieron como el cuadro delimitador alineado con el eje (AABB).
Cada paralelepípedo está representado por un triple de segmentos, por ejemplo . Un algoritmo común para detectar colisiones de cuadros delimitadores es el algoritmo de " barrido y podado " [ 3 ] . Obviamente, dos de esos paralelepípedos y se intersecan si y solo si se interseca con , se interseca con y se interseca con . Se supone que si de una iteración a la siguiente se intersecan, es muy probable que aún se crucen en la siguiente iteración. Además, si no se cruzaron en la iteración anterior, es muy probable que no se crucen en la siguiente.
Entonces, el problema se reduce al control iterativo de "marco" a "marco" para determinar cuál de los segmentos se cruzan. Hay tres listas de intervalos (uno para cada uno de los ejes de coordenadas), y los tres de la misma longitud, ya que la longitud de cada uno es igual a , según el número de objetos en la escena y, en consecuencia, sus cuadros delimitadores. Cada una de las listas corresponde a una matriz cuyos elementos son iguales a 1 ó 0. - si los segmentos y se cortan, y en caso contrario.
Suponga que la matriz permanece prácticamente sin cambios de una iteración a la siguiente. Para usar esto, la lista de segmentos de línea está contenida en forma de puntos extremos etiquetados. Cada elemento de la lista tiene las coordenadas del punto extremo y un número único que identifica el segmento. La lista se ordena por coordenadas y la matriz se actualiza en el orden apropiado. Es fácil verificar que el algoritmo indicado proporcionará un rendimiento suficientemente alto si la configuración de los cuadros delimitadores no cambia significativamente en una iteración.
En el caso de cuerpos deformables , como la representación de un modelo físico de un tejido , no hay forma de utilizar un método más específico: el algoritmo de eliminación de pares que se describe a continuación y los algoritmos que utilizan el enfoque de "poda de n cuerpos" se convierten en el mejor método. .
Si se puede imponer una restricción de valor máximo a la velocidad de los cuerpos físicos en la escena, se pueden eliminar pares de objetos de la lista de candidatos a colisión según la distancia inicial entre ellos y el tamaño del paso de iteración de tiempo .
Después de seleccionar un par de objetos de escena para un estudio más detallado, se requiere una verificación más detallada de una colisión. En muchas aplicaciones, algunos de los objetos (si su configuración geométrica es relativamente constante, es decir, no están sujetos a deformaciones severas) se describen mediante un conjunto de primitivas de pequeño tamaño, en su mayoría triángulos. Es decir, hay dos conjuntos de triángulos y (por simplicidad, se supone que la cardinalidad de los conjuntos es igual).
Una forma obvia de probar la colisión de los cuerpos es probar la colisión de todos los pares ordenados de triángulos. Sin embargo, la complejidad de tal verificación es extremadamente ineficiente. Se vuelve necesario, si es posible, usar un algoritmo de "caída" para reducir la cantidad de pares de triángulos que deben verificarse.
La familia de algoritmos más utilizada es el método de volumen límite jerárquico . Como paso preliminar, para cada objeto (en nuestro ejemplo, esto es y ) se calcula y asigna una jerarquía de objetos delimitadores. Después de eso, en cada iteración de tiempo, cuando se requiere verificar una colisión entre objetos y , se usan volúmenes delimitadores para reducir la cantidad de triángulos que caen bajo la prueba. Uno de los tipos más simples de volumen límite es una esfera.
Para un conjunto de triángulos , se puede calcular la esfera límite . Hay varias formas de elegir , la principal es que la esfera cubra por completo el conjunto de primitivas triangulares y al mismo tiempo sea lo más pequeña posible.
Al determinar la presencia de una colisión de cuerpos y , es posible en primer lugar calcular las esferas y . Es obvio que si estas esferas no se intersecan, entonces ambos y no se intersecan . Sin embargo, esto no es mucho más eficiente que el algoritmo de poda de n cuerpos.
Sea un conjunto de triángulos. Entonces se puede dividir en dos partes: y . De manera similar, uno puede particionar y precalcular las esferas delimitadoras y .
El cálculo es que estas esferas delimitadoras son mucho más pequeñas que y . Y, si, por ejemplo, y no se intersecan, entonces no tiene sentido verificar las intersecciones de los triángulos del conjunto con triángulos de .
En el curso de cálculos preliminares, es posible considerar cada cuerpo físico representado como un conjunto de triángulos y descomponerlo como un árbol binario , en el que los nodos (nodos) serán conjuntos de triángulos, y sus descendientes serán y . Para cada nodo de este árbol, se puede precalcular la esfera límite . En tal caso, cuando sea necesario verificar la colisión del siguiente par de cuerpos, sus árboles binarios precalculados de esferas límite se pueden usar para excluir una parte significativa de los conjuntos de triángulos que deben verificarse.
Muchas implementaciones adicionales de algoritmos de "árbol" se obtienen eligiendo otros objetos estereométricos como volúmenes delimitadores, en lugar de esferas. Al elegir un paralelepípedo orientado paralelo a los ejes del sistema de medición ( ing. cuadro delimitador alineado con el eje ), se obtienen los llamados árboles AABB ( ing. AABB-Trees ). Los árboles OBB (o árboles OOBB ) se obtienen utilizando una caja orientada según el propio sistema de coordenadas del objeto. Algunos de los árboles son más fáciles de actualizar si cambia el objeto principal. Algunos árboles pueden funcionar con primitivas de orden superior, como splines en lugar de triángulos elementales.
Después de que haya tenido lugar una reducción preliminar de pares de candidatos a una posible colisión, es necesario realizar una verificación exacta de la presencia de una colisión para cada par restante.
La observación principal es que para cualesquiera dos objetos convexos no contiguos, existe un plano tal que un objeto estará completamente en un lado de este plano y el otro en el otro. Este hecho permite desarrollar algoritmos rápidos de detección de colisiones para objetos convexos.
Los primeros trabajos en esta área delinearon los métodos del plano de separación . Dos triángulos chocan esencialmente solo cuando no pueden ser separados por un plano que pasa por tres vértices. Esto es así, si los triángulos y , donde cada vector está en , entonces puedes elegir tres vértices - , dibujar un plano a través de los tres y verificar si el plano se está separando. Si alguno de estos planos se está separando, entonces los triángulos no se cortan; y se cruzan si, por el contrario, ninguno de ellos se separa. Hay 20 aviones de este tipo en total.
Si los triángulos son coplanares, esta prueba no será completamente exitosa. Sin embargo, puede agregar planos, por ejemplo, perpendiculares a las caras de un triángulo, para resolver el problema en el caso general. En otros casos, los objetos que, por ejemplo, se tocan en sus bordes necesariamente también deben encontrar esquinas en alguna parte y, por lo tanto, un método general de detección de colisiones debe poder resolver el problema de la colisión.
Desde entonces, se han desarrollado mejores métodos. Actualmente, se dispone de algoritmos muy rápidos para encontrar los puntos más cercanos en la superficie de dos cuerpos poliédricos convexos. En 1993, M. C. Lin usó una variación del método simplex de la programación lineal en su disertación [4] . Posteriormente, el algoritmo de Gilbert-Johnson-Curthy reemplazó este enfoque. Estos algoritmos se aproximan a un tiempo de cálculo constante cuando se aplican secuencialmente a pares de cuerpos estacionarios o que se mueven lentamente cuando se usan con datos iniciales de una iteración anterior de detección de colisiones.
El resultado de todos estos avances es la capacidad de detectar colisiones en tiempo real para miles de cuerpos en movimiento en una computadora personal o consola de juegos típica .
En los casos en que la mayoría de los objetos en la escena están inmóviles, como suele ser el caso en los juegos de computadora, se pueden usar métodos a priori que usan cálculos previos para acelerar los cálculos.
En estas situaciones, es deseable la poda (eliminación): tanto la "poda de n cuerpos" como la poda por pares. Sin embargo, estos algoritmos tardan en calcularse y tener en cuenta los tipos de movimiento utilizados en el sistema físico subyacente.
Cuando se trata de una detección precisa de colisiones por pares, el algoritmo se vuelve altamente dependiente de la trayectoria de los cuerpos involucrados en la colisión, y para al menos un cuerpo se requiere usar un algoritmo numérico de búsqueda de raíces para calcular el momento de la colisión.
Como ejemplo, considere dos triángulos que se mueven en el tiempo: y . En cualquier momento, estos dos triángulos pueden probarse para la intersección utilizando los veinte planos discutidos anteriormente. Sin embargo, el proceso se puede mejorar ya que estos veinte aviones se pueden rastrear a lo largo del tiempo. Si es un plano que pasa por los puntos en , significa que hay veinte planos disponibles para el seguimiento. Cada plano debe seguirse con respecto a tres vértices, lo que da sesenta valores de seguimiento. El uso de la búsqueda de raíz para estas sesenta funciones calcula el tiempo de colisión exacto para dos triángulos dados y para dos trayectorias dadas. Si las trayectorias de los vértices se consideran polinomios lineales (polinomios) en , entonces las sesenta funciones finales son polinomios cúbicos y, en este caso excepcional, es posible encontrar el tiempo exacto de colisión utilizando la fórmula de las raíces cúbicas. Algunos expertos en análisis numérico creen que usar la fórmula de la raíz cúbica no es numéricamente tan estable como usar el enraizamiento polinomial.
Los algoritmos alternativos se pueden agrupar por el hecho de que usan partición espacial , que incluye árboles BSP , octrees y otros enfoques similares . Si el algoritmo de partición espacial aplicado divide la escena con objetos en un conjunto de regiones, y si dos objetos están en regiones diferentes, entonces no se verifican las intersecciones. Dado que los árboles BSP se pueden precalcular, este enfoque es muy adecuado para manejar paredes y otros obstáculos fijos en los juegos. Estos algoritmos de partición de espacio son generalmente más antiguos que los algoritmos descritos anteriormente.
Los juegos de computadora, especialmente los juegos de consola , deben distribuir muchas de sus tareas entre recursos de hardware muy limitados y tiempos de ejecución de procesos de juego muy limitados. A pesar de estas limitaciones y del uso de algoritmos de detección de colisiones relativamente primitivos e inexactos, los desarrolladores de juegos han podido crear subsistemas físicos visualmente creíbles y relativamente realistas.
Durante mucho tiempo, en los juegos de computadora había un número muy limitado de objetos que interactuaban físicamente entre sí y, por lo tanto, verificar todos los objetos en busca de intersecciones no era un problema. En los juegos 2D, en algunos casos, el hardware pudo detectar e informar de manera eficiente los píxeles que se cruzan entre los sprites en la pantalla. En otros casos, el descarte efectivo (reducción) se proporcionó mediante mosaico simple (rompiendo en fragmentos - mosaicos ) de la pantalla y vinculando cada objeto al mosaico con el que se cruza. Se usaron cuadros delimitadores y/o círculos para verificar las intersecciones por pares, lo que se consideró bastante preciso.
Los juegos 3D usan técnicas de partición espacial para la "poda de n cuerpos" y han usado durante mucho tiempo una o más esferas delimitadoras para un solo objeto 3D para verificar las intersecciones por pares. Los controles precisos han sido muy raros, a excepción de los juegos que intentan imitar la realidad con relativa precisión. Pero incluso en estos casos, no siempre se llevan a cabo controles precisos de las intersecciones, sino solo en los lugares y/o situaciones más importantes desde el punto de vista del juego.
Basado en el hecho de que los juegos no necesitan imitar con precisión la realidad, la estabilidad no es crítica. Casi todos los juegos utilizan métodos de detección de colisiones a posteriori , y las colisiones a menudo se resuelven aplicando reglas muy simples. Por ejemplo, si un personaje virtual "atraviesa" una pared, simplemente se puede mover de nuevo a su última posición "correcta" conocida. Algunos juegos no detectan colisiones en absoluto, sino que simplemente miden la distancia recorrida por el personaje, y si esa distancia es igual o mayor que una distancia predeterminada que el personaje puede caminar (por ejemplo, la longitud de una habitación desde la pared a la pared), luego evite que se mueva más.
En la mayoría de los juegos de ordenador, los objetos principales para evitar colisiones y penetraciones son el terreno y el entorno del nivel: estructuras estáticas, no interactivas y no destructibles (montañas, árboles, edificios, vallas, etc.). En este caso, el personaje está representado por un solo punto, y el método de partición del espacio binario proporciona una forma viable, simple y eficiente de verificar si el punto que representa al personaje está en el entorno o no. Las colisiones entre personajes y otros objetos dinámicos se consideran y manejan por separado.
Un simulador robusto de detección y resolución de colisiones es aquel que responderá de manera inteligente a cualquier entrada. Basado en el enfoque a posteriori de la detección de colisiones, se puede suponer que en un juego de carreras , el jugador, acelerando a alta velocidad en un automóvil, chocará contra un obstáculo como una pared y el sistema de detección de colisiones detectará una colisión después. ha pasado, y en ese momento el coche ya estará "hundido" contra una pared o incluso "caerá en un vacío sin fin" llamado "infierno negro", "infierno azul" o "infierno verde", según el color dominante en el motor gráfico . Por lo tanto, un mecanismo de detección de colisiones a posteriori debe manejar correctamente tales situaciones. Una de las soluciones a tales situaciones es el concepto de "detección continua de colisiones" ( ing. Continuous Collision Detection ). [5]