Alineación espacial

La alineación espacial  es una forma de establecer la homología entre dos o más estructuras poliméricas en función de su estructura tridimensional. Este proceso generalmente se aplica a la estructura terciaria de las proteínas , pero también se puede usar para moléculas de ARN grandes . A diferencia de la superposición de estructuras simples, donde se conocen al menos algunos residuos de aminoácidos equivalentes , la alineación espacial no requiere ningún dato previo aparte de las coordenadas atómicas .

La alineación espacial es adecuada para comparar proteínas con secuencias diferentes cuando las relaciones evolutivas no pueden establecerse mediante métodos estándar de alineación de secuencias , pero en este caso debe tenerse en cuenta la influencia de la evolución convergente .

La alineación espacial permite la comparación de dos o más moléculas para las que se conocen estructuras tridimensionales. Los dos métodos principales para obtenerlos son el análisis de difracción de rayos X y la espectroscopia de RMN . Las estructuras derivadas de los métodos de predicción de estructuras de proteínas también se pueden utilizar para la alineación espacial . Los alineamientos espaciales son especialmente importantes para el análisis de los datos obtenidos por métodos de genómica estructural y proteómica, también se pueden utilizar para evaluar los alineamientos obtenidos mediante la comparación de secuencias [1] .

Datos de alineación estructural

El resultado de los programas de alineación estructural, por regla general, es la combinación de conjuntos de coordenadas atómicas y la desviación estándar mínima (RMSD) entre estructuras. Además, se pueden calcular parámetros más complejos que evalúan la similitud estructural, por ejemplo, la prueba de distancia global [2] . RMSD indica el grado de divergencia de las estructuras alineadas. La alineación estructural puede ser difícil debido a la presencia de múltiples dominios en la estructura de las proteínas que se alinean, ya que los cambios en la posición relativa de estos dominios entre dos estructuras pueden cambiar artificialmente el valor de RMSD. Un correspondiente alineamiento unidimensional de secuencias se deriva directamente del alineamiento estructural y también se puede utilizar para calcular la proporción de residuos de aminoácidos que son idénticos entre dos proteínas.

Tipos de comparación

Para crear una alineación estructural y calcular los valores RMSD correspondientes, se pueden utilizar tanto todos los átomos de la molécula de proteína como sus subconjuntos. Por ejemplo, los átomos de los radicales laterales de los residuos de aminoácidos no siempre se tienen en cuenta, y solo los átomos incluidos en el esqueleto peptídico de la molécula pueden usarse para la alineación. Esta opción se elige si las estructuras alineadas tienen una secuencia de aminoácidos muy diferente y los radicales laterales difieren en un gran número de residuos. Por esta razón, por defecto, los métodos de alineación espacial usan solo átomos de la columna vertebral involucrados en un enlace peptídico . Para una mayor simplificación y aumento de la eficiencia, a menudo se usa la posición de solo los átomos de carbono alfa , ya que su posición determina con bastante precisión la posición de los átomos del esqueleto polipeptídico. Solo cuando se alinean estructuras muy similares o incluso idénticas es importante tener en cuenta las posiciones de los átomos de la cadena lateral. En este caso, RMSD refleja no solo la similitud de la conformación del esqueleto de la proteína, sino también los estados rotámeros de las cadenas laterales. Otras formas de reducir el ruido y aumentar el número de coincidencias correctas son el etiquetado de elementos de estructura secundaria , mapas de contacto nativos o patrones de interacción de residuos, medidas del grado de empaquetamiento de cadenas laterales y medidas de conservación de enlaces de hidrógeno [3] .

La forma más sencilla de comparar dos estructuras no requiere la alineación de las estructuras en sí, sino que utiliza la alineación de secuencias. Determina qué pares de residuos de aminoácidos se asignan entre sí, y luego solo se usan para calcular RMSD. La superposición estructural se usa comúnmente para comparar múltiples conformaciones de la misma proteína (en cuyo caso ni siquiera es necesario alinear secuencias) y para evaluar la calidad de las alineaciones de secuencias si se conocen estructuras para ellas. Tradicionalmente, cuando se superponen estructuras, se utiliza un método simple de mínimos cuadrados , en el que las rotaciones y traslaciones óptimas se encuentran minimizando la suma de las distancias al cuadrado entre todas las estructuras en la superposición [4] . Recientemente, dicha búsqueda se ha vuelto más precisa debido a los métodos de máxima verosimilitud y métodos bayesianos [5] [6] .

Se han desarrollado algoritmos basados ​​en rotaciones multidimensionales y cuaterniones modificados para determinar las relaciones topológicas entre estructuras de proteínas sin construir alineaciones de secuencias. Dichos algoritmos han identificado con éxito pilas canónicas como el paquete de cuatro hélices [7] . El método SuperPose permite tener en cuenta las rotaciones de dominio relativas y otros momentos complicados de alineación estructural [8] .

Representación de estructuras

Para comparar las estructuras de las proteínas es necesario representarlas en un espacio que no dependa de coordenadas. Esto generalmente se logra con una matriz de secuencia contra secuencia o una serie de matrices que incluyen medidas de comparación que se refieren a un espacio de coordenadas fijo en lugar de distancias absolutas. Una forma obvia de representar esto es mediante una matriz de distancia , que es una matriz bidimensional que contiene todas las distancias por pares entre algún conjunto de átomos en cada estructura (por ejemplo, carbonos alfa ). La dimensión de tal matriz crece con un aumento en el número de estructuras comparadas simultáneamente. Representando la proteína en forma de grandes partes, como elementos de estructura secundaria (SSE) u otros fragmentos estructurales, también es posible obtener una alineación razonable, a pesar de la pérdida de información de distancias no contabilizadas, ya que el ruido de ellos no ser tomado en cuenta. Por lo tanto, la elección de una forma de representar una proteína para facilitar el cálculo es fundamental para el desarrollo de un algoritmo de alineación eficiente [9] .

Complejidad computacional

Solución óptima

Se ha demostrado que el " estiramiento " óptimo de una secuencia de proteína a través de una estructura conocida y la construcción de un alineamiento óptimo de múltiples secuencias son problemas NP-completos [10] [11] . Sin embargo, el problema habitual de alineación estructural no es NP-completo. Estrictamente hablando, la solución óptima al problema de alineación estructural de proteínas se conoce solo para ciertas medidas de similitud de estructuras de proteínas, por ejemplo, las medidas utilizadas en los problemas de predicción de estructuras de proteínas GDT_TS [2] y MaxSub [12] . Estas medidas se pueden optimizar utilizando un algoritmo capaz de maximizar el número de átomos en dos proteínas que se pueden combinar, siempre que satisfagan un umbral predeterminado para la distancia entre ellos. Desafortunadamente, el algoritmo de alineación óptimo no es práctico, ya que su tiempo de ejecución depende no solo de la longitud de las secuencias, sino también de la geometría de las proteínas que se alinean [13] .

Solución aproximada

También se han desarrollado algoritmos de alineación estructural aproximada que operan en tiempo polinomial y producen toda una familia de soluciones "óptimas" dentro del parámetro de aproximación para una función de conteo dada [13] [14] . Aunque teóricamente el problema del alineamiento estructural aproximado de las proteínas se da fácilmente a tales algoritmos, todavía son costosos desde el punto de vista computacional para el análisis a gran escala de estructuras de proteínas. Como consecuencia, no existen algoritmos prácticos que, con una función de conteo dada, converjan a una solución de alineación global. Por esta razón, la mayoría de los algoritmos son heurísticos , pero se han desarrollado algoritmos prácticos que garantizan la convergencia al menos a una maximización local de la función de conteo [15] .

Métodos

La alineación estructural se usa tanto cuando se comparan estructuras individuales o sus conjuntos, como cuando se crean bases de datos de comparaciones "todos con todos" ("todos con todos"), que reflejan las diferencias entre cada par de estructuras presentes en Protein Data. Banco (PDB). Tales bases de datos se usan comúnmente para clasificar proteínas según su plegamiento.

DALI

Uno de los métodos populares de alineación estructural es DALI ( método de matriz de alineación de distancia  ) .  En él, las estructuras originales de las proteínas se descomponen en hexapéptidos y se calcula una matriz de distancias evaluando patrones de contacto entre fragmentos. Los elementos de la estructura secundaria, cuyos restos son adyacentes en la secuencia, están en la diagonal principal de la matriz; las diagonales restantes de la matriz reflejan contactos espaciales entre residuos que no están uno al lado del otro en la secuencia. Si estas diagonales son paralelas a la diagonal principal, entonces los elementos de la estructura secundaria que representan también son paralelos; si, por el contrario, son perpendiculares a ella, entonces sus elementos de la estructura secundaria son antiparalelos. Tal representación requiere mucha memoria, ya que la matriz utilizada es simétrica con respecto a la diagonal principal (y por lo tanto redundante) [16] .

Cuando las matrices de distancia de dos proteínas tienen elementos iguales o similares en aproximadamente las mismas posiciones, se puede decir que las proteínas tienen un pliegue similar y sus elementos de estructura secundaria están conectados por bucles de aproximadamente la misma longitud. El proceso directo de alineación DALI es buscar similitudes en las matrices construidas para las dos proteínas; esto generalmente se hace con una serie de submatrices superpuestas de 6 × 6. Las coincidencias de la submatriz luego se vuelven a ensamblar en una alineación final utilizando el algoritmo de maximización de puntaje estándar. La versión original de DALI usa simulación Monte Carlo para maximizar el valor de similitud espacial, que es una función de las distancias entre los átomos correspondientes asumidos. En particular, el peso de los átomos más distantes dentro de los elementos estructurales respectivos se reduce exponencialmente para reducir el ruido causado por la movilidad del bucle, la deformación de la hélice y otras pequeñas variaciones estructurales [9] . Dado que DALI se basa en una matriz de distancia de todos contra todos, el método puede tener en cuenta la disposición de elementos de estructuras en un orden diferente en dos secuencias comparadas.

El método DALI se utilizó para crear la base de datos FSSP ( Familias de  proteínas estructuralmente similares ), en la que todas las estructuras de proteínas conocidas se alinearon por pares para determinar su relación espacial y clasificación de pliegues [17] .

DaliLite es un programa descargable que utiliza el algoritmo DALI [18] .

Expansión combinatoria

El método de  extensión combinatoria (CE) es similar a DALI en el sentido de que también divide cada estructura en varios fragmentos, que luego intenta volver a ensamblar en una alineación completa. Se utiliza una serie de combinaciones de fragmentos por pares, denominadas AFP ( pares de fragmentos alineados   ), para definir una matriz de similitud a través de la cual se dibuja una ruta óptima para determinar la alineación final. Solo aquellas AFP que cumplen con los criterios de similitud local dados se incluyen en la matriz, lo que reduce el espacio de búsqueda requerido y aumenta la eficiencia [19] . Son posibles diferentes medidas de similitud; Inicialmente, el método CE usaba solo alineaciones estructurales y distancias entre residuos, pero con el tiempo se ha extendido para usar propiedades locales como estructura secundaria, accesibilidad de solventes, patrones de enlaces de hidrógeno y ángulos diédricos [19] .

La ruta correspondiente a la alineación se calcula como la ruta óptima a través de la matriz de similitud pasando linealmente a través de las secuencias, extendiendo la alineación de la siguiente AFP de puntuación alta posible. La AFP inicial que inicia la alineación se puede seleccionar en cualquier punto de la matriz de secuencias. A continuación, hay una extensión a la AFP, que satisface el criterio especificado para una distancia que limita el tamaño de los espacios (brechas) en la alineación. El tamaño de cada AFP y la mayor longitud de la brecha son parámetros de entrada requeridos, pero generalmente se establecen en valores determinados empíricamente de 8 y 30, respectivamente [19] . Similar a DALI o SSAP, CE se utilizó para generar una base de datos de clasificación de pliegues basada en las estructuras espaciales de proteínas conocidas del PDB. Recientemente, el PDB lanzó una versión actualizada de CE que puede detectar permutaciones cíclicas en la estructura de las proteínas [20] .

SSAP

El  método SSAP ( Programa de Alineación Estructural Secuencial ) utiliza programación dinámica dual para construir una alineación estructural basada en vectores átomo a átomo en el espacio estructural. En lugar de los carbonos alfa comúnmente utilizados en las alineaciones estructurales, SSAP define sus vectores de átomos beta para todos los residuos de aminoácidos excepto la glicina . Así, este método tiene en cuenta la posición del rotámero de cada residuo, así como su posición en el esqueleto. Primero, para cada proteína, SSAP construye una serie de vectores de distancia entre cada residuo y su vecino más cercano, pero no consecutivo. Después de eso, se construye una serie de matrices que contienen la diferencia de vectores entre vecinos para cada par de residuos para los que se construyeron los vectores. Para cada matriz resultante, se determina un conjunto de alineaciones locales óptimas mediante programación dinámica. Luego, las alineaciones resultantes se agregan a una matriz generalizada, a la que se aplica nuevamente la programación dinámica para determinar la alineación estructural completa. Inicialmente, SSAP creaba solo alineaciones por pares, pero luego se amplió para crear múltiples alineaciones [21] . Se ha aplicado a una alineación de todos contra todos para crear un sistema de clasificación de pila jerárquica conocido como CATH, que se utiliza en la base de datos de clasificación de estructuras de proteínas CATH [22] .

Desarrollos recientes

La mejora de las técnicas de alineación espacial sigue siendo un área de investigación activa. Los métodos nuevos o modificados a menudo tienen ventajas sobre las técnicas más antiguas y más utilizadas. Un ejemplo reciente es el programa TM-align [23] , que utiliza un nuevo método para ponderar una matriz de distancia, que luego se programa dinámicamente . La ponderación acelera la convergencia de programación dinámica y corrige el efecto de la longitud de alineación. Las pruebas han demostrado que TM-align funciona con mayor precisión y velocidad que DALI y CE [24] .

Sin embargo, con los nuevos avances algorítmicos y los avances en el poder de cómputo, ha quedado claro que no existe un criterio universal para la alineación óptima. Por lo tanto, los desarrollos recientes se han centrado en optimizar parámetros específicos como la velocidad, la puntuación, la correlación con estándares de oro alternativos o la robustez ante errores de datos estructurales o modelos estructurales ab initio . Una metodología alternativa que está ganando popularidad es el uso de un consenso de múltiples métodos para refinar las similitudes estructurales de las proteínas [25] .

Alineación flexible

Los algoritmos de alineación estructural estándar implican rigidez de las estructuras que se alinean, lo que no refleja la realidad biológica. Por lo tanto, se han desarrollado algoritmos de alineación flexibles que consideran la posibilidad de movimiento de dos fragmentos dentro de una proteína entre sí, así como permutaciones internas de fragmentos. Uno de esos algoritmos es FATCAT [26] . Utiliza AFP como CE (consulte la sección relacionada ) e intenta hacer una cadena larga de ellas, pero la conexión entre AFP adyacentes se considera flexible y el algoritmo la dobla si esto mejora la superposición de estructuras. FATCAT resume espacios, giros y adiciones simples de nuevos pares a una parte alineada en una sola función de puntuación y crea una alineación al mismo tiempo que determina las secciones del bucle usando programación dinámica.

Se ha demostrado que la alineación flexible supera a la alineación rígida en términos de superposición geométrica y búsqueda de similitud en las estructuras [27] .

Alineación inconsistente

A veces, las proteínas pueden contener fragmentos similares dispuestos en un orden diferente, lo que no se tiene en cuenta en los algoritmos clásicos. Los métodos de alineación no consecutivos que son independientes del orden de los elementos de la estructura pueden manejar estos casos. Ejemplos son los programas FATCAT, MASS [28] , MultiProt [29] .

Alineación de complejos moleculares

En algunos casos, existe la necesidad de comparar las estructuras no de moléculas de proteínas individuales, sino de complejos de proteínas con proteínas o ácidos nucleicos . La construcción de tales alineaciones es difícil por varias razones. Primero, las áreas a menudo alineadas están dispersas por todo el complejo, mientras que las cadenas específicas solo están parcialmente alineadas. En segundo lugar, es necesario tener en cuenta la movilidad de las cadenas proteicas, el movimiento de dominios y el reordenamiento de las subunidades. En tercer lugar, en los complejos hay repeticiones y simetrías que no pueden superponerse simultáneamente. Además, una gran cantidad de átomos alineados impone requisitos adicionales en la velocidad de los cálculos. Para realizar tal tarea, el algoritmo TopMatch [30] construye alineaciones locales exactas, a partir de las cuales se construye una alineación completa. La calidad de la alineación se evalúa por su longitud y por la desviación espacial de las estructuras alineadas. Puede utilizar el método en el servicio web TopMatch.

Alineación de ARN

Las moléculas grandes de ARN , como las moléculas de proteína, se caracterizan por una estructura espacial compleja, que se mantiene unida mediante el emparejamiento de bases a través de enlaces de hidrógeno y el apilamiento . Sin embargo, es muy difícil obtener datos genómicos para ARN no codificantes con funciones similares, ya que tales moléculas, como las proteínas, tienen una estructura de secuencia mucho más conservadora, pero el alfabeto de ARN es mucho más pequeño (4 nucleótidos en lugar de 20 aminoácidos). , por lo que la información intrínseca de cualquier nucleótido en posiciones inferiores a las del residuo de aminoácido [31] .

Sin embargo, en relación con el creciente interés en el ARN y el aumento en el número de estructuras 3D de ARN establecidas experimentalmente, se han desarrollado métodos para evaluar la similitud estructural del ARN. Uno de estos métodos, SETTER  , rompe cada estructura de ARN en fragmentos más pequeños llamados unidades de estructura secundaria común (GSSU). Las GSSU también están sujetas a una alineación espacial, y estas alineaciones parciales se combinan en una alineación total [32] [33] .

FOLDALIGN  es un método para construir alineaciones por pares de moléculas de ARN con baja similitud de secuencia [34] . Este método difiere de los métodos para la alineación espacial de proteínas en que él mismo predice las estructuras espaciales de las secuencias de ARN suministradas como entrada, en lugar de utilizar estructuras establecidas experimentalmente suministradas como entrada. Si bien aún no se ha resuelto el problema de predecir el plegamiento de proteínas , se puede predecir la estructura espacial de una molécula de ARN sin pseudonudos [35] .

Notas

  1. Zhang Y. , Skolnick J. El problema de predicción de la estructura de la proteína podría resolverse utilizando la biblioteca PDB actual.  (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 2005. - vol. 102, núm. 4 . - Pág. 1029-1034. -doi : 10.1073 / pnas.0407152101 . —PMID 15653774 .
  2. 1 2 Zemla A. LGA: Un método para encontrar similitudes 3D en estructuras de proteínas.  (Inglés)  // Investigación de ácidos nucleicos. - 2003. - vol. 31, núm. 13 _ - Pág. 3370-3374. — PMID 12824330 .
  3. Godzik A. La alineación estructural entre dos proteínas: ¿hay una respuesta única?  (inglés)  // Ciencia de las proteínas: una publicación de la Protein Society. - 1996. - vol. 5, núm. 7 . - Pág. 1325-1338. -doi : 10.1002/ pro.5560050711 . —PMID 8819165 .
  4. Martín ACR. Comparación rápida de estructuras de proteínas  //  Acta Crystallogr A : diario. - Unión Internacional de Cristalografía , 1982. - Vol. 38 , núm. 6 _ - Pág. 871-873 . - doi : 10.1107/S0567739482001806 .
  5. Theobald DL , Wuttke DS Modelos jerárquicos bayesianos empíricos para regularizar la estimación de máxima verosimilitud en el problema de matriz gaussiana de Procrustes.  (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 2006. - vol. 103, núm. 49 . - Pág. 18521-18527. -doi : 10.1073 / pnas.0508445103 . — PMID 17130458 .
  6. Theobald DL , Wuttke DS THESEUS: superposición de máxima verosimilitud y análisis de estructuras macromoleculares.  (Inglés)  // Bioinformática. - 2006. - vol. 22, núm. 17 _ - Pág. 2171-2172. -doi : 10.1093 / bioinformática/btl332 . —PMID 16777907 .
  7. Diederichs K. Superposición estructural de proteínas con alineación desconocida y detección de similitud topológica mediante un algoritmo de búsqueda de seis dimensiones.  (Inglés)  // Proteínas. - 1995. - vol. 23, núm. 2 . - Pág. 187-195. - doi : 10.1002/prot.340230208 . — PMID 8592700 .
  8. Maiti R. , Van Domselaar G.H. , Zhang H. , Wishart D.S. SuperPose: un servidor simple para una superposición estructural sofisticada.  (Inglés)  // Investigación de ácidos nucleicos. - 2004. - vol. 32. - Pág. 590-594. doi : 10.1093 / nar/gkh477 . — PMID 15215457 .
  9. 12 Monte DM . Bioinformática: Análisis de Secuencias y Genomas. — 2ª ed. - Nueva York, 2004. - ISBN 0879697121 .
  10. Lathrop RH El problema del enhebrado de proteínas con preferencias de interacción de secuencias de aminoácidos es NP-completo.  (Inglés)  // Ingeniería de proteínas. - 1994. - vol. 7, núm. 9 _ - Pág. 1059-1068. —PMID 7831276 .
  11. Wang L. , Jiang T. Sobre la complejidad de la alineación de secuencias múltiples.  (Inglés)  // Revista de biología computacional: una revista de biología celular molecular computacional. - 1994. - vol. 1, no. 4 . - Pág. 337-348. -doi : 10.1089/ cmb.1994.1.337 . — PMID 8790475 .
  12. Siew N. , Elofsson A. , Rychlewski L. , Fischer D. MaxSub: una medida automatizada para la evaluación de la calidad de predicción de la estructura de proteínas.  (Inglés)  // Bioinformática. - 2000. - vol. 16, núm. 9 _ - Pág. 776-785. —PMID 11108700 .
  13. 1 2 Poleksic A. Algoritmos para la alineación óptima de la estructura de proteínas.  (Inglés)  // Bioinformática. - 2009. - Vol. 25, núm. 21 . - Pág. 2751-2756. -doi : 10.1093 / bioinformática/btp530 . —PMID 19734152 .
  14. Kolodny R. , Linial N. Alineación estructural aproximada de proteínas en tiempo polinomial.  (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 2004. - vol. 101, núm. 33 . - Pág. 12201-12206. -doi : 10.1073 / pnas.0404383101 . — PMID 15304646 .
  15. Martínez L. , Andreani R. , Martínez JM Algoritmos convergentes para el alineamiento estructural de proteínas.  (Inglés)  // BMC bioinformática. - 2007. - vol. 8. - Pág. 306. - doi : 10.1186/1471-2105-8-306 . — PMID 17714583 .
  16. Holm L. , Sander C. Mapeo del universo de proteínas.  (Inglés)  // Ciencia (Nueva York, NY). - 1996. - vol. 273, núm. 5275 . - Pág. 595-603. —PMID 8662544 .
  17. Holm L. , Sander C. Dali/FSSP clasificación de pliegues de proteínas tridimensionales.  (Inglés)  // Investigación de ácidos nucleicos. - 1997. - vol. 25, núm. 1 . - Pág. 231-234. —PMID 9016542 .
  18. Holm L. , Park J. Banco de trabajo DaliLite para comparación de estructuras de proteínas.  (Inglés)  // Bioinformática. - 2000. - vol. 16, núm. 6 _ - Pág. 566-567. —PMID 10980157 .
  19. 1 2 3 Shindyalov IN , Bourne PE Alineación de la estructura de la proteína mediante extensión combinatoria incremental (CE) de la ruta óptima.  (Inglés)  // Ingeniería de proteínas. - 1998. - vol. 11, núm. 9 _ - Pág. 739-747. — PMID 9796821 .
  20. Prlic A. , Bliven S. , Rose PW , Bluhm WF , Bizon C. , Godzik A. , Bourne PE Alineaciones de estructuras de proteínas precalculadas en el sitio web RCSB PDB.  (Inglés)  // Bioinformática. - 2010. - Vol. 26, núm. 23 . - Pág. 2983-2985. -doi : 10.1093 / bioinformática/btq572 . —PMID 20937596 .
  21. Taylor WR , Flores TP , Orengo CA Alineación de estructuras de proteínas múltiples.  (inglés)  // Ciencia de las proteínas: una publicación de la Protein Society. - 1994. - vol. 3, núm. 10 _ - Pág. 1858-1870. -doi : 10.1002/ pro.5560031025 . — PMID 7849601 .
  22. Orengo CA , Michie AD , Jones S. , Jones DT , Swindells MB , Thornton JM CATH: una clasificación jerárquica de estructuras de dominio de proteínas.  (Inglés)  // Estructura (Londres, Inglaterra: 1993). - 1997. - vol. 5, núm. 8 _ - Pág. 1093-1108. — PMID 9309224 .
  23. Zhang Y. , Skolnick J. TM-align: un algoritmo de alineación de estructuras de proteínas basado en la puntuación TM.  (Inglés)  // Investigación de ácidos nucleicos. - 2005. - vol. 33, núm. 7 . - Pág. 2302-2309. doi : 10.1093 / nar/gki524 . —PMID 15849316 .
  24. Zhang Y. , Skolnick J. Función de puntuación para la evaluación automatizada de la calidad de la plantilla de la estructura de la proteína.  (Inglés)  // Proteínas. - 2004. - vol. 57, núm. 4 . - Pág. 702-710. - doi : 10.1002/prot.20264 . — PMID 15476259 .
  25. Barthel D. , Hirst JD , Błazewicz J. , Burke EK , Krasnogor N. ProCKSI: un sistema de soporte de decisiones para la comparación, el conocimiento, la similitud y la información de proteínas (estructura).  (Inglés)  // BMC bioinformática. - 2007. - vol. 8. - Pág. 416. - doi : 10.1186/1471-2105-8-416 . —PMID 17963510 .
  26. Ye Y. , Godzik A. FATCAT: un servidor web para la comparación de estructuras flexibles y la búsqueda de similitud de estructuras.  (Inglés)  // Investigación de ácidos nucleicos. - 2004. - vol. 32. - Pág. 582-585. doi : 10.1093 / nar/gkh430 . — PMID 15215455 .
  27. J. Xiang, M. Hu. Comparaciones de métodos de alineación de estructuras de proteínas: rígidos y flexibles, secuenciales y no secuenciales  // 2008 2ª Conferencia Internacional sobre Bioinformática e Ingeniería Biomédica. - 2008-05-01. — págs. 21–24. -doi : 10.1109/ ICBBE.2008.12 .
  28. Dror O. , Benyamini H. , Nussinov R. , Wolfson H. MASS: alineación estructural múltiple por estructuras secundarias.  (Inglés)  // Bioinformática. - 2003. - vol. 19 Suplemento 1. - Pág. 95-104. —PMID 12855444 .
  29. Shatsky M. , Nussinov R. , Wolfson HJ Un método para la alineación simultánea de múltiples estructuras de proteínas.  (Inglés)  // Proteínas. - 2004. - vol. 56, núm. 1 . - Pág. 143-156. -doi : 10.1002/ prot.10628 . —PMID 15162494 .
  30. Sippl MJ , Wiederstein M. Detección de correlaciones espaciales en estructuras de proteínas y complejos moleculares.  (Inglés)  // Estructura (Londres, Inglaterra: 1993). - 2012. - vol. 20, núm. 4 . - Pág. 718-728. -doi : 10.1016/ j.str.2012.01.024 . —PMID 22483118 .
  31. Torarinsson E. , Sawera M. , Havgaard JH , Fredholm M. , Gorodkin J. Miles de regiones genómicas humanas y de ratón correspondientes que no se pueden alinear en la secuencia primaria contienen una estructura de ARN común.  (Inglés)  // Investigación del genoma. - 2006. - vol. 16, núm. 7 . - Pág. 885-889. - doi : 10.1101/gr.5226606 . —PMID 16751343 .
  32. Hoksza D. , Svozil D. Comparación eficiente de estructuras por pares de ARN mediante el método SETTER.  (Inglés)  // Bioinformática. - 2012. - vol. 28, núm. 14 _ - Pág. 1858-1864. -doi : 10.1093 / bioinformática/bts301 . — PMID 22611129 .
  33. Cech P. , Svozil D. , Hoksza D. SETTER: servidor web para comparación de estructuras de ARN.  (Inglés)  // Investigación de ácidos nucleicos. - 2012. - vol. 40. - Pág. 42-48. -doi : 10.1093 / nar/gks560 . —PMID 22693209 .
  34. Havgaard JH , Lyngsø RB , Stormo GD , Gorodkin J. Alineación estructural local por pares de secuencias de ARN con una similitud de secuencia inferior al 40 %.  (Inglés)  // Bioinformática. - 2005. - vol. 21, núm. 9 _ - Pág. 1815-1824. -doi : 10.1093 / bioinformática/bti279 . —PMID 15657094 .
  35. Mathews DH , Turner DH Predicción de la estructura secundaria del ARN mediante la minimización de la energía libre.  (Inglés)  // Opinión actual en biología estructural. - 2006. - vol. 16, núm. 3 . - Pág. 270-278. -doi : 10.1016/ j.sbi.2006.05.010 . —PMID 16713706 .