Composición de GC
Composición de GC ( composición de guanina-citosina, composición de GC ) [1] - la proporción de guanina (G) y citosina (C) entre todos los residuos de nucleótidos de la secuencia de nucleótidos considerada. La composición de GC se puede determinar tanto para un fragmento de una molécula de ADN o ARN , como para la molécula completa o incluso el genoma completo .
El par GC tiene tres enlaces de hidrógeno , mientras que el par AT ( adenina - timina ) tiene dos. Por lo tanto, el ADN de GC alto es más resistente a la desnaturalización de la solución que el ADN de GC bajo. Además de los enlaces de hidrógeno, la estabilidad de la estructura secundaria del ADN y el ARN se ve afectada por interacciones hidrofóbicas o de apilamiento entre nucleótidos adyacentes, que no dependen de la secuencia de bases de los ácidos nucleicos [2] [3] .
En la PCR , la composición de GC del cebador se utiliza para predecir el punto de fusión y la temperatura de hibridación del cebador. La alta composición de GC de la imprimación permite su uso a altas temperaturas de recocido.
Cálculo de la composición del GC
La composición de GC generalmente se presenta como un porcentaje ( fracción G+C o fracción GC ) para una de las cadenas de ADN o ARN . El porcentaje de composición de GC se calcula como [4]
donde es la cantidad total de guaninas y citosinas, y es la longitud de la cadena de ADN o ARN en nucleótidos:
.
también se puede representar como un código degenerado como , entonces
Cálculo de cambios en la composición de nucleótidos
La composición del GC es un caso especial de desviaciones[ clear ] ( sesgo inglés ) en la secuencia de nucleótidos de ciertas bases de nucleótidos o grupos de bases.
Por ejemplo, la desviación en la proporción de purinas (la suma de todas las guaninas y adeninas ) a la longitud de la cadena de ADN o ARN en nucleótidos ( participación G+A o participación GA ) se puede calcular como un porcentaje [5] :
donde es la cantidad total de guaninas y adeninas, y es la longitud de la cadena de ADN o ARN en nucleótidos:
.
también se puede representar como un código degenerado como , entonces
Del mismo modo, para las pirimidinas ( citosina y timina ):
donde es la suma de todas las citosinas y timinas , mientras que es la longitud de la cadena de ADN o ARN en nucleótidos.
- Desviación en relación a la suma de todas las guaninas a la suma de todas las citosinas o viceversa (cambio en relación a la suma de todas las citosinas a la suma de todas las guaninas ):
Este valor - GC skew - puede ser positivo (si la cantidad de guanina es mayor que la cantidad de citosina ), negativo (en caso contrario) o igual a 0 (cuando la cantidad de guanina y citosina es la misma).
- De manera similar, puede calcular la desviación en la proporción de la suma de todas las adeninas a las timinas o viceversa (la suma de todas las timinas a las adeninas ):
Este valor - AT skew - será positivo si la cantidad de adenina es superior a la cantidad de timina , negativo en caso contrario, o igual a 0 cuando las sumas de adeninas A y timina T sean iguales.
- Calcular la desviación en relación a la suma de todas las guaninas y todas las citosinas , en relación a la suma de todas las adeninas y timinas, o viceversa ( adeninas y timinas en relación a la suma de todas las guaninas y citosinas ):
donde es la suma de todas las guaninas y citosinas , mientras que es la suma de todas las adeninas y timinas .
- Cálculo de la desviación total de todas las purinas a pirimidinas o viceversa (todas las pirimidinas a todas las purinas), en una hebra de ADN:
donde es la suma de todas las guaninas y adeninas , mientras que es la suma de todas las citosinas y timinas .
- Calcular la desviación en relación a la suma de todas las citosinas y todas las adeninas , en relación a la suma de todas las guaninas y timinas , o viceversa ( guaninas y timinas en relación a la suma de todas las citosinas y adeninas ):
donde es la suma de todas las citosinas y adeninas , mientras que es la suma de todas las guaninas y timinas .
Notas
- ↑ Abreviatura: composición GC, composición CG, composición GC, composición CG, % GC, % GC
- ↑ Ponnuswamy P., Gromiha M. Sobre la estabilidad conformacional de los dúplex de oligonucleótidos y las moléculas de ARNt // J Theor Biol : diario. - 1994. - vol. 169 , núm. 4 . - pág. 419-432 . — PMID 7526075 .
- ↑ Yakovchuk P., Protozanova E., Frank-Kamenetskii MD Contribuciones del apilamiento y emparejamiento de bases a la estabilidad térmica de la doble hélice del ADN // Nucleic Acids Res . : diario. - 2006. - vol. 34 , núm. 2 . - Pág. 564-574 . doi : 10.1093 / nar/gkj454 . — PMID 16449200 . Archivado el 5 de marzo de 2020.
- ↑ Madigan, MT y Martinko JM Brock biología de microorganismos (neopr.) . — 10mo. - Pearson-Prentice Hall, 2003. - ISBN 84-205-3679-2 .
- ↑ Maxim I. Pyatkov y Anton N. Pankratov. SBARS: creación rápida de diagramas de puntos para secuencias de ADN en diferentes escalas usando contenido de GA y GC // Bioinformática: 30. - 2014. - No. 12 . - S. 1765-1766 . -doi : 10.1093 / bioinformática/btu095 .
Véase también
Enlaces