Composición de GC

Composición de GC ( composición de guanina-citosina, composición de GC ) [1]  - la proporción de guanina (G) y citosina (C) entre todos los residuos de nucleótidos de la secuencia de nucleótidos considerada. La composición de GC se puede determinar tanto para un fragmento de una molécula de ADN o ARN , como para la molécula completa o incluso el genoma completo .

El par GC tiene tres enlaces de hidrógeno , mientras que el par AT ( adenina  - timina ) tiene dos. Por lo tanto, el ADN de GC alto es más resistente a la desnaturalización de la solución que el ADN de GC bajo. Además de los enlaces de hidrógeno, la estabilidad de la estructura secundaria del ADN y el ARN se ve afectada por interacciones hidrofóbicas o de apilamiento entre nucleótidos adyacentes, que no dependen de la secuencia de bases de los ácidos nucleicos [2] [3] .

En la PCR , la composición de GC del cebador se utiliza para predecir el punto de fusión y la temperatura de hibridación del cebador. La alta composición de GC de la imprimación permite su uso a altas temperaturas de recocido.

Cálculo de la composición del GC

La composición de GC generalmente se presenta como un porcentaje ( fracción G+C o fracción GC ) para una de las cadenas de ADN o ARN . El porcentaje de composición de GC se calcula como [4]


donde  es la cantidad total de guaninas y citosinas, y  es la longitud de la cadena de ADN o ARN en nucleótidos: .

también se puede representar como un código degenerado como , entonces


Cálculo de cambios en la composición de nucleótidos

La composición del GC es un caso especial de desviaciones[ clear ] ( sesgo inglés  ) en la secuencia de nucleótidos de ciertas bases de nucleótidos o grupos de bases.

Por ejemplo, la desviación en la proporción de purinas (la suma de todas las guaninas y adeninas ) a la longitud de la cadena de ADN o ARN en nucleótidos ( participación G+A o participación GA ) se puede calcular como un porcentaje [5] :

donde  es la cantidad total de guaninas y adeninas, y  es la longitud de la cadena de ADN o ARN en nucleótidos: .

también se puede representar como un código degenerado como , entonces

Del mismo modo, para las pirimidinas ( citosina y timina ):

donde es la suma de todas las citosinas y timinas , mientras que es la longitud de la cadena de ADN o ARN en nucleótidos.

Notas

  1. Abreviatura: composición GC, composición CG, composición GC, composición CG, % GC, % GC
  2. Ponnuswamy P., Gromiha M. Sobre la estabilidad conformacional de los dúplex de oligonucleótidos y las moléculas de ARNt  // J  Theor Biol : diario. - 1994. - vol. 169 , núm. 4 . - pág. 419-432 . — PMID 7526075 .
  3. Yakovchuk P., Protozanova E., Frank-Kamenetskii MD Contribuciones del apilamiento y emparejamiento de bases a la estabilidad térmica de la doble hélice del ADN  // Nucleic Acids Res  . : diario. - 2006. - vol. 34 , núm. 2 . - Pág. 564-574 . doi : 10.1093 / nar/gkj454 . — PMID 16449200 . Archivado el 5 de marzo de 2020.
  4. Madigan, MT y Martinko JM Brock biología de microorganismos  (neopr.) . — 10mo. - Pearson-Prentice Hall, 2003. - ISBN 84-205-3679-2 .
  5. Maxim I. Pyatkov y Anton N. Pankratov. SBARS: creación rápida de diagramas de puntos para secuencias de ADN en diferentes escalas usando contenido de GA y GC // Bioinformática: 30. - 2014. - No. 12 . - S. 1765-1766 . -doi : 10.1093 / bioinformática/btu095 .

Véase también

Enlaces