Secuenciación final emparejada

La secuenciación de extremos emparejados  es uno de los métodos de secuenciación de ADN de nueva generación que se basa en la obtención y secuenciación de una biblioteca de etiquetas de extremos emparejados  (PET ), en la que las regiones terminales 5' y 3' cortas de fragmentos de ADN/ADNc están conectadas entre sí. otro con un amigo.

Construcción de una biblioteca de fragmentos finales emparejados

Existen dos métodos principales para crear bibliotecas de fragmentos de extremos emparejados: clonando y sin clonar [1] .

Obtención por clonación

El ADN genómico se fragmenta (por cualquier método: usando endonucleasas de restricción, ultrasonido, nebulización). Los adaptadores que contienen sitios de restricción para endonucleasas especiales, como MmeI o EcoP15I, se ligan a fragmentos de ADN . Los fragmentos con adaptadores se ligan en un vector bacteriano . A continuación, las células de E. coli se transforman con la mezcla de ligación. Los plásmidos separados se purifican a partir de las colonias bacterianas obtenidas, tratadas con una de las endonucleasas de restricción especiales, cuyos sitios están contenidos en los adaptadores. Estas endonucleasas cortan la parte central de los fragmentos de ADN clonados, dejando las secciones finales. Después de ligar estas secciones entre sí, se forman fragmentos de extremos emparejados. Estos fragmentos de extremos emparejados se escinden con una endonucleasa de restricción estándar cuyos sitios están en los bordes de los adaptadores clonados. Dependiendo de la elección de la técnica de secuenciación posterior, las secuencias de fragmentos de extremos emparejados se pueden usar como monómeros, dímeros o concatémeros (varios fragmentos unidos entre sí).

Obtención sin clonación

El fragmento de ADN se metila para protegerlo contra la acción de las endonucleasas de restricción . Los extremos del fragmento se "embotan" y fosforilan el extremo 5'. Estas manipulaciones son necesarias para coser adaptadores (no metilados) a los extremos del fragmento de ADN. Estos adaptadores contienen un sitio de restricción y también se pueden biotinilar. Los fragmentos de ADN resultantes flanqueados por adaptadores se circularizan. Si los adaptadores no han sido biotinilados, se puede agregar un adaptador "interno" biotinilado durante la ciclación. La biotina se usa para aislar fragmentos de extremos emparejados objetivo en un sorbente con estreptavidina. La molécula de ADN circular es procesada por la endonucleasa MmeI o EcoP15I, cuyos sitios de unión están contenidos en los adaptadores. Se forma PET libre. Antes de la secuenciación, se suturan adaptadores a estos fragmentos de extremos emparejados, que contienen secuencias para hibridar los cebadores de PCR . La reacción en cadena de la polimerasa (PCR) se utiliza para amplificar PET [2] .

La ventaja de crear una biblioteca mediante la clonación es la conservación de los fragmentos originales de cDNA de longitud completa. Sin embargo, la clonación es un proceso largo y laborioso. El método más popular ha ganado el método sin el uso de la clonación. La longitud de las secuencias de etiquetas de los fragmentos de extremos emparejados puede ser diferente. Las etiquetas más largas facilitan la asignación de lecturas . Las endonucleasas utilizadas para crear los fragmentos descritos anteriormente (MmeI o EcoP15I) dan etiquetas de 18/20 pb. y 25/27 pb, respectivamente [3] . La peculiaridad de estas endonucleasas es que introducen una ruptura en la cadena de ADN por debajo de su sitio de unión. Los fragmentos finales emparejados resultantes se utilizan para la secuenciación de próxima generación ( SOLiD , Illumina, 454 Life Sciences). Se pueden obtener etiquetas más largas mediante otros métodos de linealización de ADN después del paso de ciclación de fragmentos de ADN. Las principales ventajas de la secuenciación de extremos coincidentes sobre los enfoques de etiqueta única (es decir, etiquetar solo un extremo de un fragmento de ADN) son un costo reducido, una mayor especificidad de mapeo de lectura y la capacidad de determinar las características estructurales del genoma.

Aplicación

Secuenciación de extremos emparejados

El uso de fragmentos de extremos emparejados para la secuenciación del genoma de novo tiene una serie de ventajas. Este tipo de secuenciación se denomina secuenciación final por pares o "secuenciación de escopeta de doble cañón". El enfoque más popular se propuso en 1995 [4] , que supuso una mejora de la estrategia de secuenciación descrita en 1991 [5] .

Las tecnologías de secuenciación de última generación permiten leer una muestra de ADN de forma muy rápida y económica, pero la longitud de las lecturas resultantes es mucho más corta en comparación con las obtenidas mediante la secuenciación mediante el método Sanger .  El ensamblaje de genomas, en particular tan complejos como los genomas eucariotas , a partir de fragmentos cortos es un problema complejo. Con una gran cantidad de secuencias cortas, surge la pregunta de cómo orientarlas en la dirección correcta y conectarlas para obtener un genoma completo. La presencia de repeticiones en el genoma complica aún más esta tarea. La solución a este problema puede ser el uso de fragmentos de extremos emparejados.

Al variar la longitud del fragmento de ADN y, por lo tanto, la distancia entre las etiquetas, se puede elegir una distancia que sea mayor que la sección repetida. Como resultado, la asignación de lectura deja de ser ambigua. La tecnología de secuenciación de extremos emparejados permite el uso de lecturas "ambiguas" (es decir, aquellas que se asignan a más de una ubicación en el genoma) para el ensamblaje del genoma. Esto aumenta la eficiencia al mismo tiempo que reduce el costo de la secuenciación, ya que estas secuencias o lecturas ambiguas generalmente se descartan y no se consideran durante el ensamblaje.

El método de secuenciación de los extremos apareados del ADN permite detectar variaciones estructurales que se han producido en el genoma: inserciones, deleciones , inversiones y transposiciones. Al crear una biblioteca de fragmentos de extremos emparejados, se seleccionan fragmentos de ADN de igual longitud, por ejemplo, 3 kb. [6] . Después de completar los pasos estándar restantes (ver arriba), obtenemos la biblioteca. Secuenciamos y mapeamos las lecturas resultantes. Al mapear el genoma de referencia, las etiquetas derivadas de un solo fragmento de ADN deben superponerse al genoma de referencia a una distancia de aproximadamente 3 kb. (esta distancia se establece cuando se construye la biblioteca) entre sí y en una orientación particular. Entonces, si la distancia entre las etiquetas es menor a 3 kb, esto indica la presencia de una deleción en el genoma secuenciado, si es más, entonces una inserción. Se pueden obtener ejemplos más complejos de variación estructural en el genoma considerando sitios de mapeo de etiquetas "inconsistentes" (por ejemplo, inserción de una secuencia de otro locus) [2] [6] .

La comparación de las variaciones estructurales del genoma en dos personas (una representante de la raza africana y una caucásica) mostró la presencia de alrededor del 50% de las variaciones estructurales totales. Los "puntos calientes" de variación estructural a menudo se encuentran en sitios del genoma asociados con ciertas enfermedades. Las variaciones estructurales afectan la organización del genoma, ya que permiten el movimiento de exones, la "fusión" de genes, un cambio en la orientación del gen o su amplificación [6] .

El método de secuenciación de los extremos apareados del ADN también se ha utilizado para mapear los reordenamientos genómicos de las células cancerosas [7] .

Secuenciación de ARN emparejado

El método se utiliza para identificar ARNm de longitud completa mediante la secuenciación de los extremos 5' y 3' de la biblioteca de ADNc correspondiente [8] [9] . En la fig. 3. Se presenta el esquema general del método. La obtención de una biblioteca de fragmentos de extremos emparejados mediante PCR sin clonación de ADNc permite la inclusión en el análisis de ARNm difícil de clonar o ARNm con una concentración muy baja. A continuación, la biblioteca se secuencia utilizando secuenciadores modernos como Illumina GA o SOLiD v4.

La secuenciación de los extremos emparejados del ARN se utiliza para el análisis cualitativo y cuantitativo del transcriptoma : determinación de inicios de transcripción alternativos , sitios de poliadenilación y determinación del perfil de expresión génica. El método también se puede utilizar para identificar genes quiméricos y casos de transempalme , sin embargo, estos datos requieren una verificación experimental adicional.

La ventaja de la secuenciación de extremos de ARN emparejados en comparación con otros métodos para identificar los extremos 5' y 3' del ARNm, como CAGE , SAGE y SuperSAGE , es la detección de ambos extremos del ARNm al mismo tiempo, lo que proporciona una mayor precisión. en el mapeo del ARNm correspondiente en el genoma. A diferencia del método de secuenciación de ARN del genoma completo , que analiza una biblioteca de fragmentos de ARN obtenidos aleatoriamente, la secuenciación de extremos pareados de ARN determina las secuencias de solo los extremos de las moléculas de ARN, lo que reduce significativamente el costo del análisis cuantitativo del transcriptoma, pero no proporcionar información sobre la estructura interna del ARNm, por ejemplo, sobre la posición de los polimorfismos o la estructura exón - intrón . Además, las estructuras secundarias de mRNA estables pueden complicar la preparación de cDNA de longitud completa y, por lo tanto, la identificación de mRNA.

CHIA-PET

Chromatin Interaction Analysis by Paired-End Tag Sequencing (ChIA-PET) es un método de biología molecular que permite determinar la interacción (proximidad espacial) de regiones de cromatina ubicadas a una distancia considerable entre sí de un amigo en el genoma. Este método permite determinar de novo la disposición espacial de las regiones de cromatina entre sí. Tales interacciones son de interés para definir elementos reguladores (p. ej., elementos reguladores en cis, elementos reguladores en trans, aisladores , potenciadores , silenciadores ). A su vez, la información obtenida es importante para comprender los mecanismos de regulación de la expresión génica .

Literatura

  1. Fullwood MJ., Wei CL, Liu ET, Ruan Y, Secuenciación de ADN de próxima generación de etiquetas de extremos emparejados (PET) para análisis de transcriptomas y genomas, Genome Research, 2009, 19:521-532 [1] Archivado desde el 20 de mayo 2016 en la Wayback Machine
  2. 1 2 Fei Yao, Pramila N et al., Estrategia de secuenciación de etiquetas emparejadas (DNA-PET) de ADN de largo alcance para el interrogatorio de mutaciones estructurales genómicas y reconstrucción de amplicones guiada por punto de fusión, PLos One, 2012, 7 (9): e46152 [2] Archivado el 1 de noviembre de 2014 en Wayback Machine .
  3. Morgan RD et al., MmeI: un sistema mínimo de modificación de restricción de tipo II que solo modifica una hebra de ADN para la protección del huésped, Nucleic Acids, 2008, 36(20):6558-6570 [3]
  4. Roach JC, Boysen C, Wang K, Hood L, Pairwise End Sequencing: A unified approach to genomic mapping and sequencing, Genomics, 1995, 26(2):345-53 [4] Archivado el 2 de octubre de 2016 en Wayback Machine .
  5. Edwards A., Caskey T., Estrategias de cierre para la secuenciación aleatoria de ADN, A Companion to Methods in Enzymology, 1991, págs. 41-47 [5] Archivado el 27 de junio de 2016 en Wayback Machine .
  6. 1 2 3 Korbel JO et al., El mapeo de extremos emparejados revela una variación estructural extensa en el genoma humano, Science, 2007, 318(5849): 420-6 [6] Archivado el 24 de marzo de 2017 en Wayback Machine .
  7. Campbell PJ et al., Identificación de reordenamientos adquiridos somáticamente en el cáncer usando secuenciación de extremos emparejados masivamente paralelos en todo el genoma, Nat Genet, 2008, 40(6): 722-729 [ 7] Archivado el 21 de mayo de 2016 en Wayback Machine .
  8. Ng P, Wei CL, Sung WK ​​​​et al., Análisis de la firma de identificación de genes (GIS) para la caracterización del transcriptoma y la anotación del genoma, Nat. Methods, 2005, 2: 105-111 [8] Archivado el 17 de septiembre de 2019 en Wayback Machine .
  9. Ruan X, Ruan Y, Genome wide full-length transcript analysis using 5' and 3' paired-end-tag next generation sequencing (RNA-PET), Methods Mol.Biol., 2012, 809: 535-562 [9] Archivado el 25 de febrero de 2016 en Wayback Machine .