La secuenciación de nanoporos es una familia de métodos de secuenciación de ADN o ARN de tercera generación altamente eficientes [1] . El método se basa en el uso de proteínas, en estado sólido u otros poros con un diámetro de varios nanómetros que son sensibles a los ácidos nucleicos.
La secuenciación de nanoporos evita los pasos de PCR : amplificación y marcaje químico de una muestra de ADN o ARN [2] . Esta es una ventaja significativa sobre otros métodos de secuenciación que utilizan al menos uno de estos pasos. Las capacidades del método incluyen genotipificación relativamente barata , alta movilidad, análisis rápido y visualización de resultados en tiempo real. El uso del método en la detección rápida de patógenos virales [3] , el seguimiento de la resistencia bacteriana [4] , la secuenciación del genoma humano [5] [6] y vegetal [7] , la determinación de haplotipos [8] , el seguimiento del virus del Ébola [9] y otros campos ha sido descrito.
En 1989, se demostró la creación de canales ( nanoporos ) en una membrana artificial de fosfolípidos por alfa-toxina sintetizada por Staphylococcus aureus [10] [11] . En 1995, se propuso por primera vez la idea de la secuenciación de nanoporos : la determinación de las propiedades de un polímero lineal cuando se extrae a través de un poro en una membrana. Al pasar por un poro, el polímero interactúa con él de cierta manera, lo que permite determinar sus propiedades [12] . Un año más tarde, en 1996, apareció el primer trabajo que describía la posibilidad de utilizar nanoporos ( como nanoporo se utilizó alfa-hemolisina ) para caracterizar ácidos nucleicos [13] .
En 1999-2000, se demostró que, usando estafilococo alfa-hemolisina como nanoporo , es posible distinguir el ARN monocatenario del ADN monocatenario [14] [15] .
En 2001, por primera vez, se realizó un trabajo en el que se determinó la presencia de secuencias cortas de ADN utilizando nanoporos [16] . Solo en 2009 fue posible demostrar la capacidad de distinguir todas las bases en la secuencia de ADN con nanoporos, lo cual es necesario para crear métodos de secuenciación [17] .
En 2012, Oxford Nanopore Technologies demostró los primeros secuenciadores de nanoporos : GridION y MinION [18] .
Al mismo tiempo, se demostró la posibilidad fundamental de utilizar este método: el genoma del bacteriófago phiX se secuenció con una longitud de 5,4 mil pares de bases (pb) [19] .
Un sistema de nanoporos es una cámara de reacción dividida en dos partes por una membrana que contiene un orificio de tamaño nanométrico, un nanoporo. Se aplica un voltaje a partes de la cámara , como resultado de lo cual las moléculas estudiadas pasan a través del poro en la dirección del campo eléctrico . Cuando una molécula de ácido nucleico pasa a través de un poro, los nucleótidos individuales afectan uno u otro parámetro medido del sistema, lo que permite determinar la secuencia de nucleótidos [2] . En una versión práctica de secuenciación de nanoporos, la cámara se llena con una solución electrolítica y se mide la fuerza de la corriente de iones que fluye a través del poro bajo la acción del campo; cuando los nucleótidos pasan a través del poro, reducen la sección transversal disponible para los iones y la corriente disminuye [20] .
Dependiendo de si las moléculas de ácido nucleico secuenciadas conservan su integridad química, hay dos opciones: secuenciación de cadena completa y secuenciación de exonucleasa [21] .
En este método, las cadenas de ácido nucleico no se escinden. La transferencia de moléculas enteras de ADN y ARN a través del poro se puede realizar de las siguientes formas:
En este método, la cadena de ácido nucleico se corta en nucleótidos individuales mediante una exonucleasa ubicada en las inmediaciones del poro. Bajo la acción del campo, los nucleótidos cargados negativamente entran de forma independiente en el poro donde se determinan las bases [21] .
Para la secuenciación se utilizan nanoporos de proteínas y nanoporos sintéticos en estado sólido [21] .
Staphylococcus aureus alfa-hemolisina es un monómero soluble en agua que forma espontáneamente un heptámero en la membrana . El dominio transmembrana consta de un tallo y una cabeza de poro. La cabeza del poro contiene una cavidad de unos 4,5 nm de diámetro . En la unión del cañón y la cabeza, hay un estrechamiento del canal con un ancho de 1,5 nm. El tallo del poro consta de 14 hebras beta antiparalelas que forman un canal pasante de unos 2 nm de ancho. A pH neutro , muchos residuos de aminoácidos en el poro están cargados (por ejemplo, el residuo de lisina K147 cargado positivamente y el residuo de glutamato E111 cargado negativamente). En una solución de KCl 1 M , se mantiene un potencial de 120 mV en el poro (del tallo a la cabeza), lo que provoca una corriente de 120 pA [22] . Hay tres sitios de reconocimiento de nucleótidos dentro del tallo , lo que en teoría hace posible que más de un sitio reconozca un solo nucleótido (lo que aumenta la precisión de la lectura) [23] .
MSPAPorin A Mycobacterium smegmatis ( Eng. Mycobacterium smegmatis porin A, MspA ) es un nanoporo con un diámetro de 1,2 nm. Tiene características estructurales (forma y diámetro de los poros) que mejoran la relación señal/ruido en la secuenciación del ADN en comparación con la alfa-hemolisina [24] . Sin embargo, MspA también tiene un inconveniente importante: el núcleo cargado negativamente interfiere con el avance del ADN monocatenario dentro del poro. Por lo tanto, para la secuenciación en la proteína original, se reemplazaron tres residuos de aspartato cargados negativamente con residuos de asparagina neutral [25] .
Proteína de empaquetamiento de ADN motor del bacteriófago phi29La proteína motora de empaquetamiento de ADN del bacteriófago phi29 participa en el empaquetamiento de ADN en la cápside de los virus, así como en la liberación de ADN de la cápside tras la infección. La principal diferencia con las proteínas antes mencionadas es que, al tener un canal de mayor diámetro (de 3,6 nm a 6 nm), es capaz de pasar ADN de doble cadena. Debido a su naturaleza, la proteína motora phi29, a diferencia de otros poros, no se integra a la membrana en su forma original, pero este problema se soluciona modificando la proteína [26] . Otras modificaciones permiten que la proteína se salte el ADN monocatenario o el ARN monocatenario [27] .
Además de los nanoporos de proteínas, también se utilizan nanoporos de estado sólido no biológicos. Para el análisis de ácidos nucleicos, los nanoporos se utilizan en sustratos hechos de silicio , nitruro de silicio y polietilenimina [27] . Los poros suelen quemarse con haces de iones o electrones, lo que facilita la variación de su tamaño [28] . Por separado, vale la pena destacar los materiales que forman poros “2D” muy delgados: grafeno , bisulfuro de molibdeno y otros [27] . El grafeno también tiene un grosor extremadamente pequeño, lo que contribuye a aumentar la resolución espacial a lo largo del ADN y, al mismo tiempo, la fuerza, la inercia química y la conductividad eléctrica . Estas propiedades facilitan el uso de estos materiales en la secuenciación de nanoporos [28] .
GrafenoAl ser una estructura delgada y hermética a los iones, el grafeno es un buen material de secuenciación basado en nanoporos. Por lo tanto, se demostró que los nanoporos de grafeno se pueden utilizar como electrodo para medir la corriente que fluye a través de los nanoporos entre dos cámaras que contienen soluciones iónicas [28] .
Detección de fluorescenciaEn 2010, se desarrolló un método de nanosecuenciación de estado sólido basado en la detección de señales fluorescentes . Primero, el ADN deseado se convierte en ADN, en el que cada base original corresponde a una secuencia corta. Las sondas fluorescentes ( balizas moleculares ) se hibridan con estas secuencias cortas , con el extremo de una sonda extinguiendo la fluorescencia del fluoróforo al comienzo de la otra sonda. Al mismo tiempo, para codificar cuatro bases, solo se necesitan dos tipos de sondas: cada base (más precisamente, la secuencia corta que le corresponde) corresponde a dos señales fluorescentes (00, 01, 10 u 11, donde 0 corresponde a una color, y 1 a otro). Al atravesar el poro, el ADN bicatenario resultante se desenrolla, la sonda se separa y, en consecuencia, el fluoróforo de la siguiente sonda comienza a brillar [29] [30] .
Las ventajas del método incluyen la precisión de la señal: las cámaras registran la señal con mucha más precisión que otras técnicas disponibles. Sin embargo, el método requiere un pretratamiento de la muestra: la conversión de cada nucleótido en aproximadamente 12 nucleótidos (que también alarga el propio ADN) [29] .
Comparación de nanoporos biológicos y de estado sólidoLos nanoporos de estado sólido carecen de algunas de las desventajas de los nanoporos biológicos: sensibilidad al pH , temperatura , concentraciones de electrolitos , estrés mecánico, etc. Además, son más estables, duran más, es mucho más fácil obtener una variedad de formas. y tamaños de tales poros, y la tecnología de producción es similar a la producción de semiconductores , lo que facilita enormemente el proceso de obtención de dichos poros y hace que sea potencialmente posible combinarlos con otros nanodispositivos. Las ventajas de los nanoporos biológicos incluyen la posibilidad de modificación química o genética, especificidad química para el ADN o el ARN y una tasa relativamente baja de paso del ADN o el ARN a través del poro [28] [31] .
Para obtener nanoporos se puede utilizar la tecnología de origami de ADN . Esta posibilidad se demostró por primera vez en 2012, cuando se obtuvo una estructura similar a la alfa hemolisina usando origami de ADN. La estructura resultante se incorporó espontáneamente a las membranas [27] .
En 2010, se demostró que los nanotubos de carbono de pared simple también se pueden incrustar en membranas y permitir el paso del ADN [27] .
A partir de 2020, los nanoporos de estado sólido no tienen la especificidad química de las proteínas; por lo tanto, se está estudiando activamente la posibilidad de integrar nanoporos de proteínas en sustratos de estado sólido [28] .
Otra dirección prometedora es el uso de nanoporos de estado sólido con sensores (sensores capacitivos, túneles electrónicos y otros detectores) [28] .
En comparación con los métodos de secuenciación existentes, el uso de este método de secuenciación tiene ventajas [2] , como el bajo costo y la facilidad de uso (debido a la ausencia de la necesidad de preparación de muestras y el uso de reactivos), alta sensibilidad (hasta la secuenciación). sin amplificación de ADN de sangre y saliva ), alta longitud de lectura (hasta decenas de miles de bases), alta movilidad, análisis rápido y visualización de resultados en tiempo real [2] .
Las desventajas incluyen propiedades tales como la baja calidad de las lecturas en comparación con las tecnologías de secuenciación de lectura corta (sin embargo, esta situación está mejorando con la aparición de nuevos algoritmos), la pérdida de propiedades funcionales de los poros biológicos con el tiempo (los poros funcionan de manera confiable). sólo durante un cierto tiempo). trabajando lo suficientemente rápido fuera del rango) [32] .
En febrero de 2012, en la conferencia AGBT en Florida , Oxford Nanopore Technologies presentó prototipos de dos plataformas para la secuenciación de alto rendimiento de fragmentos largos basada en la secuenciación de nanoporos de cadena completa: GridION y MinION. Como demostración, se secuenció el genoma del bacteriófago PhiX de 5386 pb. [19] Para 2020, la empresa lanza varios dispositivos. Todos ellos permiten el análisis de datos en tiempo real [33]
MininoMinION es un secuenciador de células desechable de tamaño pequeño diseñado para uso doméstico con un precio objetivo de alrededor de $900. El secuenciador tiene un conector USB 3.0 para conectarse a una computadora. Contiene 512 nanoporos con características similares [2] . La celda le permite secuenciar hasta 30 millones de pb. ADN (en unos dos días, se pueden digitalizar entre 10 y 20 millones de pb de ADN) [34] . En 2019, la compañía comenzó a lanzar Flongle, un adaptador para MinION o GridION que le permite trabajar con celdas menos productivas (~1 Gb, 126 nanoporos en lugar de 512), pero mucho más económicas ($90) [35] .
GridIONGridION es un dispositivo diseñado para la secuenciación del genoma completo (esencialmente, un MinION con mayor rendimiento). El prototipo tenía 2000 nanoporos individuales, cada uno capaz de recibir lecturas de hasta 5100 pb de longitud. a una velocidad de 150 millones de bp/h durante 6 horas [2] . GridION Mk1 cuesta $49,955 y contiene 5 celdas independientes. Con su ayuda, se pueden secuenciar hasta 150 millones de pb en un experimento. ADN [36] .
PromethionEl secuenciador de mayor rendimiento de la compañía permite secuenciar varios billones de pb en un solo experimento. ADN. PromethION 24 contiene 24 celdas y es capaz de digitalizar 3,8 billones de pb en tres días. El ADN, PromethION 48 contiene 48 células y es capaz de digitalizar 7,6 billones de pb en tres días. ADN. Las celdas del secuenciador contienen 3000 nanoporos [37] . Una computadora convencional no puede analizar un flujo de datos de tal cantidad de nanoporos, por lo que se requiere una supercomputadora para usar este secuenciador (sin embargo, si ejecuta solo una celda, entonces una computadora convencional puede manejarlo) [37] [38] .
Otros desarrollosLa compañía planea lanzar dos dispositivos más: SmidgION, un secuenciador que se conecta a un teléfono inteligente, y Plongle, un secuenciador que contiene 96 células independientes pero de bajo rendimiento y, en consecuencia, está diseñado para la secuenciación frecuente de grandes cantidades de ADN corto. [39] .
Posprocesamiento de datos de Oxford NanoporeDespués de usar los productos Oxford Nanopore, la salida son datos sin procesar en formato FAST5. El formato FAST5 utilizado por Oxford Nanopore es una variante del estándar HDF5 con una estructura interna jerárquica diseñada para almacenar eventos y metadatos relacionados con la secuencia de ADN (medidas de corriente total agregadas) preprocesados por un dispositivo en funcionamiento. Los resultados del procesamiento se muestran en tiempo real en la interfaz gráfica de MinKNOW y los datos se registran en formato de archivo FASTQ o .fast5 [40] . A continuación, debe realizar el reconocimiento de nucleótidos ( llamadas de bases en inglés ). Este proceso procesará datos en formato FAST5 sin procesar en formato FASTQ (en MinKNOW, este proceso se puede iniciar mientras se leen las lecturas). También puede utilizar programas como poreTools [41] , Guppy [42] [43] .
A continuación, debe limpiar las secuencias recibidas para deshacerse de los datos con demasiado ruido. Para esta tarea, por ejemplo, se utiliza el programa NanoFilt [44] [45] . Una vez que se han limpiado los datos, los datos resultantes se pueden utilizar para la posterior recopilación y análisis de datos [43] .
Programa ( https://github.com/skovaka/UNCALLED )
diccionarios y enciclopedias |
---|