Secuenciación de ADN de una sola célula

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 12 de octubre de 2019; las comprobaciones requieren 5 ediciones .

La secuenciación de ADN de una sola célula es un  enfoque que permite obtener datos sobre la secuencia de ADN de una célula individual mediante secuenciación y, por lo tanto, identificar diferencias entre células individuales de organismos unicelulares , órganos, tejidos y subpoblaciones celulares de organismos multicelulares . El enfoque hace posible analizar las características funcionales de la célula en el contexto del microambiente. La secuenciación del genoma de una sola célula implica varios pasos: aislamiento de una sola célula, amplificación del genoma completo , generación de bibliotecas y secuenciación de ADN utilizando técnicas de secuenciación de próxima generación .

Con el advenimiento de una variedad de métodos de secuenciación, se hizo posible establecer la secuencia del ADN genómico . Sin embargo, la mayoría de los datos hasta la fecha se han obtenido mediante la secuenciación de muestras de ADN genómico aisladas de poblaciones de microorganismos o subpoblaciones celulares de organismos multicelulares [1] . Sin embargo, se sabe que la diversidad dentro de ambos grupos puede ser significativa, ya que las propias células realizan aportes diferentes a la existencia de una población u organismo.

La secuenciación del genoma de una sola célula permite trasladar el estudio del genoma al nivel celular. Hoy en día, ayuda a resolver problemas como la secuenciación de novo de microorganismos no cultivables [2] , el estudio del mosaicismo genético en casos normales y patológicos [3] , la identificación y el estudio de la contribución de las subpoblaciones de células tumorales al desarrollo del cáncer y la aparición de resistencia al tratamiento [4] .

Desafíos tecnológicos

La secuenciación del ADN de una sola célula se enfrenta a los desafíos de aislar físicamente las células individuales , elegir un método de amplificación con el menor potencial de introducir errores para obtener una cantidad suficiente de material y elegir un método de secuenciación [5] [6] .

Aislamiento de células individuales

El primer paso en el aislamiento celular es crear una suspensión de células viables que no estén conectadas entre sí. El propósito del aislamiento puede ser una selección aleatoria de celdas para crear una muestra representativa al analizar la composición de las subpoblaciones o una búsqueda dirigida de celdas específicas. En el estudio de tejidos duros, es necesaria una disociación mecánica o química preliminar de la muestra, y las condiciones de disociación deberían actuar por igual en todas las subpoblaciones de células tisulares. Esto es necesario para crear una muestra imparcial en relación con el conjunto original de celdas , donde se conserva la representación inicial de las celdas, lo que puede ser importante para analizar la composición de las subpoblaciones. Debe tenerse en cuenta que las condiciones para la disociación de tejidos normales y no saludables pueden diferir, por lo que en esta etapa es importante elegir las condiciones adecuadas. También es posible trabajar con muestras de tejido completo, por ejemplo, utilizando microdisección de captura láser [7] .

Después de obtener la suspensión, las células se pueden aislar mediante dilución en serie [8] , micropipeteo [9] , dilución en micropocillos [10] , utilizando pinzas ópticas . La citometría de flujo fluorescente se puede utilizar para aislar células con propiedades fluorescentes específicas, que pueden ser naturales o introducidas por el experimentador. Los métodos automatizados de micromanipulación [11] [12] han recibido un gran desarrollo recientemente , incluido el aislamiento de células en chips utilizando tecnologías de microfluidos [13] ; tomar nanobiopsias ya permite estudiar el ADN de orgánulos individuales [14] . Las células aisladas se someten posteriormente a lisis .

Amplificación del genoma completo

El siguiente paso, la amplificación del genoma completo  (WGA ), se utiliza para generar suficiente ADN para detectar la señal y extraerla del ruido en el futuro durante la secuenciación. Al mismo tiempo, es deseable minimizar la introducción de artefactos tales como la amplificación preferencial de secuencias simples, la introducción de mutaciones aleatorias y la formación de secuencias quiméricas. Recientemente ha aparecido un conjunto de posibilidades para solucionar este problema. El uso de la PCR no se ha justificado debido, por ejemplo, a la mayor frecuencia de introducción de errores por parte de las polimerasas termoestables . Por lo tanto, los métodos isotérmicos e híbridos, como el método de amplificación con amplificación de desplazamiento múltiple ( inglés  Multiple scroll amplification, MDA ) y la amplificación con rectificación múltiple y looping ( English  Multiple Annealing and Looping Based Amplification Cycles, MALBAC ) [15] .

MDA

MDA permite una rápida amplificación de ADN sin necesidad de PCR. El método se basa en el uso del fago polimerasa phi29, que se caracteriza por una mayor procesividad (puede sintetizar regiones de más de 10 kilobases de largo sin disociación) y una tasa de error baja (1 por 10 6–10 7 pares de bases ). La reacción transcurre como sigue: los cebadores hexaméricos se hibridan sobre la matriz, se alargan mediante polimerasa; cuando la enzima encuentra otro cebador (que también se alarga), lo desplaza (reemplaza) y continúa su camino a través de la plantilla. El sitio recién sintetizado sustituido sirve como sitio de aterrizaje para nuevos cebadores y se convierte en una plantilla. Así, se forma un árbol ramificado, donde se produce la síntesis en cada rama. Al final del procedimiento, se inhibe la polimerasa, se agrega la nucleasa S1 para cortar las ramas en los sitios de ramificación y la ADN polimerasa I para completar las secciones monocatenarias resultantes [15] .

El método tiene una serie de problemas, como la pérdida de alelos , la amplificación preferencial y las interacciones entre cebadores. El primer problema surge de la amplificación aleatoria de solo uno de los alelos en heterocigotos , lo que resulta en que los heterocigotos se identifiquen incorrectamente como homocigotos . Debido a la alta frecuencia de este efecto (0 - 60 %), la precisión del genotipado disminuye . El segundo problema es la sobreamplificación de un alelo sobre otros. Las interacciones entre los cebadores de hexámeros ocurren debido a la naturaleza aleatoria de las secuencias; pueden reducirse significativamente introduciendo restricciones en la síntesis de estos cebadores [15] .

MALBACS

MALBAC es un método de amplificación de genoma completo lineal híbrido. El método se basa en cebadores especiales: tienen una longitud de 35 nucleótidos , 27 de los cuales son iguales en todos los cebadores (GTG AGT GAT GGT TGA GGT AGT GTG GAG), y los 8 nucleótidos restantes varían. Todo el proceso de amplificación se describe de la siguiente manera [9] :

  1. Fusión (94 °C) de ADN bicatenario con formación de fragmentos monocatenarios.
  2. Enfriamiento (0 °C), adición de cebadores y polimerasa.
  3. Cebadores de recocido en ubicaciones aleatorias en la plantilla. La ADN polimerasa Bst alarga los cebadores para formar un medio amplicón a 64 °C. Todos los cebadores contrarios se desplazan de la plantilla.
  4. Fusión (94 °C), separación del semiamplicón de la matriz.
  5. Enfriamiento (0 °C), adición de cebadores y polimerasa. Los cebadores se unen de manera efectiva tanto a la plantilla como al semiamplicón.
  6. La ADN polimerasa Bst extiende los cebadores a 64 °C. Los semiamplicones se sintetizan en la matriz inicial, los amplicones completos se sintetizan en semiamplicones obtenidos anteriormente .
  7. Fusión (94 °C).
  8. Bucle (58 °C): Los extremos 3' y 5' de los amplicones completos son complementarios entre sí y forman un bucle, lo que impide el uso del amplicón completo como plantilla.
  9. Repita los pasos 5 a 8 cinco veces.
  10. PCR usando 27 nucleótidos comunes como cebadores para amplificar solo amplicones completos [9] .

La ventaja del método es la reducción del ruido asociado con la naturaleza exponencial de la amplificación por PCR debido a la introducción de la amplificación cuasilineal preliminar. Esto hizo posible aumentar la cobertura del genoma (la proporción del genoma cubierta por al menos una lectura), para reducir la probabilidad de pérdida de alelos y polimorfismos de un solo nucleótido (SNP). Además, se requiere una cantidad muy pequeña de ADN inicial para la entrada; sin embargo, cualquier contaminación de las muestras puede afectar significativamente los resultados de la secuenciación [9] .

La desventaja es que, para deshacerse de los resultados falsos positivos, es necesario comparar los resultados de la secuenciación de 2 o 3 células de la misma línea celular y de líneas diferentes [9] . En este caso, se pueden perder algunos polimorfismos, ya que las células que pertenecen a la misma línea celular todavía tienen algunas diferencias en el genoma. Además, la polimerasa de ADN bst utilizada tiene una alta tasa de error (1 en 10 5 bases) [16] .

Comparación de los métodos de amplificación del genoma completo

Recientemente, se han realizado varios estudios que comparan estos métodos [17] [18] [19] . Un estudio concluyó que la MDA proporciona una mayor cobertura que la MALBAC (84 % y 52 %, respectivamente), lo que permite una detección más precisa de polimorfismos de un solo nucleótido [17] . Sin embargo, MALBAC proporciona una cobertura más uniforme y, por lo tanto, permite una detección más precisa de las variaciones del número de copias (CNV) [17] . Curiosamente, al secuenciar algunas células, el nivel de detección de variaciones en el número de copias por el método MDA fue comparable al de MALBAC [17] . Otros autores también confirman la diferencia de cobertura entre MDA y MALBAC (84% y 72%) y la uniformidad comparativamente mayor de la cobertura de MALBAC ( coeficiente de variación 0,10 frente a 0,21 para MDA) [18] . Se ha demostrado que la MDA produce menos falsos positivos, pero el número de falsos negativos varía de un experimento a otro [18] . MALBAC da una menor tasa de pérdida de alelos (21%), sin embargo, su cobertura es menor que la de MDA [18] . En general, no está claro cuál conduce a menos falsos negativos, ya que la MDA cubre una mayor parte del genoma, pero pierde más alelos debido a la amplificación preferencial de solo uno de los alelos en el heterocigoto [15] [18] .

Por lo tanto, MDA y MALBAC tienen un conjunto de ventajas y desventajas, y la elección debe depender de la tarea en cuestión.

Creación de una biblioteca

Después de la amplificación, las bibliotecas se pueden preparar utilizando kits comerciales. Aquí son posibles varias opciones: la elección de un locus específico , la elección de un exoma o el genoma completo para su posterior secuenciación. Cada una de estas opciones asume ciertos valores de cobertura, propensión a error y costo [20] . La selección de áreas pequeñas le permite concentrarse en áreas que hacen la mayor contribución biológica al trabajo del sistema bajo estudio. Esto reduce el costo de la investigación y la probabilidad de introducir errores en la preparación de las muestras. El uso del genoma de referencia reduce los resultados falsos positivos, aunque limita los polimorfismos de un solo nucleótido detectados a los presentes en el genoma de referencia. La secuenciación del exoma permite aislar las características únicas de las células, sin embargo, con un aumento en la longitud de la región secuenciada, aumenta la probabilidad de introducir errores durante la amplificación. El uso del genoma completo permite identificar regiones estructurales y no codificantes, pero el costo de la investigación aumenta drásticamente, lo que dificulta la secuenciación del genoma completo de muchas células [20] .

El ADN de las bibliotecas creadas de una forma u otra se utiliza en la secuenciación mediante uno de los métodos existentes .

Procesamiento de datos

Errores comunes

La mayoría de los artefactos de secuenciación ocurren durante la preparación de la muestra: aislamiento celular, contaminación de ADN genómico, amplificación y generación de bibliotecas, ya que todos estos pasos introducen errores adicionales, pérdida de cobertura, reducción en la homogeneidad de la cobertura, sesgo de muestreo en la selección preferencial de ciertos grupos de células y amplificación. de ciertas secuencias de ADN son la causa de la pérdida de alelos en posiciones heterocigóticas. También hay que tener en cuenta las líneas celulares, sobre las que se realiza la optimización de todas las etapas de la secuenciación: no todas las células son diploides , existen tanto poblaciones haploides como aneuploides , y su ploidía puede afectar significativamente al experimento [4] . Un obstáculo para comparar diferentes resultados en esta área es a veces la falta de información sobre el número total de células evaluadas y la medida de evaluación de la calidad de la secuenciación en estudios específicos [20] .

Polimorfismos de un solo nucleótido

Los polimorfismos de un solo nucleótido, según el proyecto 1000 genomas , aportan la mayor diversidad al genoma humano [21] : 38 millones de polimorfismos de un solo nucleótido, 1,4 millones de inserciones / deleciones y más de 14 mil grandes deleciones [21] fueron confirmados en el mapa de haplotipos . También se supone que muchas enfermedades complejas, como la enfermedad de Alzheimer [22] , varios tipos de cáncer [23] , enfermedades autoinmunes [24] pueden estar asociadas precisamente con la presencia de polimorfismos.

Hoy en día, la búsqueda de polimorfismos en los datos de secuenciación de una sola célula se basa en los mismos algoritmos que el análisis de los resultados de la secuenciación convencional: GATK [25] , SNPdetector [26] , SOAPsnp [27] , VarScan [28] . Sin embargo, existen diferencias entre la secuenciación de poblaciones celulares y la secuenciación de células individuales: esta última tiene una menor cobertura del genoma y una mayor tasa de falsos positivos.

Variación en el número de copias de los segmentos de ADN

Las variaciones en el número de copias de los fragmentos de ADN conducen a un número anormal de copias de estos fragmentos; la diversidad de este tipo de polimorfismo genético también afecta la salud humana [29] [30] . Algunos estudios destacan su conexión con el desarrollo de tumores [31] , enfermedades autoinmunes [24] , autismo [32] , etc. Aquí, como en la búsqueda de polimorfismos de un solo nucleótido, se utilizan básicamente los mismos algoritmos que para la secuenciación convencional: CNV -seq [33] , PenCNV [34] , CNAseg [35] , ReadDepth [36] y cn.MOPS [37] . Para tener en cuenta el ruido introducido, es necesario analizar el efecto de los métodos de amplificación sobre la aparición y desaparición de variaciones en el número de copias de ADN [38] .

Análisis comparativo de células

Una estrategia para la agrupación celular basada en datos genómicos es la introducción de una función de distancia que cuantifica las diferencias entre pares de muestras [39] . En este caso, la Medida Jaccard se considera la más apropiada debido a la naturaleza binaria de los datos genéticos (ver más abajo) [40] . Una alternativa a los métodos basados ​​en funciones de distancia es el agrupamiento basado en modelos , que asume un enfoque probabilístico: en lugar de distancias "duras", se introducen probabilidades "suaves" de origen de células de diferentes clones.

Habiendo presentado los datos de la secuenciación de una sola célula como una matriz , donde las mutaciones de interés están marcadas verticalmente y las células están marcadas horizontalmente, lo llenamos con 0 y 1 dependiendo de la presencia de una mutación particular en una célula particular. Si se examina un tumor, con el tiempo se caracteriza por la expansión de algunos clones y la desaparición de otros [41] . Al mismo tiempo, no sabemos cuántos clones están presentes y suponemos que parte de los datos se perdió durante la preparación de la muestra.

Los parámetros del modelo, como la probabilidad de que una célula descienda de un clon particular, así como la tasa de falsos negativos, se pueden estimar utilizando un algoritmo de maximización de expectativas [42] . Luego, el problema de determinar el número de clones se reduce a la elección del modelo estadístico que mejor describa los datos de secuenciación; la evaluación se realiza utilizando los criterios de información de Bayes y Akaike [43] . También existe un enfoque híbrido que permite el agrupamiento inicial mediante una función de distancia, lo que aumenta la velocidad del agrupamiento basado en modelos, que requiere una gran potencia informática [44] . Sobre la base de los resultados del agrupamiento, se construye un perfil de mutaciones clonales consenso [45] . Según él, utilizando varios métodos de construcción de árboles , es posible identificar la relación entre diferentes clones. Por ejemplo, es posible demostrar la historia evolutiva de un tumor [45] .

Logros

Evolución clonal de células de cáncer de mama

El análisis de los patrones de mutación (inserciones, deleciones, sustituciones de un solo nucleótido, variaciones en el número de copias de genes ) de varias poblaciones de células de cáncer de mama permitió identificar tanto un conjunto de mutaciones características de cada una de las poblaciones (mutaciones clonales) como aquellas que ocurrieron en varias células (mutaciones subclonales) . Los datos se obtuvieron utilizando la secuenciación del exoma de una sola célula, verificada mediante secuenciación profunda. El estudio utilizó células de poblaciones aneuploides de ERBC (ER + /PR + /Her2 - ) y TNBC (ER - /PR - /Her2 - ), que difieren en la presencia de ciertos receptores (ER/PR/Her2) en la membrana superficie, así como células diploides normales. El resultado fue la identificación de significativamente más mutaciones clonales en la población de TNBC en comparación con ERBC y células normales. En la población de células TNBC se ha demostrado la existencia de tres subpoblaciones de células cancerosas, identificadas por patrones de mutaciones subclonales. Se ha obtenido evidencia de que TNBC tiene una tasa de mutación más alta, y su acumulación puede ocurrir no solo debido a errores durante la proliferación acelerada [4] .

Aún no está claro cómo exactamente los tumores se vuelven resistentes a la quimioterapia . O ya hay células resistentes raras en la población, o la respuesta se produce espontáneamente tras la acción de los fármacos. Además, no siempre está claro por qué se acumulan las mutaciones: o es una tasa de mutación acelerada, como en el caso de TNBC, o es la acumulación de mutaciones a una tasa normal, pero en gran número debido a la proliferación acelerada [4] .

Perspectivas

Por el momento, el principal problema es la presencia de un paso de amplificación de ADN genómico responsable de introducir la mayor cantidad de artefactos. Los requisitos de cantidad de ADN en la preparación de bibliotecas son cada vez más reducidos, y ya se ha demostrado la creación directa de bibliotecas a partir de ADN aislado [46] [47] . Además, se demostró que es posible prescindir por completo de las bibliotecas enviando ADN aislado de una célula para su secuenciación [48] . También existe la posibilidad de revelar información epigenética , como buscar patrones de metilación [49] [50] y capturar el estado conformacional de los cromosomas [51] . Hoy en día, los científicos generalmente operan en decenas a cientos de células, pero el desarrollo de plataformas automatizadas para la captura de células, la amplificación de ADN y la preparación de bibliotecas aumentará significativamente la escala y la disponibilidad del análisis de células individuales, lo que permitirá realizar experimentos más grandes en menos tiempo. [52] .

El uso de la secuenciación del ADN de una sola célula, junto con los estudios epigenómicos y transcriptómicos, permitirá clasificar con precisión las células y complementar la visión existente de las poblaciones celulares. También será posible establecer relaciones entre la secuencia del genoma, el estado epigenético y la expresión génica, y determinar la funcionalidad de las células [52] .

Véase también

Notas

  1. Tringe SG , von Mering C. , Kobayashi A. , Salamov AA , Chen K. , Chang HW , Podar M. , Short JM , Mathur EJ , Detter JC , Bork P. , Hugenholtz P. , Rubin EM Metagenómica comparativa de microbios comunidades  (Inglés)  // Ciencia (Nueva York, NY). - 2005. - vol. 308, núm. 5721 . - Pág. 554-557. -doi : 10.1126 / ciencia.1107851 . —PMID 15845853 .
  2. Marcy Y. , Ouverney C. , Bik EM , Lösekann T. , Ivanova N. , Martin HG , Szeto E. , Platt D. , Hugenholtz P. , Relman DA , Quake SR Disección de la "materia oscura" biológica con células unicelulares análisis genético de microbios TM7 raros y no cultivados de la boca humana.  (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 2007. - vol. 104, núm. 29 . - Pág. 11889-11894. -doi : 10.1073/ pnas.0704662104 . —PMID 17620602 .
  3. McConnell MJ , Lindberg MR , Brennand KJ , Piper JC , Voet T. , Cowing-Zitron C. , Shumilina S. , Lasken RS , Vermeesch JR , Hall IM , Gage FH Variación del número de copias del mosaico en neuronas humanas.  (Inglés)  // Ciencia (Nueva York, NY). - 2013. - Vol. 342, núm. 6158 . - Pág. 632-637. -doi : 10.1126 / ciencia.1243472 . — PMID 24179226 .
  4. ↑ 1 2 3 4 Wang Y. , Waters J. , Leung ML , Unruh A. , Roh W. , Shi X. , Chen K. , Scheet P. , Vattathil S. , Liang H. , Multani A. , Zhang H . , Zhao R. , Michor F. , Meric-Bernstam F. , Navin NE Evolución clonal en el cáncer de mama revelada por secuenciación del genoma de un solo núcleo.  (Inglés)  // Naturaleza. - 2014. - Vol. 512, núm. 7513 . - Pág. 155-160. -doi : 10.1038/ naturaleza13600 . —PMID 25079324 .
  5. Wen L. , Tang F. Secuenciación de células individuales en biología de células madre.  (Inglés)  // Biología del genoma. - 2016. - Vol. 17, núm. 1 . - Pág. 71. - doi : 10.1186/s13059-016-0941-0 . —PMID 27083874 .
  6. Bacher R. , Kendziorski C. Diseño y análisis computacional de experimentos de secuenciación de ARN de una sola célula.  (Inglés)  // Biología del genoma. - 2016. - Vol. 17, núm. 1 . - Pág. 63. - doi : 10.1186/s13059-016-0927-y . — PMID 27052890 .
  7. Emmert-Buck MR , Bonner RF , Smith PD , Chuaqui RF , Zhuang Z. , Goldstein SR , Weiss RA , Liotta LA Microdisección por captura láser.  (Inglés)  // Ciencia (Nueva York, NY). - 1996. - vol. 274, núm. 5289 . - Pág. 998-1001. —PMID 8875945 .
  8. CRECIMIENTO CLONAL DE HAM RG DE CÉLULAS DE MAMÍFEROS EN UN MEDIO SINTÉTICO QUÍMICAMENTE DEFINIDO. (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 1965. - Vol. 53. - Pág. 288-293. — PMID 14294058 .  
  9. ↑ 1 2 3 4 5 Zong C. , Lu S. , Chapman AR , Xie XS Detección en todo el genoma de variaciones de un solo nucleótido y número de copias de una sola célula humana.  (Inglés)  // Ciencia (Nueva York, NY). - 2012. - vol. 338, núm. 6114 . - Pág. 1622-1626. -doi : 10.1126 / ciencia.1229164 . — PMID 23258894 .
  10. Gole J. , Gore A. , Richards A. , Chiu YJ , Fung HL , Bushman D. , Chiang HI , Chun J. , Lo YH , Zhang K. Clonación de polimerasa masivamente paralela y secuenciación del genoma de células individuales usando micropocillos de nanolitros.  (Inglés)  // Biotecnología de la naturaleza. - 2013. - Vol. 31, núm. 12 _ - Pág. 1126-1132. -doi : 10.1038/ nbt.2720 . — PMID 24213699 .
  11. White AK , VanInsberghe M. , Petriv OI , Hamidi M. , Sikorski D. , Marra MA , Piret J. , Aparicio S. , Hansen CL High-throughput microfluidic single-cell RT-qPCR.  (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 2011. - vol. 108, núm. 34 . - Pág. 13999-14004. -doi : 10.1073/ pnas.1019446108 . —PMID 21808033 .
  12. Macosko EZ , Basu A. , Satija R. , Nemesh J. , Shekhar K. , Goldman M. , Tirosh I. , Bialas AR , Kamitaki N. , Martersteck EM , Trombetta JJ , Weitz DA , Sanes JR , Shalek AK , Regev A. , McCarroll SA Perfilado de expresión de todo el genoma altamente paralelo de células individuales utilizando gotas de nanolitros.  (Inglés)  // Celular. - 2015. - Vol. 161, núm. 5 . - Pág. 1202-1214. -doi : 10.1016 / j.cell.2015.05.002 . — PMID 26000488 .
  13. Thompson AM , Paguirigan AL , Kreutz JE , Radich JP , Chiu DT Microfluidics para análisis genético unicelular.  (Inglés)  // Laboratorio en un chip. - 2014. - Vol. 14, núm. 17 _ - Pág. 3135-3142. -doi : 10.1039/ c4lc00175c . —PMID 24789374 .
  14. Actis P. , Maalouf MM , Kim HJ , Lohith A. , Vilozny B. , Seger RA , Pourmand N. Genómica compartimental en células vivas revelada por nanobiopsia unicelular.  (Inglés)  // ACS nano. - 2014. - Vol. 8, núm. 1 . - Pág. 546-553. doi : 10.1021 / nn405097u . — PMID 24279711 .
  15. ↑ 1 2 3 4 Paez JG , Lin M. , Beroukhim R. , Lee JC , Zhao X. , Richter DJ , Gabriel S. , Herman P. , Sasaki H. , Altshuler D. , Li C. , Meyerson M. , Sellers WR Cobertura del genoma y fidelidad de la secuencia de la amplificación del genoma completo con desplazamiento de cadena múltiple basada en la polimerasa phi29.  (Inglés)  // Investigación de ácidos nucleicos. - 2004. - vol. 32, núm. 9 _ — Pág. e71. -doi : 10.1093 / nar/gnh069 . — PMID 15150323 .
  16. Ausubel, FM et al. vol. I., John Wiley & Songs, Inc. PROTOCOLOS ACTUALES EN BIOLOGÍA MOLECULAR. — 1995.
  17. ↑ 1 2 3 4 Hou Y. , Wu K. , Shi X. , Li F. , Song L. , Wu H. , Dean M. , Li G. , Tsang S. , Jiang R. , Zhang X. , Li B. , Liu G. , Bedekar N. , Lu N. , Xie G. , Liang H. , Chang L. , Wang T. , Chen J. , Li Y. , Zhang X. , Yang H. , Xu X. , Wang L. , Wang J. Comparación de la detección de variaciones entre los métodos de amplificación del genoma completo utilizados en la resecuenciación de una sola célula.  (Inglés)  // GigaCiencia. - 2015. - Vol. 4. - Pág. 37. - doi : 10.1186/s13742-015-0068-3 . — PMID 26251698 .
  18. ↑ 1 2 3 4 5 Huang L. , Ma F. , Chapman A. , Lu S. , Xie XS Amplificación y secuenciación del genoma completo de una sola célula: metodología y aplicaciones.  (Inglés)  // Revista anual de genómica y genética humana. - 2015. - Vol. 16. - Pág. 79-102. -doi : 10.1146 / annurev-genom-090413-025352 . —PMID 26077818 .
  19. Chen M. , Song P. , Zou D. , Hu X. , Zhao S. , Gao S. , Ling F. Comparación de amplificación de desplazamiento múltiple (MDA) y ciclos de amplificación basados ​​en bucles y recocido múltiple (MALBAC) en un solo -secuenciación celular.  (Inglés)  // Biblioteca Pública de Ciencias UNO. - 2014. - Vol. 9, núm. 12 _ - P. e114520. - doi : 10.1371/journal.pone.0114520 . —PMID 25485707 .
  20. ↑ 1 2 3 Gawad C. , Koh W. , Quake SR Secuenciación del genoma de una sola célula: estado actual de la ciencia.  (Inglés)  // Reseñas de la naturaleza. genética. - 2016. - Vol. 17, núm. 3 . - Pág. 175-188. -doi : 10.1038/ nrg.2015.16 . —PMID 26806412 .
  21. ↑ 1 2 Abecasis GR , Auton A. , Brooks LD , DePristo MA , Durbin RM , Handsaker RE , Kang HM , Marth GT , McVean GA Un mapa integrado de variación genética de 1092 genomas humanos.  (Inglés)  // Naturaleza. - 2012. - vol. 491, núm. 7422 . - Pág. 56-65. -doi : 10.1038/ naturaleza11632 . — PMID 23128226 .
  22. Martin ER , Lai EH , Gilbert JR , Rogala AR , Afshari AJ , Riley J. , Finch KL , Stevens JF , Livak KJ , Slotterbeck BD , Slifer SH , Warren LL , Conneally PM , Schmechel DE , Purvis I. , Pericak- Vance MA , Roses AD , Vance JM Eliminación de SNP en enfermedades complejas: análisis de polimorfismos de un solo nucleótido alrededor de APOE en la enfermedad de Alzheimer.  (Inglés)  // Revista estadounidense de genética humana. - 2000. - vol. 67, núm. 2 . - Pág. 383-394. -doi : 10.1086/ 303003 . —PMID 10869235 .
  23. Zhu Y. , Spitz MR , Lei L. , Mills GB , Wu X. Un polimorfismo de un solo nucleótido en el promotor de metaloproteinasa-1 de la matriz aumenta la susceptibilidad al cáncer de pulmón.  (Inglés)  // Investigación del cáncer. - 2001. - vol. 61, núm. 21 . - Pág. 7825-7829. — PMID 11691799 .
  24. 1 2 Schaschl H. , Aitman TJ , Vyse TJ Variación del número de copias en el genoma humano y su implicación en la autoinmunidad.  (Inglés)  // Inmunología clínica y experimental. - 2009. - Vol. 156, núm. 1 . - Pág. 12-16. -doi : 10.1111 / j.1365-2249.2008.03865.x . — PMID 19220326 .
  25. McKenna A. , Hanna M. , Banks E. , Sivachenko A. , Cibulskis K. , Kernytsky A. , Garimella K. , Altshuler D. , Gabriel S. , Daly M. , DePristo MA El kit de herramientas de análisis del genoma: MapReduce Marco para analizar datos de secuenciación de ADN de próxima generación.  (Inglés)  // Investigación del genoma. - 2010. - Vol. 20, núm. 9 _ - Pág. 1297-1303. -doi : 10.1101/ gr.107524.110 . —PMID 20644199 .
  26. Zhang J. , Wheeler DA , Yakub I. , Wei S. , Sood R. , Rowe W. , Liu PP , Gibbs RA , Buetow KH SNPdetector: una herramienta de software para la detección sensible y precisa de SNP.  (Inglés)  // Biblioteca Pública de Ciencias de Biología Computacional. - 2005. - vol. 1, no. 5 . - Pág. e53. -doi : 10.1371 / journal.pcbi.0010053 . —PMID 16261194 .
  27. Li R. , Li Y. , Fang X. , Yang H. , Wang J. , Kristiansen K. , Wang J. Detección de SNP para la resecuenciación paralela masiva del genoma completo.  (Inglés)  // Investigación del genoma. - 2009. - Vol. 19, núm. 6 _ - Pág. 1124-1132. -doi : 10.1101/ gr.088013.108 . —PMID 19420381 .
  28. Koboldt DC , Chen K. , Wylie T. , Larson DE , McLellan MD , Mardis ER , Weinstock GM , Wilson RK , Ding L. VarScan: detección de variantes en secuenciación masivamente paralela de muestras individuales y agrupadas.  (Inglés)  // Bioinformática. - 2009. - Vol. 25, núm. 17 _ - Pág. 2283-2285. -doi : 10.1093 / bioinformática/btp373 . —PMID 19542151 .
  29. Redon R. , Ishikawa S. , Fitch KR , Feuk L. , Perry GH , Andrews TD , Fiegler H. , Shapero MH , Carson AR , Chen W. , Cho EK , Dallaire S. , Freeman JL , González JR , Gratacòs M. , Huang J. , Kalaitzopoulos D. , Komura D. , MacDonald JR , Marshall CR , Mei R. , Montgomery L. , Nishimura K. , Okamura K. , Shen F. , Somerville MJ , Tchinda J. , Valsesia A . , Woodwark C. , Yang F. , Zhang J. , Zerjal T. , Zhang J. , Armengol L. , Conrad DF , Estivill X. , Tyler-Smith C. , Carter NP , Aburatani H. , Lee C. , Jones KW , Scherer SW , Hurles ME Variación global en el número de copias en el genoma humano.  (Inglés)  // Naturaleza. - 2006. - vol. 444, núm. 7118 . - Pág. 444-454. -doi : 10.1038/ naturaleza05329 . — PMID 17122850 .
  30. Zhang F. , Gu W. , Hurles ME , Lupski JR Variación del número de copias en la salud humana, la enfermedad y la evolución.  (Inglés)  // Revista anual de genómica y genética humana. - 2009. - Vol. 10.- Pág. 451-481. -doi : 10.1146 / annurev.genom.9.081307.164217 . —PMID 19715442 .
  31. Frank B. , Bermejo JL , Hemminki K. , Sutter C. , Wappenschmidt B. , Meindl A. , Kiechle-Bahat M. , Bugert P. , Schmutzler RK , Bartram CR , Burwinkel B. Número de copia variante en el tumor candidato gen supresor MTUS1 y riesgo familiar de cáncer de mama.  (Inglés)  // Carcinogénesis. - 2007. - vol. 28, núm. 7 . - Pág. 1442-1445. -doi : 10.1093 / carcin/bgm033 . —PMID 17301065 .
  32. Glessner JT , Wang K. , Cai G. , Korvatska O. , Kim CE , Wood S. , Zhang H. , Estes A. , Brune CW , Bradfield JP , Imielinski M. , Frackelton EC , Reichert J. , Crawford EL , Munson J. , Sleiman PM , Chiavacci R. , Annaiah K. , Thomas K. , Hou C. , Glaberson W. , Flory J. , Otieno F. , Garris M. , Soorya L. , Klei L. , Piven J . , Meyer KJ , Anagnostou E. , Sakurai T. , Game RM , Rudd DS , Zurawiecki D. , McDougle CJ , Davis LK , Miller J. , Posey DJ , Michaels S. , Kolevzon A. , Silverman JM , Bernier R. , Levy SE , Schultz RT , Dawson G. , Owley T. , McMahon WM , Wassink TH , Sweeney JA , Nurnberger JI , Coon H. , Sutcliffe JS , Minshew NJ , Grant SF , Bucan M. , Cook EH , Buxbaum JD , Devlin B. , Schellenberg GD , Hakonarson H. La variación del número de copias en todo el genoma del autismo revela la ubiquitina y los genes neuronales.  (Inglés)  // Naturaleza. - 2009. - Vol. 459, núm. 7246 . - Pág. 569-573. -doi : 10.1038/ naturaleza07953 . —PMID 19404257 .
  33. Xie C. , Tammi MT CNV-seq, un nuevo método para detectar la variación del número de copias mediante secuenciación de alto rendimiento.  (Inglés)  // BMC bioinformática. - 2009. - Vol. 10. - Pág. 80. - doi : 10.1186/1471-2105-10-80 . — PMID 19267900 .
  34. Wang K. , Li M. , Hadley D. , Liu R. , Glessner J. , Grant SF , Hakonarson H. , Bucan M. PennCNV: un modelo de Markov oculto integrado diseñado para la detección de variación del número de copias de alta resolución en datos de genotipado de SNP del genoma.  (Inglés)  // Investigación del genoma. - 2007. - vol. 17, núm. 11 _ - Pág. 1665-1674. - doi : 10.1101/gr.6861907 . —PMID 17921354 .
  35. Ivakhno S. , Royce T. , Cox AJ , Evers DJ , Cheetham RK , Tavaré S. CNAseg: un marco novedoso para la identificación de cambios en el número de copias en el cáncer a partir de datos de secuenciación de segunda generación.  (Inglés)  // Bioinformática. - 2010. - Vol. 26, núm. 24 . - Pág. 3051-3058. -doi : 10.1093 / bioinformática/btq587 . —PMID 20966003 .
  36. Miller CA , Hampton O. , Coarfa C. , Milosavljevic A. ReadDepth: un paquete R paralelo para detectar alteraciones en el número de copias de lecturas de secuencias cortas.  (Inglés)  // Biblioteca Pública de Ciencias UNO. - 2011. - vol. 6, núm. 1 . - Pág. e16327. - doi : 10.1371/journal.pone.0016327 . —PMID 21305028 .
  37. Klambauer G. , Schwarzbauer K. , Mayr A. , Clevert DA , Mitterecker A. , Bodenhofer U. , Hochreiter S. cn.MOPS: mezcla de Poissons para descubrir variaciones en el número de copias en datos de secuenciación de próxima generación con un descubrimiento falso bajo Velocidad.  (Inglés)  // Investigación de ácidos nucleicos. - 2012. - vol. 40, núm. 9 _ — Pág. e69. -doi : 10.1093 / nar/gks003 . — PMID 22302147 .
  38. Ning L. , Liu G. , Li G. , Hou Y. , Tong Y. , He J. Desafíos actuales en la bioinformática de la genómica unicelular.  (Inglés)  // Fronteras en oncología. - 2014. - Vol. 4. - Pág. 7. - doi : 10.3389/fonc.2014.00007 . —PMID 24478987 .
  39. Eisen MB , Spellman PT , Brown PO , Botstein D. Análisis de conglomerados y visualización de patrones de expresión de todo el genoma.  (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 1998. - vol. 95, núm. 25 . - Pág. 14863-14868. —PMID 9843981 .
  40. Prokopenko D. , Hecker J. , Silverman EK , Pagano M. , Nöthen MM , Dina C. , Lange C. , Fier HL Utilización del índice de Jaccard para revelar la estratificación de la población en los datos de secuenciación: un estudio de simulación y una aplicación al 1000 Proyecto Genoma.  (Inglés)  // Bioinformática. - 2016. - Vol. 32, núm. 9 _ - Pág. 1366-1372. -doi : 10.1093 / bioinformática/btv752 . — PMID 26722118 .
  41. Greaves M. , Maley C. C. Clonal evolution in cancer.  (Inglés)  // Naturaleza. - 2012. - vol. 481, núm. 7381 . - Pág. 306-313. -doi : 10.1038/ naturaleza10762 . —PMID 22258609 .
  42. AP Dempster; NM Laird; DB Rubin. Máxima probabilidad de datos incompletos a través del algoritmo EM  // Revista de la Royal Statistical Society. Serie B (Metodológica). - 1977. - vol. 39, núm. 1 . - Pág. 1-38. -doi : 10.2307/ 2984875 . Archivado desde el original el 11 de diciembre de 2015.
  43. C. Fraley, A. E. Raftery. ¿Cuántos clústeres? ¿Qué método de agrupación? Respuestas a través del análisis  de conglomerados basado en modelos . - 1998. - doi : 10.1093/comjnl/41.8.578 . Archivado desde el original el 22 de febrero de 2017.
  44. Chris Fraley, Adrian E. Raftery. MCLUST: Software para análisis de conglomerados basado en modelos  (inglés)  // Revista de clasificación. - 1999. - doi : 10.1007/s003579900058 . Archivado desde el original el 22 de julio de 2017.
  45. ↑ 1 2 Kim KI , Simon R. Uso de datos de secuenciación de células individuales para modelar la historia evolutiva de un tumor.  (Inglés)  // BMC bioinformática. - 2014. - Vol. 15. - Pág. 27. - doi : 10.1186/1471-2105-15-27 . —PMID 24460695 .
  46. Falconer E. , Hills M. , Naumann U. , Poon SS , Chavez EA , Sanders AD , Zhao Y. , Hirst M. , Lansdorp PM DNA template strand sequencing of single-cell mapea reordenamientos genómicos a alta resolución.  (Inglés)  // Métodos de la naturaleza. - 2012. - vol. 9, núm. 11 _ - Pág. 1107-1112. -doi : 10.1038/ nmeth.2206 . — PMID 23042453 .
  47. Falconer E. , Lansdorp PM Strand-seq: una herramienta unificadora para estudios de segregación cromosómica.  (Inglés)  // Seminarios de biología celular y del desarrollo. - 2013. - Vol. 24, núm. 8-9 . - Pág. 643-652. -doi : 10.1016/ j.semcdb.2013.04.005 . —PMID 23665005 .
  48. Coupland P. , Chandra T. , Quail M. , Reik W. , Swerdlow H. Secuenciación directa de genomas pequeños en Pacific Biosciences RS sin preparación de biblioteca.  (Inglés)  // Biotécnicas. - 2012. - vol. 53, núm. 6 _ - Pág. 365-372. -doi : 10.2144 / 000113962 . — PMID 23227987 .
  49. El Hajj N. , Trapphoff T. , Linke M. , May A. , Hansmann T. , Kuhtz J. , Reifenberg K. , Heinzmann J. , Niemann H. , Daser A. , Eichenlaub-Ritter U. , Zechner U . , Haaf T. La secuenciación de bisulfito de dilución limitada (piro) revela patrones de metilación específicos de los padres en embriones de ratón tempranos individuales y ovocitos bovinos.  (Inglés)  // Epigenética. - 2011. - vol. 6, núm. 10 _ - Pág. 1176-1188. -doi : 10.4161/ epi.6.10.17202 . —PMID 21937882 .
  50. Guo H. , Zhu P. , Wu X. , Li X. , Wen L. , Tang F. Paisajes de metiloma de una sola célula de células madre embrionarias de ratón embrionario y embriones tempranos analizados mediante secuenciación de bisulfito de representación reducida.  (Inglés)  // Investigación del genoma. - 2013. - Vol. 23, núm. 12 _ - Pág. 2126-2135. -doi : 10.1101/ gr.161679.113 . — PMID 24179143 .
  51. Nagano T. , Lubling Y. , Yaffe E. , Wingett SW , Dean W. , Tanay A. , Fraser P. Hi-C de una sola célula para la detección de interacciones de cromatina en todo el genoma que ocurren simultáneamente en una sola célula.  (Inglés)  // Protocolos de la naturaleza. - 2015. - Vol. 10, núm. 12 _ - Pág. 1986-2003. -doi : 10.1038/ nprot.2015.127 . —PMID 26540590 .
  52. ↑ 1 2 Macaulay IC , Voet T. Genómica unicelular: avances y perspectivas futuras.  (Inglés)  // Genética PLoS. - 2014. - Vol. 10, núm. 1 . — Pág. e1004126. -doi : 10.1371 / journal.pgen.1004126 . — PMID 24497842 .