Metagenómica

La metagenómica  es una rama de la genética molecular que estudia el material genético obtenido de muestras ambientales. La metagenómica estudia el conjunto de genes de todos los microorganismos que se encuentran en una muestra del medio ambiente: el metagenoma . El análisis metagenómico permite determinar la diversidad de especies de la muestra en estudio sin necesidad de aislamiento y cultivo de microorganismos.

La principal ventaja de utilizar el enfoque metagenómico es tener en cuenta no solo los microorganismos cultivados, sino también los no cultivados. Resultó que tales organismos hacen la principal contribución a la diversidad de especies de las comunidades [1] . La metagenómica permite estudiar en detalle la diversidad de las comunidades y, por tanto, conocer los mecanismos de su funcionamiento, determinar las relaciones metabólicas [2] .

El desarrollo generalizado de la metagenómica se debe a la difusión de métodos de secuenciación de nueva generación . Permiten obtener las secuencias de casi todos los genes de cada microorganismo de la comunidad [3] . A medida que el precio de la secuenciación del ADN cae cada día, este tipo de análisis se vuelve más asequible.

Etimología

El  término "metagenómica" fue utilizado por primera vez por Joe Handelsman , John Clardy , Robert Goodman , Sean Brady y otros en su publicación de 1998 [4] . El término "metagenoma" surgió de la idea de que un conjunto de genes recolectados del medio ambiente puede analizarse de la misma manera que se analizan genomas completos. Kevin Chen y Lyor Patcher (investigadores de la Universidad de California, Berkeley ) han definido la metagenómica como "la aplicación de técnicas modernas de genómica sin necesidad de aislamiento y cultivo en laboratorio de especies individuales" [5] .

Historia

Durante mucho tiempo, al secuenciar los genomas de los microorganismos, por regla general, se usaban cultivos de células idénticas como fuentes de ADN. Sin embargo, los primeros estudios de metagenómica han demostrado que en muchos hábitats existen grandes grupos de microorganismos que no pueden crecer en cultivos de laboratorio y, por lo tanto, sus genomas no pueden secuenciarse. Estos primeros trabajos estudiaron secuencias de ARNr 16S , que son bastante cortas, a menudo conservadas dentro de una sola especie y tienden a diferir de una especie a otra. Muchas secuencias de ARNr 16S que se encuentran en diferentes hábitats no se pueden atribuir a ninguna de las especies cultivadas, lo que indica la existencia de muchos microorganismos no aislados. Estos estudios han demostrado que solo el 1% de las especies encontradas en una muestra ambiental son cultivadas [1] .

La investigación molecular en esta área fue iniciada por Norman Pace y sus colegas, quienes utilizaron PCR para estudiar la diversidad de secuencias de ARNr [6] . A través de estos estudios, Pace avanzó la idea de clonar ADN directamente de muestras ambientales en 1985 [7] . En 1991, Pace y sus colegas publicaron el primer informe sobre el aislamiento y clonación de ADN de una muestra ambiental [8] . Aunque la metodología existente entonces solo permitía trabajar con genes muy conservadores, no codificadores de proteínas , nos permitió confirmar los resultados de los estudios microbiológicos morfológicos, indicando una mayor diversidad de especies de microorganismos que la que permitían los métodos de cultivo en laboratorio. En 1995, Healy informó sobre el aislamiento metagenómico de genes funcionales de un complejo cultivo de laboratorio de microorganismos ambientales cultivados en hierba seca [9] . Edward DeLong , quien dejó el laboratorio de Pace, sentó las bases para construir filogenias de microorganismos del medio ambiente basadas en 16S rRNA. Su propio grupo comenzó a ensamblar una biblioteca de material genético de microorganismos marinos [10] .

En 2002, Mia Breitbard, Forest Rower y sus colegas, utilizando secuencias de escopeta de muestras ambientales , demostraron que 200 litros de agua de mar contenían más de 5000 tipos de virus [11] . Otros estudios han demostrado que las heces humanas contienen más de mil tipos de virus, y un kilogramo de sedimento marino puede contener más de un millón de tipos de virus, incluidos los bacteriófagos . Casi todos estos virus eran especies nuevas. En 2004, se secuenció completamente el ADN de las aguas ácidas de las minas [12] . Gracias a este estudio, fue posible obtener genomas completos o casi completos de especies bacterianas y arqueas, que previamente no habían sido cultivadas en el laboratorio [13] .

A principios de 2003, Craig Venter , jefe de un proyecto paralelo al Proyecto Genoma Humano, organizó una expedición para recolectar muestras de agua oceánica de toda la Tierra ( inglés:  Global Ocean Sampling Expedition (GOS) ). Todas las muestras se secuenciaron al azar para identificar los genomas de los nuevos organismos. Se ha identificado el ADN de 2000 especies diferentes en el Mar de los Sargazos, incluidas 148 nuevas especies bacterianas [14] .

En 2005, Stefan Schuster y sus colegas de la Universidad de Pensilvania publicaron la primera secuencia de una muestra ambiental obtenida mediante secuenciación de alto rendimiento, más precisamente, pirosecuenciación [15] .

Varios proyectos de metagenómica humana se encuentran en diversas etapas de implementación o ya se han completado, incluido el análisis de la piel y la microflora intestinal [16] . Obtener una imagen bacteriana completa del cuerpo requiere enormes esfuerzos, debido a la enorme diversidad de especies de microorganismos.

En 2007-2008, se lanzó un proyecto global llamado Microbioma Humano . En 2011, se presentaron algunos resultados [17] [18] . Desde 2010, se ha esbozado en Rusia un estudio a gran escala del metagenoma humano. Un consorcio de los principales institutos rusos en el campo de la gastroenterología y la biología molecular, como proyecto de iniciativa, comenzó a realizar los primeros experimentos de secuenciación a gran escala de muestras de ADN del intestino humano [19] .

Secuenciación

Secuenciación mediante fragmentación aleatoria

El primer método ampliamente utilizado de secuenciación por fragmentación aleatoria es el método de escopeta . Se encuentra en el hecho de que el ADN aislado de la muestra se hidroliza en fragmentos aleatorios. Luego, utilizando los métodos de clonación molecular , se crea una biblioteca de clones a partir de los fragmentos obtenidos . Las secuencias de ADN se determinan mediante la secuenciación de Sanger y luego se ensambla el genoma [20] . La secuenciación proporciona información sobre los genes que están presentes en los organismos representados en la muestra. Una descripción funcional de los productos de estos genes permite determinar las relaciones metabólicas en la comunidad [21] .

La presencia de la etapa de clonación molecular en el método hace que requiera bastante tiempo. Sin embargo, a partir de 2016 ya no se utiliza la secuenciación de Sanger para determinar secuencias genómicas, sino que se utilizan métodos de secuenciación de nueva generación , que permiten obtener secuencias genómicas de organismos que se encuentran en una muestra del medio ambiente de manera más rápida y sin la etapa de clonación molecular. [22] [23]

Con tal análisis, las secuencias pertenecientes a los organismos más representados predominarán en el conjunto de ADN de la muestra. Para proporcionar una cobertura suficiente de los genomas de organismos subrepresentados, se hace necesario utilizar grandes volúmenes de medio de muestra. Por otro lado, la naturaleza aleatoria de los métodos de secuenciación (fragmentación aleatoria de una secuencia de ADN de una muestra) hace que las secuencias de muchos organismos que podrían pasar desapercibidos utilizando métodos de cultivo tradicionales estén disponibles para el análisis, al menos en algunas parcelas pequeñas. sus secuencias de ADN genómico [12] .

Secuenciación de genes conservados evolutivamente

La tarea de determinar la composición de especies de una comunidad se resuelve secuenciando ciertos genes que deberían tener todos los organismos de una comunidad. Algunas regiones de tales secuencias de ADN genómico, como el gen que codifica el ARNr 16S , consisten en secuencias altamente conservadas y regiones hipervariables [24] . Esta característica permite el uso de cebadores de secuenciación que son complementarios a las regiones conservadas para generar secuencias de regiones hipervariables. Las secuencias obtenidas permiten atribuir el organismo a una determinada especie [25] [26] .

Análisis bioinformático

Los datos obtenidos como resultado de un experimento metagenómico contienen una gran cantidad de información y ruido, ya que son fragmentos de secuencias de ADN pertenecientes a miles y decenas de miles de especies diferentes [27] . Recolectar, curar y extraer información biológica útil de conjuntos de datos de este tamaño son desafíos computacionales que pueden resolverse utilizando la bioinformática [28] .

Preprocesamiento de datos

La primera etapa del análisis metagenómico es el filtrado preliminar de datos. Incluye la eliminación de secuencias redundantes y de baja calidad. Para los metagenomas derivados de organismos animales, es importante eliminar las secuencias de origen eucariótico [29] . La contaminación del ADN genómico eucariótico se elimina utilizando los algoritmos Eu-Detect [30] y DeConseq [31] .

Montaje de secuencias

En esencia, las secuencias de ADN de los experimentos genómicos y metagenómicos son las mismas. Sin embargo, los experimentos metagenómicos brindan una cobertura menor, y el uso de métodos de secuenciación de próxima generación para el análisis conduce a una limitación en la longitud de la secuencia que se está secuenciando [28] . La tarea también es complicada debido a la diferente representación de las especies en la comunidad. Estas características llevan a que el ensamblaje de las regiones del genoma a partir de los datos de un experimento metagenómico se convierta en una tarea difícil, requiere una gran potencia de cálculo y puede dar lugar a resultados erróneos. Por ejemplo, se pueden obtener secuencias quiméricas, que son una combinación de secciones de secuencias de ADN de diferentes organismos [32] .

Hay varios programas que se ensamblan con respecto a las lecturas de los extremos de los pares, este método le permite reducir la cantidad de errores. Programas como Phrap o Celera Assembler fueron creados originalmente para el ensamblaje de genomas individuales, pero dan buenos resultados al procesar datos metagenómicos [27] . Otros programas, como el ensamblador Velvet, usan gráficos de Bruijn para manejar las secuencias cortas (lecturas) que resultan de los métodos de secuenciación de próxima generación. El ensamblaje de los genomas de las especies más comunes se ve facilitado por el uso de genomas de referencia [32] . Después del ensamblaje, surge el siguiente problema: es necesario determinar a qué especie pertenecen las secuencias resultantes [33] .

Búsqueda de secuencias de codificación

En el análisis metagenómico, se utilizan dos enfoques principales para anotar las secuencias de codificación después del ensamblaje [32] . El primer método se basa en la búsqueda de genes homólogos anotados, generalmente utilizando BLAST . Este enfoque se implementa en el programa MEGAN4 [34] . El segundo enfoque ( ab initio ) usa características internas de la secuencia para predecir regiones codificantes , para su implementación se usan conjuntos de genes de entrenamiento de organismos relacionados [35] . Este enfoque es utilizado por los programas GeneMark [36] y GLIMMER [37] . La principal ventaja del enfoque ab initio es que puede identificar secuencias codificantes para las que no se conocen homólogos [27] .

Definición de composición por especies

Mientras que la anotación del metagenoma indica qué funciones se implementan en la comunidad, la definición de composición de especies permite determinar qué organismos son responsables de su implementación. El proceso de asociar ciertos genes, y por lo tanto las funciones que pueden realizar, con ciertos tipos de organismos se denomina binning . Se implementa mediante el método BLAST a través de la búsqueda de genes similares, por lo que se sabe a qué organismo pertenecen. Este enfoque se implementa en el programa MEGAN (MEta Genome ANalyzer) [38] . Además, este programa le permite realizar una anotación funcional del metagenoma. Durante el procesamiento, las secuencias se asocian con los nodos de taxonomía NCBI y los nodos de clasificación funcional SEED o KEGG [39] utilizando el algoritmo del ancestro menos común [39] . La primera versión del programa se utilizó en 2005 para analizar el contexto metagenómico de secuencias de ADN obtenidas de hueso de mamut [15] .

Otro programa, PhymmBL, utiliza modelos de Markov interpolados [27] para este propósito . Los métodos MetaPhlAn [40] y AMPHORA [41] utilizan datos sobre marcadores genéticos únicos  (secuencias características de cualquier clado ) para determinar la representación de un grupo taxonómico en una comunidad [42] . Algunos métodos de agrupamiento utilizan información sobre las propiedades intrínsecas de la secuencia, como las frecuencias de oligonucleótidos o el uso de codones .

Integración de datos

Analizar el gran número exponencialmente creciente de secuencias de ADN disponibles es una tarea desafiante. Además, el análisis se complica por los metadatos complejos asociados con los proyectos metagenómicos. Incluyen información sobre la geografía de la muestra en estudio, características ambientales, datos físicos, así como métodos de muestreo [28] . Esta información es necesaria para garantizar la reproducibilidad de los experimentos y para análisis posteriores. Es importante presentar esta información usando formatos de datos estandarizados y desarrollar bases de datos especializadas como Genomes OnLine Database (GOLD) [43] .

Se han desarrollado servicios especiales para la integración de metadatos y datos sobre secuencias genómicas. En 2007 se creó un servicio accesible para el análisis de datos de experimentos metagenómicos Metagenomics Rapid Anotation utilizando el servidor Subsystem Technology (MG-RAST). En 2012, se habían cargado en esta base de datos unos 50 000 metagenomas [44] .

Metagenómica comparada

Un análisis comparativo de los metagenomas permite comprender las características del funcionamiento de las comunidades microbiológicas y, para los microorganismos simbióticos , establecer su papel en el mantenimiento de la salud del huésped [45] . Las comparaciones por parejas y múltiples de metagenomas se realizan alineando sus fragmentos, comparando la composición de GC , los patrones de uso de oligonucleótidos y la diversidad de especies. Se puede realizar una comparación funcional comparando fragmentos de metagenomas con bases de datos que contienen información sobre vías metabólicas [39] . Para determinar la función de una comunidad, no es la definición de la composición de especies la que juega un papel importante, sino la descripción funcional de todos los genes presentes en ella. Las mismas funciones se encuentran en comunidades bajo condiciones ecológicas similares, aunque la composición de especies de tales comunidades puede diferir mucho [46] . Es por eso que los metadatos que describen las condiciones para obtener una muestra metagenómica son muy importantes para el análisis comparativo [27] .

El objetivo principal de la metagenómica comparativa es identificar grupos de microorganismos que determinan las características de un área particular del medio ambiente. Estas características son el resultado de interacciones entre grupos de microorganismos. Para ello se desarrolló el programa Community-Analyzer [47] . Permite comparar la composición taxonómica de comunidades e identificar posibles interacciones entre los grupos de microorganismos detectados. En lugar de simplemente comparar la distribución de grupos taxonómicos, el programa tiene en cuenta los patrones probabilísticos de las interacciones.

Análisis de datos

El método principal en el análisis de la comunidad metagenómica es el mapeo de lecturas a los genomas de bacterias o arqueas conocidas anotadas en GenBank . Por lo tanto, para comprender qué microorganismos viven en una muestra determinada y qué relaciones metabólicas son posibles entre ellos, no es necesario volver a ensamblar la secuencia [48] .

Relaciones metabólicas

En muchas comunidades bacterianas, tanto naturales como artificiales (como los biorreactores ), existe una distribución de responsabilidades en los procesos metabólicos, la denominada sintrofia , como consecuencia de la cual los productos metabólicos de unos microorganismos son utilizados por otros microorganismos [49] . Por ejemplo, en uno de estos sistemas -digestores-  existen dos especies sintróficas ( Syntrophobacterales y Synergistia ), fruto del trabajo conjunto de que la materia prima utilizada se convierte en un residuo totalmente metabolizable ( metano ) [50] . Mediante el estudio de la expresión génica mediante micromatrices de ADN o análisis proteómico , los investigadores pueden unir partes de la red metabólica para formar grupos metabólicos [51] .

Metatranscriptoma

La metagenómica permite a los investigadores acceder a la diversidad funcional y metabólica de las comunidades microbianas; sin embargo, la metagenómica no puede mostrar cuáles de estos procesos metabólicos están activos. La extracción y el análisis del ARN mensajero metagenómico (metatranscriptoma) proporciona información sobre la regulación de los perfiles de expresión génica de comunidades complejas [46] . Debido a dificultades técnicas (por ejemplo, la rápida degradación de las moléculas de ARN mensajero ), existen muy pocos estudios de transcripciones de comunidades microbianas no cultivadas hasta la fecha. Sin embargo, el desarrollo de las tecnologías de micromatrices impulsó el estudio de los metatranscriptomas y fue posible evaluar la expresión de varios genes de toda la comunidad [52] .

Virus

La secuenciación metagenómica se utiliza en el estudio de comunidades virales . Dado que los virus no comparten un marcador filogenético universal común (como el ARN 16S para bacterias y arqueas , y el ARN 18S para eucariotas), la única forma de acceder al estudio de la diversidad genética de una comunidad viral en una muestra ecológica es a través de la metagenómica. Los metagenomas virales (también llamados viromas ) deberían proporcionar cada vez más información sobre la diversidad y evolución viral [53] .

Aplicaciones de la metagenómica

La metagenómica tiene el potencial de ser explorada en una amplia variedad de aplicaciones. La metagenómica se puede aplicar para resolver problemas prácticos en áreas como la medicina , la ingeniería, la agricultura y la ecología.

Medicina

Las comunidades microbianas juegan un papel clave en el mantenimiento de la salud humana , pero su composición y mecanismos de funcionamiento siguen sin resolverse [54] . La secuenciación metagenómica se ha utilizado para caracterizar comunidades microbianas en cientos de individuos. Esto es parte del llamado Proyecto Microbioma Humano, cuyos principales objetivos son: identificar el conjunto básico de microbios humanos , comprender cómo los cambios en la microflora humana se correlacionan con los cambios en la salud, y desarrollar la base tecnológica y bioinformática para lograr estos objetivos [55] secuenciación de genomas de microorganismos intestinales aptos para el cultivo en condiciones de laboratorio:

Otra dirección médica es el proyecto MetaHit (metagenomics of the human digestivo tract ), en el que participaron 124 personas de Dinamarca y España , entre ellas personas sanas, con sobrepeso y con enfermedades del tubo digestivo. El objetivo principal del estudio fue intentar caracterizar la diversidad filogenética de las bacterias gastrointestinales. El estudio mostró que dos clados bacterianos, Bacteroidetes y Firnicutes , comprenden más del 90% de todos los grupos filogenéticos bacterianos conocidos que dominan el intestino distal. Utilizando la frecuencia relativa de los genes que se encuentran en el intestino, los investigadores identificaron 1244 grupos metagenómicos que desempeñan un papel fundamental en el mantenimiento de un estado saludable. Se han identificado dos funciones principales de estos grupos: mantener la expresión de genes de mantenimiento y la expresión de genes específicos del tracto gastrointestinal. El grupo de genes de limpieza es esencial para todas las bacterias y, a menudo, juega un papel importante en las vías metabólicas, como el metabolismo central del carbono , la síntesis de aminoácidos . Un conjunto de genes específicos incluye la capacidad de adherirse a las proteínas del huésped y la capacidad de alimentarse de azúcares . Los pacientes con irritación del colon tienen un 25 % menos de estos genes y también muestran recuentos bacterianos más bajos que las personas a las que no se les ha diagnosticado ningún problema gastrointestinal.

Aunque estos estudios tienen aplicaciones médicas potencialmente valiosas, solo el 31-48,8 % de las secuencias se alinearon con los 194 genomas bacterianos intestinales conocidos, y solo el 7,6-21,2 % de las lecturas se alinearon con las secuencias de GenBank , lo que indica la necesidad de un mayor desarrollo de investigación para cubrir completamente todos los genomas bacterianos [56] .

El costo de la secuenciación del genoma humano en los últimos tres años[ ¿Qué? ] ha disminuido casi 100 veces y continúa disminuyendo rápidamente. La mejora de las tecnologías de secuenciación de ADN NGS en un futuro próximo conducirá a superar el próximo umbral de precios ($1000 por genoma) y provocará cambios fundamentales en muchas áreas de la biología y la genética médica , lo que debería conducir a la personalización de la medicina en el futuro . El auge tecnológico en este campo de la genética molecular apunta a que la metagenómica sustituirá paulatinamente al diagnóstico por PCR . En 2011, también se anunció en Rusia una subvención para la investigación en el campo de la metagenómica [57] .

Biocombustibles

Los biocombustibles se obtienen mediante la conversión de biomasa , por ejemplo, mediante la conversión de celulosa , derivada del maíz y el mijo , en alcohol de hidrólisis . Este proceso se basa en consorcios microbianos para convertir la celulosa en azúcares, seguido de la fermentación de los azúcares en etanol . Los microorganismos también producen diversas fuentes de bioenergía, incluidos el metano y el hidrógeno [58] .

La producción industrial eficiente de nuevos compuestos a partir de biomasa requiere nuevas enzimas con mayor productividad y menores costos de producción [59] . Los enfoques metagenómicos para el análisis de comunidades microbianas complejas permiten la detección selectiva de enzimas de aplicación industrial en la producción de biocombustibles, como las glicosil hidrolasas [60] . Además, el conocimiento de cómo funcionan las comunidades microbianas es esencial para gestionar estas comunidades, y la metagenómica es una herramienta clave para comprenderlas. Los enfoques metagenómicos permiten realizar un análisis comparativo entre sistemas convergentes de microorganismos.

Biorremediación

A través de la metagenómica, se pueden mejorar las estrategias para monitorear los efectos de los contaminantes en un ecosistema y se pueden desarrollar nuevos métodos para limpiar los ambientes contaminados. Una comprensión más profunda de cómo las comunidades microbianas lidian con los contaminantes brinda la esperanza de que este proceso pueda usarse en el futuro para combatir la contaminación industrial [61] .

Biotecnología

Las comunidades microbianas pueden producir una amplia gama de sustancias biológicamente activas que luego son utilizadas por otros organismos. Muchas de las drogas que se usan hoy en día se encontraron originalmente en microorganismos. El éxito reciente en la obtención de material genético diverso de microorganismos no cultivados ha llevado al descubrimiento de nuevos genes, enzimas y otros compuestos activos. El uso de la metagenómica ha permitido el desarrollo de nuevas ramas de la industria química y farmacéutica [62] .

Agricultura

Un gramo de suelo utilizado para el cultivo de plantas contiene entre 10 9 y 10 10 células microbianas [63] . La composición de las comunidades microbianas que viven en el suelo ha atraído durante mucho tiempo la atención de los científicos, pero sigue sin comprenderse bien, a pesar de su importancia económica. Las comunidades microbianas realizan una amplia gama de funciones ecosistémicas necesarias para el crecimiento de las plantas (por ejemplo, fijación de nitrógeno ), protección de las plantas contra enfermedades, participación en el ciclo del hierro y otros metales . La metagenómica ayuda a estudiar las interacciones de los microbios en esta comunidad, así como la interacción entre plantas y microbios. A partir de los datos obtenidos mediante el análisis metagenómico, es posible identificar las propiedades de los microorganismos pertenecientes a taxones no cultivados, comprender su papel en el ciclo de las sustancias, así como su relación con las plantas. Todo esto es necesario para mejorar la sanidad de los cultivos [64] .

Ecología

La metagenómica puede proporcionar información valiosa sobre la ecología funcional de las comunidades ambientales [65] . Por ejemplo, los análisis metagenómicos de las comunidades bacterianas encontradas en las heces de los leones marinos australianos indican que las heces de los leones marinos son ricas en nutrientes y pueden ser una importante fuente de alimento para los ecosistemas costeros. Esto se debe a que las bacterias que se excretan simultáneamente con las heces pueden convertir compuestos no digeribles en formas biológicamente disponibles que pueden participar más en la cadena alimentaria [66] .

La secuenciación de ADN también se puede utilizar para identificar especies presentes en la columna de agua. Esto puede ayudar a establecer la gama de especies invasoras y especies en peligro de extinción , así como a realizar un seguimiento de las poblaciones estacionales [67] .

Véase también

Notas

  1. 1 2 Hugenholtz P. , Goebel BM , Pace NR Impacto de los estudios independientes de la cultura en la visión filogenética emergente de la diversidad bacteriana.  (Inglés)  // Revista de bacteriología. - 1998. - vol. 180, núm. 18 _ - Pág. 4765-4774. — PMID 9733676 .
  2. Marco, D. Metagenómica: innovaciones actuales y tendencias futuras. Prensa Académica Caister. - 2011. - ISBN 978-1-904455-87-5 .
  3. Eisen JA Environmental shotgun sequencing: su potencial y desafíos para estudiar el mundo oculto de los microbios.  (Inglés)  // Biblioteca Pública de Ciencias Biología. - 2007. - vol. 5, núm. 3 . - Pág. e82. - doi : 10.1371/journal.pbio.0050082 . —PMID 17355177 .
  4. Handelsman J. , Rondon MR , Brady SF , Clardy J. , Goodman RM Acceso biológico molecular a la química de los microbios del suelo desconocidos: una nueva frontera para los productos naturales.  (Inglés)  // Química y biología. - 1998. - vol. 5, núm. 10 _ - Pág. 245-249. — PMID 9818143 .
  5. Chen K. , Pachter L. Bioinformática para la secuenciación aleatoria de genoma completo de comunidades microbianas.  (Inglés)  // Biblioteca Pública de Ciencias de Biología Computacional. - 2005. - vol. 1, no. 2 . — Pág. e106. -doi : 10.1371 / journal.pcbi.0010024 . — PMID 16110337 .
  6. Lane DJ , Pace B. , Olsen GJ , Stahl DA , Sogin ML , Pace NR Determinación rápida de secuencias de ARN ribosomal 16S para análisis filogenéticos.  (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 1985. - vol. 82, núm. 20 _ - Pág. 6955-6959. — PMID 2413450 .
  7. Pace NR, DA Stahl, DJ Lane, GJ Olsen. Análisis de poblaciones microbianas naturales por secuencias de ARNr  (inglés)  // ASM News: revista. - 1985. - vol. 51 . - Pág. 4-12 . Archivado desde el original el 4 de abril de 2012. Copia archivada (enlace no disponible) . Consultado el 11 de mayo de 2016. Archivado desde el original el 4 de abril de 2012. 
  8. Schmidt TM , DeLong EF , Pace NR Análisis de una comunidad de picoplancton marino mediante clonación y secuenciación del gen 16S rRNA.  (Inglés)  // Revista de bacteriología. - 1991. - vol. 173, núm. 14 _ - Pág. 4371-4378. —PMID 2066334 .
  9. Healy FG , Ray RM , Aldrich HC , Wilkie AC , Ingram LO , Shanmugam KT Aislamiento directo de genes funcionales que codifican celulasas de los consorcios microbianos en un digestor anaeróbico termofílico mantenido en lignocelulosa.  (Inglés)  // Microbiología aplicada y biotecnología. - 1995. - vol. 43, núm. 4 . - Pág. 667-674. —PMID 7546604 .
  10. Stein JL , Marsh TL , Wu KY , Shizuya H. , DeLong EF Caracterización de procariotas no cultivadas: aislamiento y análisis de un fragmento de genoma de 40 kilobases de un archaeon marino planctónico.  (Inglés)  // Revista de bacteriología. - 1996. - vol. 178, núm. 3 . - Pág. 591-599. —PMID 8550487 .
  11. Breitbart M. , Salamon P. , Andresen B. , Mahaffy JM , Segall AM , Mead D. , Azam F. , Rohwer F. Análisis genómico de comunidades virales marinas no cultivadas.  (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 2002. - vol. 99, núm. 22 . - Pág. 14250-14255. -doi : 10.1073/ pnas.202488399 . — PMID 12384570 .
  12. 1 2 Tyson GW , Chapman J. , Hugenholtz P. , Allen EE , Ram RJ , Richardson PM , Solovyev VV , Rubin EM , Rokhsar DS , Banfield JF Estructura y metabolismo de la comunidad mediante la reconstrucción de genomas microbianos del medio ambiente.  (Inglés)  // Naturaleza. - 2004. - vol. 428, núm. 6978 . - Pág. 37-43. -doi : 10.1038/ naturaleza02340 . —PMID 14961025 .
  13. Hugenholtz P. Explorando la diversidad procariótica en la era genómica.  (Inglés)  // Biología del genoma. - 2002. - vol. 3, núm. 2 . - P. 0003. - PMID 11864374 .
  14. Venter JC , Remington K. , Heidelberg JF , Halpern AL , Rusch D. , Eisen JA , Wu D. , Paulsen I. , Nelson KE , Nelson W. , Fouts DE , Levy S. , Knap AH , Lomas MW , Nealson K. , White O. , Peterson J. , Hoffman J. , Parsons R. , Baden-Tillson H. , Pfannkoch C. , Rogers YH , Smith HO Secuenciación aleatoria del genoma ambiental del mar de los Sargazos.  (Inglés)  // Ciencia (Nueva York, NY). - 2004. - vol. 304, núm. 5667 . - Pág. 66-74. -doi : 10.1126 / ciencia.1093857 . —PMID 15001713 .
  15. 1 2 Poinar HN , Schwarz C. , Qi J. , Shapiro B. , Macphee RD , Buigues B. , Tikhonov A. , Huson DH , Tomsho LP , Auch A. , Rampp M. , Miller W. , Schuster SC Metagenómica a la paleogenómica: secuenciación a gran escala de ADN de mamut.  (Inglés)  // Ciencia (Nueva York, NY). - 2006. - vol. 311, núm. 5759 . - Pág. 392-394. -doi : 10.1126 / ciencia.1123360 . —PMID 16368896 .
  16. MetaHIT - censo de la población en el tracto gastrointestinal - Deutsche Welle, 02.10.2009 . Consultado el 4 de octubre de 2009. Archivado desde el original el 4 de octubre de 2009.
  17. El Human Microbiome Consortium publicó los resultados de muchos años de trabajo  (14 de junio de 2012). Archivado desde el original el 27 de febrero de 2014. Consultado el 5 de diciembre de 2013.
  18. Smita Mundasad . Los científicos mapean microbios en el cuerpo humano , BBC (14 de junio de 2012). Archivado desde el original el 17 de junio de 2012. Consultado el 5 de diciembre de 2013.
  19. Proyecto Metagenoma Ruso . Consultado el 15 de julio de 2022. Archivado desde el original el 7 de julio de 2022.
  20. Anderson S. Shotgun DNA Sequencing usando fragmentos clonados generados por DNase I.  (Inglés)  // Investigación de ácidos nucleicos. - 1981. - vol. 9, núm. 13 _ - Pág. 3015-3027. —PMID 6269069 .
  21. Segata N. , Boernigen D. , Tickle TL , Morgan XC , Garrett WS , Huttenhower C. Metaómica computacional para estudios de comunidades microbianas.  (Inglés)  // Biología de sistemas moleculares. - 2013. - Vol. 9. - Pág. 666. - doi : 10.1038/msb.2013.22 . — PMID 23670539 .
  22. Escobar-Zepeda A. , Vera-Ponce de Le A. , Sanchez-Flores A. El camino hacia la metagenómica: de la microbiología a las tecnologías de secuenciación de ADN y la bioinformática.  (Inglés)  // Fronteras en genética. - 2015. - Vol. 6. - Pág. 348. - doi : 10.3389/fgene.2015.00348 . — PMID 26734060 .
  23. Hamady M. , Knight R. Perfiles de comunidades microbianas para proyectos de microbiomas humanos: herramientas, técnicas y desafíos.  (Inglés)  // Investigación del genoma. - 2009. - Vol. 19, núm. 7 . - Pág. 1141-1152. -doi : 10.1101/ gr.085464.108 . —PMID 19383763 .
  24. McCabe KM , Zhang YH , Huang BL , Wagar EA , McCabe ER Identificación de especies bacterianas después de la amplificación de ADN con un par de cebadores universales.  (Inglés)  // Genética molecular y metabolismo. - 1999. - vol. 66, núm. 3 . - Pág. 205-211. -doi : 10.1006/ mgme.1998.2795 . —PMID 10066390 .
  25. Susannah G. Tringe, Philip Hugenholtz. Un renacimiento para el gen pionero 16S rRNA  // Opinión actual en microbiología. — 2008-10-01. - T. 11 , n. 5 . - S. 442-446 . — ISSN 1369-5274 . -doi : 10.1016 / j.mib.2008.09.011 . Archivado desde el original el 21 de octubre de 2017.
  26. Fadrosh DW , Ma B. , Gajer P. , Sengamalay N. , Ott S. , Brotman RM , Ravel J. Un enfoque de indexación dual mejorado para la secuenciación del gen 16S rRNA multiplexado en la plataforma Illumina MiSeq.  (Inglés)  // Microbioma. - 2014. - Vol. 2, núm. 1 . - Pág. 6. - doi : 10.1186/2049-2618-2-6 . —PMID 24558975 .
  27. ↑ 1 2 3 4 5 Wooley JC , Godzik A. , Friedberg I. Introducción a la metagenómica.  (Inglés)  // Biblioteca Pública de Ciencias de Biología Computacional. - 2010. - Vol. 6, núm. 2 . — Pág. e1000667. -doi : 10.1371 / journal.pcbi.1000667 . —PMID 20195499 .
  28. ↑ 1 2 3 Comité de Metagenómica del Consejo Nacional de Investigación (EE. UU.): desafíos y aplicaciones funcionales. La nueva ciencia de la metagenómica: revelando los secretos de nuestro planeta microbiano . — Washington (DC): National Academies Press (EE. UU.), 2007-01-01. — (Colección de las Academias Nacionales: Informes financiados por los Institutos Nacionales de Salud). — ISBN 9780309106764 , 0309106761. Archivado el 24 de junio de 2020 en Wayback Machine .
  29. Mende DR , Waller AS , Sunagawa S. , Järvelin AI , Chan MM , Arumugam M. , Raes J. , Bork P. Evaluación del ensamblaje metagenómico utilizando datos de secuenciación de próxima generación simulados.  (Inglés)  // Biblioteca Pública de Ciencias UNO. - 2012. - vol. 7, núm. 2 . - Pág. e31386. - doi : 10.1371/journal.pone.0031386 . —PMID 22384016 .
  30. Mohammed MH , Chadaram S. , Komanduri D. , Ghosh TS , Mande SS Eu-Detect: un algoritmo para detectar secuencias eucarióticas en conjuntos de datos metagenómicos.  (Inglés)  // Revista de biociencias. - 2011. - vol. 36, núm. 4 . - Pág. 709-717. —PMID 21857117 .
  31. Schmieder R. , Edwards R. Identificación y eliminación rápidas de la contaminación de secuencias de conjuntos de datos genómicos y metagenómicos.  (Inglés)  // Biblioteca Pública de Ciencias UNO. - 2011. - vol. 6, núm. 3 . - P. e17288. - doi : 10.1371/journal.pone.0017288 . —PMID 21408061 .
  32. ↑ 1 2 3 Kunin V. , Copeland A. , Lapidus A. , Mavromatis K. , Hugenholtz P. Una guía de metagenómica para bioinformáticos.  (Inglés)  // Revisiones de microbiología y biología molecular: MMBR. - 2008. - Vol. 72, núm. 4 . - Pág. 557-578. -doi : 10.1128/ MMBR.00009-08 . —PMID 19052320 .
  33. Burton JN , Liachko I. , Dunham MJ , Shendure J. Desconvolución a nivel de especie de ensamblajes de metagenoma con mapas de probabilidad de contacto basados ​​en Hi-C.  (Inglés)  // G3 (Bethesda, Maryland). - 2014. - Vol. 4, núm. 7 . - Pág. 1339-1346. -doi : 10.1534/ g3.114.011825 . —PMID 24855317 .
  34. Huson DH , Mitra S. , Ruscheweyh HJ , Weber N. , Schuster SC Análisis integrador de secuencias ambientales usando MEGAN4.  (Inglés)  // Investigación del genoma. - 2011. - vol. 21, núm. 9 _ - Pág. 1552-1560. -doi : 10.1101/ gr.120618.111 . —PMID 21690186 .
  35. Zhu W. , Lomsadze A. , Borodovsky M. Identificación de genes ab initio en secuencias metagenómicas.  (Inglés)  // Investigación de ácidos nucleicos. - 2010. - Vol. 38, núm. 12 _ — Pág. e132. -doi : 10.1093 / nar/gkq275 . —PMID 20403810 .
  36. Besemer J. , Borodovsky M. GeneMark : software web para la búsqueda de genes en procariotas, eucariotas y virus.  (Inglés)  // Investigación de ácidos nucleicos. - 2005. - vol. 33. - Pág. 451-454. doi : 10.1093 / nar/gki487 . —PMID 15980510 .
  37. Aggarwal G. , Ramaswamy R. Identificación de genes ab initio: anotación del genoma procariota con GeneScan y GLIMMER.  (Inglés)  // Revista de biociencias. - 2002. - vol. 27, núm. 1 Suplemento 1 . - Pág. 7-14. — PMID 11927773 .
  38. Huson DH , Auch AF , Qi J. , Schuster SC MEGAN análisis de datos metagenómicos.  (Inglés)  // Investigación del genoma. - 2007. - vol. 17, núm. 3 . - Pág. 377-386. - doi : 10.1101/gr.5969107 . — PMID 17255551 .
  39. ↑ 1 2 3 Mitra S. , Rupek P. , Richter DC , Urich T. , Gilbert JA , Meyer F. , Wilke A. , Huson DH Análisis funcional de metagenomas y metatranscriptomas usando SEED y KEGG.  (Inglés)  // BMC bioinformática. - 2011. - vol. 12 Suplemento 1. - Pág. 21. - doi : 10.1186/1471-2105-12-S1-S21 . — PMID 21342551 .
  40. ^ MetaPhlAn: análisis filogenético metagenómico | El Laboratorio Huttenhower . huttenhower.sph.harvard.edu. Consultado el 1 de mayo de 2016. Archivado desde el original el 26 de abril de 2016.
  41. Kerepesi C. , Bánky D. , Grolmusz V. AmphoraNet: la implementación del servidor web de la suite de flujo de trabajo metagenómico AMPHORA2.  (Inglés)  // Gen. - 2014. - Vol. 533, núm. 2 . - Pág. 538-540. -doi : 10.1016/ j.gene.2013.10.015 . — PMID 24144838 .
  42. Segata N. , Waldron L. , Ballarini A. , Narasimhan V. , Jousson O. , Huttenhower C. Perfilado de comunidades microbianas metagenómicas utilizando genes marcadores únicos específicos de clado.  (Inglés)  // Métodos de la naturaleza. - 2012. - vol. 9, núm. 8 _ - Pág. 811-814. - doi : 10.1038/nmeth.2066 . —PMID 22688413 .
  43. Pagani I. , Liolios K. , Jansson J. , Chen IM , Smirnova T. , Nosrat B. , Markowitz VM , Kyrpides NC The Genomes OnLine Database (GOLD) v.4: estado de los proyectos genómicos y metagenómicos y sus metadatos asociados .  (Inglés)  // Investigación de ácidos nucleicos. - 2012. - vol. 40.-P.D571-579. -doi : 10.1093 / nar/gkr1100 . —PMID 22135293 .
  44. Meyer F. , Paarmann D. , D'Souza M. , Olson R. , Glass EM , Kubal M. , Paczian T. , Rodriguez A. , Stevens R. , Wilke A. , Wilkening J. , Edwards RA La metagenómica Servidor RAST: un recurso público para el análisis filogenético y funcional automático de metagenomas.  (Inglés)  // BMC bioinformática. - 2008. - Vol. 9. - Pág. 386. - doi : 10.1186/1471-2105-9-386 . —PMID 18803844 .
  45. Kurokawa K. , Itoh T. , Kuwahara T. , Oshima K. , Toh H. , Toyoda A. , Takami H. , Morita H. , Sharma VK , Srivastava TP , Taylor TD , Noguchi H. , Mori H. , Ogura Y. , Ehrlich DS , Itoh K. , Takagi T. , Sakaki Y. , Hayashi T. , Hattori M. La metagenómica comparativa reveló conjuntos de genes comúnmente enriquecidos en microbiomas intestinales humanos.  (inglés)  // Investigación de ADN: una revista internacional para la publicación rápida de informes sobre genes y genomas. - 2007. - vol. 14, núm. 4 . - Pág. 169-181. -doi : 10.1093 / dnares/dsm018 . — PMID 17916580 .
  46. 1 2 Simon C. , Daniel R. Análisis metagenómicos: tendencias pasadas y futuras.  (Inglés)  // Microbiología aplicada y ambiental. - 2011. - vol. 77, núm. 4 . - Pág. 1153-1161. -doi : 10.1128/ AEM.02345-10 . —PMID 21169428 .
  47. Kuntal BK , Ghosh TS , Mande SS Community-analyzer: una plataforma para visualizar y comparar la estructura de la comunidad microbiana en los microbiomas.  (Inglés)  // Genómica. - 2013. - Vol. 102, núm. 4 . - Pág. 409-418. -doi : 10.1016/ j.ygeno.2013.08.004 . —PMID 23978768 .
  48. Aaron E. Darling, Guillaume Jospin, Eric Lowe, Frederick A. Matsen, Holly M. Bik. PhyloSift: análisis filogenético de genomas y  metagenomas  // PeerJ. — PeerJ, 2014-01-09. — vol. 2 . — ISSN 2167-8359 . -doi : 10.7717/ peerj.243 . Archivado desde el original el 22 de abril de 2016.
  49. Werner JJ , Knights D. , Garcia ML , Scalfone NB , Smith S. , Yarasheski K. , Cummings TA , Beers AR , Knight R. , Angenent LT Las estructuras de la comunidad bacteriana son únicas y resistentes en los sistemas de bioenergía a gran escala.  (inglés)  // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América. - 2011. - vol. 108, núm. 10 _ - Pág. 4158-4163. -doi : 10.1073/ pnas.1015676108 . —PMID 21368115 .
  50. McInerney MJ , Sieber JR , Gunsalus RP Syntrophy en ciclos anaeróbicos globales de carbono.  (Inglés)  // Opinión actual en biotecnología. - 2009. - Vol. 20, núm. 6 _ - Pág. 623-632. - doi : 10.1016/j.copbio.2009.10.001 . —PMID 19897353 .
  51. Niels Klitgord, Daniel Segre. Biología de los ecosistemas del metabolismo microbiano  // Opinión actual en biotecnología. - T. 22 , n. 4 . - S. 541-546 . -doi : 10.1016/ j.copbio.2011.04.018 . Archivado desde el original el 29 de agosto de 2017.
  52. Leininger S. , Urich T. , Schloter M. , Schwark L. , Qi J. , Nicol GW , Prosser JI , Schuster SC , Schleper C. Archaea predomina entre los procariotas que oxidan amoníaco en los suelos.  (Inglés)  // Naturaleza. - 2006. - vol. 442, núm. 7104 . - Pág. 806-809. -doi : 10.1038/ naturaleza04983 . —PMID 16915287 .
  53. Kristensen DM , Mushegian AR , Dolja VV , Koonin EV Nuevas dimensiones del mundo de los virus descubiertas a través de la metagenómica.  (Inglés)  // Tendencias en microbiología. - 2010. - Vol. 18, núm. 1 . - Pág. 11-19. -doi : 10.1016/ j.tim.2009.11.003 . —PMID 19942437 .
  54. CARL ZIMMER. Cómo nos defienden y nos definen los microbios (12 de julio de 2010). Consultado el 30 de septiembre de 2017. Archivado desde el original el 9 de septiembre de 2017.
  55. Wang WL , Xu SY , Ren ZG , Tao L. , Jiang JW , Zheng SS Aplicación de la metagenómica en el microbioma intestinal humano.  (Inglés)  // Revista mundial de gastroenterología. - 2015. - Vol. 21, núm. 3 . - Pág. 803-814. -doi : 10.3748 / wjg.v21.i3.803 . — PMID 25624713 .
  56. Qin J. , Li R. , Raes J. , Arumugam M. , Burgdorf KS , Manichanh C. , Nielsen T. , Pons N. , Levenez F. , Yamada T. , Mende DR , Li J. , Xu J. , Li S. , Li D. , Cao J. , Wang B. , Liang H. , Zheng H. , Xie Y. , Tap J. , Lepage P. , Bertalan M. , Batto JM , Hansen T. , Le Paslier D. , Linneberg A. , Nielsen HB , Pelletier E. , Renault P. , Sicheritz-Ponten T. , Turner K. , Zhu H. , Yu C. , Li S. , Jian M. , Zhou Y. , Li Y . , Zhang X. , Li S. , Qin N. , Yang H. , Wang J. , Brunak S. , Doré J. , Guarner F. , Kristiansen K. , Pedersen O. , Parkhill J. , Weissenbach J. , Bork P. , Ehrlich SD , ​​​​Wang J. Un catálogo de genes microbianos del intestino humano establecido por secuenciación metagenómica.  (Inglés)  // Naturaleza. - 2010. - Vol. 464, núm. 7285 . - Pág. 59-65. -doi : 10.1038/ naturaleza08821 . — PMID 20203603 .
  57. Lote del Ministerio de Educación y Ciencia de la Federación Rusa sobre metagenómica (enlace inaccesible) . Fecha de acceso: 19 de diciembre de 2012. Archivado desde el original el 7 de abril de 2014. 
  58. Consejo Nacional de Investigación. La nueva ciencia de la metagenómica: revelando los secretos de nuestro planeta microbiano . — 2007-03-27. — ISBN 9780309106764 .
  59. Hess M. , Sczyrba A. , Egan R. , Kim TW , Chokhawala H. , Schroth G. , Luo S. , Clark DS , Chen F. , Zhang T. , Mackie RI , Pennacchio LA , Tringe SG , Visel A . , Woyke T. , Wang Z. , Rubin EM Descubrimiento metagenómico de genes y genomas degradantes de biomasa del rumen de vaca.  (Inglés)  // Ciencia (Nueva York, NY). - 2011. - vol. 331, núm. 6016 . - Pág. 463-467. -doi : 10.1126 / ciencia.1200387 . — PMID 21273488 .
  60. Li LL , McCorkle SR , Monchy S. , Taghavi S. , van der Lelie D. Metagenomas de bioprospección: glicosil hidrolasas para convertir biomasa.  (Inglés)  // Biotecnología para biocombustibles. - 2009. - Vol. 2. - Pág. 10. - doi : 10.1186/1754-6834-2-10 . —PMID 19450243 .
  61. Zissis C. Croneos. Metagenómica: teoría, métodos y aplicaciones: editado por Diana Marco Caister Academic Press, Norfolk, Reino Unido; 2010  // Genómica Humana. — 2010-01-01. - T. 4 . - art. 282 . — ISSN 1479-7364 . -doi : 10.1186/ 1479-7364-4-4-282 .
  62. Simon C. , Daniel R. Logros y nuevos conocimientos revelados por enfoques metagenómicos.  (Inglés)  // Microbiología aplicada y biotecnología. - 2009. - Vol. 85, núm. 2 . - Pág. 265-276. -doi : 10.1007 / s00253-009-2233-z . —PMID 19760178 .
  63. Timothy M. Vogel, Pascal Simonet, Janet K. Jansson, Penny R. Hirsch, James M. Tiedje. TerraGenome: un consorcio para la secuenciación de un metagenoma del suelo  // Nature Reviews Microbiology. - T. 7 , núm. 4 . - S. 252-252 . -doi : 10.1038/ nrmicro2119 .
  64. TerraGenoma . Consultado el 1 de mayo de 2016. Archivado desde el original el 7 de noviembre de 2012.
  65. Raes J. , Letunic I. , Yamada T. , Jensen LJ , Bork P. Hacia una ecología basada en rasgos moleculares a través de la integración de datos biogeoquímicos, geográficos y metagenómicos.  (Inglés)  // Biología de sistemas moleculares. - 2011. - vol. 7. - Pág. 473. - doi : 10.1038/msb.2011.6 . — PMID 21407210 .
  66. Lavery TJ , Roudnew B. , Seymour J. , Mitchell JG , Jeffries T. Alto potencial de transporte y ciclo de nutrientes revelado en el metagenoma microbiano de las heces del león marino australiano (Neophoca cinerea).  (Inglés)  // Biblioteca Pública de Ciencias UNO. - 2012. - vol. 7, núm. 5 . - Pág. e36478. - doi : 10.1371/journal.pone.0036478 . —PMID 22606263 .
  67. ¿Qué está nadando en el río? Solo busca ADN . Consultado el 1 de mayo de 2016. Archivado desde el original el 27 de mayo de 2016.