La metagenómica es una rama de la genética molecular que estudia el material genético obtenido de muestras ambientales. La metagenómica estudia el conjunto de genes de todos los microorganismos que se encuentran en una muestra del medio ambiente: el metagenoma . El análisis metagenómico permite determinar la diversidad de especies de la muestra en estudio sin necesidad de aislamiento y cultivo de microorganismos.
La principal ventaja de utilizar el enfoque metagenómico es tener en cuenta no solo los microorganismos cultivados, sino también los no cultivados. Resultó que tales organismos hacen la principal contribución a la diversidad de especies de las comunidades [1] . La metagenómica permite estudiar en detalle la diversidad de las comunidades y, por tanto, conocer los mecanismos de su funcionamiento, determinar las relaciones metabólicas [2] .
El desarrollo generalizado de la metagenómica se debe a la difusión de métodos de secuenciación de nueva generación . Permiten obtener las secuencias de casi todos los genes de cada microorganismo de la comunidad [3] . A medida que el precio de la secuenciación del ADN cae cada día, este tipo de análisis se vuelve más asequible.
El término "metagenómica" fue utilizado por primera vez por Joe Handelsman , John Clardy , Robert Goodman , Sean Brady y otros en su publicación de 1998 [4] . El término "metagenoma" surgió de la idea de que un conjunto de genes recolectados del medio ambiente puede analizarse de la misma manera que se analizan genomas completos. Kevin Chen y Lyor Patcher (investigadores de la Universidad de California, Berkeley ) han definido la metagenómica como "la aplicación de técnicas modernas de genómica sin necesidad de aislamiento y cultivo en laboratorio de especies individuales" [5] .
Durante mucho tiempo, al secuenciar los genomas de los microorganismos, por regla general, se usaban cultivos de células idénticas como fuentes de ADN. Sin embargo, los primeros estudios de metagenómica han demostrado que en muchos hábitats existen grandes grupos de microorganismos que no pueden crecer en cultivos de laboratorio y, por lo tanto, sus genomas no pueden secuenciarse. Estos primeros trabajos estudiaron secuencias de ARNr 16S , que son bastante cortas, a menudo conservadas dentro de una sola especie y tienden a diferir de una especie a otra. Muchas secuencias de ARNr 16S que se encuentran en diferentes hábitats no se pueden atribuir a ninguna de las especies cultivadas, lo que indica la existencia de muchos microorganismos no aislados. Estos estudios han demostrado que solo el 1% de las especies encontradas en una muestra ambiental son cultivadas [1] .
La investigación molecular en esta área fue iniciada por Norman Pace y sus colegas, quienes utilizaron PCR para estudiar la diversidad de secuencias de ARNr [6] . A través de estos estudios, Pace avanzó la idea de clonar ADN directamente de muestras ambientales en 1985 [7] . En 1991, Pace y sus colegas publicaron el primer informe sobre el aislamiento y clonación de ADN de una muestra ambiental [8] . Aunque la metodología existente entonces solo permitía trabajar con genes muy conservadores, no codificadores de proteínas , nos permitió confirmar los resultados de los estudios microbiológicos morfológicos, indicando una mayor diversidad de especies de microorganismos que la que permitían los métodos de cultivo en laboratorio. En 1995, Healy informó sobre el aislamiento metagenómico de genes funcionales de un complejo cultivo de laboratorio de microorganismos ambientales cultivados en hierba seca [9] . Edward DeLong , quien dejó el laboratorio de Pace, sentó las bases para construir filogenias de microorganismos del medio ambiente basadas en 16S rRNA. Su propio grupo comenzó a ensamblar una biblioteca de material genético de microorganismos marinos [10] .
En 2002, Mia Breitbard, Forest Rower y sus colegas, utilizando secuencias de escopeta de muestras ambientales , demostraron que 200 litros de agua de mar contenían más de 5000 tipos de virus [11] . Otros estudios han demostrado que las heces humanas contienen más de mil tipos de virus, y un kilogramo de sedimento marino puede contener más de un millón de tipos de virus, incluidos los bacteriófagos . Casi todos estos virus eran especies nuevas. En 2004, se secuenció completamente el ADN de las aguas ácidas de las minas [12] . Gracias a este estudio, fue posible obtener genomas completos o casi completos de especies bacterianas y arqueas, que previamente no habían sido cultivadas en el laboratorio [13] .
A principios de 2003, Craig Venter , jefe de un proyecto paralelo al Proyecto Genoma Humano, organizó una expedición para recolectar muestras de agua oceánica de toda la Tierra ( inglés: Global Ocean Sampling Expedition (GOS) ). Todas las muestras se secuenciaron al azar para identificar los genomas de los nuevos organismos. Se ha identificado el ADN de 2000 especies diferentes en el Mar de los Sargazos, incluidas 148 nuevas especies bacterianas [14] .
En 2005, Stefan Schuster y sus colegas de la Universidad de Pensilvania publicaron la primera secuencia de una muestra ambiental obtenida mediante secuenciación de alto rendimiento, más precisamente, pirosecuenciación [15] .
Varios proyectos de metagenómica humana se encuentran en diversas etapas de implementación o ya se han completado, incluido el análisis de la piel y la microflora intestinal [16] . Obtener una imagen bacteriana completa del cuerpo requiere enormes esfuerzos, debido a la enorme diversidad de especies de microorganismos.
En 2007-2008, se lanzó un proyecto global llamado Microbioma Humano . En 2011, se presentaron algunos resultados [17] [18] . Desde 2010, se ha esbozado en Rusia un estudio a gran escala del metagenoma humano. Un consorcio de los principales institutos rusos en el campo de la gastroenterología y la biología molecular, como proyecto de iniciativa, comenzó a realizar los primeros experimentos de secuenciación a gran escala de muestras de ADN del intestino humano [19] .
El primer método ampliamente utilizado de secuenciación por fragmentación aleatoria es el método de escopeta . Se encuentra en el hecho de que el ADN aislado de la muestra se hidroliza en fragmentos aleatorios. Luego, utilizando los métodos de clonación molecular , se crea una biblioteca de clones a partir de los fragmentos obtenidos . Las secuencias de ADN se determinan mediante la secuenciación de Sanger y luego se ensambla el genoma [20] . La secuenciación proporciona información sobre los genes que están presentes en los organismos representados en la muestra. Una descripción funcional de los productos de estos genes permite determinar las relaciones metabólicas en la comunidad [21] .
La presencia de la etapa de clonación molecular en el método hace que requiera bastante tiempo. Sin embargo, a partir de 2016 ya no se utiliza la secuenciación de Sanger para determinar secuencias genómicas, sino que se utilizan métodos de secuenciación de nueva generación , que permiten obtener secuencias genómicas de organismos que se encuentran en una muestra del medio ambiente de manera más rápida y sin la etapa de clonación molecular. [22] [23]
Con tal análisis, las secuencias pertenecientes a los organismos más representados predominarán en el conjunto de ADN de la muestra. Para proporcionar una cobertura suficiente de los genomas de organismos subrepresentados, se hace necesario utilizar grandes volúmenes de medio de muestra. Por otro lado, la naturaleza aleatoria de los métodos de secuenciación (fragmentación aleatoria de una secuencia de ADN de una muestra) hace que las secuencias de muchos organismos que podrían pasar desapercibidos utilizando métodos de cultivo tradicionales estén disponibles para el análisis, al menos en algunas parcelas pequeñas. sus secuencias de ADN genómico [12] .
La tarea de determinar la composición de especies de una comunidad se resuelve secuenciando ciertos genes que deberían tener todos los organismos de una comunidad. Algunas regiones de tales secuencias de ADN genómico, como el gen que codifica el ARNr 16S , consisten en secuencias altamente conservadas y regiones hipervariables [24] . Esta característica permite el uso de cebadores de secuenciación que son complementarios a las regiones conservadas para generar secuencias de regiones hipervariables. Las secuencias obtenidas permiten atribuir el organismo a una determinada especie [25] [26] .
Los datos obtenidos como resultado de un experimento metagenómico contienen una gran cantidad de información y ruido, ya que son fragmentos de secuencias de ADN pertenecientes a miles y decenas de miles de especies diferentes [27] . Recolectar, curar y extraer información biológica útil de conjuntos de datos de este tamaño son desafíos computacionales que pueden resolverse utilizando la bioinformática [28] .
La primera etapa del análisis metagenómico es el filtrado preliminar de datos. Incluye la eliminación de secuencias redundantes y de baja calidad. Para los metagenomas derivados de organismos animales, es importante eliminar las secuencias de origen eucariótico [29] . La contaminación del ADN genómico eucariótico se elimina utilizando los algoritmos Eu-Detect [30] y DeConseq [31] .
En esencia, las secuencias de ADN de los experimentos genómicos y metagenómicos son las mismas. Sin embargo, los experimentos metagenómicos brindan una cobertura menor, y el uso de métodos de secuenciación de próxima generación para el análisis conduce a una limitación en la longitud de la secuencia que se está secuenciando [28] . La tarea también es complicada debido a la diferente representación de las especies en la comunidad. Estas características llevan a que el ensamblaje de las regiones del genoma a partir de los datos de un experimento metagenómico se convierta en una tarea difícil, requiere una gran potencia de cálculo y puede dar lugar a resultados erróneos. Por ejemplo, se pueden obtener secuencias quiméricas, que son una combinación de secciones de secuencias de ADN de diferentes organismos [32] .
Hay varios programas que se ensamblan con respecto a las lecturas de los extremos de los pares, este método le permite reducir la cantidad de errores. Programas como Phrap o Celera Assembler fueron creados originalmente para el ensamblaje de genomas individuales, pero dan buenos resultados al procesar datos metagenómicos [27] . Otros programas, como el ensamblador Velvet, usan gráficos de Bruijn para manejar las secuencias cortas (lecturas) que resultan de los métodos de secuenciación de próxima generación. El ensamblaje de los genomas de las especies más comunes se ve facilitado por el uso de genomas de referencia [32] . Después del ensamblaje, surge el siguiente problema: es necesario determinar a qué especie pertenecen las secuencias resultantes [33] .
En el análisis metagenómico, se utilizan dos enfoques principales para anotar las secuencias de codificación después del ensamblaje [32] . El primer método se basa en la búsqueda de genes homólogos anotados, generalmente utilizando BLAST . Este enfoque se implementa en el programa MEGAN4 [34] . El segundo enfoque ( ab initio ) usa características internas de la secuencia para predecir regiones codificantes , para su implementación se usan conjuntos de genes de entrenamiento de organismos relacionados [35] . Este enfoque es utilizado por los programas GeneMark [36] y GLIMMER [37] . La principal ventaja del enfoque ab initio es que puede identificar secuencias codificantes para las que no se conocen homólogos [27] .
Mientras que la anotación del metagenoma indica qué funciones se implementan en la comunidad, la definición de composición de especies permite determinar qué organismos son responsables de su implementación. El proceso de asociar ciertos genes, y por lo tanto las funciones que pueden realizar, con ciertos tipos de organismos se denomina binning . Se implementa mediante el método BLAST a través de la búsqueda de genes similares, por lo que se sabe a qué organismo pertenecen. Este enfoque se implementa en el programa MEGAN (MEta Genome ANalyzer) [38] . Además, este programa le permite realizar una anotación funcional del metagenoma. Durante el procesamiento, las secuencias se asocian con los nodos de taxonomía NCBI y los nodos de clasificación funcional SEED o KEGG [39] utilizando el algoritmo del ancestro menos común [39] . La primera versión del programa se utilizó en 2005 para analizar el contexto metagenómico de secuencias de ADN obtenidas de hueso de mamut [15] .
Otro programa, PhymmBL, utiliza modelos de Markov interpolados [27] para este propósito . Los métodos MetaPhlAn [40] y AMPHORA [41] utilizan datos sobre marcadores genéticos únicos (secuencias características de cualquier clado ) para determinar la representación de un grupo taxonómico en una comunidad [42] . Algunos métodos de agrupamiento utilizan información sobre las propiedades intrínsecas de la secuencia, como las frecuencias de oligonucleótidos o el uso de codones .
Analizar el gran número exponencialmente creciente de secuencias de ADN disponibles es una tarea desafiante. Además, el análisis se complica por los metadatos complejos asociados con los proyectos metagenómicos. Incluyen información sobre la geografía de la muestra en estudio, características ambientales, datos físicos, así como métodos de muestreo [28] . Esta información es necesaria para garantizar la reproducibilidad de los experimentos y para análisis posteriores. Es importante presentar esta información usando formatos de datos estandarizados y desarrollar bases de datos especializadas como Genomes OnLine Database (GOLD) [43] .
Se han desarrollado servicios especiales para la integración de metadatos y datos sobre secuencias genómicas. En 2007 se creó un servicio accesible para el análisis de datos de experimentos metagenómicos Metagenomics Rapid Anotation utilizando el servidor Subsystem Technology (MG-RAST). En 2012, se habían cargado en esta base de datos unos 50 000 metagenomas [44] .
Un análisis comparativo de los metagenomas permite comprender las características del funcionamiento de las comunidades microbiológicas y, para los microorganismos simbióticos , establecer su papel en el mantenimiento de la salud del huésped [45] . Las comparaciones por parejas y múltiples de metagenomas se realizan alineando sus fragmentos, comparando la composición de GC , los patrones de uso de oligonucleótidos y la diversidad de especies. Se puede realizar una comparación funcional comparando fragmentos de metagenomas con bases de datos que contienen información sobre vías metabólicas [39] . Para determinar la función de una comunidad, no es la definición de la composición de especies la que juega un papel importante, sino la descripción funcional de todos los genes presentes en ella. Las mismas funciones se encuentran en comunidades bajo condiciones ecológicas similares, aunque la composición de especies de tales comunidades puede diferir mucho [46] . Es por eso que los metadatos que describen las condiciones para obtener una muestra metagenómica son muy importantes para el análisis comparativo [27] .
El objetivo principal de la metagenómica comparativa es identificar grupos de microorganismos que determinan las características de un área particular del medio ambiente. Estas características son el resultado de interacciones entre grupos de microorganismos. Para ello se desarrolló el programa Community-Analyzer [47] . Permite comparar la composición taxonómica de comunidades e identificar posibles interacciones entre los grupos de microorganismos detectados. En lugar de simplemente comparar la distribución de grupos taxonómicos, el programa tiene en cuenta los patrones probabilísticos de las interacciones.
El método principal en el análisis de la comunidad metagenómica es el mapeo de lecturas a los genomas de bacterias o arqueas conocidas anotadas en GenBank . Por lo tanto, para comprender qué microorganismos viven en una muestra determinada y qué relaciones metabólicas son posibles entre ellos, no es necesario volver a ensamblar la secuencia [48] .
En muchas comunidades bacterianas, tanto naturales como artificiales (como los biorreactores ), existe una distribución de responsabilidades en los procesos metabólicos, la denominada sintrofia , como consecuencia de la cual los productos metabólicos de unos microorganismos son utilizados por otros microorganismos [49] . Por ejemplo, en uno de estos sistemas -digestores- existen dos especies sintróficas ( Syntrophobacterales y Synergistia ), fruto del trabajo conjunto de que la materia prima utilizada se convierte en un residuo totalmente metabolizable ( metano ) [50] . Mediante el estudio de la expresión génica mediante micromatrices de ADN o análisis proteómico , los investigadores pueden unir partes de la red metabólica para formar grupos metabólicos [51] .
La metagenómica permite a los investigadores acceder a la diversidad funcional y metabólica de las comunidades microbianas; sin embargo, la metagenómica no puede mostrar cuáles de estos procesos metabólicos están activos. La extracción y el análisis del ARN mensajero metagenómico (metatranscriptoma) proporciona información sobre la regulación de los perfiles de expresión génica de comunidades complejas [46] . Debido a dificultades técnicas (por ejemplo, la rápida degradación de las moléculas de ARN mensajero ), existen muy pocos estudios de transcripciones de comunidades microbianas no cultivadas hasta la fecha. Sin embargo, el desarrollo de las tecnologías de micromatrices impulsó el estudio de los metatranscriptomas y fue posible evaluar la expresión de varios genes de toda la comunidad [52] .
La secuenciación metagenómica se utiliza en el estudio de comunidades virales . Dado que los virus no comparten un marcador filogenético universal común (como el ARN 16S para bacterias y arqueas , y el ARN 18S para eucariotas), la única forma de acceder al estudio de la diversidad genética de una comunidad viral en una muestra ecológica es a través de la metagenómica. Los metagenomas virales (también llamados viromas ) deberían proporcionar cada vez más información sobre la diversidad y evolución viral [53] .
La metagenómica tiene el potencial de ser explorada en una amplia variedad de aplicaciones. La metagenómica se puede aplicar para resolver problemas prácticos en áreas como la medicina , la ingeniería, la agricultura y la ecología.
Las comunidades microbianas juegan un papel clave en el mantenimiento de la salud humana , pero su composición y mecanismos de funcionamiento siguen sin resolverse [54] . La secuenciación metagenómica se ha utilizado para caracterizar comunidades microbianas en cientos de individuos. Esto es parte del llamado Proyecto Microbioma Humano, cuyos principales objetivos son: identificar el conjunto básico de microbios humanos , comprender cómo los cambios en la microflora humana se correlacionan con los cambios en la salud, y desarrollar la base tecnológica y bioinformática para lograr estos objetivos [55] secuenciación de genomas de microorganismos intestinales aptos para el cultivo en condiciones de laboratorio:
Otra dirección médica es el proyecto MetaHit (metagenomics of the human digestivo tract ), en el que participaron 124 personas de Dinamarca y España , entre ellas personas sanas, con sobrepeso y con enfermedades del tubo digestivo. El objetivo principal del estudio fue intentar caracterizar la diversidad filogenética de las bacterias gastrointestinales. El estudio mostró que dos clados bacterianos, Bacteroidetes y Firnicutes , comprenden más del 90% de todos los grupos filogenéticos bacterianos conocidos que dominan el intestino distal. Utilizando la frecuencia relativa de los genes que se encuentran en el intestino, los investigadores identificaron 1244 grupos metagenómicos que desempeñan un papel fundamental en el mantenimiento de un estado saludable. Se han identificado dos funciones principales de estos grupos: mantener la expresión de genes de mantenimiento y la expresión de genes específicos del tracto gastrointestinal. El grupo de genes de limpieza es esencial para todas las bacterias y, a menudo, juega un papel importante en las vías metabólicas, como el metabolismo central del carbono , la síntesis de aminoácidos . Un conjunto de genes específicos incluye la capacidad de adherirse a las proteínas del huésped y la capacidad de alimentarse de azúcares . Los pacientes con irritación del colon tienen un 25 % menos de estos genes y también muestran recuentos bacterianos más bajos que las personas a las que no se les ha diagnosticado ningún problema gastrointestinal.
Aunque estos estudios tienen aplicaciones médicas potencialmente valiosas, solo el 31-48,8 % de las secuencias se alinearon con los 194 genomas bacterianos intestinales conocidos, y solo el 7,6-21,2 % de las lecturas se alinearon con las secuencias de GenBank , lo que indica la necesidad de un mayor desarrollo de investigación para cubrir completamente todos los genomas bacterianos [56] .
El costo de la secuenciación del genoma humano en los últimos tres años[ ¿Qué? ] ha disminuido casi 100 veces y continúa disminuyendo rápidamente. La mejora de las tecnologías de secuenciación de ADN NGS en un futuro próximo conducirá a superar el próximo umbral de precios ($1000 por genoma) y provocará cambios fundamentales en muchas áreas de la biología y la genética médica , lo que debería conducir a la personalización de la medicina en el futuro . El auge tecnológico en este campo de la genética molecular apunta a que la metagenómica sustituirá paulatinamente al diagnóstico por PCR . En 2011, también se anunció en Rusia una subvención para la investigación en el campo de la metagenómica [57] .
Los biocombustibles se obtienen mediante la conversión de biomasa , por ejemplo, mediante la conversión de celulosa , derivada del maíz y el mijo , en alcohol de hidrólisis . Este proceso se basa en consorcios microbianos para convertir la celulosa en azúcares, seguido de la fermentación de los azúcares en etanol . Los microorganismos también producen diversas fuentes de bioenergía, incluidos el metano y el hidrógeno [58] .
La producción industrial eficiente de nuevos compuestos a partir de biomasa requiere nuevas enzimas con mayor productividad y menores costos de producción [59] . Los enfoques metagenómicos para el análisis de comunidades microbianas complejas permiten la detección selectiva de enzimas de aplicación industrial en la producción de biocombustibles, como las glicosil hidrolasas [60] . Además, el conocimiento de cómo funcionan las comunidades microbianas es esencial para gestionar estas comunidades, y la metagenómica es una herramienta clave para comprenderlas. Los enfoques metagenómicos permiten realizar un análisis comparativo entre sistemas convergentes de microorganismos.
A través de la metagenómica, se pueden mejorar las estrategias para monitorear los efectos de los contaminantes en un ecosistema y se pueden desarrollar nuevos métodos para limpiar los ambientes contaminados. Una comprensión más profunda de cómo las comunidades microbianas lidian con los contaminantes brinda la esperanza de que este proceso pueda usarse en el futuro para combatir la contaminación industrial [61] .
Las comunidades microbianas pueden producir una amplia gama de sustancias biológicamente activas que luego son utilizadas por otros organismos. Muchas de las drogas que se usan hoy en día se encontraron originalmente en microorganismos. El éxito reciente en la obtención de material genético diverso de microorganismos no cultivados ha llevado al descubrimiento de nuevos genes, enzimas y otros compuestos activos. El uso de la metagenómica ha permitido el desarrollo de nuevas ramas de la industria química y farmacéutica [62] .
Un gramo de suelo utilizado para el cultivo de plantas contiene entre 10 9 y 10 10 células microbianas [63] . La composición de las comunidades microbianas que viven en el suelo ha atraído durante mucho tiempo la atención de los científicos, pero sigue sin comprenderse bien, a pesar de su importancia económica. Las comunidades microbianas realizan una amplia gama de funciones ecosistémicas necesarias para el crecimiento de las plantas (por ejemplo, fijación de nitrógeno ), protección de las plantas contra enfermedades, participación en el ciclo del hierro y otros metales . La metagenómica ayuda a estudiar las interacciones de los microbios en esta comunidad, así como la interacción entre plantas y microbios. A partir de los datos obtenidos mediante el análisis metagenómico, es posible identificar las propiedades de los microorganismos pertenecientes a taxones no cultivados, comprender su papel en el ciclo de las sustancias, así como su relación con las plantas. Todo esto es necesario para mejorar la sanidad de los cultivos [64] .
La metagenómica puede proporcionar información valiosa sobre la ecología funcional de las comunidades ambientales [65] . Por ejemplo, los análisis metagenómicos de las comunidades bacterianas encontradas en las heces de los leones marinos australianos indican que las heces de los leones marinos son ricas en nutrientes y pueden ser una importante fuente de alimento para los ecosistemas costeros. Esto se debe a que las bacterias que se excretan simultáneamente con las heces pueden convertir compuestos no digeribles en formas biológicamente disponibles que pueden participar más en la cadena alimentaria [66] .
La secuenciación de ADN también se puede utilizar para identificar especies presentes en la columna de agua. Esto puede ayudar a establecer la gama de especies invasoras y especies en peligro de extinción , así como a realizar un seguimiento de las poblaciones estacionales [67] .
![]() | |
---|---|
En catálogos bibliográficos |
Medicina personalizada | |
---|---|
Secciones de datos de Omix | |
Secciones de aplicación | |
Métodos | |
Artículos relacionados |