Enciclopedia de elementos de ADN

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 10 de febrero de 2017; las comprobaciones requieren 17 ediciones .
CODIFICAR
Contenido
Descripción Base de datos del genoma completo
Contactos
Centro de Investigación Universidad de California Santa Cruz
Laboratorio Centro de Ciencias e Ingeniería Biomolecular
Los autores Brian J Raney [1]
Publicación original PMID 21037257
Fecha de lanzamiento 2010
Disponibilidad
Sitio web encodeproject.org

La Enciclopedia de Elementos de ADN ( ENCODE  ) es un consorcio de investigación internacional establecido en septiembre de 2003 . Organizado y financiado por el Instituto Nacional de Investigación del Genoma Humano de EE . UU. ( NHGRI ) [1] [2] [3] . Concebido como una continuación del Proyecto Genoma Humano, ENCODE tiene como objetivo realizar un análisis completo de los elementos funcionales del genoma humano . Todos los resultados obtenidos durante la ejecución del proyecto se publican en bases de datos públicas .  

El 5 de septiembre de 2012 se publicaron los primeros resultados del proyecto en forma de 30 publicaciones interconectadas en los sitios web de las revistas " Nature ", " Genome Biology " y " Genome Research " [4] [ 5] . Estas publicaciones muestran que al menos el 80% del genoma humano es biológicamente activo, hasta entonces dominaba la noción de que la mayor parte del ADN era " basura ". Sin embargo, estas conclusiones apresuradas son criticadas por muchos científicos, quienes señalan la falta de evidencia necesaria para la funcionalidad de estos elementos [6] .

Relevancia

Se estima que el genoma humano contiene 20.000 genes que codifican proteínas (juntos forman el exoma ), y representan solo alrededor del 1,5% del ADN del genoma humano. El objetivo principal del proyecto ENCODE es determinar la función del resto del genoma, la mayor parte del cual tradicionalmente se ha considerado " basura " (por ejemplo, el ADN que no se transcribe ).

Aproximadamente el 90% de los polimorfismos de un solo nucleótido en el genoma humano (que se ha demostrado que están asociados con varias enfermedades utilizando estudios de asociación de todo el genoma ) se encuentran fuera de las regiones codificantes de proteínas. [7]

La actividad y la expresión de los genes que codifican proteínas pueden ser reguladas por el reguloma: varios elementos del ADN, como el promotor , las secuencias reguladoras y las regiones de cromatina , así como las modificaciones de las histonas . Se cree que los cambios en las regiones reguladoras pueden alterar la expresión de proteínas y la función celular y, por lo tanto, provocar enfermedades ( antecedentes del proyecto ENCODE ). Al determinar la ubicación de los elementos reguladores y su efecto sobre la transcripción, es posible dilucidar la relación entre los cambios en los niveles de expresión de genes específicos y el desarrollo de enfermedades. [ocho]

ENCODE pretende ser un recurso integral que permitirá a la comunidad científica comprender mejor cómo el genoma puede influir en la salud humana y estimular el desarrollo de nuevos métodos de prevención y tratamiento de enfermedades. [9]

Hasta la fecha, el proyecto está ayudando en el descubrimiento de nuevos elementos reguladores del ADN, proporcionando nuevos conocimientos sobre la organización y regulación de nuestros genes y genoma, así como sobre cómo los cambios en la secuencia del ADN pueden influir en el desarrollo de enfermedades. [7] Uno de los principales resultados del proyecto es la descripción de que se ha demostrado que el 80% del genoma humano está asociado con al menos una función bioquímica. [10] [11] La mayor parte de este ADN no codificante está involucrado en la regulación de la expresión de genes codificantes. [10] Además, la expresión de cada gen codificante está controlada por una variedad de regiones reguladoras ubicadas tanto cerca como lejos del gen. Estos resultados demuestran que la regulación génica es mucho más compleja de lo que se pensaba. [12]

Proyecto ENCODE

El proyecto ENCODE se implementa en tres etapas: la fase inicial, la fase de desarrollo tecnológico y la fase productiva.

Durante la fase inicial, el consorcio ENCODE evaluó estrategias para identificar diferentes tipos de elementos del genoma . El objetivo de la fase inicial era definir un conjunto de procedimientos que en conjunto permitieran la caracterización precisa y detallada de grandes regiones del genoma humano , teniendo en cuenta la viabilidad económica y la alta eficiencia del proceso. La fase inicial fue identificar brechas en el conjunto de herramientas para definir secuencias funcionales, así como mostrar si alguno de los métodos utilizados resultó ser ineficiente o inadecuado para la ampliación. Algunos de estos problemas tuvieron que abordarse durante la fase de desarrollo de la tecnología ENCODE (concurrente con la fase inicial del proyecto), cuyo objetivo era desarrollar nuevos métodos computacionales y de laboratorio que mejorarían la identificación de secuencias funcionales conocidas o el estudio de nuevas elementos funcionales del genoma. El resultado de las dos primeras etapas, tomando como ejemplo el estudio del 1% del genoma humano, determinó la mejor forma de analizar el 99% restante con la máxima eficiencia y el menor coste durante la fase productiva. [9]

Fase I del proyecto ENCODE: fase inicial

Durante la fase piloto, se llevó a cabo la investigación y comparación de los métodos existentes para un análisis exhaustivo de una determinada sección de la secuencia del genoma humano. Se organizó como un consorcio abierto y reunió a investigadores de diversos orígenes y antecedentes para evaluar los méritos de cada técnica, tecnología y estrategia de un conjunto diverso. Al mismo tiempo, el objetivo de la fase de desarrollo tecnológico del proyecto era desarrollar métodos nuevos y altamente eficientes para determinar elementos funcionales. El objetivo de este trabajo fue determinar un conjunto de enfoques que permitieran la determinación más precisa de todos los elementos funcionales en el genoma humano. Durante la fase inicial, se determinó la capacidad de varios métodos de escalar para analizar el genoma humano completo y se identificaron las lagunas en la definición de elementos funcionales en la secuencia del genoma.

La fase inicial del proyecto tuvo lugar en estrecha colaboración entre experimentadores y teóricos, lo que permitió la evaluación de una serie de métodos para anotar el genoma humano. Un conjunto de regiones, que representan aproximadamente el 1% (30 Mb) del genoma humano, se eligió como objetivo para la fase inicial del proyecto y fue analizado por todos los participantes en la fase piloto del proyecto. Todos los datos sobre estas regiones obtenidos por los participantes de ENCODE se publicaron rápidamente en bases de datos públicas. [13] [14]

Resultados de la Fase I [13]
  • El genoma humano se transcribe de forma ubicua, de modo que la mayoría de sus bases están asociadas con al menos un transcrito primario, y muchos transcritos asocian regiones distales con loci específicos de codificación de proteínas.
  • Se han identificado numerosos transcritos nuevos que no codifican proteínas, muchos de los cuales se superponen a loci codificadores de proteínas y otros loci ubicados en regiones del genoma que antes se consideraban transcripcionalmente silenciosas.
  • Se han identificado numerosos sitios de inicio de la transcripción no reconocidos previamente, muchos de los cuales exhiben una estructura de cromatina y propiedades de unión específicas de secuencias de proteínas similares a los promotores bien caracterizados.
  • Las secuencias reguladoras que rodean los sitios de inicio de la transcripción se distribuyen simétricamente, sin desplazamiento hacia las regiones suprayacentes.
  • La disponibilidad de cromatina y los patrones de modificación de histonas son altamente predictivos tanto de la presencia como de la actividad de los sitios de inicio de la transcripción.
  • Los sitios de DNasaI hipersensibles distales tienen patrones característicos de modificación de histonas que los distinguen de manera confiable de los promotores.
  • El tiempo de replicación del ADN se correlaciona con la estructura de la cromatina.
  • Se puede identificar con certeza que un total del 5% de las bases del genoma están sujetas a restricciones evolutivas en los mamíferos; para alrededor del 60% de estas bases limitadas, hay evidencia de funcionamiento basado en análisis experimentales realizados hasta la fecha.
  • Varios elementos funcionales varían mucho en su variabilidad de secuencia en la población humana y en su probabilidad de estar en una región estructuralmente variable del genoma.
  • Sorprendentemente, muchos elementos funcionales no parecen estar limitados a la evolución de los mamíferos. Esto sugiere la posibilidad de una gran cantidad de elementos neutros que son bioquímicamente activos pero que no brindan muchos beneficios al cuerpo. Este grupo puede servir como un "almacén" para la selección natural, actuando potencialmente como una fuente de elementos específicos del linaje y elementos funcionalmente conservados pero no ortólogos entre especies.

Fase II del proyecto ENCODE: fase productiva

En septiembre de 2007 se inició el financiamiento de la fase productiva del proyecto ENCODE. En esta etapa, el objetivo era analizar el genoma completo y realizar "estudios adicionales en condiciones industriales". [15]

Al igual que en la fase inicial, el trabajo de la fase productiva se organizó como un consorcio abierto. En octubre de 2007, el Instituto Nacional para la Investigación del Genoma Humano le asignó subvenciones por un total de más de $ 80 millones durante 4 años. [16] Durante la fase productiva, el proyecto incluyó el Centro de Coordinación de Datos, el Centro de Análisis de Datos y el Centro de Desarrollo Tecnológico. [17] En este momento, el proyecto se convierte en una empresa verdaderamente masiva, que involucra a 440 científicos de 32 laboratorios de todo el mundo. En 2007, cuando se completó la etapa inicial, el proyecto aumentó la capacidad en gran parte debido a la secuenciación de próxima generación . De hecho, se procesó una gran cantidad de datos, los investigadores recibieron alrededor de 15 terabytes de información sin procesar.

Para 2010, el proyecto ENCODE había recibido más de 1000 conjuntos de datos de todo el genoma. En conjunto, estos datos muestran qué regiones parecen controlar la expresión de genes utilizados en ciertos tipos de células y qué regiones interactúan con una gran variedad de proteínas. El proyecto proporciona información sobre los sitios de transcripción, sus factores de transcripción asociados, la estructura de la cromatina y las modificaciones de las histonas.

Resultados de la Fase II [18]
  • La gran mayoría (80,4 %) del genoma humano está involucrado en al menos un evento bioquímico asociado con el ARN y/o la cromatina en al menos un tipo de célula. La mayor parte del genoma está ubicado cerca de eventos regulatorios: el 95 % del genoma está dentro de las 8 kilobases de una interacción ADN-proteína (según lo medido por el análisis de motivos ChIP-seq o la unión a la ADNasa I), y el 99 % está dentro de las 1,7 kilobases de al menos uno de los eventos bioquímicos presentados por ENCODE.
  • La clasificación del genoma en siete estados de cromatina sugiere un conjunto inicial de 399 124 regiones con características de potenciador y 70 292 regiones con características de promotor, así como cientos de miles de regiones no móviles. El análisis de alta resolución subdivide aún más el genoma en miles de estados estrechos con diferentes propiedades funcionales.
  • La generación y el procesamiento de la secuencia de ARN se pueden correlacionar cuantitativamente con las marcas de cromatina y la unión del factor de transcripción (TF) en los promotores, lo que indica que la funcionalidad del promotor puede explicar gran parte de la variación en la expresión del ARN.
  • Muchas variantes no codificantes en secuencias genómicas individuales se encuentran en regiones funcionales anotadas por ENCODE; este número es al menos tan alto como el contenido en los genes que codifican proteínas.
  • Los SNP asociados con enfermedades por GWAS están enriquecidos en elementos funcionales no codificantes, la mayoría de los cuales se encuentran en o cerca de ciertas regiones definidas por ENCODE, fuera de los genes codificadores de proteínas. En muchos casos, los fenotipos de la enfermedad se pueden asociar con un tipo de célula o factor de transcripción en particular.
  • Consorcio ENCODE

El Consorcio ENCODE está compuesto principalmente por científicos patrocinados por el Instituto Nacional de Investigación del Genoma Humano de EE. UU . Otros participantes del proyecto son miembros del Consorcio o del Grupo de Trabajo Analítico.

La fase inicial del proyecto consistió en ocho grupos de estudio y doce grupos que participaron en la fase de desarrollo tecnológico del proyecto ENCODE (Proyecto Piloto ENCODE: Participantes y Proyectos ). A finales de 2007, cuando finalizó oficialmente la fase piloto del proyecto, el número de participantes había aumentado a 440 científicos de 32 laboratorios de todo el mundo. Actualmente, el consorcio está formado por varios centros que realizan diversas tareas ( Participantes y Proyectos ENCODE ):

  1. Centros de producción (Centros de Producción ENCODE)
  2. Centro de Coordinación de Datos (Centro de Coordinación de Datos ENCODE)
  3. Centro de Análisis de Datos (Centro de Análisis de Datos ENCODE)
  4. Análisis computacional de resultados (Premios ENCODE al Análisis Computacional)
  5. Desarrollo tecnológico (ENCODE Technology Development Esfuerzo)

Datos presentados

Desde 2007, los participantes del proyecto ENCODE han realizado un gran número de estudios basados ​​en diversas secuencias biológicas para cartografiar los elementos funcionales del genoma humano [19] . Los elementos mapeados (y los enfoques utilizados) incluyen regiones de transcripción de ARN (RNA-seq, CAGE, RNA-PET y anotación manual), regiones de codificación de proteínas (espectrometría de masas), sitios de unión de factores de transcripción (ChIP-seq y DNase-seq), estructura de la cromatina (DNase-seq, FAIRE-seq, histona ChIP-seq y MNase-seq) y sitios de metilación del ADN (análisis RRBS). A continuación se presenta una descripción detallada de los datos obtenidos por los participantes del proyecto a lo largo de los años de trabajo y presentados en el sitio web del proyecto.

Regiones transcritas y codificantes de proteínas

El proyecto utilizó la anotación manual y automatizada para crear un catálogo completo de pseudogenes y ARN codificantes y no codificantes de proteínas humanas, denominado GENCODE. [20] [21] El catálogo incluye 20.687 genes codificadores de proteínas, con una media de 6,3 empalmados alternativamente por locus.

Además, se anotaron 8801 ARN pequeños generados automáticamente y 9640 ARN no codificantes largos curados manualmente (lncRNA). La comparación de los lncRNA con otros datos de ENCODE muestra que los lncRNA se generan a través de una vía similar a la de los genes que codifican proteínas. [22] El proyecto GENCODE también anotó 11.224 pseudogenes, de los cuales 863 se transcriben y se asocian con cromatina activa. [23]

ARN

  • Se secuenciaron ARN de 16 líneas celulares diferentes y múltiples fracciones subcelulares para desarrollar un amplio catálogo de expresión de ARN. Suponiendo que se utilice un umbral conservador para identificar regiones de actividad de ARN, el 62 % de las bases genómicas están representadas de forma reproducible en moléculas de ARN largas secuenciadas (>200 nucleótidos) o exones GENCODE.
  • Se utilizó el método CAGE-seq (aislamiento y secuenciación de ARN diana con capuchón 5') para identificar 62 403 sitios de inicio de transcripción (TSS) con alta confianza (IDR 0,01).
  • Finalmente, se encontró una proporción significativa de transcripciones codificantes y no codificantes que se procesaron en ARN estables persistentes de menos de 200 nucleótidos. Estos precursores incluyen ARN de transferencia, miARN , ARN nuclear pequeño y ARN nucleolar pequeño ( ARNt , miARN , ARNsn y ARNsno, respectivamente)

Sitios de unión a proteínas

Para identificar directamente las regiones reguladoras, los participantes del proyecto mapearon los sitios de unión de 119 proteínas diferentes de unión al ADN y varios componentes de la ARN polimerasa en 72 tipos de células utilizando ChIP-seq. [24] Se examinó el enriquecimiento de cada sitio de unión en motivos de unión al ADN conocidos y la presencia de motivos novedosos.

Regiones del genoma hipersensibles a la DNasa I

La accesibilidad a la cromatina, caracterizada por hipersensibilidad a la ADNasa I, es un sello distintivo de las regiones reguladoras del ADN. [25] [26] Los participantes del proyecto mapearon 2,89 millones de sitios de hipersensibilidad a la DNasa I (DHS) únicos y no superpuestos utilizando DNase-seq en 125 tipos de células.

Sitios de modificación de histonas

Se analizaron las ubicaciones cromosómicas de 12 modificaciones de histonas en 46 tipos de células. Los datos obtenidos muestran que los patrones globales de modificación varían mucho para diferentes tipos de células de acuerdo con los cambios en la actividad transcripcional. Se ha encontrado que la integración de diversa información de modificación de histonas puede usarse sistemáticamente para asignar atributos funcionales a regiones genómicas. [27]

Metilación del ADN

La metilación de citosina (generalmente en los dinucleótidos CpG) está involucrada en la regulación epigenética de la expresión génica. La metilación del promotor a menudo se asocia con la represión, mientras que la metilación del gen se correlaciona con la actividad transcripcional. [28] Los participantes del proyecto utilizaron el método Restricted Genomic Loci Set Bisulfite Sequencing (RRBS) para perfilar cuantitativamente la metilación del ADN para un promedio de 1,2 millones de CpG en cada una de las 82 líneas celulares y tejidos, incluidos CpG en regiones intergénicas de promotores proximales y regiones dentro de un gen (cuerpos genéticos). [29]

Sitios de interacciones cromosómicas

Las interacciones físicas entre regiones individuales de los cromosomas, que pueden estar separadas por cientos de kilobases, se consideran importantes en la regulación de la expresión génica 46. El método 5C ha revelado interacciones de largo alcance con los sitios de inicio de la transcripción (TSS) en un objetivo del 1 % de el genoma (44 regiones piloto ENCODE) en cuatro tipos de células (GM12878, K562, HeLa-S3 y H1 hESC) 49. Se encontraron cientos de interacciones de largo alcance estadísticamente significativas en cada tipo de célula después de tener en cuenta el comportamiento del polímero de cromatina y la variación experimental. Los pares de loci que interactúan mostraron una fuerte correlación entre el nivel de expresión del gen TSS y la presencia de ciertas clases de elementos funcionales, como los potenciadores . El número medio de elementos distales que interactuaban con el TSS fue de 3,9 y el número medio de TSS que interactuaban con el elemento distal fue de 2,5, lo que indica una red compleja de cromatina interconectada. Esta arquitectura entrelazada de "largo alcance" también se ha descubierto en todo el genoma mediante el análisis de interacción de la cromatina con secuenciación de marca final emparejada ( ChIA-PET ) utilizada para detectar interacciones en la cromatina enriquecida con ARN polimerasa II (Pol II) en cinco tipos de células. [treinta]

Crítica

A pesar de las afirmaciones del consorcio de que el proyecto ENCODE está lejos de terminar, la respuesta a los artículos y la cobertura de prensa ya publicados ha sido positiva. Los editores de la revista Nature y los autores del proyecto ENCODE escriben: "... hemos colaborado durante muchos meses para hacer el mayor impacto posible, que atraerá la atención no solo de la comunidad científica, sino también del público en general". ("... colaboraron durante muchos meses para causar el mayor impacto posible y captar la atención no solo de la comunidad investigadora sino también del público en general"). [31] La afirmación presentada por el proyecto ENCODE de que el 80% del genoma humano tiene una función bioquímica [10] fue retomada rápidamente por publicaciones de divulgación científica, que caracterizaron los resultados del proyecto como causantes de la muerte del ADN "basura". . [32] [33]

Sin embargo, la conclusión de que la mayor parte del genoma es "funcional" ha sido criticada porque el proyecto ENCODE define "funcionalidad" de manera demasiado amplia, es decir, que todo lo que se transcribe en una célula tiene una función. Se llegó a esta conclusión a pesar de la opinión generalmente aceptada de que muchos elementos del ADN que se transcriben , como los pseudogenes , no son funcionales. Además, el proyecto ENCODE hizo hincapié en la sensibilidad más que en la especificidad, lo que dio lugar a muchos falsos positivos . [34] [35] [36] La elección un tanto arbitraria de líneas celulares y factores de transcripción , así como la falta de los experimentos de control necesarios, se ha convertido en una fuente adicional de serias críticas a ENCODE, ya que una molécula de ADN aleatoria puede imitar tal comportamiento "funcional" en las interpretaciones ENCODE. [37]

En respuesta a estas críticas, se ha argumentado que la mayor parte de la transcripción y empalme del genoma , como se ve en los humanos, es un indicador más preciso de la función genética que el conservadurismo de secuencias. Además, la mayor parte del ADN "basura" está involucrado en la regulación epigenética y fue un requisito previo necesario para el desarrollo de organismos complejos. [38] En respuesta a los comentarios sobre la definición de la palabra "funcional", muchos señalaron que en este caso la disputa se refiere a una diferencia en la definición, y no a la esencia del proyecto, que es proporcionar datos para estudios posteriores de la bioquímica. actividad de regiones de ADN que no codifican proteínas. Si bien las definiciones son importantes y la ciencia se limita al lenguaje, ENCODE parece haber cumplido su propósito, ya que una gran cantidad de trabajos de investigación actualmente utilizan los datos generados por el proyecto en lugar de discutir las definiciones de "funcionalidad". [39] Ewan Birney, uno de los investigadores de ENCODE comentó sobre algunas de las reacciones al proyecto. Señala que la palabra "función" se ha utilizado pragmáticamente para referirse a "cierta actividad bioquímica" que se manifiesta en varias clases de experimentos de diferentes maneras: la presencia de ARN , modificaciones de histonas , regiones hipersensibles a DNaseI , picos de factores de transcripción ChIP-seq , huellas de ADN , sitios de unión de factores de transcripción y exones . [40]

Además, el proyecto ha sido criticado por su alto presupuesto (alrededor de $400 millones en total) y el patrocinio de la llamada "gran ciencia", investigación científica básica que toma dinero de desarrollos científicos más productivos que deben llevarse a cabo en el expensas de los propios investigadores. [41] La etapa inicial del proyecto ENCODE se estimó en $55 millones, su expansión costó aproximadamente $130 millones y el Instituto Nacional de Investigación del Genoma Humano de EE . UU. estaba listo para asignar hasta $123 millones para la siguiente fase del proyecto. Algunos investigadores argumentan que aún no se ha obtenido el retorno adecuado de la inversión. En un intento de contar todas las publicaciones en las que ENCODE juega un papel importante, se identificaron 300 artículos de este tipo desde 2012, 110 de los cuales se basaron en resultados de laboratorios sin financiación de ENCODE. Un problema adicional fue que ENCODE no es un nombre único que se refiera únicamente al proyecto ENCODE, por lo que la palabra 'encode' (encode) aparece en mucha literatura sobre genética e investigación del genoma . [7]

Como otro comentario importante, se argumenta que los resultados no justificaron la cantidad de tiempo empleado y que el proyecto es, en principio, de naturaleza infinita. Aunque se ha comparado con el Proyecto Genoma Humano e incluso se ha llamado su secuela, El Genoma Humano tiene un final claro del que ENCODE carece actualmente.

Los autores del proyecto aparentemente comparten la preocupación del mundo científico y no niegan la existencia de problemas, pero al mismo tiempo intentan justificar sus esfuerzos explicando los detalles del proyecto en entrevistas no solo a la comunidad científica, pero también a los medios de comunicación. Dicen que tomó más de medio siglo pasar de comprender que el ADN  es la base material de la herencia a descifrar la secuencia del genoma humano , por lo que su plan para el próximo siglo es comprender esta secuencia [7] .

Otros proyectos

Actualmente, el consorcio ENCODE está involucrado en varios proyectos adicionales con objetivos similares. Algunos de estos proyectos formaron parte de la segunda fase de ENCODE.

modENCODE

Por analogía con el proyecto ENCODE, también se lanzó un proyecto para mapear los elementos funcionales del genoma de los principales objetos modelo  , Drosophila melanogaster y Caenorhabditis elegans  , inglés.  Organismo Modelo ENCyclopedia Of DNA Elements (modENCODE) . La ventaja de este proyecto es la posibilidad de realizar algunos experimentos en organismos modelo que son difíciles o imposibles de realizar en humanos. [42]

El proyecto fue fundado en 2007 por los Institutos Nacionales de Salud ( NIH ) [  43] [44] En 2010, el consorcio modENCODE presentó una serie de artículos en Science sobre la anotación y el análisis de la distribución de elementos funcionales en el genoma de Drosophila melanogaster y Caenorhabditis elegans Los datos de estas publicaciones están disponibles en el sitio web modENCODE [45] .

En la actualidad, modENCODE es un conglomerado de investigación de 11 proyectos de semillas divididos entre la investigación de D. melanogaster y C. elegans . El proyecto cubre la investigación en las siguientes áreas:

moderno

modERN (  organismo modelo Encyclopedia of Regulatory Networks ) es una rama de modENCODE .  El proyecto combina la investigación sobre los grupos de C. elegans y D. melanogaster y se centra en la identificación de sitios de unión de factores de transcripción adicionales. El proyecto se puso en marcha al mismo tiempo que la tercera fase de ENCODE y está previsto que finalice en 2017. Hasta la fecha, modERN ha publicado los resultados de 198 experimentos, otros 500 han sido aceptados para su publicación y están siendo procesados ​​por la cámara de compensación de datos de ENCODE.

Genómica de la regulación génica

El programa Genómica de   Regulación Genética (GGR) fue lanzado a principios de 2015 por los Institutos Nacionales de Salud de EE. UU. y tendrá una duración de tres años. El objetivo del programa es estudiar redes y vías de genes en varios sistemas del cuerpo para avanzar en la comprensión de los mecanismos que controlan la expresión de genes. Aunque el proyecto ENCODE está separado del GGR, el Centro de intercambio de datos de ENCODE mantiene los datos del GGR en su portal.

Hoja de ruta

En 2008 , los Institutos Nacionales de Salud de EE. UU. organizaron el Roadmap Epigenomics   Mapping Consortium para desarrollar una fuente pública de datos epigenéticos del genoma humano para la investigación biológica y médica. Basándose en los resultados del trabajo, en febrero de 2015 el consorcio publicó el artículo "Análisis integrador de 111 epigenomas humanos de referencia". El consorcio recopiló y anotó elementos normativos en 127 epigenomas de referencia, 16 de los cuales formaban parte del proyecto ENCODE. Los datos del proyecto Roadmap están disponibles en los portales Roadmap o ENCODE .

fruitENCODE

Proyecto fruitENCODE: una enciclopedia de los elementos del ADN de las frutas en maduración, parte de ENCODE. El objetivo del proyecto es generar conjuntos de datos: sitios de metilación del ADN, modificaciones de histonas, regiones de cromatina hipersensibles a la ADNasa I, expresión génica, sitios de unión de factores de transcripción para frutas suculentas de todo tipo en diferentes etapas de desarrollo. La fecha de publicación preliminar de los resultados se publica en el portal fruitENCODE .

Libro de factores

Los datos de unión del factor de transcripción obtenidos por ENCODE están actualmente disponibles en Factorbook.org [47]  , una base de datos basada en wiki. El primer número de FactorBook contiene:

  • 457 conjuntos de datos ChIP-seq para 119 factores de transcripción en algunos cultivos de células humanas
  • Perfiles promedio de modificaciones de histonas y posicionamiento de nucleosomas alrededor de los sitios de unión del factor de transcripción
  • Motivos que enriquecen los sitios de unión, así como la distancia entre ellos y su orientación [48]

Véase también

Notas

  1. 1 2 Raney BJ, Cline MS, Rosenbloom KR, Dreszer TR, Learned K., Barber GP, Meyer LR, Sloan CA, Malladi VS, Roskin KM, Suh BB, Hinrichs AS, Clawson H., Zweig AS, Kirkup V. , Fujita PA, Rhead B., Smith KE, Pohl A., Kuhn RM, Karolchik D., Haussler D., Kent, WJ . ENCODE datos de genoma completo en el navegador de genomas de UCSC (actualización de 2011  )  // Nucleic Acids Res. : diario. - 2011. - Enero ( vol. 39 , núm. Número de base de datos ). - P.D871-5 . doi : 10.1093 / nar/gkq1017 . —PMID 21037257 .
  2. EGASP: Proyecto de evaluación de anotaciones del genoma humano ENCODE.  (Inglés) . Pub Med .
  3. Kleshchenko E. ADN sin basura  // The New Times. - 2012. - Edición. 29 (256) .
  4. Proyecto ENCODE en UCSC (enlace descendente) . Consorcio ENCODE. Consultado el 5 de septiembre de 2012. Archivado desde el original el 10 de septiembre de 2012. 
  5. Walsh, Fergus . Mapa detallado de la función del genoma  (5 de septiembre de 2012). Archivado desde el original el 5 de septiembre de 2012. Consultado el 6 de septiembre de 2012.
  6. Blog de Dan Graur .
  7. 1 2 3 4 Maher B. ENCODE: La enciclopedia humana   // Nature . - 2012. - Septiembre ( vol. 489 , no. 7414 ). - Pág. 46-8 . -doi : 10.1038/ 489046a . —PMID 22962707 .
  8. Saey, Tina Hesman Team lanza la secuela del genoma humano . Society for Science & the Public (6 de octubre de 2012). Consultado: 18 de octubre de 2012.
  9. 1 2 El Consorcio del Proyecto ENCODE. El proyecto ENCODE (ENCyclopedia Of DNA Elements) . Ciencia (2004).
  10. 1 2 3 Bernstein BE, Birney E., Dunham I., Green ED, Gunter C., Snyder M. Una enciclopedia integrada de elementos de ADN en el genoma humano  //  Nature: journal. - 2012. - Septiembre ( vol. 489 , no. 7414 ). - Pág. 57-74 . -doi : 10.1038/ naturaleza11247 . — . —PMID 22955616 .
  11. Timmer J. La mayor parte de lo que leíste estaba mal: cómo los comunicados de prensa reescribieron la historia científica . Personal / De las mentes de Ars . Ars Technica (10 de septiembre de 2012). Consultado: 10 de septiembre de 2012.
  12. Pennisi E. Genómica. El proyecto ENCODE escribe un elogio para el ADN basura  (inglés)  // Ciencia: revista. - 2012. - Septiembre ( vol. 337 , no. 6099 ). - P. 1159, 1161 . -doi : 10.1126 / ciencia.337.6099.1159 . —PMID 22955811 .
  13. 1 2 Birney E. , Stamatoyannopoulos JA , Dutta A. et al. Identificación y análisis de elementos funcionales en el 1% del genoma humano por el proyecto piloto ENCODE.  (Inglés)  // Naturaleza. - 2007. - vol. 447, núm. 7146 . - Pág. 799-816. -doi : 10.1038/ naturaleza05874 . —PMID 17571346 .
  14. Personal del programa ENCODE. ENCODE: Proyecto piloto: descripción general . Instituto Nacional de Investigación del Genoma Humano (18 de octubre de 2012).
  15. Genoma.gov | Proyectos ENCODE y modENCODE . El Proyecto ENCODE: ENCyclopedia Of DNA Elements . Instituto Nacional de Investigación del Genoma Humano de los Estados Unidos (1 de agosto de 2011). Consultado: 5 de agosto de 2011.
  16. ^ Instituto Nacional de Investigación del Genoma Humano - Organización . El almanaque NIH . Institutos Nacionales de Salud de los Estados Unidos. Consultado: 5 de agosto de 2011.
  17. Genoma.gov | ENCODE Participantes y Proyectos . El Proyecto ENCODE: ENCyclopedia Of DNA Elements . Instituto Nacional de Investigación del Genoma Humano de los Estados Unidos (1 de agosto de 2011). Consultado: 5 de agosto de 2011.
  18. Joseph R. Ecker, Wendy A. Bickmore, Inês Barroso, Jonathan K. Pritchard, Yoav Gilad. ENCODE explicado   // Naturaleza . — 2012-09. — vol. 489 , edición. 7414 . — págs. 52–54 . — ISSN 1476-4687 . -doi : 10.1038/ 489052a .
  19. El Consorcio del Proyecto ENCODE. Guía del usuario de la Enciclopedia de elementos de ADN (ENCODE  )  // PLOS Biology. — 2011-04-19. — vol. 9 , edición. 4 . — P.e1001046 . — ISSN 1545-7885 . - doi : 10.1371/journal.pbio.1001046 .
  20. Jennifer Harrow, Adam Frankish, José M. González, Electra Tapanari, Mark Diekhans. GENCODE: la anotación del genoma humano de referencia para The ENCODE Project  //  Genome Research. — 2012-09-01. — vol. 22 , edición. 9 _ — Pág. 1760–1774 . — ISSN 1549-5469 1088-9051, 1549-5469 . -doi : 10.1101/ gr.135350.111 .
  21. Cédric Howald, Andrea Tanzer, Jacqueline Chrast, Felix Kokocinski, Thomas Derrien. Combinando RT-PCR-seq y RNA-seq para catalogar todos los elementos génicos codificados en el genoma humano  //  Genome Research. — 2012-09-01. — vol. 22 , edición. 9 _ — Pág. 1698–1710 . — ISSN 1549-5469 1088-9051, 1549-5469 . -doi : 10.1101/ gr.134478.111 .
  22. Thomas Derrien, Rory Johnson, Giovanni Bussotti, Andrea Tanzer, Sarah Djebali. El catálogo GENCODE v7 de ARN largos no codificantes humanos: análisis de su estructura génica, evolución y expresión  //  Genome Research. — 2012-09-01. — vol. 22 , edición. 9 _ - Pág. 1775-1789 . — ISSN 1549-5469 1088-9051, 1549-5469 . -doi : 10.1101/ gr.132159.111 .
  23. Baikang Pei, Cristina Sisu, Adam Frankish, Cedric Howald, Lukas Habegger. El recurso del pseudogen GENCODE  // Biología del genoma. — 2012-09-05. - T. 13 , n. 9 _ - S. R51 . — ISSN 1474-760X . -doi : 10.1186 / gb-2012-13-9-r51 .
  24. Mark B. Gerstein, Anshul Kundaje, Manoj Hariharan, Stephen G. Landt, Koon-Kiu Yan. Arquitectura de la red reguladora humana derivada de datos ENCODE   // Naturaleza . — 2012-09. — vol. 489 , edición. 7414 . — P. 91–100 . — ISSN 1476-4687 . -doi : 10.1038/ naturaleza11245 .
  25. David S. Gross, William T. Garrard. Sitios hipersensibles a la nucleasa en la cromatina  // Revisión anual de bioquímica. - 1988-06-01. - T. 57 , n. 1 . — S. 159–197 . — ISSN 0066-4154 . -doi : 10.1146 / annurev.bi.57.070188.001111 .
  26. Fiódor D. Urnov. La remodelación de la cromatina como guía para las redes reguladoras de la transcripción en los mamíferos  (fr.)  // Revista de bioquímica celular. - 2003. - vol. 88 , libro. 4 . — págs. 684–694 . — ISSN 1097-4644 . -doi : 10.1002/ jcb.10397 .
  27. Jason Ernst, Pouya Kheradpour, Tarjei S. Mikkelsen, Noam Shoresh, Lucas D. Ward. Mapeo y análisis de la dinámica del estado de la cromatina en nueve tipos de células humanas   // Naturaleza . — 2011-05. — vol. 473 , edición. 7345 . — págs. 43–49 . — ISSN 1476-4687 . -doi : 10.1038 / nature09906 .
  28. Madeleine P. Ball, Jin Billy Li, Yuan Gao, Je-Hyuk Lee, Emily M. LeProust. Estrategias dirigidas y a escala del genoma para revelar firmas de metilación de genes y cuerpos en células humanas  //  Nature Biotechnology. — 2009-04. — vol. 27 , edición. 4 . — págs. 361–368 . — ISSN 1546-1696 . -doi : 10.1038/ nbt.1533 .
  29. Alexander Meissner, Tarjei S. Mikkelsen, Hongcang Gu, Marius Wernig, Jacob Hanna. Mapas de metilación del ADN a escala del genoma de células pluripotentes y diferenciadas  (inglés)  // Nature. — 2008-08. — vol. 454 , edición. 7205 . — Pág. 766–770 . — ISSN 1476-4687 . -doi : 10.1038/ naturaleza07107 .
  30. Redirección . linkinghub.elsevier.com . Recuperado: 10 de noviembre de 2020.
  31. Maher B. Fighting about ENCODE y basura . Blog de noticias . Nature Publishing Group (6 de septiembre de 2012).
  32. Kolata G. Lejos de ser 'basura', la materia oscura del ADN demuestra ser crucial para la salud , The New York Times (5 de septiembre de 2012).
  33. Gregorio TR. La máquina de exageración de los medios ENCODE . Genomicron (6 de septiembre de 2012).
  34. Graur D., Zheng Y., Price N., Azevedo RB, Zufall RA, Elhaik E. Sobre la inmortalidad de los televisores: "función" en el genoma humano según el evangelio libre de evolución de  ENCODE  // Genome Biol Evol : diario. - 2013. - Vol. 5 , núm. 3 . - pág. 578-590 . -doi : 10.1093 / gbe/evt028 . — PMID 23431001 .
  35. Moran LA Sandwalk: sobre el significado de la palabra "función" . Sandwalk (15 de marzo de 2013).
  36. Gregorio TR. Críticas de ENCODE en revistas revisadas por pares. "Genomicron (enlace no disponible) . Genomicron (11 de abril de 2013). Consultado el 30 de abril de 2015. Archivado desde el original el 2 de abril de 2015. 
  37. White MA, Myers CA, Corbo JC, Cohen BA El ensayo de potenciador in vivo masivamente paralelo revela que las características altamente locales determinan la función reguladora cis de los picos de ChIP-seq   // Actas de la Academia Nacional de Ciencias de los Estados Unidos de América  : diario. - 2013. - julio ( vol. 110 , no. 29 ). - Pág. 11952-11957 . -doi : 10.1073/ pnas.1307449110 . — PMID 23818646 .
  38. Mattick JS, Dinger ME El alcance de la funcionalidad en el genoma humano  (indefinido)  // The HUGO Journal. - 2013. - T. 7 , N º 1 . - S. 2 . -doi : 10.1186/ 1877-6566-7-2 .
  39. Editorial Naturaleza. Forma y función   // Naturaleza . - 2013. - 14 de marzo ( vol. 495 ). - pág. 141-142 . -doi : 10.1038/ 495141b .
  40. Birney, Ewan ENCODE: Mis propios pensamientos . Blog de Ewan: Bioinformatician at large (5 de septiembre de 2012).
  41. Timpson T. Debatiendo ENCODE: Dan Graur, Michael Eisen . Mendelspod (5 de marzo de 2013).
  42. El proyecto modENCODE: Organismo Modelo ENCyclopedia Of DNA Elements (modENCODE) . Sitio web de NHGRI . Consultado el 13 de noviembre de 2008.
  43. Participantes y Proyectos de modENCODE . Sitio web de NHGRI . Consultado el 13 de noviembre de 2008.
  44. Berkeley Lab Life Sciences recibió subvenciones del NIH para estudios sobre moscas de la fruta y nematodos . Sitio web del Laboratorio Nacional Lawrence Berkeley (14 de mayo de 2007). Consultado el 13 de noviembre de 2008.
  45. modENCODE . El Instituto Nacional de Investigación del Genoma Humano.
  46. Celniker S. Desvelando los secretos del genoma . Naturaleza (11 de junio de 2009).
  47. Libro de factores
  48. Wang J. Factorbook.org: una base de datos basada en Wiki para datos de unión de factores de transcripción generados por el consorcio ENCODE . Investigación de ácidos nucleicos (29 de noviembre de 2012).

Enlaces