FAIRE-Seq ( aislamiento asistido por formaldehído de secuenciación de elementos reguladores ) es un método de biología molecular utilizado para determinar secuencias reguladoras (secciones) de ADN [1] [2] . FAIRE-Seq es una combinación de aislamiento de elementos reguladores de la cromatina (FAIRE) y secuenciación de alto rendimiento .
FAIRE es uno de los métodos para mapear regiones abiertas de cromatina , junto con los métodos hipersensibles a la DNasa I ( DNase-seq ) y de inmunoprecipitación de cromatina ( ChIP-seq , ChIP-on-chip). La idea del método fue propuesta en 2003 para el fraccionamiento de la cromatina de Saccharomyces cerevisiae en 2 partes: la primera son las regiones transcritas por la ARN polimerasa II, la segunda son las secuencias no codificantes y las regiones transcritas por las ARN polimerasas I o III [ 3] . La separación se lleva a cabo debido a los diferentes grados de reticulación de formaldehído de las regiones de cromatina individuales. En 2007, las regiones asociadas con la actividad reguladora de la cromatina humana se identificaron mediante este método; por lo tanto, el método pasó la prueba y obtuvo su nombre FAIRE [4] . En la versión original, el análisis de datos se basaba en la hibridación de fragmentos de ADN marcados con fluorescencia con micromatrices de ADN [4] , que más tarde se denominó FAIRE-chip. En trabajos posteriores se propusieron otros métodos para analizar los fragmentos de ADN obtenidos, entre los cuales el más común es FAIRE-seq [1] .
Hasta la fecha, existen varias variantes del método destinado a tejidos de animales y plantas. Cuando se trabaja con plantas, se requieren condiciones más estrictas y un tiempo prolongado de fijación del formaldehído debido a la pared celular, la cutícula cerosa de las hojas y los espacios de aire en el mesófilo esponjoso [5] . Además de mapear regiones reguladoras, el método permite la comparación de elementos activos en diferentes tejidos (tanto tumorales como sanos). Los experimentos que utilizan FAIRE-seq duran una media de unos tres días, sin incluir el análisis y la interpretación de los datos [6] .
En las células eucariotas se observa cromatina abierta en regiones reguladoras activas, por lo que el aislamiento de regiones no ricas en nucleosomas permitiría mapear los elementos reguladores del genoma, independientemente del tipo celular [2] . Cuando se añade formaldehído al cultivo de tejidos, se forman enlaces cruzados entre proteínas , proteínas y ácidos nucleicos, en particular ADN e histonas, o entre histonas. A continuación, el ADN genómico se somete a fragmentación ultrasónica en segmentos de 300 a 400 pares de bases de longitud en promedio. Durante la extracción subsiguiente con fenol-cloroformo, el ADN libre de proteínas estará en la fase acuosa y los complejos de ADN-proteína unidos covalentemente estarán en el límite de fase. Así, las regiones del genoma asociadas con actividad reguladora y libres de nucleosomas (o con un pequeño número de ellos) se ubican por encima del límite de fase en el agua. Se pueden extraer de allí, una vez más se purifican de las proteínas restantes con fenol-cloroformo, se tratan con ribonucleasa A y se vuelven a precipitar para su posterior análisis. Como control, se utiliza una muestra de ADN obtenida del mismo cultivo de tejido utilizando los mismos procedimientos, pero sin fijación de formaldehído [6] .
Además, según el método de análisis de las secciones de ADN obtenidas, FAIRE-seq (secuenciación de fragmentos de ADN de alto rendimiento, por ejemplo, utilizando Illumina ), FAIRE-chip (hibridación de fragmentos de ADN marcados con fluorescencia con micromatrices de ADN ), FAIRE-qPCR (análisis cuantitativo de secciones de ADN mediante PCR en tiempo real ). Ahora FAIRE-seq ha suplantado casi por completo a otros métodos para determinar fragmentos de ADN extraídos [6] .
El análisis de los datos de secuenciación requiere el alineamiento de las secuencias con el genoma de referencia, para lo cual, por ejemplo, se utiliza Bowtie . Luego, se buscan regiones significativas de enriquecimiento . A estos efectos, se recomienda el uso de ZINBA. A diferencia de FAIRE-chip y FAIRE-qPCR, cuando se utiliza FAIRE-seq con suficiente profundidad de cobertura del genoma, la muestra de control puede estar ausente [6] .
Con FAIRE-seq, se pueden buscar promotores objetivo de factores tumorales, detectar y probar regiones potenciales de cromatina libre no asociadas con nucleosomas, identificar regiones reguladoras inducibles del genoma y describir elementos reguladores activos del genoma. El método también permite evaluar la variabilidad de la composición de nucleótidos de las regiones reguladoras en diferentes poblaciones [7] .
El uso de FAIRE-seq junto con otros métodos, como DNase-seq, brinda un resultado más confiable y de alta calidad [2] .
El método FAIRE no requiere un pretratamiento de las células, ya que se añade formaldehído al medio nutritivo o directamente al tejido, lo que conduce rápidamente a la muerte celular, lo que permite obtener la cromatina en un estado previo a la fijación. Al mismo tiempo, diferentes tiempos de fijación con formaldehído a una concentración constante dan el mismo resultado. A diferencia de ChIP [8] , el método no depende de la fiabilidad y la variabilidad de los anticuerpos. Además, FAIRE no requiere el uso de enzimas como DNase o MNase, que se usan comúnmente en métodos similares para detectar regiones libres de nucleosomas. La ausencia de tratamiento enzimático hace que este método sea menos variable, más fiable y reproducible [6] .
FAIRE es fácilmente adaptable para su uso en muestras de tejido porque FAIRE no requiere una suspensión de una sola célula o aislamiento nuclear. En este caso, el único paso adicional es triturar el tejido congelado hasta convertirlo en un polvo grueso antes de la fijación [6] .
FAIRE puede detectar elementos reguladores distales ubicados lejos de los promotores (p. ej., potenciadores de la transcripción) que no se encuentran en DNase-seq [2] .
A pesar de la sencillez de la parte experimental, FAIRE-seq, al igual que otros métodos asociados a la secuenciación extensiva, requiere una gran cantidad de recursos computacionales y memoria para interpretar los resultados. En este sentido, FAIRE-chip y FAIRE-qPCR pueden ser más atractivos [6] .
En comparación con DNase-seq y ChIP-seq , FAIRE tiene una relación señal/ruido más baja. Por lo tanto, los sitios detectados por FAIRE pueden diferir solo ligeramente de la señal de fondo de vez en cuando, lo que reduce la confianza en los sitios identificados. Este efecto se exacerba cuando se utilizan métodos de detección sin secuenciación. A pesar de la baja relación señal-ruido, vale la pena señalar que los resultados de FAIRE tienen una buena reproducibilidad . Sin embargo, la detección de algunos promotores de genes expresados activamente es peor que otros métodos como DNase-seq [2] .
La efectividad de la fijación de tejidos varía según sus propiedades (pureza, permeabilidad, densidad celular, contenido de grasa y área de superficie), lo que puede dificultar la comparación de los resultados obtenidos para diferentes tejidos [6] .
Los datos del genoma humano FAIRE-seq están disponibles como parte del proyecto ENCODE (Encyclopedia of DNA Elements) en el sitio web interactivo UCSC Genome Browser que ofrece acceso a los datos del genoma de varios vertebrados , invertebrados y grandes organismos modelo , integrados con una gran colección de anotaciones consistentes [9] .