STARR-Seq ( secuenciación de la región reguladora activa autotranscribible ) es un método para analizar la actividad potenciadora de millones de secuencias de ADN simultáneamente de los genomas de organismos arbitrarios . STARR-seq tiene un alto rendimiento y se puede utilizar para la búsqueda y cuantificación de la actividad potenciadora en todo el genoma [1] .
En los eucariotas, la transcripción está regulada por factores de transcripción , proteínas que se unen a regiones específicas del ADN en los promotores de genes , así como a regiones que no están ubicadas muy cerca de los genes, incluidos los potenciadores . Los potenciadores son regiones no codificantes de ADN que contienen sitios de unión específicos para varios factores de transcripción [2] . Los potenciadores reclutan factores de transcripción que activan la ARN polimerasa II y los factores de transcripción generales cerca del promotor, lo que conduce a la transcripción del gen. Los potenciadores pueden regular la transcripción de genes diana de una manera específica de tejido [1] , independientemente de su ubicación en el ADN y la distancia desde el promotor del gen. En algunos casos, pueden regular la transcripción de genes ubicados en un cromosoma diferente [3] . Sin embargo, hasta ahora, la información se ha limitado al estudio de un pequeño número de potenciadores debido a la complejidad de su búsqueda en todo el genoma [2] . Además, muchos elementos reguladores funcionan exclusivamente en tipos de células específicos y bajo ciertas condiciones [4] .
Para determinar los potenciadores en Drosophila , se usa una técnica que usa una inserción aleatoria de un transposón que codifica un promotor mínimo con una proteína informadora . Este método proporciona información sobre la regulación de genes ubicados cerca del sitio de inserción por potenciadores [5] .
En los últimos años, se han estudiado varias características de los potenciadores activos e inactivos utilizando tecnologías posgenómicas. El desarrollo de nuevos métodos, como DNase-seq , FAIRE-Seq , ChIP-seq , hizo posible predecir la posición de los potenciadores en el genoma. Sin embargo, DNase-seq y FAIRE-seq no permiten la determinación directa del potenciador y su actividad. Además, estos métodos no pueden probar la presencia de actividad potenciadora en un gran número de secuencias candidatas. El desarrollo de STARR-seq hace posible realizar una búsqueda de potenciadores en todo el genoma y cuantificar su actividad [1] .
La idea de STARR-seq se propuso en el laboratorio de A. Stark (A. Stark, Instituto de Patología Molecular , Viena , Austria ) para una búsqueda en todo el genoma de potenciadores de organismos arbitrarios, así como la determinación cuantitativa de su actividad. El método se basa en el hecho de que los potenciadores pueden funcionar independientemente de su ubicación relativa en el ADN. La esencia del método radica en la ubicación del potenciador potencial después del promotor mínimo, lo que permite que el potenciador activo active la transcripción del ADN que contiene su propia secuencia. La actividad de cada potenciador se caracteriza por el grado de enriquecimiento del ARN con la secuencia potenciadora entre todos los ARN celulares. Usando este enfoque, es posible verificar simultáneamente millones de secciones de ADN de una fuente arbitraria [1] .
El ADN genómico se rompe aleatoriamente en pequeños fragmentos. Se seleccionan fragmentos de cierta longitud, se les unen adaptadores. Luego se amplifican los fragmentos de ADN con adaptadores . Los productos de PCR se purifican y se insertan en el plásmido después del promotor mínimo en la región 3' no traducida del gen informador, lo que permite que el potenciador activo active la transcripción por la ARN polimerasa de una región de ADN que contiene, después del punto de inicio de la transcripción, la secuencia del propio potenciador. A continuación, las células se transfectan con la biblioteca indicadora resultante y se cultivan. El ARN poliadenilado se aísla del ARN total y el ADNc se obtiene mediante transcripción inversa , que se amplifica, después de lo cual se reconoce la secuencia de los fragmentos mediante secuenciación de extremos emparejados . Los fragmentos secuenciados se asignan al genoma de referencia y los datos se envían para su procesamiento informático [1] .
El método STARR-seq se aplicó originalmente al genoma de Drosophila . Se encontró que la mayoría (55,6%) de los potenciadores se encuentran en los intrones , en particular en el primer intrón y en las regiones intergénicas. Es interesante que una pequeña parte (4,5%) de los potenciadores se encuentran en los sitios de inicio de la transcripción y, por lo tanto, se puede suponer que estos potenciadores pueden iniciar la transcripción en este sitio y afectar la transcripción de otros genes. Los potenciadores más activos se encuentran cerca de los genes constitutivos , como los que codifican las proteínas del citoesqueleto , y algunos reguladores del desarrollo, como los factores de transcripción. Los autores demostraron que muchos genes están regulados por varios potenciadores activos independientes. Además, resultó que los niveles de expresión génica en promedio se correlacionan con la actividad potenciadora total por gen, lo que proporciona una relación directa entre el nivel de expresión y la actividad potenciadora [1] .
Utilizando STARR-seq para buscar y caracterizar variantes de alelos reguladores , Vockey y otros descubrieron los efectos de la variación genética humana en la función de los elementos reguladores no codificantes al medir la actividad de 100 potenciadores putativos de los genomas de 95 individuos. Este enfoque permite identificar variantes reguladoras (incluidos SNP ) ubicadas en loci genómicos que contribuyen a cambios en los niveles de expresión de varios ARNm ( eQTL ), además de contribuir a fenotipos complejos [7] .
El método STARR-seq tiene las siguientes ventajas:
STARR-seq combina métodos clásicos de biología molecular con métodos bioinformáticos altamente especializados para detectar y cuantificar la actividad potenciadora. Hasta la fecha, STARR-seq se ha aplicado en células humanas y de ratón y se ha confirmado su eficacia [8] . La aplicación de STARR-seq a una variedad de tipos celulares de diversos organismos permitirá dar un paso significativo en el estudio de la regulación génica y las vías de señalización responsables de la misma durante el desarrollo y la diferenciación celular , en condiciones normales y patológicas [6]. ] .