Promotor

La versión actual de la página aún no ha sido revisada por colaboradores experimentados y puede diferir significativamente de la versión revisada el 14 de abril de 2022; la verificación requiere 1 edición .

El promotor ( ing.  promotor ) es una secuencia de nucleótidos de ADN reconocida por la ARN polimerasa como plataforma de lanzamiento para iniciar la transcripción . El promotor juega uno de los papeles clave en el proceso de iniciación de la transcripción [1] .

Información general

Por lo general, el promotor se encuentra alrededor del punto de inicio de la transcripción: el primer nucleótido del que se obtiene la transcripción, que tiene una coordenada de +1 (el nucleótido anterior se denota como -1). El promotor suele incluir una serie de motivos que son importantes para su reconocimiento por la ARN polimerasa. En particular, elementos -10 y -35 en bacterias , caja TATA en eucariotas [1] .

El promotor es asimétrico, lo que permite que la ARN polimerasa comience la transcripción en la dirección correcta e indica cuál de las dos cadenas de ADN servirá como molde para la síntesis de ARN . La cadena de plantilla de ADN se denomina no codificante, mientras que la otra cadena codificante coincide con el ARN resultante en la secuencia (excluyendo el reemplazo de timina con uracilo ) [1] .

El promotor bajo el cual se encuentra la región de ARN codificante del ADN juega un papel decisivo en la intensidad de expresión de este gen en cada tipo celular específico. Por actividad, los promotores se dividen en constitutivos (nivel constante de transcripción) e inducibles (la transcripción depende de las condiciones en la célula, por ejemplo, la presencia de ciertas sustancias o la presencia de un choque térmico). La activación del promotor está determinada por la presencia de un conjunto de factores de transcripción [1] .

La estructura de los promotores

En bacterias

La ARN polimerasa del núcleo bacteriano (que consta de subunidades α2ββ'ω) puede iniciar la transcripción en cualquier parte del genoma. Sin embargo, en la célula, la iniciación ocurre solo en las regiones promotoras. Esta especificidad la proporciona la subunidad σ (factor σ ), que, en complejo con la enzima central, forma una holoenzima . El principal factor σ de las células de Escherichia coli es la subunidad σ 70 [1] .

El promotor clásico (σ 70 ) consiste en dos secuencias conservadas de 6 nucleótidos de longitud, ubicadas aguas arriba del sitio de inicio de la transcripción por 10 y 35 pb, separadas por 17 nucleótidos. Estas secuencias se denominan respectivamente -10 y -35 elementos . Los elementos no son idénticos en todos los promotores, pero se pueden obtener secuencias consenso para ellos [1] .

Algunos promotores fuertes también tienen un elemento UP cadena arriba del elemento -35, lo que aumenta el nivel de unión de la ARN polimerasa. Algunos promotores σ 70 no tienen el elemento -35, sino que tienen el elemento -10 extendido unos pocos nucleótidos ( -10 extendido ). Este es el promotor del operón galactosa E. coli . A veces, debajo del elemento -10, hay otro elemento de conexión: el discriminador [1] .

Las subunidades σ alternativas de la ARN polimerasa cambian la especificidad del reconocimiento del promotor. Por ejemplo, la subunidad σ 32 provoca el reconocimiento de los promotores de los genes de respuesta al choque térmico, σ 54 está asociada con los genes del metabolismo del nitrógeno [1] .

En eucariotas

Las células eucariotas contienen varios tipos de ARN polimerasas. La transcripción del ARNm la lleva a cabo la ARN polimerasa II junto con un conjunto de factores de transcripción de proteínas [1] .

El promotor del núcleo eucariótico es el conjunto mínimo de elementos de secuencia requeridos para la unión de la ARN polimerasa II y los factores de transcripción involucrados en el inicio de la transcripción. Por lo general, el promotor central tiene una longitud de 40 a 60 pb y se puede ubicar por encima o por debajo del punto de inicio de la transcripción. El conjunto completo de elementos principales del promotor incluye el elemento BRE , la caja TATA , Inr (iniciador) y/o elementos posteriores (DPE, DCE y MTE). Normalmente, el promotor contiene una combinación de estos elementos. Por ejemplo, las cajas DPE y TATA normalmente no ocurren al mismo tiempo en un promotor. A menudo hay una combinación de caja TATA, DPE e Inr [1] .

elemento promotor Proteína de unión Coordenadas Secuencia de consenso
elemento BRE TFIIB -37 -32 [GC][GC][GA]CGCCC
caja tata TBP -31 -26 TATA[AT]A[AT]
interior TFIID -2 +4 [CT][CT]AN[TA][CT][CT]
DCE I TFIID +6 +11 CTTC
DCE II TFIID +16 +21 CTGT
MTE +21 +28
DPE TFIID +28 +32 [AG]G[AT]CGTG
DCE III TFIID +30 +34 CAG

Además, para que prosiga la transcripción de eucariotas, es necesaria la interacción con secuencias reguladoras ubicadas desde el punto de inicio de la transcripción: secuencias proximales, potenciadores , silenciadores , aislantes, elementos fronterizos [1] .

En las células eucariotas, además de la ARN polimerasa II, existen dos ARN polimerasas más que transcriben ARNr ( la ARN polimerasa I es responsable de esto ) y ARN no codificantes como el ARNt y el 5sARN (son transcriptos por la ARN polimerasa III ) [1 ] .

La ARN polimerasa I en células eucariotas transcribe un solo gen precursor de ARNr , presente en muchas copias en el genoma. El promotor del gen rRNA contiene elementos centrales (coordenadas alrededor de -45 +20) y UCE ( elemento de control aguas arriba , coordenadas alrededor de -150 -100). El inicio de la transcripción de este gen también requiere varios factores de transcripción, TBP, SL1 (consiste en las proteínas TBP y tres TAF) y UBF. UBF se une al elemento UCE, SF1 se une al promotor central. El UBF unido estimula la unión de la polimerasa a la región promotora del núcleo [1] .

La ARN polimerasa III transcribe los genes de algunos de los ARN no codificantes de la célula ( ARNt , 5sARN). Los promotores de la ARN polimerasa III son muy diversos y normalmente se encuentran por debajo del punto de inicio de la transcripción. Los promotores de los genes de ARNt, en particular, contienen cajas A y B; los factores de transcripción TFIIIB y TFIIIC son necesarios para la iniciación. Otros promotores pueden contener cajas A y C (por ejemplo, 5sRNA); los factores de transcripción TFIIIA, TFIIIB, TFIIIC son necesarios para la iniciación. El grupo promotor de la ARN polimerasa III contiene cajas TATA [1] .

Reglamento de promotores

La regulación del nivel de transcripción a menudo ocurre en la etapa de iniciación, es decir, desde la unión de la ARN polimerasa al promotor antes del inicio de la elongación [1] .

La región promotora dentro de un operón en bacterias puede superponerse o no superponerse en absoluto con la región operadora de un cistrón ( gen ) . En las bacterias, la unión al promotor está determinada por la parte estructural de la polimerasa, la subunidad σ. Las proteínas reguladoras también suelen estar involucradas en la regulación, lo que puede acelerar el proceso y aumentar su eficiencia (activadores) o ralentizarlo (represores) [1] .

La transcripción de los eucariotas se regula de manera similar a la de las bacterias (debido a diferentes proteínas reguladoras), pero también difiere. Los genes eucariotas no forman operones, cada gen tiene su propio promotor. Los eucariotas tienen cromatina compuesta por ADN y nucleosomas. Tanto el ADN como los nucleosomas pueden sufrir modificaciones químicas que afectan el nivel de transcripción. Además, otras regiones del ADN, como potenciadores, silenciadores, aislantes, elementos de contorno, están involucradas en la regulación de promotores en eucariotas [1] .

Ejemplos de promotores

Las secuencias y las características reguladoras de muchos promotores de varios organismos vivos ahora se conocen bien. Este conocimiento se utiliza ampliamente en la creación de construcciones genéticas de bioingeniería ( plásmidos , vectores ). Para la expresión del producto en células bacterianas o eucariotas, se puede utilizar tanto un promotor característico de este grupo de organismos que se encuentra en el genoma como un promotor, por ejemplo, de virus que infectan a este organismo [1] .

Ejemplos clásicos de operones bacterianos con regulación conocida de promotores procarióticos son: promotor de lactosa, promotor de triptófano, promotor de arabinosa , operón GABA, operón de galactosa . Los promotores de células eucariotas bien estudiados son el promotor GAL1 de levadura, el promotor de tetraciclina TRE inducible y el promotor de edkysona inducible. En el genoma viral, así como en los procariotas y eucariotas, existen promotores, por ejemplo, el promotor del fago T5, el promotor del fago T7, los promotores constitutivos de los virus SV40 (virus del polioma), RSV, CMV (citomegalovirus) [1] .

Predicción de la región promotora

A menudo, los algoritmos de predicción de promotores producen una gran cantidad de falsos positivos (predicen secuencias de promotores que no son promotores). Por ejemplo, en promedio, varios algoritmos predicen un promotor por 1000 pb, mientras que el genoma humano contiene aproximadamente un gen por 30 000 a 40 000 pb. [2] Este resultado se debe al hecho de que se deben tener en cuenta muchos factores al predecir los promotores [2] :

A pesar de las dificultades descritas anteriormente, existen muchos algoritmos para predecir regiones promotoras en varios organismos. La siguiente tabla muestra algunos de ellos.

Nombre del algoritmo Cómo funciona el algoritmo Lo que predice el algoritmo
TSSW [3] El algoritmo predice los posibles sitios de inicio de la transcripción utilizando una función discriminante lineal que combina características que describen los motivos funcionales y la composición de oligonucleótidos de estos sitios. TSSW utiliza la base de datos del sitio funcional TRANSFAC (escrita por E. Wingender [4] , de ahí la última letra del nombre del método TSSW). Región promotora humana PolII.
TSSG [3] /Fprom [3] El algoritmo TSSG funciona de la misma manera que TSSW, pero utiliza una base de datos diferente, TFD [5] . Fprom es el mismo TSSG entrenado en un conjunto diferente de secuencias promotoras. TSSG, región promotora de PolII humana, Fprom, región promotora humana.
TSSP [3] El algoritmo funciona de la misma forma que TSSW, utilizando la base de datos de elementos reguladores de plantas RegSite [6] . Al mismo tiempo, el algoritmo fue entrenado en las secuencias de las regiones promotoras de plantas. región promotora de la planta.
PIMIENTA [7] El algoritmo predice la región promotora basándose en una matriz de peso posicional curada y un modelo oculto de Markov para las secuencias de consenso -35 y -10, así como diferentes sitios de unión de Bacillus subtilis y Escherichia coli (tomados como representantes de Gram -positivos y Gram- bacterias negativas, respectivamente). Región promotora de procariotas (adecuada principalmente para genomas bacterianos).
Promotor Inspector [8] El algoritmo heurístico se basa en el entorno genómico de la región promotora de una muestra de secuencias de mamíferos. Región promotora de PolII de mamíferos.
BPROM [3] El algoritmo funciona de la misma manera que TSSW, utilizando la base de datos del sitio funcional DPInteract [9] . σ 70 región promotora de E. coli .
NNPP 2.2 [10] El programa es una red neuronal con retardo, que consta de dos capas funcionales, una para el reconocimiento de cajas TATA y otra para el reconocimiento de elementos Inr. Región promotora de eucariotas y procariotas.
Buscador de G4Prom [11] El algoritmo identifica promotores putativos basados ​​en elementos ricos en AT y motivos de ADN cuádruple G en la región rica en GC. Región promotora de bacterias.

Con el aumento en el número de regiones promotoras predichas y demostradas experimentalmente de varios organismos, se hizo necesario crear una base de datos de secuencias promotoras. La mayor base de datos de secuencias de promotores eucariotas (principalmente vertebrados) es la base de datos de promotores eucariotas [12] . La base de datos se divide en dos partes. El primero (EPD) es una colección seleccionada de secuencias de promotores obtenidas mediante el procesamiento de datos experimentales, el segundo (EPDnew) es el resultado de fusionar información de promotores de la base de datos de EPD con análisis de datos de métodos de secuenciación de alto rendimiento. Con la ayuda de métodos de alto rendimiento para la obtención de transcriptomas, fue posible obtener un conjunto de promotores para algunos representantes de plantas y hongos: Arabidopsis thaliana (Tal's coli), Zea mays (Sugar corn), Saccharomyces cerevisiae , Schizosaccharomyces pombe [13 ] .

Notas

  1. 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 Watson JD, Baker TA, Bell SP, Gann AA, Levine M., Losick RM Biología molecular del  gen . — 7mo. — Pearson, 2014.
  2. 1 2 Pedersen Anders Gorm , Baldi Pierre , Chauvin Yves , Brunak Søren. La biología de la predicción del promotor eucariótico: una revisión  //  Computadoras y química. - 1999. - junio ( vol. 23 , n. 3-4 ). - pág. 191-207 . — ISSN 0097-8485 . - doi : 10.1016/S0097-8485(99)00015-7 .
  3. 1 2 3 4 5 Solovyev Victor V. , Shahmuradov Ilham A. , Salamov Asaf A. Identificación de regiones promotoras y sitios reguladores  (inglés)  // Métodos en biología molecular. - 2010. - Págs. 57-83 . — ISBN 9781607618539 . — ISSN 1064-3745 . -doi : 10.1007 / 978-1-60761-854-6_5 .
  4. Wingender E. TRANSFAC: una base de datos sobre factores de transcripción y sus sitios de unión al ADN  //  Nucleic Acids Research. - 1996. - 1 de enero ( vol. 24 , n. 1 ). - pág. 238-241 . — ISSN 1362-4962 . doi : 10.1093 / nar/24.1.238 .
  5. David Ghosh. Una base de datos relacional de factores de transcripción  //  Nucleic Acids Research. - 1990. - vol. 18 , núm. 7 . - Pág. 1749-1756 . — ISSN 0305-1048 . -doi : 10.1093 / nar/18.7.1749 .
  6. Base de datos RegSite . Baya suave . Consultado el 7 de abril de 2019. Archivado desde el original el 22 de octubre de 2019.
  7. de Jong Anne , Pietersma Hilco , Cordes Martijn , Kuipers Oscar P , Kok Jan. PePPER: un servidor web para la predicción de elementos promotores de procariotas y regulones  //  BMC Genomics. - 2012. - vol. 13 , núm. 1 . — Pág. 299 . — ISSN 1471-2164 . -doi : 10.1186 / 1471-2164-13-299 .
  8. Scherf Matthias , Klingenhoff Andreas , Werner Thomas. Localización altamente específica de regiones promotoras en grandes secuencias genómicas por parte de PromoterInspector: un nuevo enfoque de análisis de contexto  //  Journal of Molecular Biology. - 2000. - marzo ( vol. 297 , no. 3 ). - Pág. 599-606 . — ISSN 0022-2836 . -doi : 10.1006 / jmbi.2000.3589 .
  9. Robison Keith , McGuire Abigail Manson , Church George M. Una biblioteca completa de matrices de sitios de unión al ADN para 55 proteínas aplicadas al genoma completo de Escherichia coli K-12 1 1 Editado por R. Ebright  //  Journal of Molecular Biology . - 1998. - noviembre ( vol. 284 , n. 2 ). - Pág. 241-254 . — ISSN 0022-2836 . -doi : 10.1006/ jmbi.1998.2160 .
  10. Carga S. , Lin Y.-X. , Zhang R. Mejora de la predicción del promotor Mejora de la predicción del promotor para el algoritmo NNPP2.2: un estudio de caso utilizando secuencias de ADN de Escherichia coli   // Bioinformática . - 2004. - 28 de septiembre ( vol. 21 , n. 5 ). - Pág. 601-607 . — ISSN 1367-4803 . -doi : 10.1093 / bioinformática/bti047 .
  11. Di Salvo Marco , Pinatel Eva , Talà Adelfia , Fondi Marco , Peano Clelia , Alifano Pietro. G4PromFinder: un algoritmo para predecir promotores de transcripción en genomas bacterianos ricos en GC basado en elementos ricos en AT y motivos G-quadruplex  //  BMC Bioinformatics. - 2018. - 6 febrero ( vol. 19 , núm. 1 ). — ISSN 1471-2105 . -doi : 10.1186 / s12859-018-2049-x .
  12. Cavin Perier R. La base de datos de promotores eucariotas EPD  //  Investigación de ácidos nucleicos. - 1998. - 1 de enero ( vol. 26 , no. 1 ). - P. 353-357 . — ISSN 1362-4962 . doi : 10.1093 / nar/26.1.353 .
  13. Dreos René , Ambrosini Giovanna , Groux Romain , Cavin Périer Rouaïda , Bucher Philipp. La base de datos de promotores eucarióticos en su trigésimo año: enfoque en organismos no vertebrados  //  Investigación de ácidos nucleicos. - 2016. - 28 de noviembre ( vol. 45 , n. D1 ). -P.D51- D55 . — ISSN 0305-1048 . doi : 10.1093 / nar/gkw1069 .