5' - Región no traducida (5'-UTR , pronunciada como región no traducida de cinco trazos , ing. 5'-región no traducida, 5'-UTR ), o secuencia líder [1] - región no codificante de ARNm , ubicada inmediatamente después de la tapa , pero antes de la región de codificación. La región de ADN correspondiente a la 5'-UTR de la transcripción tiene el mismo nombre [2] . La 5′-UTR contiene varios elementos que intervienen en la regulación de la eficiencia de la traducción [3] .
La longitud total de la 5′-UTR es, en la mayoría de los casos, aproximadamente la misma para todos los grupos taxonómicos de eucariotas y es de aproximadamente 100 a 200 nucleótidos , pero puede alcanzar varios miles [4] [5] . Así, en la levadura Schizosaccharomyces pombe , la longitud de la 5'-UTR en la transcripción de ste11 es de 2273 nucleótidos [6] [7] . La longitud media de una 5'-UTR en humanos es de unos 210 nucleótidos (al mismo tiempo, la longitud media de una 3'-UTR es de 800 nucleótidos [8] ). La 5'-UTR humana más larga conocida se encuentra en el oncogén Tre , su longitud es de 2858 nucleótidos, y la 5'-UTR humana más corta tiene 18 nucleótidos de longitud [1] .
La composición de bases también difiere en 3'- y 5'-UTR. Así, el contenido de G + C es mayor en 5'-UTR que en 3'-UTR. Esta diferencia es especialmente notable en el ARNm de vertebrados de sangre caliente , en los que el contenido de G+C en la 5'-UTR es del 60% y en la 3'-UTR del 45% [9] .
Dentro de las regiones de ADN correspondientes a la 5'-UTR del transcrito hay intrones , así como en las regiones de ADN correspondientes a la región codificante del ARNm. Alrededor del 30% de los genes Metazoa tienen regiones correspondientes a la 5'-UTR, que consisten únicamente en exones [4] . En los seres humanos, alrededor del 35 % de los genes tienen intrones en la 5′-UTR. Los intrones de la 5'-UTR difieren de los de la región codificante y de la 3'-UTR en términos de composición, longitud y densidad de nucleótidos [10] . Se sabe que la relación entre la longitud total de intrones y la longitud de exones en la 5'-UTR es menor que en la región codificante; sin embargo, la densidad de intrones en la 5'-UTR es mayor (según otros datos, por el contrario, es más bajo [11] ), -UTR es aproximadamente el doble de largo que los intrones en la región codificante. Los intrones son mucho más raros en 3'-UTR que en 5'-UTR [12] .
La evolución y las funciones de los intrones en la 5'-UTR siguen sin explorarse en gran medida. Sin embargo, se ha encontrado que los genes expresados activamente tienen con más frecuencia intrones cortos en la 5'-UTR que intrones largos o están completamente ausentes. Aunque aún no se ha establecido la relación entre la longitud y el número de intrones y tejido , se ha encontrado cierta correlación entre el número de intrones en los genes y sus funciones. Por lo tanto, se encontraron especialmente muchos intrones en genes que realizan funciones reguladoras [10] . En general, la presencia de al menos un intrón en la 5'-UTR potencia la expresión génica mejorando la transcripción (en este caso, estamos hablando de la región del ADN correspondiente a la 5'-UTR del transcrito) o estabilizando la madura. ARNm. Por ejemplo, la expresión del gen de la ubiquitina C ( UbC ) depende de la presencia de un intrón en la 5'-UTR. Con la pérdida de un intrón, la actividad del promotor cae bruscamente y estudios posteriores han demostrado que los factores de transcripción Sp1 y Sp3 se unen en la región 5'-UTR del ADN [11] .
La composición estructural y de nucleótidos de la 5'-UTR es importante para la regulación de la expresión génica; además, se mostraron diferencias en la estructura del ARNm de 5'-UTR de los genes "housekeeping" y los genes implicados en la regulación de la ontogenia . Los genes 5′-UTR, cuya expresión se acompaña de la formación de una gran cantidad de proteína , por regla general, tienen una longitud corta, se caracterizan por un bajo contenido de G + C , la ausencia de elementos pronunciados de la estructura secundaria y codones AUG internos (codones de inicio ) ubicados antes del codón de inicio principal . Por el contrario, los genes 5'-UTR que dan lugar a una pequeña cantidad de proteína son más largos, tienen un mayor contenido de GC y tienen un mayor número de elementos característicos de estructura secundaria. Los 5'-UTR altamente estructurados a menudo son inherentes a los ARNm de genes implicados en la regulación del desarrollo; además, la formación de estos ARNm a menudo se caracteriza por la especificidad de tejido y edad [13] .
Se ha establecido que las 5'-UTR, que tienen un efecto supresor de la traducción, tienen estructuras compactas alrededor del codón de inicio . Aunque se desconocen los mecanismos específicos de dicha represión, se cree que las características estructurales y de nucleótidos de la 5'-UTR determinan la unión de varios factores proteicos a ella, que activan o suprimen la traducción [13] .
Los G-quadruplex son elementos de estructura secundaria importantes y bien estudiados de la 5'- UTR . Se forman cuando las secuencias enriquecidas con guanina se pliegan en una estructura de cuatro cadenas no canónica extremadamente estable; tales estructuras tienen un efecto estrictamente supresor sobre la traducción. El análisis bioinformático ha demostrado que los cuádruplex G suelen estar muy conservados y presentes en aproximadamente 3000 ARNm humanos [14] . Ejemplos de estos ARNm humanos son los ARNm del receptor de estrógeno [15] , la metaloproteinasa extracelular [16] , el protooncogén NRAS [14] . Además de las 5'-UTR, se han encontrado G-quadruplex en promotores , telómeros y 3'-UTR. Hay especialmente muchos cuádruplex G en el ARNm de proteínas implicadas en la regulación de la traducción y la ontogénesis. El efecto supresor de los G-quadruplex sobre la traducción del ARNm en el que se encuentran puede deberse tanto a su propia estructura secundaria como a su interacción con proteínas y otros factores [17] .
El modelo de escaneo de iniciación de la traducción asume que la subunidad pequeña del ribosoma se mueve a lo largo del ARNm ("escanea") en la dirección del extremo 5' al 3' en busca de un codón de inicio AUG adecuado y comienza la traducción a partir de él. Al mismo tiempo, también se creía que la presencia de elementos estables de la estructura secundaria (por ejemplo, horquillas ) en la 5'-UTR tiene un efecto supresor de la traducción, ya que el ribosoma es incapaz de atravesarlos. Sin embargo, estudios recientes han demostrado que esto no siempre es así. La traducción de mRNA con un 5'-UTR largo y altamente estructurado puede proceder tan bien como el mRNA con un 5'-UTR corto y no estructurado. Esto se explica por el hecho de que el efecto inhibidor de la propia estructura secundaria a menudo no se expresa, ya que está determinado principalmente por las proteínas que interactúan con ella. El punto de vista erróneo que prevalecía anteriormente descrito anteriormente apareció debido al hecho de que los investigadores anteriores utilizaron el sistema de lisado de reticulocitos de conejo (RRL ), y este sistema tenía una serie de deficiencias y no se correspondía con las condiciones in vivo [18] .
Existen varios mecanismos para la formación de 5′-UTR alternativos con la misma secuencia de codificación:
La presencia de diferentes 5'-UTR en el ARNm del mismo gen brinda oportunidades adicionales para regular su expresión, ya que incluso pequeñas diferencias en la estructura secundaria de la 5'-UTR pueden afectar radicalmente la regulación de la traducción. Un análisis de transcriptomas de mamíferos ha demostrado que la expresión de 5'-UTR alternativos es un fenómeno común y, potencialmente, la mayoría de los genes pueden utilizar este mecanismo regulador. Los productos proteicos de los genes que utilizan constantemente 5'-UTR alternativos suelen participar en procesos como la transcripción y las vías de señalización . Por ejemplo, el gen del receptor de estrógeno β (ERβ) tiene 3 ARNm con 5'-UTR alternativos que dan lugar a isoformas de la misma proteína, y a menudo se observan fallas en su actividad en los cánceres [19] .
Los elementos funcionales importantes implicados en el inicio de la traducción y el control de la expresión génica se localizan dentro de la 5'-UTR. Esto se evidencia, en primer lugar, por el hecho de que la tasa de traducción no depende de la longitud y la estructura de la 5′-UTR en los ARNm con o sin caperuza, y también por el hecho de que algunos genes pueden expresarse en condiciones de estrés [20] . Los más importantes de estos elementos funcionales incluyen sitios de entrada de ribosomas internos ( IRES ), marcos de lectura abiertos internos uORF , elemento dependiente de hierro ( IRE ), etc.
El sitio interno de entrada al ribosoma ( IRES ) es un motivo de ARNm regulador que realiza un mecanismo de iniciación de la traducción independiente de la caperuza, en el que la entrada al ribosoma se produce dentro de la 5'-UTR, pero cerca del sitio de inicio de la traducción. El mecanismo IRES es utilizado por ARNm con o sin caperuza en condiciones en las que el inicio de la traducción dependiente de la caperuza se suprime debido al estrés , en una determinada etapa del ciclo celular y durante la apoptosis , lo que proporciona expresión a largo plazo de las proteínas necesarias. Varios genes que utilizan IRES , como los genes c-Myc , APAF1 , Bcl-2 , se expresan de forma deficiente en condiciones normales y son activados por IRES en condiciones de estrés. Se supone que IRES también puede participar en el mantenimiento de un nivel bajo de expresión de varias proteínas en condiciones normales, tomando el control de los ribosomas y evitando que comiencen la traducción desde el sitio principal de iniciación. El mecanismo de iniciación de la traducción interna aún no se comprende bien, aunque se sabe que la eficiencia de IRES está influenciada en gran medida por factores proteicos reguladores trans' , lo que hace posible el uso específico de células de IRES en la traducción [20] .
La estructura de los IRES eucarióticos es muy variable, y hasta el momento no se han establecido motivos conservados característicos de ellos . Para algunos genes, IRES requiere elementos estables específicos de la estructura secundaria del ARNm; en otros genes, por el contrario, tienen un efecto supresor de la traducción. Se ha sugerido que los IRES no son estructuras estáticas y están sujetas a movimiento, cambiando significativamente su actividad. Los elementos IRES también pueden dar lugar a diferentes isoformas de proteínas , lo que brinda oportunidades adicionales para obtener diferentes productos proteicos a partir del mismo gen [21] .
Los marcos de lectura abiertos cortos ( ing. upstream open reading frames, uORF ) están ubicados en la 5′-UTR y se caracterizan por el hecho de que su codón de parada dentro del marco está ubicado después del codón de inicio interno ( ing. upstream AUG, uAUG ), pero antes del codón de inicio principal que ya está en la región traducida (codificación). Los uORF se encuentran en aproximadamente el 50 % de los ARNm de 5′-UTR humanos y su presencia provoca una disminución en la expresión génica, lo que reduce la cantidad de ARNm funcional en un 30 % y la formación de proteínas en un 30-80 %. Los ribosomas que se unen a uAUG comienzan la traducción de uORF, lo que puede afectar negativamente la eficiencia de traducción del marco de lectura principal (es decir, la región de codificación). Si no hay unión efectiva del ribosoma al codón de inicio en la región codificante (es decir, inicio de la traducción), el resultado es una disminución en la formación de proteínas y, por lo tanto, el nivel de expresión del gen correspondiente. También puede ocurrir la situación inversa: la traducción de uORF continuará en la traducción de la región codificante y, como resultado, se formará una proteína demasiado larga que puede ser dañina para el cuerpo. La reducción en la eficiencia de la traducción debido a la presencia de uORF en la 5'-UTR es un efecto bien estudiado; un ejemplo que lo ilustra es el gen de la poli(A)-polimerasa α ( ing. poli(A)-polimerasa α, PAPOLA ), cuyo ARNm contiene dos uORF altamente conservados en la 5'-UTR. La mutación del uAUG proximal provoca un aumento en la eficiencia de traducción de este ARNm, lo que sugiere que uORF reduce significativamente la expresión de este gen . Otro ejemplo es el receptor de la hormona tiroidea, que tiene un efecto activador o represivo sobre la transcripción de una serie de genes diana; una fuerte represión de su traducción se lleva a cabo mediante un uORF de 15 nucleótidos de largo dentro de la 5'-UTR de su ARNm [22] .
Se cree ampliamente que los uORF reducen la eficiencia de la traducción , porque después de la terminación de la traducción de los uORF, el ribosoma no puede comenzar la traducción nuevamente y traducir la secuencia de codificación ( CDS ) . Sin embargo, estudios recientes de más de 500 loci de genes 5'-UTR han demostrado que no existe una relación definitiva entre el efecto de uORF en la expresión génica corriente abajo y la distancia entre uORF y la secuencia codificante. Al mismo tiempo, los autores del estudio sugieren que en los genes que contienen un solo uORF, lo más probable es que la traducción de CDS ocurra después de escanear el uORF por el ribosoma sin su disociación, y no mediante el reinicio de la traducción. Esta suposición es muy diferente de las conclusiones de Kozak (1987) y, en general, de todas las ideas sobre uORF. Además, los experimentos con células que carecen de Rent1 (un factor involucrado en la destrucción dirigida de ARNm defectuosos , descomposición mediada por tonterías, NMD ) mostraron que, en ausencia de NMD, las transcripciones que contienen uORF se tradujeron con éxito. Esto muestra que NMD también juega un papel importante en la regulación del funcionamiento de estas transcripciones. Lo más probable es que haya varias opciones para el desarrollo de eventos después de la interacción del uORF y el ribosoma: la continuación de la traducción, la continuación del escaneo o el reinicio de la traducción de la región de codificación, y cuál de ellos ocurrirá depende de una serie de factores [22] .
Se ha establecido que, además de AUG, los codones que difieren de AUG en un nucleótido también pueden usarse como sitio de inicio de la traducción, y la eficiencia de iniciación en cada caso estará determinada por el entorno del codón de inicio no estándar [23]. .
Aunque la mayoría de los uORF afectan negativamente a la expresión génica, hay casos en los que la presencia de uORF mejora la traducción. Un ejemplo es el ARNm bicistrónico vpu-env del virus VIH -1 , que contiene un uORF muy pequeño conservado. Este uORF está ubicado solo 5 nucleótidos antes de AUG vpu y pronto termina con un codón de parada que se superpone con AUG vpu. Se ha encontrado que este uORF tiene un efecto beneficioso significativo en la traducción de env sin interferir con la traducción de vpu. Se obtuvieron mutantes en los que la distancia entre uORF y el AUG principal se incrementó en 5 nucleótidos, y se demostró que uORF no está implicado en la iniciación de vpu. Con base en esto, los autores del estudio sugirieron que este pequeño uORF puede servir como un sitio de retardo del ribosoma, durante el cual el ribosoma interactúa con estructuras de ARN que facilitan su promoción, es decir, supera físicamente parte de la 5'-UTR para alcanzar el principal codón de iniciación [24 ] .
Además de los anteriores, también se conocen los siguientes mecanismos de acción de uORF:
La importancia de los uORF como elementos reguladores involucrados en la regulación de la unión y traducción de ribosomas está bien estudiada, sin embargo, la función e incluso el destino de los péptidos codificados por uORF a menudo se desconoce, posiblemente debido a las dificultades para analizar el nivel de expresión y localización de péptidos [26] .
El ARNm de 5′-UTR de las proteínas asociadas con el metabolismo del hierro a menudo contiene un elemento regulador específico, el elemento dependiente del hierro . Está presente en el ARNm de 5′-UTR de proteínas tales como ferritina , receptor de transferrina , aminolevulinato sintasa eritroide , aconitasa mitocondrial , ferroportina , transportador de metal divalente ( inglés divalent metal transportador 1 ( DMT1) ) [27] (sin embargo, también se encuentra en ARNm de proteínas no asociadas al metabolismo del hierro, por ejemplo, en ARNm del producto proteico del gen CDC42BPA, una quinasa involucrada en la reorganización del citoesqueleto [28] ) . IRE es una horquilla que interactúa con proteínas reguladoras específicas - IRP1 e IRP2 ( proteínas reguladoras de hierro ) . Cuando la concentración de hierro es baja, IRP1 e IRP2 se unen a IRE, creando barreras para el ribosoma e imposibilitando la traducción del ARNm diana [29] . A altas concentraciones de hierro, no existe una unión rígida entre estas proteínas y la horquilla, y tiene lugar la traducción de las proteínas involucradas en el metabolismo del hierro. Además, se encontró que la traducción de la proteína precursora beta-amiloide también está controlada por IRE, y su IRE también es capaz de unirse a IRP1 e IRP2, por lo que es posible que IRE pueda desempeñar un papel en el desarrollo de la enfermedad de Alzheimer. enfermedad [30] .
Al comienzo de la traducción en eucariotas, el complejo proteico eIF4F se ensambla en el extremo 5' del transcrito en la región cap y sus dos subunidades, eIF4E y eIF4G , se unen a la región 5'-UTR, lo que limita la tasa con la que puede ocurrir el inicio de la traducción [31] . Sin embargo, el papel de 5'-UTR en la formación del complejo preiniciador no se limita a esto. En algunos casos, las proteínas se unen a la 5'-UTR y evitan el ensamblaje del complejo iniciador. Como ejemplo, podemos considerar la regulación del gen msl-2 ( inglés male-specific lethal 2 - male specific lethal 2), que está implicado en la determinación del sexo en Drosophila . El producto proteico del gen SXL ( letal sexual ) se une al intrón localizado en la 5'-UTR del transcrito primario msl-2 , por lo que este intrón no se elimina durante el corte y empalme [29] . Promueve la unión simultánea a las proteínas 5′-UTR y 3′-UTR que no permiten el ensamblaje del complejo de iniciación. Sin embargo, SXL puede suprimir la traducción de ARNm que carecen de una cola poli(A) o incluso de 3′-UTR [32] . El ARNm de la ornitina descarboxilasa , que interviene en el metabolismo de las poliaminas , y el ARNm de c-myc en la 5'-UTR contienen estructuras en horquilla estabilizadas por la proteína represora, que impiden que el ribosoma aterrice en ellos y el montaje del complejo iniciador. Las variaciones en el número de proteínas represoras provocan diferentes grados de estabilización de estas horquillas y, en consecuencia, la disponibilidad de estos 5'-UTR para las proteínas iniciadoras y el ribosoma puede ser diferente [33] .
El 5′-UTR de algunos puede unirse no solo a una proteína represora que evita el ensamblaje del complejo iniciador y la entrada al ribosoma, sino también a proteínas represoras que estabilizan varias barreras estructurales en el camino del complejo ribosómico de exploración. Por ejemplo, la represión traduccional del ARNm de la timidilato sintasa humana se lleva a cabo por su producto de traducción, la timidilato sintasa, de acuerdo con el principio de retroalimentación negativa; la timidilato sintasa interactúa con la horquilla de 30 nucleótidos en la 5'-UTR, estabilizándola e impidiendo el avance del ribosoma [34] .
Se sabe que el ARNm puede cerrarse en un anillo (circularización) debido a la interacción de proteínas especiales que se unen a la cola poli(A) , lo que facilita la unión del factor eIF4F a la tapa . Como resultado, el ARNm adquiere una forma cerrada, se estimula el inicio de la traducción y aumenta la eficiencia de la traducción. Sin embargo, en algunos casos, las 5'-UTR y las 3'-UTR del mismo ARNm pueden unirse entre sí. Por lo tanto, el ARNm del gen p53 humano tiene regiones en 5'-UTR y 3'-UTR que son complementarias entre sí. Al unirse entre sí y al factor de traducción RPL26 , aumentan la eficiencia de la traducción de la proteína p53 en respuesta al daño del ADN [35] .
El análisis del ARNm de varios genes humanos mostró que la 5'-UTR contiene el motivo que interactúa específicamente con los extremos 3' de los miARN, mientras que muchos de estos miARN tienen un sitio complementario a la 3'-UTR en el extremo 5'. . Otros estudios han demostrado que la unión de 5'-UTR y 3'-UTR al mismo microARN facilita la unión del extremo 5' del ARNm al extremo 3', como un puente, y los ARNm, la actividad de que está significativamente determinado por miRNA, tienen sitios de unión predecibles en ambos NTO. Estos ARNm se denominan miBridge. Además, se descubrió que la pérdida de estos sitios de unión reducía la represión de la traducción de la transcripción impulsada por miARN. Por lo tanto, se encontró que los sitios de unión de los NTO entre sí son necesarios para la supresión de la traducción del ARNm. Esto indica que la interacción complementaria de 5'-UTR y 3'-UTR es necesaria para una regulación precisa de la expresión génica [36] .
El ARNm bacteriano también contiene regiones no traducidas en 5' y 3' [38] [39] . La longitud de la 5'-UTR de las bacterias es mucho más corta que la de los eucariotas y suele ser de 3 a 10 nucleótidos. Por ejemplo, la longitud de la transcripción 5'-UTR del operón de lactosa de Escherichia coli es de sólo 7 nucleótidos [40] . En la 5'-UTR de bacterias se localiza la secuencia Shine-Dalgarno ( AGGAGG) [41] , que sirve para unirse al ribosoma y está separada por un espaciador del codón de inicio AUG. Aunque los 5′-UTR de bacterias y eucariotas son diferentes, se demostró que la adición de nucleótidos CC al espaciador de ARNm del gen Ner del bacteriófago Mu , que se expresa bien en células de Escherichia coli y Streptomyces , condujo a la expresión exitosa de este gen en células de reticulocitos de conejo [42] .
Los elementos de la estructura secundaria localizados en la 5′-UTR, por regla general, tienen un efecto supresor sobre la traducción [43] . En particular, es en el 5'-UTR donde generalmente se ubican los atenuadores , elementos de los operones que causan la terminación prematura de la traducción [44] (el ejemplo más famoso de atenuación es el trabajo del operón triptófano ).
Además, la mayoría de los riboswitches [45] se encuentran en la 5'-UTR de las bacterias, es decir, elementos reguladores del ARNm capaces de unirse a moléculas pequeñas , lo que conduce a un cambio en la formación de la proteína codificada por este ARNm [46 ] .
También existen regiones no traducidas en el ARNm de muchas arqueas . En particular, el elemento SECIS responsable de la inserción del aminoácido selenocisteína en la cadena polipeptídica se localiza en las UTR 5' y 3' del ARNm de la arquea metanogénica Methanococcus jannaschii (como en otros miembros de los órdenes Methanopyrales y Methanococcales ) [47] .
Se ha establecido que los ARNm de la mayoría de las haloarchaea , así como los de Pyrobaculum y Sulfolobus , carecen de una 5'-UTR pronunciada, pero los ARNm de las metanógenas de arqueas tienen una 5'-UTR larga. En este sentido, se supone que el mecanismo de iniciación de la traducción en las arqueas metanogénicas puede ser diferente al de otros representantes de este dominio [43] [48] .
El 5'-UTR de las arqueas contiene el TPP-riboswitch , que se une al pirofosfato de tiamina (TPP) (tales riboswitches también se encuentran en bacterias y eucariotas) [49] .
En muchos virus , el inicio de la traducción se produce mediante un mecanismo independiente de caperuza y se lleva a cabo a través de los elementos IRES ya mencionados, localizados en la 5'-UTR [50] . Por ejemplo, esto sucede en el VIH , los virus de la hepatitis A y C [51] . Este mecanismo de iniciación de la traducción es conveniente porque en su caso no hay necesidad de escanear un fragmento 5'-UTR largo [40] .
Las mutaciones que afectan a la 5′-UTR suelen dar lugar a la aparición de diversas enfermedades, ya que interrumpen el funcionamiento del fino sistema de regulación de determinados genes. El siguiente esquema resume información sobre mutaciones que afectan a varios elementos reguladores de la 5'-UTR y las enfermedades que se desarrollan en este caso [1] (cabe aclarar que el síndrome de hiperferritinemia/catarata hereditaria se desarrolla con una mutación en la IRE [1 ] [52] ).
diccionarios y enciclopedias |
---|