La región 3' no traducida (3'-UTR , inglés 3'-untranslated region, 3'-UTR ) es una región no codificante de ARNm ubicada en su extremo 3' después de la región codificante . La región de ADN correspondiente a la 3'-UTR de la transcripción tiene el mismo nombre [1] . La 3′-UTR puede estar involucrada en la regulación de la eficiencia de la traducción y la estabilidad del ARNm, contener señales de poliadenilación [2] y sitios de unión de microARN , y también realizar otras funciones reguladoras.
La longitud de la 3'-UTR puede ser de 60 a 4000 nucleótidos . La longitud media de la 3'-UTR en humanos es de unos 800 nucleótidos, mientras que la longitud media de la 5'-UTR es de 200 nucleótidos [3] . Es de destacar que la longitud total de la 3′-UTR en humanos es más del doble que en otros mamíferos , lo que indica una mayor cantidad de elementos reguladores en humanos que en otros mamíferos [4] . La composición de las bases también difiere en las UTR 3' y 5'. Así, el contenido de G + C es mayor en la 5'-UTR que en la 3'-UTR. Esta diferencia es especialmente apreciable en el ARNm de vertebrados de sangre caliente , en los que el contenido de G+C en la 5'-UTR es del 60% y en la 3'-UTR del 45% [5] [6] .
La longitud y la estructura secundaria de la 3'-UTR están determinadas en gran medida por su participación en las interacciones entre el extremo 5' de la transcripción y el extremo 3' (ver más abajo) y, a menudo, las 3'-UTR largas tienen un efecto significativo. Efecto sobre la expresión génica . En 1996, se demostró que el aumento de la 3'-UTR del ARNm de 19 a 156 nucleótidos reducía la expresión en un factor de 45, independientemente de la orientación, el gen o la secuencia de los nucleótidos insertados. Esto indica que la longitud de la 3'-UTR es importante en la expresión del ARNm. Otro factor que determina la importancia de la longitud de la 3'-UTR, además de la interacción de las 3'- y 5'-UTR, es la capacidad de la 3'-UTR para interactuar con los miARN , moléculas de ARN reguladoras especiales que suprimen la traducción ( ver más abajo para más detalles). Estas interacciones tienen lugar en sitios especiales, que son más abundantes en las 3'-UTR largas, por lo que una 3'-UTR larga puede tener un efecto inhibidor más fuerte sobre la traducción. Así, se hizo una comparación de la longitud de la 3′-UTR y el número de sitios de unión a microARN en genes de proteínas ribosómicas y genes implicados en la neurogénesis . Resultó que los genes 3′-UTR ribosómicos son más cortos y tienen menos sitios específicos de unión a microARN, mientras que en los genes implicados en la neurogénesis, por el contrario, la 3′-UTR es más larga y contiene muchos sitios específicos de unión a microARN. Consideremos otro ejemplo. El gen Hip2 utiliza 3′-UTR alternativos para un control flexible de la expresión (consulte a continuación para obtener más información sobre este fenómeno). La 3′-UTR más larga posible de este gen contiene sitios de unión conservados para dos miARN expresados en células T activadas . Tras la activación, la expresión relativa del transcrito con un 3'-UTR más largo disminuyó y la expresión de la proteína total aumentó, ya que se expresaron ARNm con 3'-UTR más cortos, que no contenían sitios de unión para los miARN inhibitorios. También se ha demostrado que la longitud de la 3′-UTR depende de la presencia de elementos reguladores tales como elementos ricos en AU ( ARE ) en ella (para obtener más detalles, consulte a continuación) [4] .
En general, las 3'-UTR largas se asocian con un nivel de expresión relativamente bajo, como se muestra en experimentos que compararon la expresión de isoformas de una sola proteína cuyos ARNm diferían solo en la longitud de la 3'-UTR. El gen SLC7A1 se expresa en dos mRNA con diferentes 3'-UTR, el más largo contiene un sitio de unión a microRNA adicional. El polimorfismo funcional en este gen se asocia con la aparición de disfunción endotelial y una predisposición hereditaria a la hipertensión . Curiosamente, el alelo responsable de la manifestación de estos trastornos suele tener una 3'-UTR más larga y, por tanto, su nivel de expresión es menor que el del alelo salvaje , que tiene una 3'-UTR más corta [4] .
A diferencia de las 5'-UTR, las 3'-UTR contienen relativamente pocos intrones (alrededor del 5%). Algunos genes de mamíferos resultantes de la transcripción inversa de un transcrito empalmado tienen intrones en el 3′-UTR que reducen la expresión de estos genes, dirigiendo sus transcritos a la vía NMD (es decir, interrupción). Este efecto negativo de los intrones en la 3′-UTR sobre la expresión génica puede explicar su baja distribución en esta región. Además, se ha encontrado que algunos transcritos pueden unirse a miARN solo en presencia de un intrón en la 3′-UTR, que también suprime la expresión génica. Esto muestra que la escisión diferente de los intrones en el 3′-UTR permite la regulación mediada por microARN específica de la isoforma, que se puede realizar de manera específica del tejido [7] .
Aparentemente, la estructura secundaria de la 3'-UTR tiene una importancia mucho mayor de lo que se pensaba anteriormente. No solo es importante la longitud de la 3'-UTR, sino también su estructura secundaria, y las mutaciones que la modifican pueden interrumpir la expresión génica. En 2006 se realizó un estudio sobre 83 variantes de 3′-UTR asociadas a diversas enfermedades y se estableció una relación entre la funcionalidad de estas variantes y los cambios en la estructura secundaria predicha [8] .
La estructura secundaria de la 3′-UTR es difícil de predecir, ya que muchos factores proteicos que se unen a ella pueden afectar significativamente su estructura espacial. Estos factores pueden cambiarlo debido a la destrucción del pliegue del ARNm, o pueden interactuar con otros factores, por lo que el ARNm puede cerrarse en un bucle. El ejemplo más común de elementos de estructura secundaria que pueden afectar la expresión es la horquilla , y las proteínas de unión a ARN se unen a las horquillas en la 3'-UTR. La transcripción del factor neurotrófico derivado del cerebro (BDNF ) contiene una horquilla larga responsable de la estabilidad del ARNm en las neuronas en respuesta a las señales de calcio . Se supone que la horquilla es una plataforma conveniente para la interacción de varias proteínas de unión a ARN, ARN no codificantes y señales de poliadenilación en respuesta a Ca 2+ . La 3′-UTR de la transcripción de TNFα contiene el elemento ARE , que forma una horquilla que puede modular la afinidad de esta región por varias proteínas (para más detalles, ver más abajo). Estos ejemplos muestran que la modulación de la estructura secundaria de la 3'-UTR por proteínas u otros medios puede cambiar su especificidad de unión a varios factores trans '', regulando así la expresión génica a nivel postranscripcional [9] .
La poliadenilación alternativa ( APA ) y el empalme alternativo son dos mecanismos que conducen a la aparición de diferentes isoformas de ARNm que difieren en sus 3′-UTR . APA puede ocurrir debido a la presencia de diferentes sitios de poliadenilación y diferentes exones terminales ; Se estima que los APA utilizan ~50% de los genes humanos. Este mecanismo es muy conveniente para organismos complejos, ya que permite que las transcripciones expresen la misma proteína, pero a diferentes niveles y en diferentes ubicaciones espaciales debido a las diferencias en la regulación mediada por 3′-UTR. Las 3′-UTR alternativas son extremadamente importantes para la expresión génica específica de tejido, así como para la expresión variable en diferentes etapas de desarrollo . Los cambios significativos en los productos ARA son característicos de varios tipos de cáncer . ARA también juega un papel importante en la localización de isoformas de proteínas. El producto proteico del gen HuR es una proteína de unión a ARE implicada en la estabilización de muchos ARNm que contienen ARE. Debido a ARA, se forman una serie de variantes de la proteína HuR, que difieren en el nivel de expresión, y aunque la gran mayoría de los transcritos de esta proteína carecen de ARE, algunos todavía tienen ARE funcionales en la 3′-UTR. Estos ARE pueden unirse a HuR, proporcionando así una regulación de retroalimentación positiva. Por lo tanto, el uso de 3'-UTR alternativos permite una diversidad aún mayor de productos proteicos de un solo gen [10] .
Los microARN son moléculas cortas de ARN no codificante monocatenario de origen endógeno, de unos 20 nucleótidos de longitud. Interactúan con los ARNm diana según el principio de complementariedad y normalmente bloquean la traducción de la diana o provocan su destrucción. Por regla general, los sitios de unión de microARN-ARNm se ubican en la 3′-UTR de este último, aunque algunos de ellos se ubican en la 5′-UTR e incluso en la región codificante. Los microARN a menudo se expresan de manera diferente según el tipo de tejido y la etapa de desarrollo, y los genes involucrados en procesos comunes a todos los genes tienen que evitar selectivamente secuencias en transcripciones que son parcialmente complementarias a los microARN, es decir, evitar la presencia de sitios de unión de microARN. Este proceso de evitación selectiva tiene un gran impacto en la evolución de la 3′-UTR [11] .
Cambiar la estabilidad de la transcripción permite un control rápido de la expresión sin cambiar la velocidad de traducción. Tal mecanismo es importante en procesos tan vitales como el crecimiento y la diferenciación celular , así como la adaptación a las condiciones ambientales. Los elementos reguladores mejor estudiados que regulan la estabilidad del ARNm son los elementos ricos en AU ( ARE ) ubicados en la 3′-UTR del ARNm de algunos genes . Estos elementos varían en tamaño de 50 a 150 nucleótidos y normalmente contienen múltiples copias del pentanucleótido AUUUA [12] .
Se encontró que las secuencias de ARE difieren y se distinguen 3 clases de ARE por el número y la disposición de los motivos AUUUA:
Los ARE se unen a proteínas ( proteínas de unión a ARE , ARE-BP ), que, por regla general, contribuyen a la destrucción del ARNm en respuesta a diversas señales intra y extracelulares, aunque algunas de ellas regulan la traducción . Los ARE regulan la expresión de genes que codifican citoquinas , factores de crecimiento , genes supresores de tumores , protooncogenes y genes cuyos productos proteicos están involucrados en la regulación del ciclo celular , como genes para ciclinas , enzimas , factores de transcripción , receptores y proteínas de membrana . Esta diversidad de genes cuyas transcripciones contienen ARE indica la importancia de la estabilidad de la transcripción en la regulación génica [12] . Además de cambiar la estabilidad del ARNm, los ARE también pueden activar la traducción, aunque este mecanismo es menos común y menos conocido [13] .
Otro elemento que regula la estabilidad de la transcripción es el elemento rico en GU (GRE) recientemente descubierto . Interactúa con CUGBP1 , una proteína de unión a ARN que promueve la descomposición de su ARNm asociado [13] .
La poliadenilación es el proceso de agregar una serie de adenosinas (es decir, una cola de poli(A)) al extremo 3' de un transcrito de ARN inmaduro [13] . Se ha establecido que la 3′-UTR contiene elementos que regulan este proceso. Por lo tanto, se ha demostrado que todos los ARNm de poliadenilación a una distancia de 20 a 30 nucleótidos del extremo 3' del transcrito, al que se une la cola poli(A), contienen la secuencia AAUAAA, una señal de poliadenilación (señales de poliadenilación). también pueden ser secuencias cercanas, como AU /GUAAAA o UAUAAA). Posteriormente, resultó que, aunque la secuencia AAUAAA es absolutamente necesaria para la poliadenilación, existen otros elementos sin los cuales la unión normal de la cola poli(A) es imposible. En particular, se identificó una secuencia rica en GU inmediatamente después de AAUAAA hacia el extremo 3' (también se denomina elemento de secuencia descendente en inglés , DSE ), así como una secuencia especial ubicada inmediatamente antes de AAUAAA ( elemento de secuencia ascendente en inglés , USE ) . Estos elementos se conservan en gran medida no sólo para los mamíferos , sino para todos los eucariotas . Para la poliadenilación, los nucleótidos ubicados en el sitio del corte en el extremo 3' del transcrito también son importantes (la cola poli(A) se unirá a este sitio después de la ruptura). Por lo tanto, la 3'-UTR juega un papel crucial en el proceso de poliadenilación [14] .
La 3′-UTR juega un papel esencial en el proceso de enmascaramiento del ARNm . El enmascaramiento del ARNm ocurre, por ejemplo, durante la ovogénesis y la espermatogénesis , cuando el ARNm sintetizado durante estos procesos no se traduce en proteína, sino que se almacena en estado inactivo, a veces durante bastante tiempo. Durante la fertilización y durante la embriogénesis temprana , se desenmascaran los ARNm maternos y se sintetizan las proteínas necesarias a partir de ellos. El enmascaramiento y el almacenamiento de ARNm también se produce en la diferenciación de células somáticas de un organismo adulto durante mucho tiempo [15] .
El fenómeno del enmascaramiento del ARNm se estudió por primera vez en el molusco bivalvo Spisula solidissima en 1990. Resultó que una gran cantidad de ARNm enmascarado que codifica la subunidad pequeña de la ribonucleótido reductasa y la ciclina A se almacena en sus ovocitos . Se ha demostrado que cuando el ARNm está en un estado enmascarado, un complejo de proteínas enmascaradoras se asocia con el sitio en su 3'-UTR. También resultó que los ARNm enmascarados tienen una cola de poli(A) muy acortada, de 200 a 250 residuos de adenilo a 20 a 40. Cuando se desenmascara el ARNm, se fosforilan las proteínas de enmascaramiento , como resultado de lo cual se libera la cubierta de la proteína bloqueadora y se estimula la poliadenilación del ARNm por la poli(A) polimerasa citoplasmática , restaurando la larga cola poli(A) necesaria para traducción eficiente [16] .
La 3′-UTR a veces está involucrada en el proceso de incorporación de un aminoácido raro pero funcionalmente importante , la selenocisteína , en la cadena polipeptídica . No hay un codón especial para la selenocisteína, y el ARNt de Sec se une al codón de terminación UGA, pero solo cuando va seguido de una secuencia de inserción de selenocisteína especial, SECIS , que forma un elemento característico de la estructura secundaria. SECIS se puede ubicar a una distancia considerable (hasta 200 nucleótidos) de UGA, y en arqueas y eucariotas se localiza en el 3′-UTR del ARNm [17] [18] .
NMD ( desintegración mediada por tonterías ) es un mecanismo eficaz para la destrucción de transcritos mutantes no funcionales . Por lo general, la eficiencia en este mecanismo está determinada por la ubicación de la mutación en relación con la unión del exón, sin embargo, la 3'-UTR también puede desempeñar algún papel. El mecanismo de terminación de la traducción en los codones de terminación prematuros depende de la distancia entre el codón terminador y la proteína de unión a poli(A) PABPC1 . Se ha demostrado que un aumento en la distancia entre el codón de terminación y la cola poli(A) desencadena NMD, y los cambios en la estructura espacial de la 3'UTR pueden modular NMD [8] .
Se sabe que el ARNm puede cerrarse en un anillo (circularización) debido a la interacción de proteínas especiales que se unen a la cola poli(A) , lo que facilita la unión del factor eIF4F a la tapa . Como resultado, el ARNm adquiere una forma cerrada, se estimula el inicio de la traducción y aumenta la eficiencia de la traducción. Sin embargo, en algunos casos, la 5'-UTR y la 3'-UTR del mismo ARNm pueden unirse entre sí. Por ejemplo, el ARNm del gen p53 humano tiene regiones en 5′-UTR y 3′-UTR que son complementarias entre sí. Al unirse entre sí y al factor de traducción RPL26 , aumentan la eficiencia de la traducción de la proteína p53 en respuesta al daño del ADN [8] .
El análisis de ARNm de varios genes humanos mostró que la 5'-UTR contiene el motivo que interactúa específicamente con los extremos 3' de los microARN, mientras que muchos de estos ARNm tienen un sitio complementario a la 3'-UTR en el extremo 5'. . Otros estudios han demostrado que la unión del 5'-UTR al miRNA facilita la unión del extremo 5' del mRNA al extremo 3', y los mRNA cuya actividad está fuertemente determinada por el miRNA tienen sitios de unión predecibles en ambos UTR. Estos ARNm se denominan miBridge. Además, se descubrió que la pérdida de estos sitios de unión reducía la represión de la traducción de la transcripción impulsada por miARN. Por lo tanto, se encontró que los sitios de unión de UTR entre sí son necesarios para suprimir la traducción de ARNm. Esto indica que la interacción complementaria de 5'-UTR y 3'-UTR es necesaria para una regulación precisa de la expresión génica [9] .
El ARNm bacteriano también contiene regiones no traducidas en 5' y 3' [19] [20] .
A diferencia de los eucariotas, las 3′-UTR largas son raras en bacterias y poco conocidas. Sin embargo, se sabe que algunas bacterias, en particular Salmonella enterica , tienen ARNm con 3'-UTR largas de tipo eucariota (en S. enterica , este es el ARNm de hilD ). Se supone que los 3'-UTR de hilD realizan varias funciones, en particular, afectan el recambio de sus ARNm, ya que la deleción de estas regiones provocó un aumento en la cantidad de los ARNm correspondientes [21] .
También existen regiones no traducidas en el ARNm de muchas arqueas . En particular, en el ARNm 5'- y 3'-UTR de la arquea metanogénica Methanococcus jannaschii (como en otros representantes de los órdenes Methanopyrales y Methanococcales ), se localiza el elemento SECIS , que es responsable de la inserción del aminoácido selenocisteína en la cadena polipeptídica [22] .
Se ha establecido que el ARNm de la mayoría de las haloarchaea , así como las de Pyrobaculum y Sulfolobus , carecen de un 5'-UTR pronunciado, pero el ARNm de los metanógenos de arqueas tiene 5'-UTR largos. En este sentido, se supone que el mecanismo de iniciación de la traducción en arqueas metanogénicas puede ser diferente al de otros representantes de este dominio [23] . Sin embargo, el ARNm de las haloarqueas contiene 3'-UTR y sus extremos 3' no sufren modificaciones postranscripcionales. Sorprendentemente, las transcripciones de haloarchaeal que tienen un 5'-UTR carecen de la secuencia Shine-Dalgarno. La longitud de la 3'-UTR de haloarchaea osciló entre 20 y 80 nucleótidos; no se han identificado secuencias ni motivos estructurales conservados, excepto el nucleótido penta-U en la región de terminación de la traducción [24] .
En muchos virus , el inicio de la traducción se produce mediante un mecanismo independiente de caperuza y se produce a través de elementos IRES situados en la 5′-UTR [25] . Sin embargo, se ha encontrado otro mecanismo de iniciación de la traducción independiente de caperuza en virus que no está asociado con IRES. Este mecanismo está presente en muchos virus de plantas . En este caso, hay un elemento especial de traducción independiente de mayúsculas (CITE) ubicado en la 3′-UTR. A menudo, CITE se une a factores de traducción, por ejemplo, el complejo eIF4F, y luego interactúa de manera complementaria con el extremo 5', entregando factores de iniciación de la traducción al sitio de su inicio [26] .
En los virus cuyo genoma está representado por una molécula de ARN monocatenario de polaridad positiva , la 3′-UTR no solo afecta la traducción, sino que también interviene en la replicación : es a partir de ella que comienza la replicación del genoma viral [27]. ] .
El virus del sarampión (género Morbillivirus de la familia Paramyxoviridae ) tiene un genoma representado por una molécula de ARN monocatenario de polaridad negativa. Se ha establecido un mecanismo interesante para sus genes M y F. Los ARNm de estos genes tienen UTR largos; representan ~6.4% del ARNm total. Aunque estos genes no están directamente involucrados en la replicación , el ARNm 3′-UTR del gen M aumenta la expresión de la proteína M y, por lo tanto, desencadena la replicación del genoma. Al mismo tiempo, la 5'-UTR del ARNm del gen F reduce la formación de la proteína F y, por lo tanto, suprime la replicación [28] .
Al estudiar la estructura y función de la 3′-UTR, los científicos utilizan varios métodos diferentes. Incluso si se demuestra que una 3′-UTR dada está presente en un determinado tejido, para obtener una imagen completa de sus funciones, es necesario analizar los efectos de su diferente localización, determinar la duración del funcionamiento, describir las interacciones con trans- proteínas reguladoras , y el efecto sobre la eficiencia de la traducción [29] . Usando métodos bioinformáticos , basados en el análisis de la estructura primaria (es decir, la secuencia de nucleótidos), se pueden buscar elementos ARE y sitios de unión de microARN en un 3'-UTR dado. Los métodos experimentales establecen secuencias que interactúan con ciertas proteínas transreguladoras y, actualmente, con base en datos de secuenciación y datos experimentales, es posible encontrar sitios de interacción con ciertas proteínas en una transcripción dada [30] . Mediante la inducción artificial de mutaciones en la 3′-UTR, como las que afectan al codón terminador, la señal de poliadenilación o la estructura secundaria de la 3′-UTR, es posible establecer cómo mutaciones en estas regiones pueden conducir a trastornos de la traducción y la aparición de enfermedades (más sobre enfermedades asociadas con 3′-UTR, ver más abajo) [31] . Entonces, con la ayuda de todos estos métodos, podemos desarrollar nuestra comprensión de la estructura y las funciones de los elementos reguladores en cis en la 3′-UTR, así como las proteínas que interactúan con la 3′-UTR.
Las mutaciones que afectan a la 3′-UTR son importantes porque una de esas mutaciones puede afectar la expresión de muchos genes. Aunque a nivel transcripcional, las mutaciones afectan al alelo específico y a los genes ligados físicamente, ya que las proteínas de unión a 3′-UTR también están involucradas en el procesamiento y exportación del ARNm desde el núcleo. Por lo tanto, una mutación puede afectar genes no relacionados [32] . Por ejemplo, las mutaciones en ARE conducen al mal funcionamiento de las proteínas de unión a ARE, lo que da lugar al desarrollo de enfermedades como la degeneración maligna de los órganos hematopoyéticos y la leucemia [33] [34] . Un contenido aumentado del trinucleótido CTG en la 3′-UTR del gen de la proteína quinasa de la miotonina causa distrofia miotónica . La inserción de un retrotransposón de 3 kb que consta de repeticiones en tándem en la 3′-UTR del gen de la proteína fukutina se ha asociado con la distrofia muscular congénita de tipo Fukuyama [29] . Los cambios en los elementos localizados en la 3′-UTR están asociados con el desarrollo de enfermedades humanas tales como leucemia mieloide aguda , alfa talasemia , neuroblastoma , queratinopatía, aniridia , síndrome IPEX , defectos cardíacos congénitos [31] . La asociación de algunas de estas enfermedades con elementos 3′-UTR específicos se muestra en el siguiente diagrama.