Los marcos de lectura abiertos cortos [1] ( marcos de lectura abiertos aguas arriba en inglés , uORF ) son marcos de lectura abiertos ( marco de lectura abierto en inglés , ORF ) ubicados dentro de la región 5' no traducida (5'-UTR) de eucariotas y algunos virales [2 ] ARNm _ Los uORF están involucrados en la regulación de la expresión génica en eucariotas y virus [3] [4] y normalmente suprimen la traducción del marco de lectura principal (es decir, la secuencia de codificación ), aunque su acción puede estar acompañada de varios efectos [ 5] .
En general, el ARNm se divide en una región 5' no traducida (5'-UTR), un marco de lectura abierto (CDS) que comienza en un codón de inicio y termina en un codón de terminación, y una región 3 no traducida (3'- UTR). Los marcos de lectura abiertos cortos (uORF) están en la 5'-UTR antes del marco de lectura principal. Sin embargo, uORF puede superponerse con la secuencia de codificación principal ( es decir , secuencia de codificación, CDS ), luego su codón de parada se ubica después del codón de iniciador CDS [1] .
Los uORF están presentes en aproximadamente el 50 % de la 5'-UTR de los ARNm humanos y al menos en el 35 % de los ARNm de mamíferos [1] , y su presencia provoca una disminución en la expresión génica, lo que reduce la cantidad de ARNm funcional en un 30 % y proteínas . formación en un 30-80%. Los ribosomas que se unen al codón de inicio del marco de lectura abierto corto (uAUG) inician la traducción de uORF, lo que puede afectar negativamente la eficiencia de la traducción del marco de lectura principal (es decir, la región codificante). Si no hay unión efectiva del ribosoma al codón de inicio en la región codificante (es decir, iniciación de la traducción), entonces el nivel de formación de proteínas y, por lo tanto, el nivel de expresión del gen correspondiente, disminuye como resultado. También puede ocurrir la situación inversa: la traducción de uORF continuará en la traducción de la región codificante y, como resultado, se formará una proteína demasiado larga que puede ser dañina para el cuerpo.
La reducción en la eficiencia de la traducción debido a la presencia de uORF en la 5'-UTR es un efecto bien estudiado; un ejemplo que lo ilustra es el gen de la poli(A)-polimerasa α ( poli( A )-polimerasa α, PAPOLA ) , cuyo ARNm contiene dos uORF altamente conservados en la 5'-UTR. La mutación del uAUG proximal provoca un aumento en la eficiencia de traducción de este mRNA, por lo tanto, uORF reduce significativamente la expresión de este gen. Otro ejemplo es el receptor de la hormona tiroidea , que tiene un efecto activador o represivo sobre la transcripción de una serie de genes diana: una fuerte represión de su traducción se lleva a cabo mediante un uORF de 15 nucleótidos dentro de la 5'-UTR de su ARNm [6] .
Se cree ampliamente que los uORF reducen la eficiencia de la traducción, porque después de la terminación de la traducción del uORF , el ribosoma no puede reiniciar la traducción y traducir la región codificante. Se ha demostrado que para el reinicio exitoso de la traducción, la longitud de uORF no debe exceder los 20 codones, pero aún no existe una explicación satisfactoria para este hecho [1] . En algunos casos y bajo ciertas condiciones , el ribosoma de exploración puede ignorar el codón de inicio uORF. Al mismo tiempo, bajo la influencia de algunos factores internos y externos, el efecto inhibidor de uORF puede mejorarse, y el principal de estos factores limitantes es la disponibilidad del complejo de iniciación después de la terminación de la traducción de uORF [7] .
Sin embargo, estudios recientes de más de 500 loci de genes que contienen 5'-UTR han demostrado que no existe una relación definitiva entre el efecto de uORF en la expresión del siguiente gen y la distancia entre uORF y la secuencia codificante. Al mismo tiempo, los autores del estudio sugieren que en los genes que contienen un solo uORF, lo más probable es que la traducción de CDS ocurra después de escanear el uORF por el ribosoma sin su disociación, y no mediante el reinicio de la traducción. Esta suposición es muy diferente de las conclusiones de Kozak (1987) y, en general, de todas las ideas previas sobre uORF (en ese momento, la regla se consideraba correcta en todos los casos, según la cual el ribosoma inicia la traducción desde el primer codón de inicio que encuentra cuando se mueve del ARNm del extremo 5' al extremo 3' [8] ).
Además, los experimentos con células que carecen de Rent1 (un factor involucrado en el proceso de destrucción dirigida de ARNm defectuosos - descomposición mediada por tonterías , NMD ) mostraron que en ausencia de NMD, las transcripciones que contenían uORF se tradujeron con éxito. Esto muestra que NMD también juega un papel importante en la regulación del funcionamiento de estas transcripciones. Lo más probable es que haya varias opciones para el desarrollo de eventos después de la interacción del uORF y el ribosoma: la continuación de la traducción, la continuación del escaneo o el reinicio de la traducción de la región de codificación, y cuál de ellos ocurrirá depende de una serie de factores.
GCN4Así, el ARNm del gen GCN4 de levadura , que codifica un activador de la transcripción, contiene 4 uORFs en la 5'-UTR, y solo uno de ellos permite que el ribosoma comience la traducción de la región codificante. El reinicio efectivo se ve facilitado por dos cis - potenciadores ubicados a ambos lados del uORF. Otros estudios demostraron que la secuencia activadora 5'-cis (potenciador) interactúa con el dominio N-terminal de la subunidad eIF3A /TIF32 del factor de iniciación eIF3, como resultado de lo cual la subunidad ribosómica 40S permanece en el ARNm después de la traducción de uORF1 y continúa escaneando. También se ha encontrado que el reinicio se ve facilitado por el plegamiento específico del ARNm durante la exploración del ribosoma, y este plegamiento permite que el potenciador interactúe con otra secuencia de ARNm. Este es solo un ejemplo de la inactivación del gen uORF, pero ahora está claro que el mecanismo de inactivación es mucho más complejo de lo que sugiere el modelo de escaneo. Se necesita más investigación para dilucidar este mecanismo o mecanismos en detalle [9] .
Proteína quinasa COtro ejemplo que ilustra la complejidad de los mecanismos de bloqueo de genes mediados por uORF es la proteína quinasa C ( PKC ) . PKC es un miembro de la familia de serina/treonina proteína quinasa involucrada en la regulación del crecimiento y la diferenciación celular . Su nueva isoforma , PKCη, es específica de tejido y se expresa principalmente en células que cambian rápidamente, como las células epiteliales . Recientemente, se ha descubierto que esta isoforma desempeña un papel específico en la respuesta al estrés , y su expresión se correlaciona con la resistencia a los medicamentos contra el cáncer en varios tipos de cáncer . La 5'-UTR de la PKCη humana es una secuencia larga (659 nucleótidos), rica en GC y contiene 2 uORF pequeños conservados. Las mutaciones en cada uno de estos uORF provocan un ligero aumento (de 1,5 y 2,2 veces) en la expresión del ORF principal, y las mutaciones en ambos provocan un aumento de tres veces. Aparentemente, el mecanismo de represión de la traducción de PKCη tiene lugar en condiciones normales. En condiciones de estrés (falta de glucosa o hipoxia ), dos uORF también están involucrados en la expresión, ya que proporcionan una exploración débil de la 5'-UTR y aumentan la traducción de la secuencia codificante. La variación en el número de ribosomas unidos a la transcripción y la traducción de cada uORF también puede proporcionar una "sintonización" específica de la célula de la expresión génica [10] .
ornitina descarboxilasaSe encontró que, además de AUG, los codones que difieren de AUG en un nucleótido también pueden usarse como sitio de inicio de la transcripción, y la eficiencia de iniciación en cada caso estará determinada por el entorno del codón de inicio no estándar. Así, la expresión de la ornitina descarboxilasa ( ing. ornitina descarboxilasa, ODC ), que está involucrada en la biosíntesis de poliaminas , es modulada por uORF con el codón de inicio AUU. La eficacia de iniciación en este caso varía en función de la concentración intracelular de poliaminas, mientras que la eficacia de iniciación a AUU se reduce fuertemente en células empobrecidas en poliaminas: es un 18% de la eficacia de traducción del ORF principal, y en células saturadas con poliaminas es del 54%. Por lo tanto, la expresión reducida de ODC se mantiene en presencia de poliaminas. Este ejemplo demuestra que es probable que haya un número mucho mayor de uORF de lo que se pensaba [10] .
ornitina descarboxilasaAunque la mayoría de los uORF afectan negativamente a la expresión génica, a veces la presencia de uORF mejora la traducción. Un ejemplo es el ARNm bicistrónico vpu-env del virus VIH -1 , que contiene un uORF muy pequeño conservado. Este uORF está ubicado solo 5 nucleótidos antes de AUG vpu y pronto termina con un codón de parada que se superpone con AUG vpu . Se ha encontrado que este uORF tiene un efecto beneficioso significativo en la traducción de env sin interferir con la traducción de vpu . Se obtuvieron mutantes en los que la distancia entre uORF y el AUG principal se incrementó en 5 nucleótidos, y se demostró que uORF no está involucrado en la iniciación de vpu . Con base en esto, los autores del estudio sugirieron que este pequeño uORF puede servir como un sitio de retardo del ribosoma, durante el cual el ribosoma interactúa con estructuras de ARN que facilitan su promoción, es decir, supera físicamente la parte 5'-UTR para llegar al codón de iniciación principal [11 ] .
ARNasa HDurante la última década, se ha demostrado que la regulación de la expresión génica por uORF es un proceso complejo. Un buen ejemplo de una regulación tan compleja es el siguiente mecanismo. La RNasa H1 está presente en los núcleos y las mitocondrias de las células de mamíferos y se expresa de manera diferente en diferentes tipos de células. La expresión de isoformas de esta enzima está bajo el control de dos codones de inicio intraframe AUG, así como uORF, localizados en el 5'-UTR. La traducción de la RNasa H1 en las mitocondrias comienza en el primer codón AUG y generalmente se limita a uORF, lo que da como resultado que la cantidad de la isoforma mitocondrial sea aproximadamente el 10 % de la isoforma nuclear. La traducción de la isoforma nuclear comienza desde el segundo AUG y no depende de uORF, ya que el ribosoma puede reiniciar efectivamente la traducción desde el segundo AUG, como si se saltara uORF. Este mecanismo regulador permite controlar la expresión de RNasa H1 en la mitocondria, donde su exceso puede conducir a la muerte celular, sin afectar el nivel normal de expresión de la isoforma nuclear. También se encontró que un cambio en el entorno de nucleótidos de AUG provocó la acumulación de transcritos, lo que indica la participación de otros factores en este mecanismo. Este ejemplo ilustra un sistema de regulación de la expresión génica muy específico en el que intervienen uORF y otros factores [12] .
Finalmente, los promotores alternativos y el empalme , así como el hecho de que el ribosoma a veces puede interactuar con codones fuera de marco y usar codones de inicio no estándar , brinda oportunidades adicionales para regular la expresión génica con la participación de uORF. Un estudio reciente en una línea celular de monocitos humanos que se trató con puromicina para la terminación prematura de la traducción y se determinaron los sitios de inicio de la traducción mostró 2994 uORF nuevos solo en 5'-UTR, aunque es seguro que muchos uORF también se superponen con la región codificante y la 3'-UTR. [13] .
La secuencia de nucleótidos real de los uORF generalmente no afecta su acción; solo la longitud, el número y las distancias entre uORFs [7] son importantes . Sin embargo, en algunos casos, el efecto de uORF aún depende de su secuencia de nucleótidos, en particular, de la secuencia de aminoácidos del péptido que codifica [14] . Aunque se comprende bien la importancia de los uORF como elementos reguladores implicados en la regulación de la unión y la traducción de los ribosomas, a menudo se desconoce la función e incluso el destino de los péptidos codificados por uORF, posiblemente debido a las dificultades para analizar el nivel de expresión y localización de los péptidos. . La evidencia de que los péptidos traducidos por uORF están presentes en las células se obtuvo en 2004, cuando se identificaron 54 péptidos de menos de 100 residuos de aminoácidos. Estos péptidos se produjeron en células de leucemia mieloide crónica humana , y se descubrió que cada una de ellas contenía uORF. Aunque estos péptidos han sido identificados, se desconoce que miles de uORF en estas células produzcan proteínas que puedan identificarse experimentalmente. Esto puede indicar que, en primer lugar, las proteínas traducidas de uORF pueden someterse selectivamente a proteólisis ; en segundo lugar, se expresan algunos uORF, pero no en células de este tipo; tercero, muchos uORF no dan lugar a proteínas. Sin embargo, es obvio que algunos uORF todavía se traducen en péptidos que se acumulan en las células y, por lo tanto, aparentemente llevan una carga funcional, aunque para muchos aún no se ha establecido [12] .
Sin embargo, en algunos casos, se conoce el mecanismo de acción de los péptidos codificados por uORF. Tal péptido funciona como un elemento regulador en cis y permanece asociado con el ribosoma de traducción. Aparentemente, el mecanismo de su acción está asociado con la interacción específica del péptido con el ribosoma, lo que resulta en un retraso en la terminación y la imposibilidad de un mayor movimiento del ribosoma a lo largo del ARNm. Ejemplos de ARNm cuyos uORF codifican péptidos inhibidores son el ARNm de S- adenosilmetionina descarboxilasa de mamíferos , el ARNm de CPA1 de levadura que codifica la biosíntesis de la enzima arginina ; ARNm de gp48 del citomegalovirus humano . La longitud de estos péptidos oscila entre 6 y 25 residuos de aminoácidos, y se ha demostrado que es su secuencia de aminoácidos la que determina el efecto inhibidor [15] .
La inhibición de la traducción de la secuencia codificante debida a uORF puede regularse mediante una serie de factores trans y condiciones ambientales. Por ejemplo, la traducción del ARNm de S-adenosilmetionina descarboxilasa ya mencionado es inhibida por uORF en células T en reposo , pero la traducción tiene éxito en células T estimuladas y células de línea T; en su caso, uORF parece ser ignorado al escanear los ribosomas. Otro ejemplo es el ARNm de CPA1 de levadura ya mencionado. En su caso, uORF bloquea la traducción del marco de lectura principal solo en presencia de arginina. No se ha establecido el mecanismo exacto de esta regulación, pero la inhibición de la función de la peptidil transferasa en respuesta a la adición de arginina detiene los ribosomas en el codón de parada uORF. Se supone que la arginina inhibe directamente la actividad de la peptidil transferasa o reduce la disponibilidad del sitio A del ribosoma [16] .
Un fenómeno interesante se observa durante la traducción del ARN policistrónico del virus del mosaico de la coliflor ( coliflower mosaic virus, CaMV ) . Su 5'-UTR contiene uORF que, como era de esperar, tienen un efecto supresor sobre la traducción de la secuencia de codificación. Además, casi todo el 5'-UTR encaja en una horquilla con una estructura secundaria y terciaria desarrollada , lo que crea un obstáculo para el movimiento del ribosoma. Esto es lo que sucede en las células vegetales que no son huéspedes del virus y en los sistemas libres de células preparados a partir de sus extractos. Sin embargo, en las plantas huéspedes del virus se produce la traducción, aparentemente debido a la presencia de un factor celular especial y los primeros uORF. Un estudio detallado reveló que cuando el ARN de CaMV es traduccionalmente activo, los ribosomas saltan la parte central de la horquilla con una estructura espacial, como si saltaran sobre ella. Es decir, en este caso se produce un shunting , en el que el ribosoma lee los 3 primeros uORF, mientras se desenrolla la base de la horquilla, y el ribosoma entra en una zona con una estructura tal que puede saltar del sitio inmediatamente posterior al tercer uORF al sitio dentro del séptimo uORF; después de eso, el ribosoma se mueve más hacia el extremo 3' y comienza a traducir la región de codificación [17] .
Las mutaciones que afectan a uORF generalmente son dañinas porque interrumpen el sistema de regulación de la expresión génica, lo que puede conducir directamente a la enfermedad. Por ejemplo, las mutaciones que destruyen uORF en el 5'-UTR del gen que codifica la proteína HR ( homólogo sin pelo humano en inglés ) conducen a la forma autosómica dominante de alopecia . No menos dañinas son las mutaciones que crean nuevos uORF, ya que también interrumpen la regulación normal de la expresión génica. Se ha sugerido que una mutación en un gen supresor de tumores puede conducir a una expresión reducida de proteínas protectoras y al desarrollo de cáncer. Las mutaciones en el gen CDKN2A que codifica un inhibidor de las proteínas quinasas pueden ser requisitos previos para el desarrollo del melanoma . Se ha establecido que las mutaciones en uORF también pueden conducir al desarrollo de enfermedades como la trombocitemia hereditaria , la enfermedad de Alzheimer , el trastorno afectivo bipolar , la miocardiopatía , la displasia arritmogénica del ventrículo derecho [18] . Todos estos ejemplos demuestran una vez más la importancia excepcional de uORF en la regulación fina de la expresión génica y el mantenimiento de la homeostasis , y la variabilidad en la región de uORF puede determinar un fenotipo individual o predisposición a enfermedades [19] .