El código genético es un conjunto de reglas según las cuales en las células vivas la secuencia de nucleótidos ( genes y ARNm ) se traduce en una secuencia de aminoácidos ( proteínas ). La traducción real ( traducción ) la lleva a cabo el ribosoma , que conecta los aminoácidos en una cadena de acuerdo con las instrucciones escritas en los codones de ARNm . Los aminoácidos correspondientes son entregados al ribosoma por moléculas de ARNt . El código genético de todos los organismos vivos de la Tierra es el mismo (solo hay variaciones menores), lo que indica la presencia de un ancestro común .
Las reglas del código genético determinan qué aminoácido corresponde a un triplete (tres nucleótidos consecutivos) en el ARNm. Con raras excepciones [1] , cada codón corresponde a un solo aminoácido. Un aminoácido en particular puede estar codificado por más de un codón, y también hay codones que marcan el inicio y el final de una proteína. La variante del código genético que utilizan la gran mayoría de los organismos vivos se denomina código genético estándar o canónico. Sin embargo, se conocen varias docenas de excepciones al código genético estándar, por ejemplo, cuando se traduce en mitocondrias , se utilizan reglas del código genético ligeramente modificadas.
La representación más simple del código genético es una tabla de 64 celdas, en la que cada celda corresponde a uno de los 64 codones posibles [2] .
Los intentos de comprender cómo la secuencia de ADN codifica la secuencia de aminoácidos de las proteínas comenzaron casi inmediatamente después de que se estableciera la estructura del ADN ( doble hélice ) en 1953. Georgy Gamow sugirió que los codones deben constar de tres nucleótidos para que haya suficientes codones para los 20 aminoácidos (en total, son posibles 64 codones diferentes de tres nucleótidos: uno de los cuatro nucleótidos puede colocarse en cada una de las tres posiciones) [3 ] .
En 1961, se confirmó experimentalmente la naturaleza triple del código genético. En el mismo año, Marshall Nirenberg y su colega Heinrich Mattei utilizaron un sistema libre de células para la traducción in vitro . Se tomó como plantilla un oligonucleótido consistente en residuos de uracilo (UUUU...) . El péptido sintetizado a partir de él contenía únicamente el aminoácido fenilalanina [4] . Así que primero se estableció el significado del codón: el codón UUU codifica fenilalanina. En el laboratorio de Severo Ochoa se establecieron otras reglas para la correspondencia entre codones y aminoácidos . Se ha demostrado que el ARN de poliadenina (AAA...) se traduce en un péptido de polilisina [5] , y un péptido que consta únicamente de residuos de prolina se sintetiza en una plantilla de ARN de policitosina (CCC...) [6] . El significado de los codones restantes se determinó usando una variedad de copolímeros en el curso de experimentos llevados a cabo en el laboratorio de Hara Gobind Qur'an . Poco tiempo después, Robert Holley estableció la estructura de la molécula de ARNt que media en la traducción. En 1968, Nirenberg, Korana y Holly recibieron el Premio Nobel de Fisiología o Medicina [7] .
Después de establecer las reglas del código genético, muchos científicos comenzaron a transformarlo artificialmente . Así, desde 2001 se han introducido en el código genético 40 aminoácidos, que en la naturaleza no forman parte de las proteínas. Para cada aminoácido, se creó su propio codón y la correspondiente aminoacil-tRNA sintetasa . La expansión artificial del código genético y la creación de proteínas con nuevos aminoácidos pueden ayudar a estudiar más a fondo la estructura de las moléculas proteicas, así como a obtener proteínas artificiales con las propiedades deseadas [8] [9] . H. Murakami y M. Sishido pudieron convertir algunos codones de tres nucleótidos en cuatro y cinco nucleótidos. Stephen Brenner recibió el codón 65, que fue funcional in vivo [10] .
En 2015, la bacteria Escherichia coli logró cambiar el valor de todos los codones UGG de triptófano a tienopirrol-alanina, que no se encuentra en la naturaleza [11] . En 2016 se obtuvo el primer organismo semisintético, una bacteria cuyo genoma contenía dos bases nitrogenadas artificiales (X e Y) que se conservan durante la división [12] [13] . En 2017, investigadores de Corea del Sur anunciaron la creación de un ratón con un código genético extendido, capaz de sintetizar proteínas con aminoácidos que no se encuentran en la naturaleza [14] .
Los genes están codificados en la dirección 5'→3' de la secuencia de nucleótidos [15] . El marco de lectura está determinado por el primer triplete a partir del cual comienza la traducción. Una secuencia de codones no superpuestos que comienza con un codón de inicio y termina con un codón de finalización se denomina marco de lectura abierto . Por ejemplo, la secuencia 5'-AAATGAACG-3' (ver Fig.) cuando se lee desde el primer nucleótido se divide en codones AAA, TGA y ACG. Si la lectura comienza desde el segundo nucleótido, entonces los codones AAT y GAA le corresponden. Finalmente, al leer a partir del tercer nucleótido, se utilizan los codones ATG y AAC. Por lo tanto, cualquier secuencia puede leerse en la dirección 5' → 3' de tres formas diferentes (con tres marcos de lectura diferentes), y en cada caso la secuencia del producto proteico diferirá debido al reconocimiento de diferentes codones por parte del ribosoma. Si tenemos en cuenta que el ADN tiene una estructura de doble cadena, entonces son posibles 6 marcos de lectura: tres en una cadena y tres en la otra [16] . Sin embargo, la lectura de genes del ADN no es aleatoria. Todos los demás marcos de lectura dentro de un solo gen generalmente contienen numerosos codones de parada para detener rápidamente y reducir el costo metabólico de la síntesis errónea [17] .
La traducción de la información de la secuencia de ARNm a la secuencia de aminoácidos comienza con el llamado codón de inicio, generalmente AUG, y en eucariotas se lee como metionina , y en bacterias, como formilmetionina . Un codón de inicio no es suficiente para iniciar la traducción; requiere factores de iniciación de la traducción , así como elementos especiales en secuencias adyacentes, como la secuencia Shine-Dalgarno en bacterias. En algunos organismos, los codones GUG, que normalmente codifica para valina , y UUG, que corresponde a leucina en el código estándar, se utilizan como codones de inicio [18] .
Después del codón de iniciación, la traducción continúa a través de la lectura secuencial de codones y la unión de aminoácidos entre sí por el ribosoma hasta que se alcanza un codón de parada para detener la traducción. Hay tres codones de terminación, cada uno con un nombre diferente: UAG (ámbar), UGA (ópalo) y UAA (ocre). Los codones de terminación también se denominan terminadores. No hay tRNA correspondientes a los codones de parada en las células, por lo tanto, cuando el ribosoma alcanza el codón de parada, en lugar del tRNA, los factores de terminación de la traducción interactúan con él, que hidrolizan el último tRNA de la cadena de aminoácidos y luego obligan al ribosoma a disociarse . [19] . En bacterias, tres factores proteicos participan en la terminación de la traducción : RF-1, RF-2 y RF-3: RF-1 reconoce los codones UAG y UAA, y RF-2 reconoce UAA y UGA. El factor RF-3 realiza un trabajo auxiliar. La estructura tridimensional de RF-1 y RF-2 se asemeja a la forma y distribución de carga del ARNt y, por lo tanto, representa un ejemplo de mimetismo molecular [20] . En eucariotas, el factor de terminación de la traducción eRF1 reconoce los tres codones de parada. La GTPasa eRF3 dependiente de ribosomas , que se considera el segundo factor de terminación de la traducción eucariota, ayuda a eRF1 en la liberación del polipéptido terminado del ribosoma [21] [22] [23] .
La distribución de los codones de terminación en el genoma de un organismo no es accidental y puede estar asociada con la composición de GC del genoma [24] [25] . Por ejemplo, la cepa E. coli K-12 tiene 2705 TAA (63 %), 1257 TGA (29 %) y 326 TAG (8 %) codones en su genoma con un contenido de GC del 50,8 % [26] . Un estudio a gran escala de los genomas de diferentes especies bacterianas mostró que la proporción del codón TAA se correlaciona positivamente con la composición de GC, mientras que la proporción de TGA se correlaciona negativamente. La frecuencia del codón de terminación que se usa con menos frecuencia, TAG, no está asociada con la composición de GC [27] . La fuerza de los codones de terminación también varía. La terminación de la traducción espontánea se produce con mayor frecuencia en el codón UGA y con menor frecuencia en UAA [23] .
Además del propio codón de parada, su entorno es de suma importancia para la terminación de la traducción. El papel del nucleótido ubicado inmediatamente después del codón de parada (+4) es el más importante. Es probable que el nucleótido +4 y otros nucleótidos que le siguen afecten la terminación de la traducción al proporcionar sitios de unión para los factores de terminación de la traducción. Por esta razón, algunos investigadores proponen considerar una señal de parada de cuatro nucleótidos en lugar de un codón de parada de tres nucleótidos. Los nucleótidos aguas arriba de los codones de terminación también afectan la traducción. Por ejemplo, en la levadura , se ha demostrado que la adenina ubicada 2 posiciones cadena arriba del nucleótido del primer codón de parada estimula la terminación de la traducción en el codón de parada UAG (posiblemente también en otros codones) [23] .
A veces, los codones de parada actúan como codones de sentido. Por ejemplo, el codón UGA codifica el aminoácido no estándar selenocisteína si el llamado elemento SECIS se encuentra junto a él en la transcripción [28] . El codón de parada UAG puede codificar otro aminoácido no estándar, la pirrolisina . A veces, un codón de parada se reconoce como un codón sentido en mutaciones que afectan al ARNt. Este fenómeno se observa con mayor frecuencia en virus , pero también se ha descrito en bacterias, levaduras , Drosophila y humanos, en los que desempeña un papel regulador [29] [30] .
En el curso de la replicación del ADN , ocasionalmente ocurren errores durante la síntesis de la hebra hija. Estos errores, llamados mutaciones , pueden afectar el fenotipo de un organismo, especialmente si afectan la región codificante de un gen. Los errores ocurren a una tasa de 1 en cada 10 a 100 millones de pares de bases (pb) porque las polimerasas de ADN pueden corregir sus errores de manera efectiva [31] [32] .
Las mutaciones puntuales son sustituciones simples de una base nitrogenada. Si la nueva base pertenece a la misma clase que la original (ambas purinas o ambas pirimidinas ), la mutación se denomina transiciones . Si se reemplaza una purina por una pirimidina o una pirimidina por una purina, entonces se habla de transversiones . Las transiciones son más comunes que las transversiones [33] . Ejemplos de mutaciones puntuales son las mutaciones missense y nonsense . Pueden causar enfermedades como la anemia de células falciformes y la talasemia , respectivamente [34] [35] . Las mutaciones sin sentido clínicamente significativas conducen a la sustitución de un residuo de aminoácido por un residuo con diferentes propiedades fisicoquímicas, y las mutaciones sin sentido dan como resultado la aparición de un codón de parada prematuro [16] .
Las mutaciones en las que se altera el marco de lectura correcto debido a inserciones y eliminaciones (colectivamente se denominan indels ) que contienen un no múltiplo de tres nucleótidos se denominan mutaciones de cambio de marco. Con estas mutaciones, el producto proteico es completamente diferente al del tipo salvaje . Por regla general, los codones de parada prematuros aparecen durante los cambios del marco de lectura, lo que provoca la formación de proteínas truncadas [36] . Dado que estas mutaciones interrumpen significativamente la función de la proteína, rara vez se fijan por selección : a menudo, la ausencia de la proteína conduce a la muerte del organismo incluso antes del nacimiento [37] . Las mutaciones de cambio de marco se asocian con enfermedades como la enfermedad de Tay-Sachs [38] .
Aunque la gran mayoría de las mutaciones son dañinas o neutras , algunas resultan beneficiosas [39] . Pueden dar al organismo una mejor adaptación que el tipo salvaje a ciertas condiciones ambientales, o permitirle reproducirse más rápido que el tipo salvaje. En este caso, la mutación se extenderá gradualmente a través de la población en el curso de una selección neutral [40] . Los virus cuyos genomas están representados por ARN mutan muy rápidamente [41] , lo que a menudo los beneficia, porque el sistema inmunitario , que reconoce eficazmente algunas variantes de antígenos virales , es impotente frente a los ligeramente modificados [42] . En grandes poblaciones de organismos que se reproducen asexualmente , como E. coli , pueden ocurrir varias mutaciones beneficiosas al mismo tiempo. Este fenómeno se llama interferencia clonal y provoca competencia entre mutaciones [43] .
La capacidad de diferentes codones para codificar el mismo aminoácido se denomina degeneración del código. Por primera vez el código genético fue llamado degenerado Nirenberg y Bernfield. Sin embargo, a pesar de la degeneración, no hay ambigüedad en el código genético. Por ejemplo, los codones GAA y GAG codifican glutamato , pero ninguno codifica ningún otro aminoácido al mismo tiempo. Los codones correspondientes al mismo aminoácido pueden diferir en cualquier posición, pero la mayoría de las veces las dos primeras posiciones de dichos codones coinciden y solo difiere la última. Debido a esto, una mutación que afecta la tercera posición del codón, muy probablemente, no afectará el producto proteico [44] .
Esta característica puede explicarse por la ambigua hipótesis del par de bases , propuesta por Francis Crick . De acuerdo con esta hipótesis, el tercer nucleótido en el codón de ADN puede no ser totalmente complementario al anticodón de ARNt para compensar la discrepancia entre el número de tipos de ARNt y el número de codones [45] [46] .
Los codones de aminoácidos con propiedades fisicoquímicas similares también suelen ser similares, por lo que las mutaciones no conducen a violaciones significativas de la estructura de la proteína. Por lo tanto, los codones NUN (N es cualquier nucleótido) suelen codificar aminoácidos hidrofóbicos . Las NCN codifican aminoácidos pequeños con hidrofobicidad moderada, mientras que las NAN codifican aminoácidos hidrofílicos de tamaño mediano. El código genético está organizado de manera tan óptima en términos de hidrofobicidad que el análisis matemático que utiliza la descomposición de valores singulares de 12 variables (4 nucleótidos por 3 posiciones) da una correlación significativa (0,95) para predecir la hidrofobicidad de un aminoácido por su codón [47] . Ocho aminoácidos no se ven afectados en absoluto por mutaciones en las terceras posiciones, y las mutaciones en la segunda posición, por regla general, conducen al reemplazo por un aminoácido con propiedades fisicoquímicas completamente diferentes. Sin embargo, las mutaciones en las primeras posiciones tienen el mayor impacto en el producto proteico. Así, las mutaciones que conducen a la sustitución de un aminoácido cargado por un aminoácido con carga opuesta sólo pueden afectar a la primera posición, y nunca a la segunda. Es probable que tal cambio en la carga tenga un fuerte efecto en la estructura de la proteína [48] .
La siguiente tabla muestra el código genético común a la mayoría de los procariotas y eucariotas . La tabla enumera los 64 codones y enumera los aminoácidos correspondientes. El orden de las bases va desde el extremo 5' al 3' del ARNm. Se dan designaciones de aminoácidos de tres letras y de una letra.
no polar | polar | básico | ácido | (codón de terminación) |
1ra base |
segunda base | tercera base | |||||||
---|---|---|---|---|---|---|---|---|---|
tu | C | A | GRAMO | ||||||
tu | UUU | (Phe/F) Fenilalanina | UCU | (Ser/S) Serina | UAU | (Tyr/Y) Tirosina | UGU | (Cys/C) Cisteína | tu |
UUC | UCC | UAC | CGU | C | |||||
UUA | (Leu/L) Leucina | UCA | SAU | Parada ( Ocre ) | UGA | Parada ( ópalo ) | A | ||
UUG | UCG | UAG | Detener ( Ámbar ) | UGG | (Trp/W) Triptófano | GRAMO | |||
C | CUU | UCC | (Pro/P) Prolina | CAU | (Su/H) Histidina | UGE | (Arg/R) Arginina | tu | |
CUC | CCC | CAC | CGC | C | |||||
ACU | CCA | CAA | (Gln/Q) Glutamina | CGA | A | ||||
CUG | CCG | CAG | CGG | GRAMO | |||||
A | AUU | (Ile/I) Isoleucina | UCA | (Thr/T) Treonina | UCA | (Asn/N) Asparagina | AGU | (Ser/S) Serina | tu |
ABC | CAC | CAA | CAG | C | |||||
AUA | ACA | AAA | (Lys/K) Lisina | AGA | (Arg/R) Arginina | A | |||
AGO [UN] | (Met/M) Metionina | ACG | AAG | AGG | GRAMO | ||||
GRAMO | GUU | (Val/V) Valina | GCU | (Ala/A) Alanina | GAU | (Asp/D) Ácido aspártico | GGU | (Gly/G) Glicina | tu |
GUC | CCG | CAG | GGC | C | |||||
GUA | GCA | AGA | (Glu/E) Ácido glutámico | GGA | A | ||||
GUG | GCC | MORDAZA | GGG | GRAMO |
Ala /A | UGC, CCG, CCG, CCG | Leu/L | UUA, UUG, CUU, CUC, CUA, CUG |
---|---|---|---|
argumento /R | UGE, CGC, CGA, CGG, AGA, AGG | Lis/K | AAA, AAG |
Asn /N | UAA, AAC | Met/M | AGO |
áspid /D | GAU, GAC | He/F | UUU, UUC |
Cis /C | UGU, UGC | Apuntalar | UCC, CCC, CCA, CCG |
Gln /Q | CAA, CAG | Ser /S | UCU, UCC, UCA, UCG, AGU, AGC |
Pegamento | GAA, GAG | Jue /T | UCA, ACC, ACA, ACG |
Gly /G | GGU, GGC, GGA, GGG | trip/W | UGG |
Su /H | CAU, CAC | Tiro /Y | UAU, UAC |
ile/yo | AUU, AUC, AUA | Valor/V | GUU, GUC, GUU, GUG |
COMIENZO | AGO | DETÉNGASE | UAG, UGA, UAA |
En algunas proteínas, los aminoácidos no estándar están codificados por codones de terminación, dependiendo de la presencia de una secuencia señal especial en el ARNm. Por ejemplo, el codón de parada UGA puede codificar selenocisteína , mientras que UAG puede codificar pirrolisina . La selenocisteína y la pirrolisina se consideran los aminoácidos proteinogénicos 21 y 22, respectivamente. A diferencia de la selenocisteína, la pirrolisina tiene su propia aminoacil-tRNA sintetasa [50] . Aunque generalmente el código genético utilizado por las células de un organismo es fijo, la arquea Acetohalobium arabaticum puede cambiar de un código de 20 aminoácidos a un código de 21 aminoácidos (incluida la pirrolisina) en diferentes condiciones de crecimiento [51] .
La existencia de desviaciones del código genético estándar se predijo ya en la década de 1970 [52] . La primera desviación se describió en 1979 en mitocondrias humanas [53] . Posteriormente, se describieron varios códigos genéticos alternativos ligeramente diferentes del estándar, incluidos códigos mitocondriales alternativos [54] .
Por ejemplo, en bacterias del género Mycoplasma , el codón de parada UGA codifica triptófano, mientras que en levaduras del llamado “ clado CTG ” (incluida la especie patógena Candida albicans ), el codón CUG codifica serina, y no leucina, como en el código genético estándar [55] [56] [57] . Debido a que los virus usan el mismo código genético que sus células anfitrionas, las desviaciones del código genético estándar pueden interrumpir la replicación del virus [58] . Sin embargo, algunos virus, como los virus del género Totivirus , utilizan el mismo código genético alternativo que el organismo huésped [59] .
En bacterias y arqueas, GUG y UUG a menudo actúan como codones de inicio [60] . También hay algunas desviaciones del código genético estándar en el genoma nuclear humano: por ejemplo, en el 4% de ARNm de la enzima malato deshidrogenasa , uno de los codones de parada codifica triptófano o arginina [61] . El valor de un codón de parada depende de su entorno [30] . Las desviaciones en el código genético de un organismo pueden detectarse encontrando genes muy conservados en su genoma y comparando sus codones con los aminoácidos correspondientes de proteínas homólogas de organismos estrechamente relacionados. El programa FACIL funciona de acuerdo con este principio, que calcula la frecuencia con la que cada codón corresponde a un aminoácido en particular, y también determina el soporte de un codón de parada y presenta el resultado en forma de logotipo (LOGO) [62] . Sin embargo, a pesar de todas estas diferencias, los códigos genéticos utilizados por todos los organismos son muy similares [63] .
La siguiente tabla enumera los códigos genéticos no estándar actualmente conocidos [64] [65] . Hay 23 códigos genéticos no estándar, siendo la diferencia más común con el código genético estándar la conversión del codón de parada UGA en un codón sentido que codifica triptófano [66] .
Lista de códigos genéticos no estándarPropiedades bioquímicas de los aminoácidos. | no polar | polar | principal | agrio | Terminación: codón de terminación |
El código | Tabla de traducción |
codón de ADN | codón de ARN | Transmitir con este código |
Transmisión estándar | notas | ||
---|---|---|---|---|---|---|---|---|
Estándar | una | Incluye tabla de traducción 8 ( cloroplastos vegetales ) | ||||||
Código mitocondrial de vertebrados | 2 | AGA | AGA | Ter (*) | Argentina (R) | |||
AGG | AGG | Ter (*) | Argentina (R) | |||||
ATA | AUA | Conocido (M) | isla (yo) | |||||
TGA | UGA | PRT (W) | Ter (*) | |||||
Código genético mitocondrial de la levadura | 3 | ATA | AUA | Conocido (M) | isla (yo) | |||
CTT | CUU | Thr (T) | Leu (L) | |||||
CTC | CUC | Thr (T) | Leu (L) | |||||
llamada a la acción | ACU | Thr (T) | Leu (L) | |||||
CTG | CUG | Thr (T) | Leu (L) | |||||
TGA | UGA | PRT (W) | Ter (*) | |||||
CGA | CGA | ausente | Argentina (R) | |||||
CGC | CGC | ausente | Argentina (R) | |||||
Código genético mitocondrial de mohos mucilaginosos, protozoos, cnidarios y el código genético de Mycoplasma y Spiroplasma | cuatro | TGA | UGA | PRT (W) | Ter (*) | Incluye tabla de traducción 7 ( cinetoplasto ) | ||
Código mitocondrial de invertebrados | 5 | AGA | AGA | Ser (S) | Argentina (R) | |||
AGG | AGG | Ser (S) | Argentina (R) | |||||
ATA | AUA | Conocido (M) | isla (yo) | |||||
TGA | UGA | PRT (W) | Ter (*) | |||||
Código genético de ciliados, Dasycladacea y Hexamita | 6 | TAA | SAU | gln (q) | Ter (*) | |||
ETIQUETA | UAG | gln (q) | Ter (*) | |||||
Código genético mitocondrial de equinodermos y platelmintos | 9 | AAA | AAA | Asn (N) | Lys (K) | |||
AGA | AGA | Ser (S) | Argentina (R) | |||||
AGG | AGG | Ser (S) | Argentina (R) | |||||
TGA | UGA | PRT (W) | Ter (*) | |||||
Código genético de Euplotidae | diez | TGA | UGA | Cis (C) | Ter (*) | |||
Código genético de bacterias, arqueas y plástidos de plantas | once | Ver tabla de traducción 1 | ||||||
Código genético alternativo de la levadura | 12 | CTG | CUG | Ser (S) | Leu (L) | |||
Código genético mitocondrial de las ascidias | 13 | AGA | AGA | Gly (G) | Argentina (R) | |||
AGG | AGG | Gly (G) | Argentina (R) | |||||
ATA | AUA | Conocido (M) | isla (yo) | |||||
TGA | UGA | PRT (W) | Ter (*) | |||||
Código genético mitocondrial alternativo para platelmintos | catorce | AAA | AAA | Asn (N) | Lys (K) | |||
AGA | AGA | Ser (S) | Argentina (R) | |||||
AGG | AGG | Ser (S) | Argentina (R) | |||||
TAA | SAU | Tiro (Y) | Ter (*) | |||||
TGA | UGA | PRT (W) | Ter (*) | |||||
Código genético del Blefarisma | quince | ETIQUETA | UAG | gln (q) | Ter (*) | |||
Código genético mitocondrial de Chlorophycia | dieciséis | ETIQUETA | UAG | Leu (L) | Ter (*) | |||
Código genético mitocondrial de los trematodos | 21 | TGA | UGA | PRT (W) | Ter (*) | |||
ATA | AUA | Conocido (M) | isla (yo) | |||||
AGA | AGA | Ser (S) | Argentina (R) | |||||
AGG | AGG | Ser (S) | Argentina (R) | |||||
AAA | AAA | Asn (N) | Lys (K) | |||||
Código genético mitocondrial de Scenedesmus obliquus | 22 | TCA | UCA | Ter (*) | Ser (S) | |||
ETIQUETA | UAG | Leu (L) | Ter (*) | |||||
Código genético mitocondrial de Thraustochytrium | 23 | TTA | UUA | Ter (*) | Leu (L) | Similar a la tabla de traducción 11. | ||
Código genético mitocondrial de las branquias de las alas | 24 | AGA | AGA | Ser (S) | Argentina (R) | |||
AGG | AGG | Lys (K) | Argentina (R) | |||||
TGA | UGA | PRT (W) | Ter (*) | |||||
Código genético de los posibles grupos SR1 y Gracilibacteria | 25 | TGA | UGA | Gly (G) | Ter (*) | |||
Código genético de Pachysolen tannophilus | 26 | CTG | CUG | Ala (A) | Leu (L) | |||
Código genético de Karyorelictea | 27 | TAA | SAU | gln (q) | Ter (*) | |||
ETIQUETA | UAG | gln (q) | Ter (*) | |||||
TGA | UGA | Ter (*) | o | PRT (W) | Ter (*) | |||
Código genético del Condilostoma | 28 | TAA | SAU | Ter (*) | o | gln (q) | Ter (*) | |
ETIQUETA | UAG | Ter (*) | o | gln (q) | Ter (*) | |||
TGA | UGA | Ter (*) | o | PRT (W) | Ter (*) | |||
Código genético de Mesodinium | 29 | TAA | SAU | Tiro (Y) | Ter (*) | |||
ETIQUETA | UAG | Tiro (Y) | Ter (*) | |||||
Código genético de Peritrichia | treinta | TAA | SAU | Glú (E) | Ter (*) | |||
ETIQUETA | UAG | Glú (E) | Ter (*) | |||||
Código genético de Blastocrithidia | 31 | TAA | SAU | Ter (*) | o | gln (q) | Ter (*) | |
ETIQUETA | UAG | Ter (*) | o | gln (q) | Ter (*) | |||
TGA | UGA | PRT (W) | Ter (*) |
En los genomas de muchos organismos se observa la llamada preferencia de codones, es decir, la frecuencia de aparición de todos los codones sinónimos correspondientes a un determinado aminoácido no es igual y para unos codones es mayor que para otros [67] [ 68] . La base evolutiva para la aparición de la preferencia de codones no está clara. Según una hipótesis, los codones que mutan con mayor frecuencia son menos comunes. Otra hipótesis establece que la preferencia de codones está regulada por la selección natural a favor de aquellos que proporcionan la mayor eficiencia y precisión en la expresión génica [69] [70] . La preferencia de codones está fuertemente asociada con el contenido de GC del genoma y, en algunos casos, el contenido de GC puede incluso predecir la frecuencia del uso de codones [71] . Desde un punto de vista funcional, la preferencia de codones está asociada con la eficiencia y precisión de la traducción y, por lo tanto, con el nivel de expresión génica [72] [73] .
Actualmente, la hipótesis más aceptada sobre el origen de la vida en la Tierra es la hipótesis del mundo del ARN . Cualquier modelo del origen del código genético utiliza la hipótesis de la transferencia de funciones básicas de enzimas de ARN ( ribozimas ) a enzimas proteicas. Como sugiere la hipótesis del mundo del ARN, los ARNt aparecieron antes que las aminoacil-ARNt sintetasas, por lo que estas enzimas no podrían afectar las propiedades de los ARNt [74] .
El código genético del último ancestro común universal (LUCA) probablemente se basó en el ADN en lugar del ARN [75] . El código genético constaba de tres codones de nucleótidos, y en total había 64 codones diferentes. Debido a que solo se usaron 20 aminoácidos para construir proteínas , algunos aminoácidos fueron codificados por múltiples codones [76] [77] [78] [79] .
Si la correspondencia entre codones y aminoácidos fuera aleatoria, existirían en la naturaleza 1,5 × 10 84 códigos genéticos [80] . Este número se obtuvo calculando el número de formas en que 21 elementos (20 codones de aminoácidos y un codón de parada) podrían clasificarse en 64 contenedores para que cada elemento se usara al menos una vez [81] . Sin embargo, las correspondencias entre codones y aminoácidos no son aleatorias [82] . Los aminoácidos que comparten una vía biosintética común tienden a compartir la posición del primer codón. Este hecho puede ser un remanente de un código genético anterior más simple que contenía menos aminoácidos que el moderno y gradualmente incluía los 20 aminoácidos [83] . Los codones de aminoácidos con propiedades fisicoquímicas similares también tienden a ser similares, lo que mitiga los efectos de las mutaciones puntuales y las alteraciones de la traducción [84] [85] .
Dado que el código genético no es aleatorio, una hipótesis plausible sobre su origen debería explicar propiedades del código genético estándar como la ausencia de codones para D - aminoácidos, la inclusión de solo 20 aminoácidos de los 64 posibles, la restricción de sustituciones sinónimas a la tercera posición de los codones, el funcionamiento de los codones como codones de parada UAG, UGA y UAA [86] . Hay tres hipótesis principales para el origen del código genético. Cada uno de ellos está representado por muchos modelos, muchos modelos son híbridos [87] .
diccionarios y enciclopedias | |
---|---|
En catálogos bibliográficos |