La superfamilia de proteínas es el grupo más grande de proteínas que se puede suponer que tienen un ancestro evolutivo común (ver homología (biología) ). Por lo general, una superfamilia se une según el principio de similitud de estructuras secundarias y terciarias (“similitud estructural”) de las proteínas incluidas en ella [1] y según el principio de similitud del mecanismo de acción de las proteínas (“similitud mecanicista”). ” o “similitud funcional”), a pesar del hecho de que las secuencias de similitudes de aminoácidos dentro de una superfamilia pueden no observarse y, en la mayoría de los casos, no observarse [2] . Las superfamilias típicamente contienen varias familias de proteínas que muestran similitud en las secuencias de aminoácidos dentro de las familias pero no entre familias. El término "clan de proteínas" se aplica a menudo a las superfamilias de proteasas según la clasificación MEROPS [2] .
Los miembros de una superfamilia de proteínas que pertenecen a diferentes familias normalmente no muestran ninguna homología de secuencia de aminoácidos significativa o fácilmente detectable, pero comparten estructuras secundarias y terciarias similares y, a menudo, tienen alguna similitud funcional. A menudo son casi imposibles o al menos muy difíciles de alinear con las secuencias de aminoácidos debido a las frecuentes inserciones y deleciones observadas . Por ejemplo, en la superfamilia de proteasas PA, no se conserva ni un solo residuo de aminoácido en toda la superfamilia, incluidos incluso aquellos residuos de aminoácidos que forman parte de las tríadas catalíticas de estas proteínas.
Y viceversa, los miembros de familias individuales que forman parte de una superfamilia están determinados precisamente por el principio de homología de las secuencias de aminoácidos (estructuras primarias) de las proteínas incluidas en la familia. Por ejemplo, la superfamilia de proteasas PA incluye la familia de proteasas C04.
Las estructuras secundarias y terciarias de las proteínas que afectan directamente a su funcionalidad (por ejemplo, la capacidad de un receptor para reconocer ligandos - agonistas y antagonistas , o la capacidad de una enzima para catalizar ciertas reacciones químicas ) están mucho más conservadas evolutivamente que el aminoácido . secuencia. Un ejemplo de esto es la superfamilia de proteasas PA. En él, muy pocos residuos de aminoácidos de las proteínas muestran un grado significativo de conservadurismo evolutivo, mientras que los elementos característicos de la estructura secundaria, así como su ordenamiento espacial en las estructuras terciarias, están muy conservados.
Los programas de alineación y ordenación estructural, como el programa DALI , pueden utilizar las estructuras tridimensionales secundarias y terciarias de proteínas de interés para el investigador con su base de datos de estructuras de proteínas para encontrar proteínas con plegamiento similar . La comparación de las estructuras tridimensionales secundarias y terciarias de las proteínas ayuda a identificar muchos casos de proteínas relacionadas evolutivamente (que comparten un ancestro evolutivo) que no serían similares simplemente analizando y comparando sus estructuras primarias (secuencias de aminoácidos).
El mecanismo catalítico de las enzimas que son miembros de la superfamilia suele estar más o menos conservado en toda la superfamilia, pero su especificidad de sustrato puede variar bastante significativamente en la superfamilia. Como resultado, el propósito funcional final de las proteínas en el cuerpo puede variar significativamente, dependiendo de su especificidad de sustrato. Es decir, puede que no haya ninguna similitud funcional externa.
Además (aunque no necesariamente y no siempre), el dominio catalítico de las enzimas que son miembros de la superfamilia tiende a un alto grado de conservación de la secuencia de aminoácidos dentro de este dominio particular (y más aún, la estructura secundaria y terciaria de la dominio catalítico). Sin embargo, incluso si la secuencia de aminoácidos del dominio catalítico no se conserva, el propio mecanismo catalítico y/o las estructuras secundaria y terciaria del dominio catalítico pueden conservarse.
Un ejemplo de la retención en toda la superfamilia del mecanismo catalítico descrito anteriormente es, de nuevo, la superfamilia de proteasas PA. Contiene proteínas de finalidades funcionales finales muy diferentes (es decir, no existe similitud funcional externa) - entre ellas se encuentra una enzima digestiva quimotripsina , una enzima trombolítica - activadora del plasminógeno , toxinas bacterianas y de serpientes y proteasas virales que aseguran el ensamblaje de las proteínas virales. partículas Como se mencionó anteriormente, en la escala de esta superfamilia, ni un solo residuo de aminoácido se conserva evolutivamente , incluso en el dominio catalítico. Y, sin embargo, todos los miembros de la superfamilia comparten similitudes significativas en los elementos catalíticos específicos de sus estructuras tridimensionales. Además, aunque los miembros de diferentes familias de la superfamilia de proteasas PA usan diferentes nucleófilos , todos producen proteólisis catalítica nucleófila covalente de proteínas o péptidos mediante un mecanismo catalítico común.
Las superfamilias de proteínas reflejan las limitaciones de nuestra capacidad actual para identificar un ancestro común [3] . Las superfamilias de proteínas son la mayor asociación significativa desde el punto de vista evolutivo de proteínas y genes similares que se pueden realizar actualmente en función de la evidencia directa de similitud (en el caso de las superfamilias, en su mayoría estructurales y en parte mecánicas). Por lo tanto, el descubrimiento de una similitud estructural tridimensional de proteínas diferentes en términos funcionales y de aminoácidos en seres vivos que están muy lejos en la escala evolutiva es una de las evidencias más antiguas (quizás la más antigua entre las que generalmente están disponibles para estudiar) eventos evolutivos.
Algunas superfamilias de proteínas contienen proteínas que están presentes de una forma u otra en todos los seres vivos estudiados (por ejemplo , canales de potasio ), en todos los reinos (incluyendo animales , plantas , hongos , bacterias y otros procariotas ). Esto puede indicar que el ancestro común de las proteínas de estas superfamilias eran proteínas presentes en el ancestro común universal de todos los seres vivos [4] .
Los miembros de la superfamilia se pueden encontrar en diferentes tipos de animales, plantas, criaturas unicelulares ( proteínas ortólogas ). Al mismo tiempo, los más antiguos evolutivamente son, obviamente, aquellos miembros de la superfamilia que pertenecen a seres que se encuentran en los peldaños más bajos de la escala evolutiva. El ancestro común de estas proteínas es aparentemente el de alguna antigua criatura extinta que fue el ancestro común de todas aquellas especies en las que se encuentran las proteínas de la superfamilia. Por lo tanto, el estudio de proteínas ortólogas dentro de superfamilias de proteínas puede permitir dibujar con mayor precisión el árbol evolutivo de las especies.
Además, en el mismo organismo de un animal, planta o criatura unicelular de la misma especie, se pueden encontrar varios representantes diferentes de una determinada superfamilia de proteínas (incluidas las que realizan funciones diferentes). Estas proteínas se denominan parálogas . Estas proteínas parálogas también pueden provenir de un solo ancestro común de proteínas, que en algún momento de la evolución se duplicó en el genoma de una especie determinada. El estudio de las proteínas parálogas, sus similitudes y diferencias, ayuda a arrojar luz sobre el camino de la evolución funcional de las proteínas.
Varias bases de datos biológicas documentan superfamilias de proteínas, en particular:
Enzimas | |
---|---|
Actividad | |
Regulación | |
Clasificación | |
Tipos |
|