Árbol filogenético ( árbol evolutivo , árbol de la vida ) - un árbol que refleja las relaciones evolutivas entre diferentes especies u otras entidades que tienen un ancestro común.
Los vértices de un árbol filogenético se dividen en tres clases: hojas, nodos y (como máximo una) raíz. Las hojas son vértices extremos, es decir, aquellas que incluyen exactamente un borde cada una; cada hoja representa algún tipo de organismo vivo (o algún otro objeto sujeto a evolución, como un dominio de proteína ). Cada nodo representa un evento evolutivo: la división de una especie ancestral en dos o más, que posteriormente evolucionaron de forma independiente. La raíz representa el ancestro común de todos los objetos en cuestión. Los bordes de un árbol filogenético se llaman "ramas".
La idea de un "árbol" apareció en las primeras visiones de la vida como un proceso de desarrollo de formas simples a formas complejas. Los biólogos evolutivos modernos continúan usando árboles para ilustrar la evolución, ya que muestran claramente las relaciones entre los organismos vivos.
Un árbol con raíz es un árbol que contiene un vértice seleccionado: la raíz. Un árbol enraizado puede considerarse un gráfico dirigido, ya que tiene una orientación natural, desde la raíz hasta las hojas. Cada nodo de un árbol enraizado corresponde al último ancestro común de las hojas subyacentes del árbol. La ilustración muestra un árbol filogenético enraizado, coloreado de acuerdo con el sistema de tres dominios de los organismos vivos [2] .
Un árbol sin raíz no contiene raíz y refleja una relación de hojas sin la supuesta posición de un ancestro común. La necesidad de considerar árboles sin raíces surge del hecho de que a menudo es más fácil restaurar los vínculos entre los nodos que la dirección de la evolución. La ilustración muestra un árbol filogenético sin raíz [3] . El método más confiable para convertir un árbol sin raíz en un árbol con raíz (para esto, uno debe declarar uno de los nodos como la raíz o dividir una de las ramas en dos que salen de la raíz) es usar un "grupo externo" de especies: lo suficientemente cerca del conjunto de especies de interés para nosotros (para restaurar de manera confiable la topología del árbol para el conjunto combinado de especies), pero al mismo tiempo, obviamente es un grupo separado. A veces, la posición de la raíz se puede adivinar en función de algún conocimiento adicional sobre la naturaleza de los objetos que se estudian (especies, proteínas, etc.)
Un árbol filogenético enraizado y no enraizado puede ser bifurcado o no bifurcado , así como etiquetado o no etiquetado . En un árbol de bifurcación, exactamente tres ramas se acercan a cada nodo (en el caso de un árbol enraizado, una rama entrante y dos salientes). Así, el árbol de bifurcación asume que todos los eventos evolutivos consistieron en el origen de exactamente dos descendientes del objeto ancestral. Cuatro o más ramas pueden acercarse a un nodo de un árbol sin bifurcación. Un árbol etiquetado contiene los nombres de las hojas, mientras que un árbol sin etiqueta simplemente refleja la topología.
Dendrograma es un término general para una representación esquemática de un árbol filogenético.
Un cladograma es un árbol filogenético que no contiene información sobre la longitud de las ramas.
Filograma (o fenograma ): un árbol filogenético que contiene información sobre la longitud de las ramas; estas longitudes representan un cambio en alguna característica, como el número de mutaciones en un gen.
Un cronograma es un filograma cuyas ramas representan el tiempo evolutivo.
En los tiempos modernos, los árboles filogenéticos generalmente se reconstruyen a partir de secuencias de proteínas o ácidos nucleicos ( ADN o ARN ) (ver filogenética molecular ). Los árboles se construyen a partir de un número arbitrario de secuencias de entrada utilizando algoritmos computacionales (filogenéticos) especiales. La medida más confiable de la correspondencia de un conjunto dado de secuencias ( alineadas ) con una topología de árbol dada es una medida (criterio) basada en el principio de máxima verosimilitud . El principio de Bayes también se usa a menudo , aunque su aplicabilidad es discutible [4] . Los criterios probabilísticos (máxima verosimilitud y bayesianos) requieren mucho tiempo de computadora para su cálculo. Otros criterios, la llamada " parsimonia máxima ", así como varios criterios basados en el cálculo preliminar de distancias entre secuencias de entrada, se calculan más rápido. Hay resultados [5] que muestran que algunos criterios basados en el cálculo de la distancia no solo son más rápidos de calcular, sino también más fiables que los criterios basados en la máxima verosimilitud.
Para cualquier criterio, surge el problema de encontrar el árbol óptimo (para una medida dada). El tiempo de solución exacto para este problema crece factorialmente (¡mucho más rápido que exponencialmente!) con un aumento en el número de secuencias de entrada, por lo que se utilizan métodos heurísticos de búsqueda y optimización para encontrar un árbol que satisfaga suficientemente los datos de entrada . Además, son populares algoritmos como el método de unión de vecinos , que no utilizan la enumeración de topologías ni el cálculo de ningún criterio, sino que construyen inmediatamente un árbol que, con datos de entrada de buena calidad, es bastante fiable.
Los métodos de construcción de árboles se pueden evaluar de acuerdo con varios indicadores principales [6] :
Además, los métodos se pueden dividir en los que asumen y los que no asumen la validez de la hipótesis del " reloj molecular " (es decir, la misma tasa de cambio para todas las secuencias ancestrales, ver teoría neutral de la evolución molecular ). El primer grupo de métodos construye árboles enraizados, el segundo, por regla general, no enraizados. La mayoría de las veces, no hay una buena razón para suponer un "reloj molecular" y, por lo tanto, la mayoría de los programas informáticos para el análisis filogenético producen árboles sin raíces de forma predeterminada.
Los métodos de reconstrucción del árbol filogenético no solo los utilizan los biólogos, sino también los matemáticos e incluso los filólogos [7] . Los árboles se pueden construir utilizando la teoría T [8] .
Entre los paquetes gratuitos de análisis filogenético, se destaca PHYLIP con un gran conjunto de algoritmos implementados , entre los pagos, PAUP . El paquete SeaView , por un lado, es cómodo y fácil de usar, y por otro lado, tiene la funcionalidad suficiente para preparar una publicación científica. Los programas más utilizados para editar y visualizar árboles terminados son FigTree , Archaeopterix , iTOL , MEGA ; este último también incluye la implementación de algoritmos básicos de reconstrucción de árboles basados en secuencias biológicas alineadas. El programa UGENE está disponible en ruso , se distribuye bajo una licencia gratuita e incluye la construcción y visualización de árboles.
Aunque los árboles filogenéticos basados en secuencias de genes o el genoma completo de individuos de varias especies pueden proporcionar información sobre la evolución, tienen serias limitaciones. Los árboles filogenéticos no dan necesariamente (y probablemente nunca) una descripción completa y absolutamente correcta de la historia evolutiva. Los datos en los que se basa la reconstrucción del árbol siempre reflejan la historia evolutiva real con algún margen de error. Debido a esto, un árbol construido a partir de datos limitados (por ejemplo, la secuencia de un solo gen o proteína ) requiere escepticismo, porque un árbol construido a partir de otra fuente independiente de datos a menudo diferirá del primero.
La transferencia horizontal de genes , así como la hibridación entre especies, dificulta el uso de árboles para describir la evolución. En los casos en que tales eventos evolutivos hayan jugado un papel importante en la evolución del grupo en estudio, se propone utilizar métodos de descripción más complejos, como las redes filogenéticas .
Por regla general, la reconstrucción de un árbol filogenético es una evaluación de la filogenia de las características (por ejemplo, la historia evolutiva de cualquier gen en particular), y no la filogenia de los organismos de los que se seleccionaron estas características, aunque idealmente ambas filogenias deberían estar cerca el uno del otro.
También se debe ser escéptico sobre la inclusión en el árbol de especies extintas cuya información se basa total o parcialmente en secuencias de ADN. Aunque pequeños fragmentos de "ADN antiguo" persisten durante más de 100.000 años, excepto en algunos casos especiales, la longitud de dichos fragmentos es insuficiente para su uso en el análisis filogenético.
En algunos organismos, los endosimbiontes pueden tener una historia evolutiva diferente a la del huésped.
Biología evolucionaria | |
---|---|
procesos evolutivos | |
Factores de evolución | |
genética de poblaciones | |
Origen de la vida | |
Conceptos históricos | |
teorías modernas | |
Evolución de los taxones | |