Zweige der Biologie

Evolution - Evolutionsbäume

Evolutionsbäume

Evolutionsbäume sind Modelle, die versuchen, die Evolutionsgeschichte von Taxa zu rekonstruieren, dh Arten oder andere Gruppen von Organismen wie Gattungen, Familien oder Ordnungen. Die Bäume umfassen zwei Arten von Informationen im Zusammenhang mit evolutionären Veränderungen: Cladogenese und Anagenese. Die Abbildung kann zur Veranschaulichung beider Arten verwendet werden. Die Verzweigungsbeziehungen der Bäume spiegeln die relativen Beziehungen der Abstammung oder der Cladogenese wider. Auf der rechten Seite der Figur sind also Menschen und Rhesusaffen enger miteinander verwandt als beide mit dem Pferd . Anders ausgedrückt zeigt dieser Baum, dass der letzte gemeinsame Vorfahr aller drei Arten in einer weiter entfernten Vergangenheit lebte als der letzte gemeinsame Vorfahr von Menschen und Affen.

Evolutionsbäume können auch die Veränderungen anzeigen, die entlang jeder Linie oder Anagenese aufgetreten sind. So änderte sich in der Entwicklung von Cytochrom c seit dem letzten gemeinsamen Vorfahren von Menschen und Rhesusaffen (wieder die rechte Seite der Figur) eine Aminosäure in der Linie, die zu Menschen geht, aber keine in der Linie, die zu Rhesusaffen geht. In ähnlicher Weise zeigt die linke Seite der Figur, dass drei Aminosäureveränderungen in der Linie von B nach C auftraten, aber nur eine in der Linie von B nach D.

Es gibt verschiedene Methoden zur Konstruktion von Evolutionsbäumen. Einige wurden zur Interpretation morphologischer Daten entwickelt, andere zur Interpretation molekularer Daten; Einige können mit beiden Arten von Daten verwendet werden. Die derzeit verwendeten Hauptmethoden heißen Distanz, Sparsamkeit und maximale Wahrscheinlichkeit.

Distanzmethoden

Eine "Entfernung" ist die Anzahl der Unterschiede zwischen zwei Taxa . Die Unterschiede werden in Bezug auf bestimmte Merkmale (dh morphologische Daten) oder bestimmte Makromoleküle (hauptsächlich die Sequenz von Aminosäuren in Proteinen oder die Sequenz von Nukleotiden in DNA oder RNA) gemessen. Die zwei in der Figur dargestellten Bäume wurden erhalten, indem der Abstand oder die Anzahl der Aminosäureunterschiede zwischen drei Organismen in Bezug auf ein bestimmtes Protein berücksichtigt wurde . Die Aminosäuresequenz eines Proteins enthält mehr Informationen als sich in der Anzahl der Aminosäureunterschiede widerspiegelt. Dies liegt daran, dass in einigen Fällen der Ersatz einer Aminosäure durch eine andere nicht mehr als ein Nukleotid erfordert Substitution in der DNA, die für das Protein kodiert, während in anderen Fällen mindestens zwei Nukleotidwechsel erforderlich sind.

Die in der Abbildung gezeigten Beziehungen zwischen Arten stimmen ziemlich gut mit den Beziehungen überein, die aus anderen Quellen wie dem Fossilienbestand ermittelt wurden . Laut der Abbildung sind Hühner weniger eng mit Enten und Tauben verwandt als mit Pinguinen, und Menschen und Affen unterschieden sich von den anderen Säugetieren, bevor sich das Beuteltierkänguru von den nicht-primitiven Plazentalen trennte. Obwohl bekannt ist, dass diese Beispiele fehlerhafte Beziehungen sind, zeigt sich die Leistungsfähigkeit der Methode darin, dass ein einzelnes Protein eine ziemlich genaue Rekonstruktion der Evolutionsgeschichte von 20 Organismen liefert, die vor mehr als einer Milliarde Jahren zu divergieren begannen.

Morphologische Daten können auch zur Erstellung von Distanzbäumen verwendet werden. Der erste Schritt besteht darin, a zu erhaltenEntfernungsmatrix basierend auf einer Reihe von morphologischen Vergleichen zwischen Arten oder anderen Taxa. Zum Beispiel kann man bei einigen Insekten die Körperlänge, Flügellänge, Flügelbreite, Anzahl und Länge der Flügelvenen oder ein anderes Merkmal messen . Das gebräuchlichste Verfahren zur Umwandlung einer Distanzmatrix in eine Phylogenie heißtClusteranalyse . Die Distanzmatrix wird nach dem kleinsten Distanzelement durchsucht, und die beiden beteiligten Taxa (z. B. A und B) werden an einem internen Knoten oder Verzweigungspunkt verbunden. Die Matrix wird erneut auf die nächstkleinere Entfernung gescannt, und die beiden neuen Taxa (z. B. C und D) werden gruppiert. Das Verfahren wird fortgesetzt, bis alle Taxa zusammengefügt wurden. Wenn eine Entfernung ein Taxon umfasst, das bereits Teil eines vorherigen Clusters ist (z. B. E und A), wird die durchschnittliche Entfernung zwischen dem neuen Taxon und dem bereits vorhandenen Cluster ermittelt (z. B. die durchschnittliche Entfernung zwischen E zu A und E zu B). . Dieses einfache Verfahren, das auch mit molekularen Daten verwendet werden kann, setzt voraus, dass die Evolutionsrate über alle Zweige hinweg gleichmäßig ist.

Andere Distanzmethoden (einschließlich derjenigen, die zur Konstruktion des Baums in der Abbildung der Phylogenie mit 20 Organismen verwendet wurden) lockern den Zustand einer gleichmäßigen Geschwindigkeit und ermöglichen ungleiche Evolutionsraten entlang der Zweige. Eine der am häufigsten verwendeten Methoden dieser Art heißtNachbarn beitreten. Die Methode beginnt nach wie vor damit, den kleinsten Abstand in der Matrix zu identifizieren und die beiden beteiligten Taxa zu verknüpfen. Der nächste Schritt besteht darin, diese beiden Taxa zu entfernen und eine neue Matrix zu berechnen, in der ihre Abstände zu anderen Taxa durch den Abstand zwischen dem Knoten, der die beiden Taxa verbindet, und allen anderen Taxa ersetzt werden. Der kleinste Abstand in dieser neuen Matrix wird zum Herstellen der nächsten Verbindung verwendet, die zwischen zwei anderen Taxa oder zwischen dem vorherigen Knoten und einem neuen Taxon besteht. Der Vorgang wird wiederholt, bis alle Taxa durch dazwischenliegende Knoten miteinander verbunden sind.

Maximale Sparsamkeitsmethoden

Maximale Sparsamkeitsmethoden versuchen, den Baum zu rekonstruieren, der die geringste (dh sparsamste) Anzahl von Änderungen erfordert, die entlang aller Zweige summiert werden. Dies ist eine vernünftige Annahme, da dies normalerweise am wahrscheinlichsten ist. Die Evolution muss jedoch nicht unbedingt auf einem minimalen Pfad stattgefunden haben, da dieselbe Änderung stattdessen unabhängig voneinander entlang verschiedener Zweige aufgetreten sein kann und einige Änderungen möglicherweise Zwischenschritte beinhalteten. Betrachten Sie drei Arten - C, D und E. Wenn sich C und D in einem bestimmten Protein um zwei Aminosäuren unterscheiden und sich eine um drei Aminosäuren von E unterscheidet, führt Sparsamkeit zu einem Baum mit der auf der linken Seite gezeigten Struktur die FigurVeranschaulichung der beiden einfachen Phylogenien. Es kann jedoch der Fall sein, dass in einer bestimmten Position, an der C und D beide Aminosäure g haben, während E h hat, die angestammte Aminosäure g war. Aminosäure g änderte sich nicht in der Linie nach C, sondern in h in einer Linie, die zum Vorfahren von D und E ging, und änderte sich dann wieder zurück zu g in der Linie nach D. Die korrekte Phylogenie würde dann von führen der gemeinsame Vorfahr aller drei Arten zu C in einem Zweig (in dem keine Aminosäureveränderungen auftraten) und zum letzten gemeinsamen Vorfahren von D und E in dem anderen Zweig (in dem g zu h geändert wurde) mit einer zusätzlichen Änderung (von h bis g) in der Linie von diesem Vorfahren zu E. auftreten.

Not all evolutionary changes, even those that involve a single step, may be equally probable. For example, among the four nucleotide bases in DNA, cytosine (C) and thymine (T) are members of a family of related molecules called pyrimidines; likewise, adenine (A) and guanine (G) belong to a family of molecules called purines. A change within a DNA sequence from one pyrimidine to another (C ⇌ T) or from one purine to another (A ⇌ G), called a transition, is more likely to occur than a change from a purine to a pyrimidine or the converse (G or A ⇌ C or T), called a transversion. Parsimony methods take into account different probabilities of occurrence if they are known.

Maximum parsimony methods are related to cladistics, a very formalistic theory of taxonomic classification, extensively used with morphological and paleontological data. The critical feature in cladistics is the identification of derived shared traits, called synapomorphic traits. A synapomorphic trait is shared by some taxa but not others because the former inherited it from a common ancestor that acquired the trait after its lineage separated from the lineages going to the other taxa. In the evolution of carnivores, for example, domestic cats, tigers, and leopards are clustered together because of their possessing retractable claws, a trait acquired after their common ancestor branched off from the lineage leading to the dogs, wolves, and coyotes. It is important to ascertain that the shared traits are homologous rather than analogous. Zum Beispiel haben Säugetiere und Vögel, aber keine Eidechsen, ein Herz mit vier Kammern. Vögel sind jedoch enger mit Eidechsen verwandt als mit Säugetieren. Das Vierkammerherz entwickelte sich unabhängig voneinander in der Vogel- und Säugetierlinie durch parallele Evolution .

Maximum-Likelihood-Methoden

Maximum likelihood methods seek to identify the most likely tree, given the available data. They require that an evolutionary model be identified, which would make it possible to estimate the probability of each possible individual change. For example, as is mentioned in the preceding section, transitions are more likely than transversions among DNA nucleotides, but a particular probability must be assigned to each. All possible trees are considered. The probabilities for each individual change are multiplied for each tree. The best tree is the one with the highest probability (or maximum likelihood) among all possible trees.

Maximum likelihood methods are computationally expensive when the number of taxa is large, because the number of possible trees (for each of which the probability must be calculated) grows factorially with the number of taxa. With 10 taxa, there are about 3.6 million possible trees; with 20 taxa, the number of possible trees is about 2 followed by 18 zeros (2 × 1018). Even with powerful computers, maximum likelihood methods can be prohibitive if the number of taxa is large. Heuristic methods exist in which only a subsample of all possible trees is examined and thus an exhaustive search is avoided.

Evaluation of evolutionary trees

Der statistische Vertrauensgrad eines Baums kann für Entfernungs- und Maximum-Likelihood-Bäume geschätzt werden. Die gebräuchlichste Methode heißt Bootstrapping. Es besteht darin, Stichproben der Daten zu entnehmen, indem mindestens ein Datenpunkt zufällig entfernt und anschließend ein Baum für den neuen Datensatz erstellt wird. Dieser Stichprobenprozess wird hunderte oder tausende Male wiederholt. Der Bootstrap-Wert für jeden Knoten wird durch den Prozentsatz der Fälle definiert, in denen alle von diesem Knoten abgeleiteten Arten zusammen in den Bäumen erscheinen. Bootstrap-Werte über 90 Prozent gelten als statistisch stark zuverlässig. diejenigen unter 70 Prozent gelten als unzuverlässig.