Download presentation
Presentation is loading. Please wait.
1
Podobnosť fylogenetických stromov
Jana Lukešová
2
O čom to bude fylogenetické stromy metódy fylogenetickej analýzy
tvorba fylogenetických stromov porovnávanie fylogenetických stromov
3
Základné pojmy Fylogenéza Fylogenetická analýza Fylogenetický strom
vývoj druhov v evolučnom procese (vzťahy) Fylogenetická analýza hľadá vzťahy medzi sekvenciami génov, proteínov Fylogenetický strom zobrazuje výsledky fylogenetickej analýzy, možný priebeh evolúcie
4
Z biológie Proteín (bielkovina) Gén Genóm
organická zlúčenina zložená z aminokyselín Gén pomenovaný úsek DNA so špecifickou funkciou kóduje bielkovinu Genóm kompletná genetická informácia
6
Evolúcia Gény Mutácie frekvencia génu/alely
polymorfné -> alely frekvencia génu/alely mení sa v priebehu evolúcie v dôsledku prirodzeného výberu Mutácie pozitívne / negatívne / neutrálne somatické / zárodočné
7
Fylogenetické stromy oblasť analýzy Systému
popisuje vzťahy medzi taxónmi (systematická jednotka) najlepší prostriedok na vizuálnu reprezentáciu evolučných vzťahov medzi organizmami
8
Fylogenetické stromy-pojmy
Vetva - vzťah medzi taxónmi (predok-potomok) Dĺžka vetvy – počet zmien v rámci danej vetvy Uzol – vyhynutý alebo žijúci druh Clade (klád) – skupina dvoch alebo viac taxónov / sekvencií proteínov / sekvencií DNA Vzdialenosť – počet zmien medzi organizmami / sekvenciami Topológia – usporiadanie vetiev
9
Fylogenetické stromy - typy
škálované počet evolučných zmien, čas (molekulárne hodiny)
10
Fylogenetické stromy - typy
neškálované nezohľadňujú počet evolučných zmien, udávajú len “dátum“, kedy vznikla daná vetva / taxón
11
Fylogenetické stromy - typy
bez roota
12
Fylogenetická analýza
Genómy sa menili mutáciami. Počet zmien nukleotidov medzi genómami rôznych organizmov môže udávať vývoj rozdielov v čase. (timing of genome divergence) Porovnávaním rôznych genómov môžeme odhaliť evolučné vzťahy.
13
Fylogenetická analýza - predpoklady
Sekvencie neobsahujú chyby pochádzajú od známeho zdroja sú homologické (spoločný predok, rôzna funkcia) každá sekvencia má spoločnú fylogentickú históriu s ostatnými
14
Hypotéza molekulárnych hodín
zmeny v sekvenciách sa objavujú v pravidelných intervaloch intervaly sú u rôznych druhov a génov rozdielne kalibrujú sa pomocou fosílií, aby sa určila doba vzniku kládu
15
Fylogenetická analýza - metódy
Maximálna parsimónia strom s najmenším možným počtom evolučných zmien Metódy založené na vzdialenostiach Bayesovský prístup Metóda maximálnej pravdepodobnosti (Maximum likelihood) najpravdepopodobnejší priebeh evolúcie
16
Fylogenetická analýza -kroky
Zarovnanie - Multiple Sequence Alignment (MSA) Určiť substitučný model Postavenie stromu Ohodnotenie stromu
17
MSA
18
MSA – metódy výpočtu Dynamické programovanie Heuristiky
Iteratívne metódy Hidden Markove modely (pravdepodobnostná metóda) Genetické algoritmy
19
Maximálna parsimónia strom s najmenším možným počtom evolučných zmien
vyžaduje MSA vhodná pre malý počet podobných sekvencií náročné na výpočet aj čas software: PHYLIP, PAUP
20
Metóda maximálnej pravdepodobnosti (ML)
používa pravdepodobnostné metódy skúša všetky možné stromy (topológia, dĺžka vetiev) časovo náročná vyžaduje substitučný model umožňuje zohľadniť viac evolučných ukazovateľov v rodokmeňoch
21
Metódy založené na vzdialenostiach
používa počet zmien v každom páre sekvencií “susedné“ sekvencie predstavujú najmenší počet zmien Metódy Fitch and Margoliash UPGMA (Unweighted Pair Group Method With Arithmetic Mean)
22
Matica vzdialeností
23
Metóda Fitch and Margoliash
Porovnáva “najbližšie“ taxóny s priemerom ostatných taxónov, potom počíta hodnoty medzi menej príbuznými taxónmi, až kým nenájde všetky vzdialenosti. Neberie v úvahu molekulárne hodiny, výsledkom sú rôzne dĺžky vetiev.
24
Konštrukcia stromu(1) Nakreslíme tri možné usporiadania nezakoreneného stromu
25
Konštrukcia stromu(2) Na základe najmenej vzdialených sekvencií v tabuľke vyberieme najpravdepodob-nejšie usporiadanie stromu
26
Konštrukcia stromu(3) Označíme vetvy stromu
27
Konštrukcia stromu(4) – výpočet vzdialeností
d(O,P)= o + p = 12 d(O,avgMN)= o + [q + (m + n)/2] = 27.5 d(P,avgMN)= p + [q + (m + n)/2] = 29.5 odpočítame d(O,avgMN) od d(P,avgMN):
28
Konštrukcia stromu(4) – výpočet vzdialeností
{p + [q + (m + n)/2]} - {o + [q + (m + n)/2]} = p -o = = 2 p = o + 2 d(O,P)= o + p = 12 o + (o + 2) = 12 2o = 10 o = 5 Teda máme o = 5, p = o+2 = 7 To isté pre M a N, dostaneme m = 6, n = 9.
29
Konštrukcia stromu(4) – výpočet vzdialeností
Máme o=5, p=7, m=6, n=9, chceme q. Dosadíme do jednej z rovníc: d(P,avgMN)= p + [q + (m + n)/2] = 29.5 d(P,avgMN)= 7 + [q + 15/2] = 29.5 q = 22.5 q = 15
30
Metóda UPGMA(1) Predpokladá, že
rýchlosť zmien je konštantná (Hypotéza molekulárnych hodín) a vzdialenosti spĺňajú podmienku: d(x, z) ≤ max{d(x, y), d(y, z)} (silná trojuholníková alebo ultrametrická nerovnosť).
31
Metóda UPGMA(2) o + p = 12 o = p= 12/2 = 6 m + n = 15
Vypočítame priemernú vzdialenosť q od všetkých sekvencií: (MO + MP + NO + NP)/4 = ( )/4 = 28.5 q = 14.25 q1 = 6.75 q = 14.25 q2 = 8.25 Therefore, q = q1 + q2 = 15
32
Metóda UPGMA(3)
33
Ďalšie metódy tvorby stromov
Presné metódy Vyčerpávajúce hľadanie (exhaustive search, implicit enumeration) Branch-and-bound (ohraničovanie vetiev) Heuristické algoritmy Pridávanie po krokoch Približné metódy, ktoré však nezaručujú nájdenie najkratšieho stromu Úpravy počiatočných stromov Výmena vetiev (branch swapping)
34
Vyčerpávajúce hľadanie (1)
35
Vyčerpávajúce hľadanie (2)
Má zmysel cca do 11 taxónov
36
Vyčerpávajúce hľadanie (3)
37
Branch-and-bound (ohraničovanie vetiev)
heuristickou metódou sa nájde suboptimálny strom, ktorý slúži ako východiskové kritérium pri počte taxónov do 25
38
Heuristické algoritmy – Pridávanie po krokoch
B C Najprv sa spoja tri objekty Potom sa náhodne vyberie štvrtý a postupne sa pridáva k trom existujúcim vetvám Jednotlivé stromy sa posudzujú podľa optimalizačného kritéria a jeden alebo viaceré najkratšie sa ponechajú do ďalšieho kola, kde sa pridáva piaty objekt, atď.
39
Výmena vetiev(1) Výmena susedných objektov (nearest neighbour interchange - NNI)
40
Výmena vetiev(2) Prerezávanie vetiev (podstromov) a vrúbľovanie (roubování) – subtree pruning and regrafting (SPR)
41
Výmena vetiev(3) Delenie a znovuspájanie stromov – tree bisection and reconnection (TBR)
42
Porovnávanie fylogen. stromov – pojmy (1)
Konsenzuálny strom (consensus tree) zobrazuje mieru zhodnosti stromov väčšinové stromy (majority-rule) striktné stromy (strict consensus)
43
Porovnávanie fylogen. stromov – pojmy (2)
Agreement subtree podstrom rovnaký pre 2 a viac stromov Greatest Agreement subtree (GAS) AS s najväčším počtom listov
44
Porovnávanie fylogen. stromov – pojmy (3)
Triplet podstrom o troch listoch štruktúra zakoreneného stromu sa dá vyjadriť výčtom tripletov
45
Porovnávanie fylogen. stromov – pojmy (4)
Triplety – využitie môže slúžiť ako báza na výpočet rozdielu medzi zakorenenými stromami rozdiel štruktúry stromov je počet rozdielnych tripletov Structural triplet difference(Tree1, Tree2) = 2
46
Porovnávanie fylogen. stromov – pojmy (4)
Výmena susedných objektov (nearest neighbour interchange - NNI) používa sa pre výpočet rozdielu medzi nezakorenenými stromami, dá sa previesť na zakorenené stromy NNI difference je minimálny počet zmien potrebných na prevedenie jedného stromu na strom druhý
47
Porovnávanie fylogen. stromov – pojmy (5)
Najbližší sused vetvy Dog je Bat a Cow Najbližší sused vetvy Ant je vetva Dog a vetva predka Bat/Cow Po 1 NNI kroku dostaneme aj strom rovnaký s Tree 2, teda NNI difference = 1
48
Porovnávanie fylogen. stromov - predpoklad
Strom z neusporiadanými vetvami môže byť nakreslený s vetvami v rôznom poradí (vo fylogenetických stromoch to ale nevadí, dôležitá je štruktúra). To je výhodné na zobrazovanie spoločných a rozdielnych častí. Cieľom je nájsť také usporiadanie, aby taxóny dvoch stromov boli face-to-face.
49
Porovnávanie fylogen. stromov - metódy
Minimum Triplet Difference (MTD) využíva Triplet difference Maximum Branch Similarity (MBS) All-But-n využíva GAS
50
MTD(1) – vzory Tripletov
Keď ohodnotíme listy hodnotami (–,0,+) dostaneme 12 vzorov Tripletov. Triplet difference je počet tripletov, ktoré majú rôzne tripletové vzory medzi dvomi stromami.
51
MTD(2) Tripplet difference je 3
52
MTD(3) MTD algoritmus hľadá usporiadanie vetiev, ktoré minimalizuje triplet difference. Ak je takých usporiadaní viac, tak vyberieme ľubovolné
53
MTD(4) - výsledok Jedno z možných vyhovujúcich usporiadaní
55
Zdroje www.wikipedia.org http://www.bioinformaticsonline.org
Wan Nazmee Wan Zainon & Paul Calder:Visualising Phylogenetic Trees
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.