Presentation is loading. Please wait.

Presentation is loading. Please wait.

Podobnosť fylogenetických stromov

Similar presentations


Presentation on theme: "Podobnosť fylogenetických stromov"— Presentation transcript:

1 Podobnosť fylogenetických stromov
Jana Lukešová

2 O čom to bude fylogenetické stromy metódy fylogenetickej analýzy
tvorba fylogenetických stromov porovnávanie fylogenetických stromov

3 Základné pojmy Fylogenéza Fylogenetická analýza Fylogenetický strom
vývoj druhov v evolučnom procese (vzťahy) Fylogenetická analýza hľadá vzťahy medzi sekvenciami génov, proteínov Fylogenetický strom zobrazuje výsledky fylogenetickej analýzy, možný priebeh evolúcie

4 Z biológie Proteín (bielkovina) Gén Genóm
organická zlúčenina zložená z aminokyselín Gén pomenovaný úsek DNA so špecifickou funkciou kóduje bielkovinu Genóm kompletná genetická informácia

5

6 Evolúcia Gény Mutácie frekvencia génu/alely
polymorfné -> alely frekvencia génu/alely mení sa v priebehu evolúcie v dôsledku prirodzeného výberu Mutácie pozitívne / negatívne / neutrálne somatické / zárodočné

7 Fylogenetické stromy oblasť analýzy Systému
popisuje vzťahy medzi taxónmi (systematická jednotka) najlepší prostriedok na vizuálnu reprezentáciu evolučných vzťahov medzi organizmami

8 Fylogenetické stromy-pojmy
Vetva - vzťah medzi taxónmi (predok-potomok) Dĺžka vetvy – počet zmien v rámci danej vetvy Uzol – vyhynutý alebo žijúci druh Clade (klád) – skupina dvoch alebo viac taxónov / sekvencií proteínov / sekvencií DNA Vzdialenosť – počet zmien medzi organizmami / sekvenciami Topológia – usporiadanie vetiev

9 Fylogenetické stromy - typy
škálované počet evolučných zmien, čas (molekulárne hodiny)

10 Fylogenetické stromy - typy
neškálované nezohľadňujú počet evolučných zmien, udávajú len “dátum“, kedy vznikla daná vetva / taxón

11 Fylogenetické stromy - typy
bez roota

12 Fylogenetická analýza
Genómy sa menili mutáciami. Počet zmien nukleotidov medzi genómami rôznych organizmov môže udávať vývoj rozdielov v čase. (timing of genome divergence) Porovnávaním rôznych genómov môžeme odhaliť evolučné vzťahy.

13 Fylogenetická analýza - predpoklady
Sekvencie neobsahujú chyby pochádzajú od známeho zdroja sú homologické (spoločný predok, rôzna funkcia) každá sekvencia má spoločnú fylogentickú históriu s ostatnými

14 Hypotéza molekulárnych hodín
zmeny v sekvenciách sa objavujú v pravidelných intervaloch intervaly sú u rôznych druhov a génov rozdielne kalibrujú sa pomocou fosílií, aby sa určila doba vzniku kládu

15 Fylogenetická analýza - metódy
Maximálna parsimónia strom s najmenším možným počtom evolučných zmien Metódy založené na vzdialenostiach Bayesovský prístup Metóda maximálnej pravdepodobnosti (Maximum likelihood) najpravdepopodobnejší priebeh evolúcie

16 Fylogenetická analýza -kroky
Zarovnanie - Multiple Sequence Alignment (MSA) Určiť substitučný model Postavenie stromu Ohodnotenie stromu

17 MSA

18 MSA – metódy výpočtu Dynamické programovanie Heuristiky
Iteratívne metódy Hidden Markove modely (pravdepodobnostná metóda) Genetické algoritmy

19 Maximálna parsimónia strom s najmenším možným počtom evolučných zmien
vyžaduje MSA vhodná pre malý počet podobných sekvencií náročné na výpočet aj čas software: PHYLIP, PAUP

20 Metóda maximálnej pravdepodobnosti (ML)
používa pravdepodobnostné metódy skúša všetky možné stromy (topológia, dĺžka vetiev) časovo náročná vyžaduje substitučný model umožňuje zohľadniť viac evolučných ukazovateľov v rodokmeňoch

21 Metódy založené na vzdialenostiach
používa počet zmien v každom páre sekvencií “susedné“ sekvencie predstavujú najmenší počet zmien Metódy Fitch and Margoliash UPGMA (Unweighted Pair Group Method With Arithmetic Mean)

22 Matica vzdialeností

23 Metóda Fitch and Margoliash
Porovnáva “najbližšie“ taxóny s priemerom ostatných taxónov, potom počíta hodnoty medzi menej príbuznými taxónmi, až kým nenájde všetky vzdialenosti. Neberie v úvahu molekulárne hodiny, výsledkom sú rôzne dĺžky vetiev.

24 Konštrukcia stromu(1) Nakreslíme tri možné usporiadania nezakoreneného stromu

25 Konštrukcia stromu(2) Na základe najmenej vzdialených sekvencií v tabuľke vyberieme najpravdepodob-nejšie usporiadanie stromu

26 Konštrukcia stromu(3) Označíme vetvy stromu

27 Konštrukcia stromu(4) – výpočet vzdialeností
d(O,P)= o + p = 12 d(O,avgMN)= o + [q + (m + n)/2] = 27.5 d(P,avgMN)= p + [q + (m + n)/2] = 29.5 odpočítame d(O,avgMN) od d(P,avgMN):

28 Konštrukcia stromu(4) – výpočet vzdialeností
{p + [q + (m + n)/2]} - {o + [q + (m + n)/2]} = p -o = = 2 p = o + 2 d(O,P)= o + p = 12 o + (o + 2) = 12 2o = 10 o = 5 Teda máme o = 5, p = o+2 = 7 To isté pre M a N, dostaneme m = 6, n = 9.

29 Konštrukcia stromu(4) – výpočet vzdialeností
Máme o=5, p=7, m=6, n=9, chceme q. Dosadíme do jednej z rovníc: d(P,avgMN)= p + [q + (m + n)/2] = 29.5 d(P,avgMN)= 7 + [q + 15/2] = 29.5 q = 22.5 q = 15

30 Metóda UPGMA(1) Predpokladá, že
rýchlosť zmien je konštantná (Hypotéza molekulárnych hodín) a vzdialenosti spĺňajú podmienku: d(x, z) ≤ max{d(x, y), d(y, z)} (silná trojuholníková alebo ultrametrická nerovnosť).

31 Metóda UPGMA(2) o + p = 12 o = p= 12/2 = 6 m + n = 15
Vypočítame priemernú vzdialenosť q od všetkých sekvencií: (MO + MP + NO + NP)/4 = ( )/4 = 28.5 q = 14.25 q1 = 6.75 q = 14.25 q2 = 8.25 Therefore, q = q1 + q2 = 15

32 Metóda UPGMA(3)

33 Ďalšie metódy tvorby stromov
Presné metódy Vyčerpávajúce hľadanie (exhaustive search, implicit enumeration) Branch-and-bound (ohraničovanie vetiev) Heuristické algoritmy Pridávanie po krokoch Približné metódy, ktoré však nezaručujú nájdenie najkratšieho stromu Úpravy počiatočných stromov Výmena vetiev (branch swapping)

34 Vyčerpávajúce hľadanie (1)

35 Vyčerpávajúce hľadanie (2)
Má zmysel cca do 11 taxónov

36 Vyčerpávajúce hľadanie (3)

37 Branch-and-bound (ohraničovanie vetiev)
heuristickou metódou sa nájde suboptimálny strom, ktorý slúži ako východiskové kritérium pri počte taxónov do 25

38 Heuristické algoritmy – Pridávanie po krokoch
B C Najprv sa spoja tri objekty Potom sa náhodne vyberie štvrtý a postupne sa pridáva k trom existujúcim vetvám Jednotlivé stromy sa posudzujú podľa optimalizačného kritéria a jeden alebo viaceré najkratšie sa ponechajú do ďalšieho kola, kde sa pridáva piaty objekt, atď.

39 Výmena vetiev(1) Výmena susedných objektov (nearest neighbour interchange - NNI)

40 Výmena vetiev(2) Prerezávanie vetiev (podstromov) a vrúbľovanie (roubování) – subtree pruning and regrafting (SPR)

41 Výmena vetiev(3) Delenie a znovuspájanie stromov – tree bisection and reconnection (TBR)

42 Porovnávanie fylogen. stromov – pojmy (1)
Konsenzuálny strom (consensus tree) zobrazuje mieru zhodnosti stromov väčšinové stromy (majority-rule) striktné stromy (strict consensus)

43 Porovnávanie fylogen. stromov – pojmy (2)
Agreement subtree podstrom rovnaký pre 2 a viac stromov Greatest Agreement subtree (GAS) AS s najväčším počtom listov

44 Porovnávanie fylogen. stromov – pojmy (3)
Triplet podstrom o troch listoch štruktúra zakoreneného stromu sa dá vyjadriť výčtom tripletov

45 Porovnávanie fylogen. stromov – pojmy (4)
Triplety – využitie môže slúžiť ako báza na výpočet rozdielu medzi zakorenenými stromami rozdiel štruktúry stromov je počet rozdielnych tripletov Structural triplet difference(Tree1, Tree2) = 2

46 Porovnávanie fylogen. stromov – pojmy (4)
Výmena susedných objektov (nearest neighbour interchange - NNI) používa sa pre výpočet rozdielu medzi nezakorenenými stromami, dá sa previesť na zakorenené stromy NNI difference je minimálny počet zmien potrebných na prevedenie jedného stromu na strom druhý

47 Porovnávanie fylogen. stromov – pojmy (5)
Najbližší sused vetvy Dog je Bat a Cow Najbližší sused vetvy Ant je vetva Dog a vetva predka Bat/Cow Po 1 NNI kroku dostaneme aj strom rovnaký s Tree 2, teda NNI difference = 1

48 Porovnávanie fylogen. stromov - predpoklad
Strom z neusporiadanými vetvami môže byť nakreslený s vetvami v rôznom poradí (vo fylogenetických stromoch to ale nevadí, dôležitá je štruktúra). To je výhodné na zobrazovanie spoločných a rozdielnych častí. Cieľom je nájsť také usporiadanie, aby taxóny dvoch stromov boli face-to-face.

49 Porovnávanie fylogen. stromov - metódy
Minimum Triplet Difference (MTD) využíva Triplet difference Maximum Branch Similarity (MBS) All-But-n využíva GAS

50 MTD(1) – vzory Tripletov
Keď ohodnotíme listy hodnotami (–,0,+) dostaneme 12 vzorov Tripletov. Triplet difference je počet tripletov, ktoré majú rôzne tripletové vzory medzi dvomi stromami.

51 MTD(2) Tripplet difference je 3

52 MTD(3) MTD algoritmus hľadá usporiadanie vetiev, ktoré minimalizuje triplet difference. Ak je takých usporiadaní viac, tak vyberieme ľubovolné

53 MTD(4) - výsledok Jedno z možných vyhovujúcich usporiadaní

54

55 Zdroje www.wikipedia.org http://www.bioinformaticsonline.org
Wan Nazmee Wan Zainon & Paul Calder:Visualising Phylogenetic Trees


Download ppt "Podobnosť fylogenetických stromov"

Similar presentations


Ads by Google