Mitmene testimine ülegenoomsetes uuringutes

Slides:



Advertisements
Similar presentations
Intensiivravi limiteerimine Mari-Liis Ilmoja SA Tallinna Lastehaigla Pärnu, 2007.
Advertisements

KÕHURÄÄKIJA (ehk seniks, kuni seedite). Tarkvara patentimine on juba täna võimalik Peeter Marvet, kodanik.
Enquiry of Employers Oct/Nov 2007 Jüri Kiho University of Tartu Institutue of Computer Science.
Immuunsuse evolutsioonist Jüri Parik. Piirid Bakterid-restriktaasid Seened-antibiootikumid-kaitse või rünnak? Aktinomütseedid ja linnud-biotiini.
1 Käsmu 2006 Õhus on äikest ja elektrit ehk tuli meie lähitaevas
Java ja.NET Framework programmide kompileerimine masinkoodi Siim Karus.
Sissejuhatus informaatikasse loeng 13 T.Tammet TTÜ / IT Kolledzh.
Loeng 5. Maksete seeria - nüüdis- ja tulevane väärtus Natalja Viilmann, PhD.
Immuunsuse evolutsioonist Jüri Parik. Piirid Bakterid-restriktaasid Seened-antibiootikumid-kaitse või rünnak? Aktinomütseedid ja linnud-biotiini.
LIHASED Koostas Leelo Lusik Are Põhikool Lihaste ülesanded Liigutavad kehaosi Annavad kehale kuju Kaitsevad siseelundeid Lihastes on vee ja valkude.
Kasutajasõbralik avalik ruum ehk tõenduspõhine planeerimine.
BIOTEHNOLOOGIABIOTEHNOLOOGIA. Mis on biotehnoloogia? Biotehnoloogia on rakendusbioloogia haruteadus, mis kasutab organismide elutegevusel tuginevaid protsesse.
WSDL Enn Õunapuu Tallinna Tehnikaülikool
Ilmselt maailma kõige halvem esitlus Demonstratsioon, mida mitte teha luues ja kasutades PowerPointi esitlusi. NIMED: kuupäev:
Kiire automaatse nimetamise (KAN) oskus
Tuule-ja päikeseenergia kasutusvõimalused Eestis
Miks doc-formaadis fail ei ole hea?
Õpiobjekt: ÕPIME KELLA
5 asja, mida ma oleksin pidanud teadma eelmine sügis
Kombinatoorsete süsteemide disain
KEERUKUSE MATEMAATIKAST
Kombinatoorsete süsteemide disain
Maailma rahvaarv Koostaja: Ülle Liiber
Veehaldjad eesti mütoloogias
Genoomi evolutsioon /mõned küsimused
Mitmese testimise probleemist
Tarkvara kvaliteet ja standardid Harjutus 5 Jekaterina Ivask
Tarkvara kvaliteet ja standardid Harjutus 6 Jekaterina Tšukrejeva
Biomassi termokeemiline muundamine 8. Biosüsi
Tehniline analüüs Veebruar 2012 Risto Sverdlik.
Mida pidada silmas kaitsmisettekande koostamisel ja esitamisel
Summary Slide Lennundus.
Katseandmete analüüs II
TEADUSLIK UURIMISMEETOD
Üleeuroopaline töötervishoiu ja tööohutuse alane arvamusküsitlus
Liblikad ja nende vastsed
Kasutatavuse testimine
Remo Suurkivi Hansapank 26/10/2005
Katseandmete analüüs I osa
Ortoloogide ennustamine
VEENUS Aleksandr Graf YAFB51.
Süsteemid ja protsessid sinu arvutis
MSE Hajaenergeetika planeerimine
Pandeemiline (H1N1) 2009 gripp
IDU0075 Sissejuhatus veebiteenustesse
Alumiste hammaste sensoorne innervatsioon Nervus mylohyoideus’ega
Director of Math and Technology Rockingham County Public Schools
Ilmselt maailma kõige hullem esitlus
Avo Ots telekommunikatsiooni õppetool,
Mitmetasandiline lineaarne regressioon
populatsiooni substruktuur
Tehniline analüüs November 2012 Risto Sverdlik.
Ravivahetuse vajaduse prognoosimine klassifikatsioonipuu abil
Põhjuslikkus ja statistika
BizTalk Martin Maripuu Integratsiooni-arhitekt
Lapse psühhosotsiaalne areng
C keel AVR mikrokontrolleril
Kadri Vilsoo november 2007 Kohilas
NSO8055 Okeanograafiline prognoos
Läbirääkimised: vormide täitmine Participant Portal’i kaudu.
Maht: 4 L 1 H 2 KT + E Prof. A. Meister, II-401
MÕK 2015/16. õa avakonverents Andres Pajula.
We invite mankind outdoors! Me kutsume inimkonda õue!
Katseandmete analüüs II
Mänguteraapia ja selle kasutamisvõimalused
Juhuslikud sündmused populatsioonigeneetikas
Rapid antibiotic-resistance predictions from genome sequence data for Staphylococcus aureus and Mycobacterium tuberculosis ehk Mykrobe predictor Phelim.
Teekond noorest täiskasvanuks
KULDVILLAK SAAREMAA Created by Educational Technology Network
Ingrid Kokmann STOM III Tartu 2013
Presentation transcript:

Mitmene testimine ülegenoomsetes uuringutes Märt Möls

Mitmese testimise probleemist Statistilisel testil on lubatud eksida (olulisuse nivool α=0,05 võivad kuni 5% testidest anda eksliku valepositiivse tulemuse...) 100 sõltumatu arulageda testi puhul: 0,05*100=5 valepositiivset tulemust; 0,95100=0,0059 ehk tõenäosusega 0,6% ei saa me ühtegi valepositiivset tulemust.

Mitmese testimise probleem on muidugi ammu teada... Farmaatsiakompaniid kordavad kliinilisi katseid senikaua, kuni saavad statistiliselt olulise tulemuse Vaata näiteks suhteliselt hästi dokumenteeritud ravimiga Seroxat - GlaxoSmithKline – seotud juhtumit: Law, ethics and medicine: Seroxat and the suppression of clinical trial data: regulatory failure and the uses of legal ambiguity L McGoey, E Jackson J Med Ethics 2009;35:107-112 doi:10.1136/jme.2008.025361

Mitmese testimise probleem on muidugi ammu teada...

Geeniteaduses ei vii probleemi ignoreerimine kahjuks paljude artiklite ja rikkuseni... Mõõdetakse ~300 000... ~2 000 000 SNP iga inimese kohta... SNP – üksiku nukleotiidi polümorfism: ...CCCTGCCTCCCC(C/T)CCAGATGGCG... 600 000 SNP testimisel tõenäosus mitte saada valepositiivset tulemust: 1,4∙10-13366 Probleem on liiga ilmne tema ignoreerimiseks...

Klassikalised lahendused Bonferroni meetod Bonferron-Holm Sidak FDR – valeavastusmäär (fikseeritakse ülempiir valesti vastuvõetud alternatiivsete hüpoteeside osakaalule – näiteks valepositiivsete testitulemuste keskmine osakaal ei tohi olla üle 5%)

Bonferroni meetodi põhiolemus

Bonferroni meetodi põhiolemus P(“valeavastus”) ≤ 0,05/2 +0,05/2 = 0,05

Bonferroni meetodi puudused Ilmne puudus Enamasti Esialgu märkamatuks jääv puudus: Arvutused olulisuse nivool 0,05 on lihtsamad kui olulisuse nivool 0,05/10000...

Näide eksitavast rusikareeglist T-test: andmed olgu normaaljaotusega või olgu valim suur

Peaaegu normaaljaotus?

Mittetöötava rusikareegli näide: t-test, “suur valim” (n=100) kasutatud vale testitulemuse olulisuse nivoo (I liiki vea) tõenäosus 0,05 0,0504 0,0005 0,00053 0,000005 0,0000073 0,000005 (ühepoolne) 0,000011 0,000011*10000 ≠ 0,05 Bonferroni meetod võimendab üles ka kõige pisema eksimuse eeldustes suureks probleemiks.

Probleemsed võivad olla ka mitteparameetrilised testid... Kui me ei riski teha eelduseid uuritava tunnuse jaotuse kohta, siis kasutame mitteparameetrilisi teste? Wilcoxon, Kruskal-Wallis, ...? Iseenesest hea idee, aga... ... statistikatarkvara (R,SAS, ...) kasutab enamike nende testide puhul ligikaudseid meetodeid olulisustõenäosuse (p-value) arvutamiseks...

Mida siis teha? Permutatsioonitest? 1. Paiguta fenotüübi väärtused juhuslikult; 2. leia olulisustõenäosus (p-väärtus) kõigi testide ehk kõigi SNP’de jaoks; 3. leia väikseim p-väärtus kõigi testide seast; 4. korda samme 1-3 palju kordi (näiteks 10000 korda); 5. vaata, kui sageli kohtasid sind huvitavast p-väärtusest pisemaid p-väärtuseid...

Seos inimese sotsiaalsuse ja genotüübi vahel - koostöö prof J Seos inimese sotsiaalsuse ja genotüübi vahel - koostöö prof J. Alliku ja prof. M. Remmiga Teste (SNP’e): 299 280 Inimesi: 596 Parim p-väärtus: 0,00000072 Bonferroni otsus: 0,00000072 > 0,05/299280 (= 0,000000167) 299280*0,00000072 > 0,05 0,215 > 0,05 Seose olemasolu ei saa tõestada...

Bonferroni vs permutatsioonitest Bonferroni korrigeeritud p-väärtus: 299280*0,00000072 = 0,215 Permutatsioonitest, 0,17 (≈236000*0,00000072) Efektiivne testide arv: 236 000 Kirjandusest: 500 000 SNP’i -> ef. teste ~ 260 000 Piirväärtus teatud juhul (α=0,05,...) ~650 000

Kuidas edasi? SNP asemel testida piirkondade olulisust? Vaatame näiteks 100 SNP pikkuseid juppe? Esialgne hinnang: p-väärtus ~0,03 ???

Lootust on... Kahtlane piirkond on geeni KCNV2 ees ja sees... Mutatsioonid geenis KCNV2 põhjustavad veidrusi värvide tajumisel... Kes näevad kaasinimesi roosades toonides, suhtlevad nendega ka meelsamini?

Tänan!