Põhjuslikkus ja statistika

Slides:



Advertisements
Similar presentations
Kärdla School. School About 500 students About 40 teachers State school High school Primary school 12 grades.
Advertisements

Enquiry of Employers Oct/Nov 2007 Jüri Kiho University of Tartu Institutue of Computer Science.
Gert Krehov Tartu Hiie Kool
1 Käsmu 2006 Õhus on äikest ja elektrit ehk tuli meie lähitaevas
Java ja.NET Framework programmide kompileerimine masinkoodi Siim Karus.
Töötaja kohustused ja õigused Jaan Olt. Töötaja on kohustatud osalema ohutu töökeskkonna loomisel, järgides töötervishoiu ja tööohutuse nõudeid; järgima.
1 Education at a Glance 2015 Soumaya Maghnouj Estonia Release date: 24 November 2015.
BIOTEHNOLOOGIABIOTEHNOLOOGIA. Mis on biotehnoloogia? Biotehnoloogia on rakendusbioloogia haruteadus, mis kasutab organismide elutegevusel tuginevaid protsesse.
Ilmselt maailma kõige halvem esitlus Demonstratsioon, mida mitte teha luues ja kasutades PowerPointi esitlusi. NIMED: kuupäev:
HAPLOBLOKID Reedik Mägi
EDASISED TEGEVUSED Meenutades sihtide seadmist …
Seminars for auditors and financial managers/accountants
Miks doc-formaadis fail ei ole hea?
Eesti pärast eurot Tsentrifuugist magnetiks
Supporting youth in Estonian Unemployment Insurance Fund
Policy Recommendations: e-Democracy and Cyber Security
Vahelduvvool & Pooljuhid
Millised on Cherry õnnestumised ja kasvuraskused?
Õpiobjekt: ÕPIME KELLA
Veehaldjad eesti mütoloogias
Singapore Mathematical Society Association of Mathematics Educators
Fülogeneesi rekonstrueerimine
Biomassi termokeemiline muundamine 8. Biosüsi
MULD KUI VIHMAUSSI KODU. Muld  Maa väärtuslikeim ja peamine loodusvara  Muld on tekkinud kõdunenud, lagunenud, surnud taimede ja loomade jäänustest.
Innovatsioon ja tootearendus
Tehniline analüüs Veebruar 2012 Risto Sverdlik.
Funktsiooni piirväärtus
Summary Slide Lennundus.
Katseandmete analüüs II
Üleeuroopaline töötervishoiu ja tööohutuse alane arvamusküsitlus
laborid gaaslahenduse labor (plasmafüüsika labor)
Projekti elluviimise kõige toredam osa!
Ortoloogide ennustamine
Statistikaamet – infoteenuse pakkuja
ELUKESTVA ÕPPE PROGRAMM COMENIUS SEKTORPROGRAMM
REACH 2018 Korraldage tegevust oma kaasregistreerijatega –
Algatusrühma ülesehitusest
1. rühm (106): 2. rühm (134): E E (106) K K R R 14.15
Rahvusvahelised projektid perinataalmeditsiinis SA TÜK
Koostas: Kristel Mäekask
PMen Import failidest.
Keemiline side Molekulid
Kuldvillak Copyright © 2002 Glenna R. Shaw ja FTC Publishing
Esitluse või esitleja nimi.
Pandeemiline (H1N1) 2009 gripp
Alumiste hammaste sensoorne innervatsioon Nervus mylohyoideus’ega
Meetodite erinevuse hindamised
Naised ja kopsuvähk Jana Jaal onkoloogia vanemarst-õppejõud, dr. med.
Struktuurivõrrandite mudelid 8. loeng Rakendusnäiteid
Tehniline analüüs November 2012 Risto Sverdlik.
Ravivahetuse vajaduse prognoosimine klassifikatsioonipuu abil
Modaalsuse semantiline kaart ja lekseem SAAMA
BizTalk Martin Maripuu Integratsiooni-arhitekt
Väärtuste õpetamine kirjanduse kaudu (?)
Mida teeme riigi turismiturunduses, mida saaks sellest kasutada ettevõtja ja seda koos näidetega.
Lapse psühhosotsiaalne areng
Arvutisüsteemide instituut 2018
C keel AVR mikrokontrolleril
NSO8055 Okeanograafiline prognoos
Läbirääkimised: vormide täitmine Participant Portal’i kaudu.
Maht: 4 L 1 H 2 KT + E Prof. A. Meister, II-401
Esmane analüüs Kordamine.
MÕK 2015/16. õa avakonverents Andres Pajula.
Kunstimuuseumid Kadi Kriit.
Suuhügieeni teavitustöö lasteaedades
Katseandmete analüüs II
Pärilus ja ülekatmine Vt Aabits, vihik 8 Klassid: Kolmik.java
Rapid antibiotic-resistance predictions from genome sequence data for Staphylococcus aureus and Mycobacterium tuberculosis ehk Mykrobe predictor Phelim.
C keel AVR mikrokontrolleril
KULDVILLAK SAAREMAA Created by Educational Technology Network
Presentation transcript:

Põhjuslikkus ja statistika Krista Fischer MRC Biostatistics Unit Cambridge, UK 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Mõningate selles ettekandes esitatud tõdemusteni oleme jõudnud koostöös Jack Bowden’iga (MRC Clinical Trials Unit, UK) 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Põhjuslikud seosed epidemioloogias – kas ekspositsioon mõjutab tervist? Mis on põhjuslik seos? Kas seda saab matemaatiliselt defineerida? Miks ja millal on meil vaja hinnata põhjuslikke seoseid? Randomiseerimine: kas imevahend põhjuslikkuse kindlakstegemiseks? Põhjuslike seoste hindamine randomiseeritud uuringutes – mida me tegelikult hindame (ja kas see on see, mida me hinnata tahame)? 29.11.2018 ESS konverents "Statistika ja eluteadused"

Seos X ja Y vahel: statistiline või põhjuslik? Kaks huvipakkuvat näitajat: X – ekspositsioon (eluviisidest või keskkonnast tulenev riskitegur) Y – väljundnäitaja (haigestumine, suremus) Kaks küsimust: Kas X ja Y vahel on seos? Kas tunnus X mõjutab tunnust Y? Need kaks küsimust ei ole samaväärsed! 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Kas X ja Y vahel on seos? Lihtsustame ülesannet: olgu mõlemad tunnused binaarsed (väärtused 0 ja 1 vastavad ekspositsiooni/tervisetulemi puudumisele ja olemasolule) Seos on olemas, kui P(Y=1|X=1) ≠ P(Y=1|X=0) Lihtne testida, kuid kahjuks ei näita põhjuslikkust. 29.11.2018 ESS konverents "Statistika ja eluteadused"

Statistiline vs põhjuslik seos P(Y=1|X=1) ja P(Y=1|X=0) Iseloomustavad haiguse Y esinemissagedust kahes rahvastikurühmas. Neid rühmi eristab ekspositsioon X (nt suitsetamine: jah/ei), kuid nad võivad erineda veel paljude muude näitajate poolest. 29.11.2018 ESS konverents "Statistika ja eluteadused"

Statistiline vs põhjuslik seos vaatlusuuringutes U – muud näitajad ? X - ekspositsioon Y - haigus 29.11.2018 ESS konverents "Statistika ja eluteadused"

Kuidas defineerida põhjuslikku mõju? Kujutame ette sekkumist, mis suudaks tunnuse X väärtust muuta vastavalt soovile kas 1-ks või 0-ks kõigil indiviididel. P(Y=1|do(X)=1): tõenäosus, et Y=1 kui tunnuse X väärtus on kogu üldkogumis seatud olema 1. Samamoodi defineerime P(Y=1|do(X)=1) (Tähistust kasutas esimesena J. Pearl) Üldkogumi keskmine põhjuslik mõju on nüüd defineeritav kui: ACE = P(Y=1|do(X)=1) - P(Y=1|do(X)=0) 29.11.2018 ESS konverents "Statistika ja eluteadused"

Kuidas defineerida põhjuslikku mõju? Üldkogumi keskmine põhjuslik mõju on defineeritav kui: ACE = P(Y=1|do(X)=1) - P(Y=1|do(X)=0) Või, alternatiivselt defineerime nn potentsiaalsed tunnused Y(1) = Y(do(X)=1) ja Y(0) = Y(do(X)=0) Nüüd: ACE = E[Y(1) – Y(0)] Kas ACE on see, mida meil tegelikult vaja on? 29.11.2018 ESS konverents "Statistika ja eluteadused"

Ekspositsiooni mõju eksponeeritutel Vahel on mõttekam rääkida ekspositsiooni mõjust neile, kes tegelikult eksponeeritud on (meid ei huvita niivõrd see, kui palju suureneks praeguse mittesuitsetaja haiguserisk kui ta suitsetaks, vaid huvitab, kui palju väheneks suitsetaja haiguserisk kui ta ei suitsetaks). Keskmine ekspositsiooni mõju eksponeeritutel: (Average Treatment effect in the Treated) ATT = P(Y=1|X=1) - P(Y=1|X=1,do(X)=0) Ehk ATT = E[Y-Y(0)|X=1] 29.11.2018 ESS konverents "Statistika ja eluteadused"

Põhjusliku mõju hindamine ACE on teoreetiliselt hinnatav, kui X on randomiseeritav - juhuvalim üldkogumist jagatakse juhuslikkuse alusel kaheks osaks, ühele osale määratakse X=1, teisele X=0. Sellises uuringus P(Y=1|do(X)=x) = P(Y=1|X=x). Kahjuks ei ole selline uuring enamasti praktiliselt teostatav. 29.11.2018 ESS konverents "Statistika ja eluteadused"

Statistiline vs põhjuslik seos ideaalses randomiseeritud uuringus U – muud näitajad R - randomiseerimine ? X - ekspositsioon Y - haigus P(Y=1|X=x) = P(Y=1|do(X)=x) 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus, kuid ei suudeta tagada ravirühma 100%-list eksponeeritust Näide (fiktiivsete andmetega): paranes/kokku Ravirühm Kontrollrühm Sai ravimit 450/800 Ei saanud ravimit 50/200 Kokku 500/1000 250/1000 Suhteline risk ravirühmas võrreldes kontrolliga = 2 See ei ole ACE ega ATT! 29.11.2018 ESS konverents "Statistika ja eluteadused"

Statistiline vs põhjuslik seos reaalses randomiseeritud uuringus U – muud näitajad R - randomiseerimine ? X - ekspositsioon Y - haigus P(Y=1|X=x) ≠ P(Y=1|do(X)=x) Siiski – R on instrument! 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus, kuid ei suudeta tagada ravirühma 100%-list eksponeeritust Näide (fiktiivsete andmetega): paranes/kokku Ravirühm Kontrollrühm Sai (oleks saanud) ravimit 450/800 ?/800 Ei (oleks) saanud ravimit 50/200 ?/200 Kokku 500/1000 250/1000 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus, kuid ei suudeta tagada ravirühma 100%-list eksponeeritust Näide (fiktiivsete andmetega): paranes/kokku Ravirühm Kontrollrühm Sai (oleks saanud) ravimit 450/800 ?/800 Ei (oleks) saanud ravimit 50/200 Kokku 500/1000 250/1000 Eeldame, et ravimi määramisel otsest mõju ei ole (nende jaoks kes ravimit ei saa) 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Realistlik randomiseeritud uuring I: suudetakse tagada kontrollrühma mitte-eksponeeritus, kuid ei suudeta tagada ravirühma 100%-list eksponeeritust Näide (fiktiivsete andmetega): paranes/kokku Ravirühm Kontrollrühm Sai (oleks saanud) ravimit 450/800 200/800 Ei (oleks) saanud ravimit 50/200 Kokku 500/1000 250/1000 Suhteline risk potentsiaalsete ravimisaajate hulgas: 450/200=2.25 See ongi hinnang ATT-le! 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Realistlik randomiseeritud uuring II: ei suudeta tagada kontrollrühma täielikku mitte-eksponeeritust, ega ka ravirühma 100%-list eksponeeritust Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku HR Kontrollrühm Sai ravimit vähemalt 3kuud 38/768 (4.9%) 6/ 120 (5.0%) Ei saanud ravimit üle 3kuu 6/ 130 (4.6%) 63/ 760 (8.3%) Kokku 44 / 898 (4.9%) 69 / 880 (7.8%) Suhteline risk ravirühmas võrreldes kontrolliga = 0.63, riskide vahe 0.029 ehk 2.9% See ei ole ACE ega ATT! 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku HR Kontrollrühm Sai ravimit vähemalt 3kuud 38/768 (4.9%) 6/ 120 (5.0%) Ei saanud ravimit üle 3kuu 6/ 130 (4.6%) 63/ 760 (8.3%) Kokku 44 / 898 (4.9%) 69 / 880 (7.8%) Mida teha nendega, kes kontrollrühmas ravimit võtsid? Variandid: A Eeldada, et nende seas on ravimi mõju samasugune kui ravimivõtjatel ravimirühmas B Eeldada, et nende seas puudub ravimi määramise mõju – nii nende ekspositsiooni kui ka tulemusnäitaja tase ei sõltu sellest, kummasse rühma nad on määratud Eeldame ka endiselt, et ravimi määramise põhjuslik mõju puudub nende hulgas, kes ravimirühmas ravimit ei võtnud (Viimased kaks eeldust väidavaid, et nn põhimõttelisi vastuhakkajaid ei ole) 29.11.2018 ESS konverents "Statistika ja eluteadused"

Mida teha nendega, kes kontrollrühmas ravimit võtsid? Variant A viib mudelini ATT jaoks: E[Y - Y(0)| X=x, R=r] = ψx ehk E[Y | X=x, R] – ψx = E[Y(0) | X=x, R=r] = E[Y(0) | X=x] eeldusel, et randomiseerimine on korrektne – seega Y(0) ei sõltu randomiseerimisest Nii osutub sobivaks selline ψ hinnang, mille korral Y- ψx ei sõltu R-st Selle saame, kui keskmine tulemite vahe jagada keskmise ekspositsioonide vahega: ψh = (µy1 – µy0)/(µx1 – µx0) HR uuringus ψh = -0.041 ehk -4.1% 29.11.2018 ESS konverents "Statistika ja eluteadused"

Mida teha nendega, kes kontrollrühmas ravimit võtsid? Variant B viib mudelini “kuulekate” keskmise põhjusliku mõju (CACE-complier average causal effect) jaoks: E[Y(1) – Y(0)|X(1)=1, X(0)=0] = ψ, Kus X(0) ja X(1) on indiviidi potentsiaalsed ekspositsioonitasemed ravi- ja kontrollrühmas. CACE iseloomustab põhjuslikku mõju kitsamas rühmas kui ATT Kas ja millistel eeldustel saame hinnata ekspositsiooni mõju nende hulgas, kes võtaksid ravimit siis ja ainult siis kui nad on randomiseeritud ravimirühma? 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku HR Kontrollrühm Oleks saanud ravimit R-st sõltumata 38/768 (4.9%) 6/ 120 (5.0%) Saaks ravimit vaid siis kui R=1 63/ 760 (8.3%) Ei saaks ravimit ei R=1 ega R=0 korral 6/ 130 (4.6%) Kokku 44 / 898 (4.9%) 69 / 880 (7.8%) 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku HR Kontrollrühm Oleks saanud ravimit R-st sõltumata 6/122 (5.0%) 6/ 120 (5.0%) Saaks ravimit vaid siis kui R=1 Ei saaks ravimit ei R=1 ega R=0 korral 6/ 130 (4.6%) 6/ 127 (4.6%) Kokku 44 / 898 (4.9%) 69 / 880 (7.8%) 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Näide: Eesti postmenopausis naiste hormoonasendusravi (HR) uuring: naiste arv kallel esines 5a jooksul luumurde / naisi kokku HR Kontrollrühm Oleks saanud ravimit R-st sõltumata 6/122 (5.0%) 6/ 120 (5.0%) Saaks ravimit vaid siis kui R=1 32/646 (5.0%) 57/633 (9.0%) Ei saaks ravimit ei R=1 ega R=0 korral 6/ 130 (4.6%) 6/ 127 (4.6%) Kokku 44 / 898 (4.9%) 69 / 880 (7.8%) CACE = - 0.04 (-4%) 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" CACE vs ATT HR uuringus selgus, et CACE = ATT = - 0.04 (-4%) Osutub, et ka matemaatiliselt on nii tuletatud CACE hinnang ekvivalentne eelnevalt tuletatud ATT hinnanguga! Sellest hoolimata tuleb silmas pidada, et eeldused ja seega ka tõlgendus sõltuvad sellest, kas hinnatavaks suuruseks on ATT või CACE. Analoogselt saab tuletada ka CACE ja ATT riskisuhte hinnangud ja jälle näidata, et nad on võrdsed. Šansisuhte hinnangud on aga erinevad! 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Kokkuvõte Põhjuslikud seosed ei ole üheselt matemaatliselt defineeritavad Põhjuslikke mõjusid hinnates peaks küsima: kas ja millise mõju hindamine on tegelikult huvi pakkuv? Kas ja milliseid eeldusi oleme nõus tegema konkreetse uuringu jooksul, et huvipakkuvad mõjud oleks hinnatavad? (Nt HR uuringus ei pruugi ei eeldus A ega B kehtida!) Hinnatud põhjuslike mõjude tõlgendus ja hinnangute valiidsus sõltuvad tehtud eeldustest ja nende paikapidavusest 29.11.2018 ESS konverents "Statistika ja eluteadused"

Randomiseerimine looduse poolt: Mendelian randomization Vahel, kui randomiseeritud uuringut korraldada ei saa, võib abi olla geenidest! Näide: teatud geneetiline mutatsioon takistab alkoholi lagundamist seedesüsteemi poolt. Teadlased on üsna veendunud, et seesama mutatsioon ei mõjuta otseselt südamehaigustesse haigestumist. Sisuliselt käitub see geen just samamoodi nagu randomiseerimine -- muud süstemaatilist erinevust selle geeniga ja ilma selleta inimeste hulgas, peale nende erineva alkoholitarbimise taseme. Uuringut, kus on kogutud sobivaid geeniandmeid, samuti andmeid ekspositsiooni ja väljundtunnuse kohta, saab analüüsida samamoodi kui tavalist randomiseeritud uuringut! 29.11.2018 ESS konverents "Statistika ja eluteadused"

ESS konverents "Statistika ja eluteadused" Kirjanduseviiteid Pearl, J., koduleht hulga põhjusliku analüüsi alase materjaliga http://bayes.cs.ucla.edu/jp_home.html (seotult ka tema raamatuga “Causality”) Sheehan, N., Didelez, V., jt. Mendelian Randomization and Causal Inference in Observational Epidemiology, PLoS Med. 2008 August; 5(8). http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2522255/?tool=pubmed 29.11.2018 ESS konverents "Statistika ja eluteadused"