25/06/2015Dr Andy Brooks1 TFV0103 Tölfræði og fræðileg vinnubrögð Fyrirlestur 3 Kafli 2 “Descriptive Analysis and Presentation of Single-Variable Data”/ Lýsandi greining og sýning af einu breytu. x-axis/x-ás y-axis/y-ás
25/06/2015Dr Andy Brooks2 Teikna myndrit af eigindlegum gögnum Tegundir af 498 aðgerðum Graphing Qualitative Data Ta02-01 Pie Chart/Skífurit Bar Graph/Súlurit Hvaða graf er best? rúm er til á milli dálka Neurosurgery/ Taugaskurðlækningar
25/06/2015Dr Andy Brooks3 Teikna myndrit af eigindlegum gögnum Tegundir af 672 slysum Type of AccidentFrequencyCumulative % Bicycle/Reiðhjól41653,33% Motorbike/Mótorhjól11876,67% Car/Bíll8090,00% Jeep/Jeppi58100,00% Pareto Diagram It is easily seen that bicycles and motorbikes account for ~ 80% of the accidents. frequency/tíðni cumulative frequency/ safntíðni rétt eða ekki? Pareto Diagram
25/06/2015(c) Thomson Learning, Inc.4 Teikna myndrit af megindlegum gögnum Fjöldi mánaða sem fólk standast eftir líffæraflutning | | | | | Stem & Leaf Display/Laufrit Only for small data sets. Leaf Stem stofn Lauf Fjöldi Graphing Quantitative Data í röð
25/06/2015Dr Andy Brooks5 Histogram/Stöplarit Stöplarit er sérstak súlurit fyrir breytu sem er megindleg (og oftast samfelld líka). Stöplarit eru með: 1.Titill. 2.Y-ás sem tilgreinir tíðnir. 3.X-ás sem tilgreinir dálka. –Oftast fjóldi dálka er á milli 5 og 12. (Það virkar best.) –Viðvörun: lögun breytast á milli 5 og 12. Stöplarit ætti að gefa góða mynd af líkindaþéttni viðkomandi breytu. Teikna myndrit af megindlegum gögnum líkindaþéttni/probability density
25/06/2015Dr Andy Brooks6 Blood Sugar Levels/Blóðsykursmælistigir 6,505,005,607,604,808,007,507,908,009,20 6,406,005,606,005,709,208,108,006,506,60 5,008,006,506,106,406,607,205,904,005,70 7,90 6,005,606,006,207,706,707,708,209,00 >=9,00 og < 10,00 diabetes/sykursýki Interactivity 2-B enginn rúm á milli dálka
25/06/2015Dr Andy Brooks7 Mean or Average/Meðaltal x n x n xxx in () Úrtak fyrir ofan er 5 tölur: 6, 3, 8, 6, og 4. The sample mean/Úrtaksmeðaltalið = 5,4. Þýði hér er tölur. The population mean/þýðismeðaltlið = . (óþekkt gildi) – rittákn, grískt stafróf Er 5,4 gott spágildi fyrir ? Measures of Central Tendency/Mælitala á miðsækni x “x bar” “leggja saman” n = úrtaksstærð
25/06/2015Dr Andy Brooks8 Median/Miðtala Sú tala í röð talna þar sem helmingur talnanna er lægri og helmingur hærri en talan sjálf. Þýðismiðtala = (rittákn, grískt stafróf). Til að reikna miðtölu: Setja tölur í röð Reikna dýpt miðtölu = (n+1)/2. {6,3,8,5,3} -> {3,3,5,6,8} (n+1)/2=3 miðtala =5 {9,6,7,9,10,8} -> {6,7,8,9,9,10} (n+1)/2=3,5 miðtala =(8+9)/2=8,5 Interactivity 2-D Measures of Central Tendency/Mælitala á miðsækni oddatal eða slétt tala... odd or even number of numbers... “x tilde” n = úrtaksstærð
25/06/2015Dr Andy Brooks9 Mode/Tindur,Kryppugildi Sú tala sem er algengust. {3,3,5,6,8} kryppugildi = 3 {6,7,8,9,9,10} kryppugildi = 9 {6,7,8,9,9,10,10}enginn kryppugildi Gæti verið meðaltal, miðtala, og kryppugildi eru mismunandi. Measures of Central Tendency/Mælitala á miðsækni
25/06/2015Dr Andy Brooks10 Box (and Whisker) Plot/Kassirit lágmark/minimum hámark/maximum miðtala/median Q3 Q1 50% Í miðjunni Teikna myndrit af megindlegum gögnum Q1, quartile/fjórðungstala 1 (25th percentile/25. hundraðsmark) Q3, quartile/fjórðungstala 3 (75th percentile/75. hundraðsmark)
25/06/2015Dr Andy Brooks11 Standard Deviation/Staðalfrávik s,σ σ signifies a population standard deviation, s signifies a sample standard deviation Interactivity 2-F þýðisstaðalfrávikúrtaksstaðalfrávik mælitala á breytileika
25/06/2015(c) Thomson Learning, Inc.12 68% 95% 99.7% Percentage of data between -2s and +2s is 95%. Hlutfall gagna frá -2s til +2s er 95%. normal distribution/normaldreifing unimodal/eintinda symmetric/samhverf
25/06/2015Dr Andy Brooks13 Sample Variance (s 2 ) & Standard Deviation (s) s n xx () n = úrtakstærð dreifni staðalfrávik skilgreiningarformúla reikniformúla
25/06/2015Dr Andy Brooks14 z-score/z-gildi How many standard deviations above or below the mean./Hve mörg staðalfrávik fyrir ofan eða neðan meðaltal. z-gildi oftast er á milli -3 og +3. “This value has a z-score of 4. Maybe there was a mistake either measuring or recording the value. Maybe we should eliminate this value from the set of data.” brottfall