Download presentation
Presentation is loading. Please wait.
Published byFrancis Tobias Snow Modified over 6 years ago
1
Dr Seyyed Alireza Moravveji Community Medicine Specialist
بسم الله الرحمن الرحيم Dr Seyyed Alireza Moravveji Community Medicine Specialist
2
دانشیار گروه پزشکی اجتماعی- دانشکده پزشکی
به نام خدا روشهای آنالیز آماری ارائه: دکتر سید علیرضا مروجی متخصص پزشکی اجتماعی دانشیار گروه پزشکی اجتماعی- دانشکده پزشکی Dr Seyyed Alireza Moravveji Community Medicine Specialist
3
Dr Seyyed Alireza Moravveji Community Medicine Specialist
Bar chartميله اي) ( كيفي يك متغير ( دايره اي)Pie chart نمودار توصيفي (بافت نگار)Histogram كمي Area Clustered Bar / Pie كيفي - كيفي آمار حیاتی بيش از يك متغير (دو متغير) Box Plot كيفي - كمي Error Bar جدول Scatter plot كمي - كمي عدد (شاخصهای آماری) Dr Seyyed Alireza Moravveji Community Medicine Specialist تحليلي
4
(نسبت-تناسب) Proportion Frequency- Percent
(سهم-نسبت)Ratio كيفي (نسبت-تناسب) Proportion Frequency- Percent عدد (شاخصهای آماری + زمان (ميزان)Rate - كمي Dr Seyyed Alireza Moravveji Community Medicine Specialist
5
(Coefficient of Variation )
ميانگين Mean شاخص هاي گرايش مركزي Central Tendency Determinants ميانه Median نما Mode شايعترين فراواني عدد كمي دامنه – بازه –Range ميانگين انحرافات (Mean Deviation) واريانس (Variance) شاخص هاي پراكندگي Dispersion Determinants انحراف معيار(Standard Deviation) خطاي معيار(Standard Error) ضريب تغييرات (Coefficient of Variation ) Dr Seyyed Alireza Moravveji Community Medicine Specialist
6
Dr Seyyed Alireza Moravveji Community Medicine Specialist
آمار توصيفي جمع آوري، تنظيم و خلاصه كردن دادهها درك اطلاعات قبل از آناليز (سازماندهي و خلاصه كردن) بسيار مهم است. Dr Seyyed Alireza Moravveji Community Medicine Specialist
7
Dr Seyyed Alireza Moravveji Community Medicine Specialist
خلاصه كردن دادهها رسم جدول توصیفی تحلیلی رسم نمودار محاسبه شاخصهای آماری تذکر مهم: هر نوع روش انتخابی برای پردازش اطلاعات بايد دو شرط زير را دارا باشد: 1- صحت انتقال اطلاعات 2- سرعت انتقال اطلاعات Dr Seyyed Alireza Moravveji Community Medicine Specialist
8
جدول گزارش نتايج بيشتر در حجم كمتر
جدول گزارش نتايج بيشتر در حجم كمتر انواع جدول يك بعدي دوبعدي سه بعدي Dr Seyyed Alireza Moravveji Community Medicine Specialist
9
جدول يك بعدي تنها اطلاعات توصيفي يك متغير بيان ميشود
جدول يك بعدي تنها اطلاعات توصيفي يك متغير بيان ميشود 1 Dr Seyyed Alireza Moravveji Community Medicine Specialist
10
Dr Seyyed Alireza Moravveji Community Medicine Specialist
جدول 1: توزيع فراواني افراد برحسب استعمال سيگار در شهرستان کاشان در سال 1389 استعمال سيگار فراواني مطلق فراواني نسبي فراواني تجمعي سيگار ميكشد سيگار نميكشد جمع Dr Seyyed Alireza Moravveji Community Medicine Specialist
11
Dr Seyyed Alireza Moravveji Community Medicine Specialist
12
Dr Seyyed Alireza Moravveji Community Medicine Specialist
جدول دو بعدي اطلاعات مربوط به دو متغير بيان ميگردد و ميتوان به وجود يا عدم وجود ارتباط بين دو متغير پي برد. 2 Dr Seyyed Alireza Moravveji Community Medicine Specialist
13
Dr Seyyed Alireza Moravveji Community Medicine Specialist
جدول 2: توزيع فراواني افراد برحسب استعمال سيگار به تفكيك جنسيت در شهرستان کاشان در سال 1389 زن مرد جنس سيگار مي كشد نمي كشد جمع Dr Seyyed Alireza Moravveji Community Medicine Specialist
14
Dr Seyyed Alireza Moravveji Community Medicine Specialist
15
Dr Seyyed Alireza Moravveji Community Medicine Specialist
16
جایگاه جمع و جهت درصدگیری در جدول دوبعدی کجاست؟
کل سالم بيمار درصد تعداد سن 175 15 9-0 90 10 19-10 5 29-20 ..... ...... پاسخ: در جهت متغیر مستقل Dr Seyyed Alireza Moravveji Community Medicine Specialist
17
جدول سه بعدي بيان ارتباط 3 متغير
جدول سه بعدي بيان ارتباط 3 متغير 3 Dr Seyyed Alireza Moravveji Community Medicine Specialist
18
Dr Seyyed Alireza Moravveji Community Medicine Specialist
جدول 3: توزيع فراواني افراد بر حسب استعمال سيگار به تفكيك سن و جنس در شهرستان کاشان در سال 1389 زن مرد جنس 50 > 50 < سن سيگار مي كشد نميكشد جمع Dr Seyyed Alireza Moravveji Community Medicine Specialist
19
Dr Seyyed Alireza Moravveji Community Medicine Specialist
20
Dr Seyyed Alireza Moravveji Community Medicine Specialist
21
نمودار يكي ديگر از روشهاي خلاصه سازي اطلاعات است.
انواع نمودار نمودار ميلهاي (نرده اي، ستوني) (Bar Chart) نمودار دايرهاي (كلوچهاي) (Pie Chart) نمودار چندگوش (Polygon Diagram) نمودار هيستوگرام Dr Seyyed Alireza Moravveji Community Medicine Specialist
22
Dr Seyyed Alireza Moravveji Community Medicine Specialist
1- نمودار ستوني : برای نمایش فراواني متغيرهاي كيفي (اسمي و رتبهاي) *ارتفاع ستونها مهم است 2- نمودار دايره اي : برای نمایش فراواني متغيرهاي كيفي (اسمي و رتبهاي) Dr Seyyed Alireza Moravveji Community Medicine Specialist
23
Dr Seyyed Alireza Moravveji Community Medicine Specialist
24
Dr Seyyed Alireza Moravveji Community Medicine Specialist
90 27.4 20.4 20.4 Dr Seyyed Alireza Moravveji Community Medicine Specialist
25
Dr Seyyed Alireza Moravveji Community Medicine Specialist
26
Dr Seyyed Alireza Moravveji Community Medicine Specialist
27
Dr Seyyed Alireza Moravveji Community Medicine Specialist
28
Dr Seyyed Alireza Moravveji Community Medicine Specialist
29
Dr Seyyed Alireza Moravveji Community Medicine Specialist
30
Dr Seyyed Alireza Moravveji Community Medicine Specialist
31
Dr Seyyed Alireza Moravveji Community Medicine Specialist
32
Dr Seyyed Alireza Moravveji Community Medicine Specialist
3- نمودار پلی گون (چندگوش): برای نمایش داده هاي كمي گسسته صفت روي محور طولها و فراواني متناظر آن روي محور عرضها Dr Seyyed Alireza Moravveji Community Medicine Specialist
33
روشهای پردازش اطلاعات(ادامه)
Dr Seyyed Alireza Moravveji Community Medicine Specialist
34
Dr Seyyed Alireza Moravveji Community Medicine Specialist
4- نمودار هيستوگرام : برای نمایش داده هاي كمي پيوسته محور عمودي فراواني هرگروه از متغير كمي ميباشد. قاعده ستونها ميتواند مساوي انتخاب نشود و سطح زير ستون متناسب با فراواني آن گروه است. Dr Seyyed Alireza Moravveji Community Medicine Specialist
35
Dr Seyyed Alireza Moravveji Community Medicine Specialist
36
Dr Seyyed Alireza Moravveji Community Medicine Specialist
37
Dr Seyyed Alireza Moravveji Community Medicine Specialist
38
Dr Seyyed Alireza Moravveji Community Medicine Specialist
39
روشهای پردازش اطلاعات(ادامه)
Scatter-gram Weight loss (Kg) Initial weight (Kg) Dr Seyyed Alireza Moravveji Community Medicine Specialist
40
Dr Seyyed Alireza Moravveji Community Medicine Specialist
41
روشهای پردازش اطلاعات (ادامه)
Mean Blood Pressure (mmHg) Time in days Polythiazide 8 mg Figure …: Mean blood pressure for a group of subjects before and during daily administration of polythiazide with and without sodium replacement.
42
روشهای پردازش اطلاعات (ادامه)
Mean Blood Pressure (mmHg) Time in days Polythiazide 8 mg Figure …: Mean blood pressure for a group of subjects before and during daily administration of polythiazide with and without sodium replacement.
43
Dr Seyyed Alireza Moravveji Community Medicine Specialist
Bar chartميله اي) ( كيفي يك متغير ( دايره اي)Pie chart نمودار توصيفي (بافت نگار)Histogram كمي Area Clustered Bar / Pie كيفي - كيفي آمار حیاتی بيش از يك متغير (دو متغير) Box Plot كيفي - كمي Error Bar جدول Scatter plot كمي - كمي عدد (شاخصهای آماری) Dr Seyyed Alireza Moravveji Community Medicine Specialist تحليلي
44
(نسبت-تناسب) Proportion Frequency- Percent
(سهم-نسبت)Ratio كيفي (نسبت-تناسب) Proportion Frequency- Percent عدد (شاخصهای آماری + زمان (ميزان)Rate - كمي Dr Seyyed Alireza Moravveji Community Medicine Specialist
45
Ratio: value obtained by dividing one quantity by another.
The ratio of male to female birth in U.S. in 1979: 1,791,000 / 1,703,000 = 1.052 The fundamental epidemiologic measure is the frequency with which the events of interest occur in the study population. These frequencies may be: ratios - where the numerator may or may not be included in the denominator proportions - where the numerator is included in the denominator rates - where the denominator reflects person-time under study Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
46
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
نسبت (Ratio) حاصل تقسیم دو عدد صورت کسر جزئی از مخرج کسر نیست می توان کمیت های متفاوت را با هم قیاس کرد = 5 / 2 = 2.5 / 1 Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
47
The proportion of males among all birth in 1979:
ابزارهاي اندازهگيري(Frequency measures) نسبت Ratio تناسب Proportion ميزان Rate Ratio: value obtained by dividing one quantity by another. The ratio of male to female birth in U.S. in 1979: 1,791,000 / 1,703,000 = 1.052 Proportion: a ratio where the numerator is always part of denominator The proportion of males among all birth in 1979: 1,791,000 / 3,494,000 = 51.3% The fundamental epidemiologic measure is the frequency with which the events of interest occur in the study population. These frequencies may be: ratios - where the numerator may or may not be included in the denominator proportions - where the numerator is included in the denominator rates - where the denominator reflects person-time under study Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
48
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
تناسب (Proportion) حاصل تقسیم دو عدد صورت کسر لزوماًجزئی از مخرج کسر است صورت و مخرج کسر از یک جنس هستند ارتباط جزء به کل را بیان می کند بین صفر و یک تغییر می کند Most fractions in epidemiology are proportions. 2 --- = 0.5 = 50% 4 Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
49
Rate: a change in one quantity per unit change in another
ابزارهاي اندازهگيري(Frequency measures) نسبت Ratio تناسب Proportion ميزان Rate Ratio: value obtained by dividing one quantity by another. The ratio of male to female birth in U.S. in 1979: 1,791,000 / 1,703,000 = 1.052 Proportion: a ratio where the numerator is always part of denominator The proportion of males among all birth in 1979: 1,791,000 / 3,494,000 = 51.3% Rate: a change in one quantity per unit change in another The rate of developing lung cancer during a 5 year study is: 7 / 50 persons*5 years or 7 / 250 person-years 0.028 cases of lung cancer per person-year The fundamental epidemiologic measure is the frequency with which the events of interest occur in the study population. These frequencies may be: ratios - where the numerator may or may not be included in the denominator proportions - where the numerator is included in the denominator rates - where the denominator reflects person-time under study Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
50
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
میزان (Rate) حاصل تقسیم دو عدد وقوع یک پیامد در جمعیت خاص در زمان معین زمان را نیز شامل می شود سرعت وقوع یک پیامد را در طی زمان نشان می دهد صورت کسر تعداد پیامدهایی که در طی یک دوره زمانی اتفاق افتاده (تعداد افراد دارای پیامد) مخرج کسر تعداد جمعیتی که پیامد در آن اتفاق افتاده (جمعیتی که افراد دارای پیامد متعلق به آن هستند) (جمعیت در معرض خطر) Observed in 1998 2 ----- = 0.02 / year 100 Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
51
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
مثال میزان میزان مرگ ناشی از حوادث ترافیکی در ایران تعداد مرگ ها در سال 82: نفر جمعیت در سال 82: 68 میلیون نفر میزان مرگ در سال: 26000/ = 38/100,000/year میزان ها را معمولاً در توانی از 10ضرب می کنند (100، 1000، ) Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
52
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
انواع ميزانها: ميزانهاي خام ( Crude Rates): مخرج اين ميزانها را كل جمعيت تشكيل ميدهند مثل ميزان خام مرگ (CDR) یا ميزان خام تولد (CBR) در سال نام دیگر: میزان غیر استاندارد ميزانهاي خاص(Specific Rates): مخرج اين ميزانها را گروههاي خاصي تشكيل ميدهند مثل میزانهای اختصاصی سنی مرگومير (ASDR) برای گروههای مختلف سنی (با فاصله 5 سال) ميزانهاي استاندارد: اين ميزانها برحسب سن يا جنس استانداردسازی شده یا تطبیق داده ميشوند. Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
53
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
انواع مخرج ( denominator) در كسرهاي فوق: --جمعيت وسط سال: به علت تغييرات روزانه درجمعيت به دلیل تولد و مرگ و مهاجرت معمولا جمعيت وسط سال را انتخاب و قرار ميدهيم. --جمعيت در معرض خطر: كساني هستند كه ممکن است واقعه ای در آنها رخ دهد (صرف نظر از اینکه واقعاً رخ دهد یا ندهد) مثلا کسانی که از غذای مسموم خورده اند در معرض خطر مسمومیت هستند (مخرج کسر میزان بروز مسمومیت) --شخص ـ زمان :(Person - Time) ممكن است اشخاص در زمانهاي متفاوت تحت مطالعه قرار گیرند لذا تركيبي از اشخاص و زمان در مخرج میزان قرار ميگيرد (کاربرد در مطالعات کوهورت و محاسبه چگالی بروز) رایج ترین: شخص- سال(person-year) Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
54
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
1.5 3 3.5 2.5 0.5 4.5 1 2 3 4 5 6 7 8 9 10 11 12 Persons Years at risk 1 2 3 4 5 Time (Years) First occurrence of disease X Dr Seyyed Alireza Moravveji MD Community Medicine Specialist Death
55
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
--شخص ـ فاصله (Person - Distance) در مخرج كسر گاهي شخص ـ فاصله مثل مسافر ـ كيلومتر قرار ميگيرد --زيرگروههاي جمعيت: در مخرج كسر زيرگروههايي مثل سن، جنس يا شغل و ... قرار ميگيرد. Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
56
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
Odds The chances of something happening can be expressed as a Rate (Risk) or as an Odds: Risk (or rate)= the chance of something happening/the chance of all things happening (or person-time) Odds= the chance of something happening/the chance of it not happening Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
57
Odds: Won Lost Total Basic Science Exam
Probability that an event will happen Probability that an event will not happen Won Lost Total Basic Science Exam 140 / 160 Odds = = 14 TO / 160 Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
58
Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
Thus a risk is a proportion. but an odds is a ratio. An odds is a special type of ratio, one in which the numerator and denominator sum to one. Example: Among 100 people at baseline, 20 develop Influenza over the year. The risk is 1 in 5 (i.e. 20 among 100).The odds is 1 to 4 (i.e. 20 compared to 80) Dr Seyyed Alireza Moravveji MD Community Medicine Specialist
59
(Coefficient of Variation )
ميانگين Mean شاخص هاي گرايش مركزي Central Tendency Determinants ميانه Median نما Mode شايعترين فراواني عدد كمي دامنه – بازه –Range ميانگين انحرافات (Mean Deviation) واريانس (Variance) شاخص هاي پراكندگي Dispersion Determinants انحراف معيار(Standard Deviation) خطاي معيار(Standard Error) ضريب تغييرات (Coefficient of Variation ) Dr Seyyed Alireza Moravveji Community Medicine Specialist
60
Dr Seyyed Alireza Moravveji Community Medicine Specialist
شاخصهای آماری: شاخص: عدد يا نسبتي است كه جهت خلاصه كردن وقايع استخراج ميشود و به عنوان مشخص كننده آن وقايع در زمان معين و يا براي مقايسه آنها در زمانهاي مختلف بكار ميرود. Dr Seyyed Alireza Moravveji Community Medicine Specialist
61
Dr Seyyed Alireza Moravveji Community Medicine Specialist
شاخص مركزي : عددي كه اكثر داده ها يا نمونه هاي جامعه حول آن قرار دارند. انواع: ميانگين ميانه نما Dr Seyyed Alireza Moravveji Community Medicine Specialist
62
Dr Seyyed Alireza Moravveji Community Medicine Specialist
شاخص پراكندگي: مشخص ميكند نمونهها چقدر از شاخص مركزي فاصله دارند. (تنوع مقادير دادهها: اگر مقادير به هم نزديك باشند پراكندگي كمتر است و بالعكس) دامنه Range ميانگين انحرافات (MD) Mean Deviation واریانس (پراش) Variance انحراف معيار Standard Deviation (Sd) Dr Seyyed Alireza Moravveji Community Medicine Specialist
63
Dr Seyyed Alireza Moravveji Community Medicine Specialist
شاخصهاي مركزي : الف) ميانگين حسابي:مشهورترين شاخص مركزي است(معدل) mean = Xi = مقدار هريك از متغيرهاي تصادفي N = تعداد متغيرها ميانگين نمونه با نماد x نشان داده مي شود . ميانگين جامعه با نماد µ نشان داده مي شود . ∑ni=1 xi N Dr Seyyed Alireza Moravveji Community Medicine Specialist
64
Dr Seyyed Alireza Moravveji Community Medicine Specialist
Mean Another name for average. If describing a population, denoted as , the Greek letter “mu”. If describing a sample, denoted as X , called “x-bar”. Appropriate for describing measurement data. Seriously affected by unusual values called “outliers”. Dr Seyyed Alireza Moravveji Community Medicine Specialist
65
Calculating Sample Mean
Formula: That is, add up all of the data points and divide by the number of data points. Data (# of classes skipped): Sample Mean = ( )/5 = 3.6 Do not round! Mean need not be a whole number.
66
Dr Seyyed Alireza Moravveji Community Medicine Specialist
ب) ميانه : برابر است با مقداري كه نيمي از افراد، از نظر داشتن آن متغير، از آن بزرگتر و نيم ديگر از آن كوچكتر باشند. کاربرد میانه: در مواقعی كه توزيع جامعه نرمال نباشد. در موارد خاص مثلاً زماني كه ميخواهيم سطح درآمد و يا سطح مصرف را در جامعهاي كه اختلاف طبقاتي زياد است (به گونهاي كه عده اي درآمد كلان و اكثريت درآمد محدود دارند) تعيين كنيم، ميانه شاخص مناسبتري خواهد بود. چون ميانه درآمدي را كه نصف مردم كمتر و نيم ديگر بيشتر از آن را دارند مشخص ميكند ولي ميانگين چنانكه درآمدهاي كلان مقادير بسيار افراطي را شامل شود نميتواند شاخص مناسبي از وضعيت درآمد باشد Dr Seyyed Alireza Moravveji Community Medicine Specialist
67
مثال مي خواهيم ميانه 99 نفر را از نظر قد پيدا كنيم
نفر وسط از هر گروه از فرمول تعداد افراد n + 1 2 به ترتيب صعودي يا نزولي صف ميكنيم. از اول تا آخر صف تا نفر پنجاهم شمرده و قد نفر پنجاهم، ميانه قد افراد خواهد بود. اگر تعداد مقادير زوج باشد ميانگين دو مقدار وسط را بعنوان ميانه انتخاب ميكنيم. 1+99 2 Dr Seyyed Alireza Moravveji Community Medicine Specialist
68
Dr Seyyed Alireza Moravveji Community Medicine Specialist
مثال ميانه 6 عدد : 2و7و13و21و35و39 =17 21+13 2 ميانه از مقادير افراطي (outlier)تأثير پذير نيست (برعكس ميانگين) ولي كاربرد ميانگين در تعبير و تفسير اطلاعات و انجام آزمونهاي آماري قابل اعتمادتر است. Dr Seyyed Alireza Moravveji Community Medicine Specialist
69
Dr Seyyed Alireza Moravveji Community Medicine Specialist
Median Another name for 50th percentile. Appropriate for describing measurement data. “Robust to outliers,” that is, not affected much by unusual values. Dr Seyyed Alireza Moravveji Community Medicine Specialist
70
Calculating Sample Median
Order data from smallest to largest. If odd number of data points, the median is the middle value. Data (# of classes skipped): Ordered Data: Median Dr Seyyed Alireza Moravveji Community Medicine Specialist
71
Calculating Sample Median
Order data from smallest to largest. If even number of data points, the median is the average of the two middle values. Data (# of classes skipped): Ordered Data: Median = (3+4)/2 = 3.5 Dr Seyyed Alireza Moravveji Community Medicine Specialist
72
Dr Seyyed Alireza Moravveji Community Medicine Specialist
ج) نما: عبارت است از داده يا داده هايي كه بيشترين فراواني را دارند، بعبارتي ديگر صفتي كه نسبت به صفات ديگر، افراد بيشتري داراي آن باشند را نما گويند. اگر همه مقادير با هم متفاوت باشند مجموعه، شاخص نما ندارد. ممكن است يك مجموعه بيش از يك نما داشته باشد. مورد استفاده نما كمتر از دو شاخص قبلي است و در اپيدميولوژي از نما مثلاً براي مشخص كردن سني كه در آن يك بيماري بيشترين شيوع را دارد استفاده مي شود . نما تنها شاخص موجود گرایش مرکزی برای داده های اسمی میباشد. Dr Seyyed Alireza Moravveji Community Medicine Specialist
73
Dr Seyyed Alireza Moravveji Community Medicine Specialist
Source: CSAP’s Data Pathways Dr Seyyed Alireza Moravveji Community Medicine Specialist
74
Choosing Appropriate Measure of Location
If data are symmetric, the mean, median, and mode will be approximately the same. If data are multimodal, report the mean, median and/or mode for each subgroup. If data are skewed, report the median. Dr Seyyed Alireza Moravveji Community Medicine Specialist
75
Dr Seyyed Alireza Moravveji Community Medicine Specialist
76
Dr Seyyed Alireza Moravveji Community Medicine Specialist
77
Central Tendencies and Distribution Shape
It is possible to represent the CT (whatever type) on the FD polygon by bisecting the curve with a straight line to represent your mean median or mode. With a ND (symmetrical, bell-shaped curve) the mean, median , and mode will all have the same value and will be represented by the exact centre of the D. For symmetrical D the mean and median will always be exactly in the centre, and will always be the same value. On skewed D shown here the position of the 3 measures differs slightly. The mode will always be at the highest point of the curve (representing the most frequent score); the median will be exactly in the middle of the D (the middle position). On + skew (the L graph) where the majority of scores are at the lower end of the scale, this means that the mode will be the lowest value, followed by the median. Then mean score will be affected by the few extreme higher scores and so will be the highest values of the 3 measures of CT. On the –skew where most of the scores are at the higher end of the scale, the opposite pattern is observed. Dr Seyyed Alireza Moravveji Community Medicine Specialist
78
Different Shapes of Distributions
Source: Dr Seyyed Alireza Moravveji Community Medicine Specialist
79
Dr Seyyed Alireza Moravveji Community Medicine Specialist
شاخصهاي پراكندگي Dr Seyyed Alireza Moravveji Community Medicine Specialist
80
Describing Variability
Describes in an exact quantitative measure, how spread out/clustered together the scores are Variability is usually defined in terms of distance How far apart scores are from each other How far apart scores are from the mean How representative a score is of the data set as a whole So far we have considered ways of describing the shape of a D and its central point. There is one other important characteristic of a data distribution set: how spread out the data scores are: whether they are clustered closely together or not. This would be a measure of variability for our data (read Last point : if an individual score is close to the mean or not ) The diagram shows how V can be important: these two distributions have the same shape: they are both symmetrical, and ND. They have the same mean value. They don’t however have the same V. Say these are graphs showing IQ from two different samples of people. In the L graph the spread of the scores is much smaller than the R hand graph: so for the L hand graph the IQs are clustered together over a smaller spread from say , while the R hand graph the IQs are spread out over a much wider range: say Dr Seyyed Alireza Moravveji Community Medicine Specialist
81
Dr Seyyed Alireza Moravveji Community Medicine Specialist
Source: Scianta.com Dr Seyyed Alireza Moravveji Community Medicine Specialist
82
Dr Seyyed Alireza Moravveji Community Medicine Specialist
Source: Dr Seyyed Alireza Moravveji Community Medicine Specialist
83
Dr Seyyed Alireza Moravveji Community Medicine Specialist
الف) دامنه: تفاوت بين كوچكترين و بزرگترين مقدار دادهها (R=Xmax - Xmin) چون در محاسبه دامنه فقط از كوچكترين و بزرگترين مقدار استفاده ميشود، نميتواند به نحو مطلوبي گوياي پراكندگي صفت باشد: مثال : دو گروه عدد 18و10و10و10و2 X = 10 R= و16و10و4و2 ولي پراكندگي سري دوم اعداد بيشتر از سري اول است. Dr Seyyed Alireza Moravveji Community Medicine Specialist
84
سن كودكان بستري در بخش اطفال 7، 6 ، 5 ،4 ،3
ب) ميانگين انحرافات (MD): متوسط قدر مطلق انحرافات از ميانگين يا متوسط انحراف خطي است. ∑ |x - xi| N مثال : سن كودكان بستري در بخش اطفال 7، 6 ، 5 ،4 ،3 X=5 MD= = 1.2 مفهوم عدد 1.2 اين است كه اين 5 عدد از ميانگين خود بطور متوسط 1.2 فاصله دارند. |3-5|+|4-5|+|5-5|+|6-5|+|7-5| 5 Dr Seyyed Alireza Moravveji Community Medicine Specialist
85
Dr Seyyed Alireza Moravveji Community Medicine Specialist
ج) پراش(Variance) : چون در محاسبه ميانگين انحرافات از قدر مطلق اختلاف استفاده شده و انجام عمليات جبري روي قدر مطلق خالي از اشكال نيست به منظور رفع اين نقيصه و همچنين تأثير بيشتر اعداد دور از ميانگين و تأثير كمتر اعداد حول ميانگين، هريك از عبارات (x – xi)را مجذور ميكنيم . واریانس = (ميانگين مجذور انحرافات از میانگین) = 2 δ ∑ (x – xi)2 N Dr Seyyed Alireza Moravveji Community Medicine Specialist
86
د) انحراف معيار (جذر واریانس): بهترين شاخص پراكندگي است.
د) انحراف معيار (جذر واریانس): بهترين شاخص پراكندگي است. چون واريانس بصورت مربع يا مجذور است براي رفع اين اشكال از جذر واريانس استفاده ميشود تا واحد آن نیز با واحد میانگین برابر باشد (مثلاً در اندازه گیری فشار خون، واحد میانگین و انحراف معیار، هر دو mmHg میباشد. SD= √δ2 Dr Seyyed Alireza Moravveji Community Medicine Specialist
87
ﻫ) ضريب تغييرات (CV): براي مقايسه پراكندگي دوصفت با دو واحد متفاوت
مثلاً مقايسه پراكندگي توزيع افراد از نظر فشارخون (mmHg) و وزن بدن (Kg) اگر انحراف معيار آنها به ترتيب 20 و 50 باشد نميتوان نتيجه گرفت كه پراكندگي وزن در جامعه بيشتر از فشارخون است. Dr Seyyed Alireza Moravveji Community Medicine Specialist
88
Dr Seyyed Alireza Moravveji Community Medicine Specialist
براي رفع اين مشكل و قابل مقايسه شدن از نسبت انحراف معیار به میانگین به صورت درصد استفاده ميشود و حاصل تقسيم آنها بدون واحد خواهد بود. CV = × 100 SD X Dr Seyyed Alireza Moravveji Community Medicine Specialist
89
Analysis Of Variances (ANOVA)
جعبه سياه ( آزمون آماري) ساختن فرضيه Chi square Cross - Tab كيفي – كيفي نشان دادن احتمال شانسي بودن پديده مشاهده شده:P value – Significancy (Sig.) T test Independent Samples آمار تحليلي Paired samples كيفي - كمي Compare Means One sample Analysis Of Variances (ANOVA) Pearson’s Correlation كمي – كمي Linear Regression
90
با تشكر از توجه شما عزيزان
Dr Seyyed Alireza Moravveji Community Medicine Specialist
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.