Download presentation
Presentation is loading. Please wait.
1
دانشکده اقتصاد و مديريت
دانشگاه آزاد اسلامي واحد علوم و تحقیقات دانشکده اقتصاد و مديريت گروه کارشناسی ارشد مدیریت درس : تحليل آماری با رويکرد پايان نامه نويسی مدرس : دکتر محمد خدائي وله زاقرد بهار 1393 1
2
1- آمار توصيفي، دوجلدي، دكتر علي مدني؛
منابع: 1- آمار توصيفي، دوجلدي، دكتر علي مدني؛ 2- آمار استنباطي، دوجلدي، دكتر علي مدني؛ 3- از كليه كتب آمار ميتوان استفاده كرد؛ 4- نرم افزار SPSS و کتابهای آموزشی مرتبط با آن. 2
3
ارزشيابی : 1 - امتحان پايان ترم 10 نمره
2 - ارائه گزارش تحقيق با الگوی پايان نامه نويسی و با استفاده از مدلهاي آماري نرم افزار SPSS 10 نمره 3
4
سر فصل دروس : چارچوب پژوهش ريشه های علم آمار
انواع و طبقه بندی علم آمار متغير و انواع آن سطوح اندازه گيری جداول آماری برآورد آزمون فرضيه مدلهای آماری مدل آماریt تک گروهی (پارامتريک) مدل آماری مربع کای ( ناپارامتريک) 4
5
سر فصل دروس : مدل آماریt دوگروه مستقل (پارامتريک)
مدل آماریU مان ويتنی ( ناپارامتريک) مدل آماری t دو گروه همبسته (پارامتريک) مدل آماری ويل کاکسون ( ناپارامتريک) مدل آماری تحليل واريانس يک طرفه (پارامتريک) مدل آماری کروسکال واليس ( ناپارامتريک) مدل آماری رگرسيون تک متغيری مدل آماری رگرسيون چند متغيری مدل آماری رگرسيون لجستيك 5
6
ریشه های علم آمار اولين بار در يونان باستان با نام علم استان شناسی (Status) شاهزادگان و علم استان شناسی مثلث شعور(توزيعهای تالسی، هندسه اقليدسی، فلسفه فيثاغورث) استاندارها فرمول ياد نمي گرفتند، بلکه تفکر استانداری ياد ميگرفتند. بعد از يونانيان، ايرانيها علم شمارش را مطرح کردند. شمارش همارش همار آمار (Statistical)
7
ریشه های علم آمار علم آمار نوين:
اين علم در بريتانيای کبير و در مرکز تحقيقات مستعمرات انگلستان و بوسيله رونالد فيشر ايجاد شد. اين مرکز قوی ترين، مخوف ترين و منظم ترين مرکز مطالعاتی بود که رياست آن را گالتون به عهده داشت. مشاوران گالتون: اسپرمن، رونالد فيشر، کارل پيرسن اسپرمن به مطالعه تفاوتهای فردی در ايران و اختلاف شيعه و سنی پرداخت. او از طريق مطالعه گرايش به مرکز، پراكندگی را زياد می کرد. 7
8
انواع و طبقه بندی علم آمار
آمار علم رياضی نيست. امروزه آمار شاخه ای از علم روش شناختی است. الف) آمار توصيفی: محاسبه( گرايش مرکزی، پراکندگی) نمايش( جدول آماری، نمودار آماری) ب) آمار استنباطی: برآورد و آزمون فرضيه و تعميم نتايج نمونه به جامعه آماری ج) آمار کاربردی: ترکيب آمار توصيفی و استنباطی (توصيف تحليل گرانه و اکتشاف داده ها به گونه همزمان ) نرم افزار SPSSبا نمودارهای متنوع، جداول آماری جذاب علاوه بر توصيف زمينه را برای تحليل آماده ميکند. پس در پايان نامه شما از آمار کاربردی استفاده ميکنید. 8
9
متغیر و انواع آن انواع طبقه بندی متغير: طبقه بندی اول: متغير:
هر چيزی كه در علم تغيير ميکند. در علم آمار با متغير سر و کار داريم. انواع طبقه بندی متغير: طبقه بندی اول: الف) متغير کمی: توانايی انتساب عدد مثل: وزن، قد، سن و ب) متغير کيفی: منسوب به رقم نيست مثل: رنگ پوست، گروه خونی و برای شناخت چيزی به آن رقم مي دهيم. بنابراین، بايستی متغير کيفی به متغير کمی تبديل شود. 9
10
متغير و انواع آن طبقه بندی دوم طبق دقت اندازه گيری:
الف) متغير گسسته (دو ارزشی، چند ارزشی): بين طبقات و فاصله ها معنی وجود ندارد. مثال: بد حجاب، با حجاب گروه خونی قوم و ... ب) متغير پيوسته: کليه اعداد حقيقی را اختيار ميکند. مثل: طول عمر، نمره، وزن و ... 10
11
متغير و انواع آن : طبقه بندی سوم: الف) متغير مستقل: يعنی متغير علت
متغير فعال، قابل دستکاری و در اختيار محقق است. مثل: روشهای تدريس مدرس و ... متغير غير فعال، غير قابل دستکاری مثل: ترک بودن مدرس و ... ب)متغير وابسته: يعنی معلول 11
12
متغير و انواع آن : ج) متغير مزاحم
کم اثر متغير کنترل اثر آنرا خنثی ميکنيم پر اثر متغیر تعديل گر اثر آنرا دقيق بررسی ميکنيم محقق بدنبال بررسی اثر متغير مستقل فعال بر متغير وابسته که کمی و پيوسته است ميباشد. موضوع (مثال): ” بررسی تاثير رتبه دانشگاهی بر ميزان رضايتمندی شغلی اعضای هئيت علمی“ با توجه به اين موضوع متغيرهای آنرا مشخص کنيد. 12
13
اندازه گيری: سطوح اندازه گيری : سطوح اندازه گيری:
اختصاص عدد به حالات و شرايط يک متغير بر اساس قواعد خاص تا کيفيت به کميت تبديل شود. سطوح اندازه گيری: اسمی (Nominal) رتبه ای (Ordinal) فاصله ای (Interval) ، صفر غيرمطلق(قرار دادی) مثال: نمره دانشجو که قراردادی است. نسبتی (Ratio) ، صفر مطلق مثل: قد که از صفر شروع ميشود و قابل رويت است. 13
14
سطوح اندازه گيری : سطوح اندازه گيری: اسمی ناپيوسته غير متريک رتبه ای
فاصله ای پيوسته متريک نسبتی 14
15
جداول آماری : روش محاسبه و اندازه گيري: مد
جداول آماری : متغير در سطح اسمی: جدول توزيع فراوانی ساده جدول توزيع فراوانی نسبی جدول توزيع فراوانی درصدی روش محاسبه و اندازه گيري: مد متغيردرسطح رتبه ای: جدول توزيع فراوانی تراکمی جدول توزيع فراوانی تراکمی نسبی جدول توزيع فراوانی تراکمی نسبی درصدی روش محاسبه و اندازه گيري: مد، ميانه، چارکها، ضريب همبستگی 15
16
جداول آماری متغير در سطح فاصله ای:
جدول توزيع فراوانی گروه بندی شده روش محاسبه و اندازه گيري: مد، ميانه، ميانگين، واريانس، انحراف معيار، ضريب همبستگی متغیر درسطح نسبتی:
17
برآورد (Estimation) شناسايی ويژگيهای نمونه(آماره) و کسب ويژگيهای جامعه(پارامتر) فرايندی که جامعه را مشخص ميکنيم و سپس نمونه ميگيريم و پس از آن ويژگيهای نمونه را بررسی ميکنيم و سپس به آماره ميرسيم و آماره را به کل جامعه تعميم ميدهيم. برآورد نقطه ای: (Point Estimate) ويژگيهای نمونه معرف دقيقی از پارامتر است. 17
18
برآورد (Estimation) برآورد فاصله ای: (Interval Estimate ) - +
در مواقعی که خطای نمونه گيری وجود داشته باشد و به گونه دقيق نتوان ميزان پارامتر جامعه را از طريق نمونه مشخص کرد، برآورد فاصله ای مطرح ميشود. لذا اصطلاح حدود اطمينان (Confidence Limit ) مطرح ميشود. ويژگيهای مطلوب برآورد کننده: الف) معرف جامعه باشد. يعنی از همه جای جامعه نمونه بگيريم. ب) مکفی باشد. نمونه به اندازه کافی باشد. فرمول برآورد فاصله ای: (سطح اطمينان)(خطای استاندارد ميانگين) ميانگين + - 18
19
برآورد (Estimation) مثال :
محقق خواهان برآورد ميزان درآمد مردانی است که به ازدواج دوم روی آورده اند. از اين رو حجم نمونه به تعداد 81 نفر از اين مردان را در نظر گرفته و ميانگين و ميانه و انحراف معيار بدست آمده است. حدود اطمينان درآمد مردان دو همسری را با 95% اطمينان برآورد کنيد. 19
20
برآورد (Estimation) تفسير:
95% مردان دو همسری در اين دامنه حقوق ميگيرند. لذا بايستی با درآمد افرادی که يک زن دارند مقايسه کنيم، که به آن آزمون فرضيه ميگوييم. فرضيه: بين درآمد مردان با يک همسر با درآمد مردان با دو همسر تفاوت معنی داری وجود دارد. که بعدا بحث خواهد شد. 20
21
کار عملی با SPSS الف) ورود داده ها ب) انتخاب مناسبترين شاخص
ج) تفسير تحليل توصيفی و استنباطی جدول شاخصهای آماری شامل: شاخصهای گرايش مرکزی مد ميانه ميانگين 21
22
کار عملی با SPSS شاخصهای پراکندگی دامنه تغيرات انحراف چارکی
انحراف معيار شاخصهای توزيع ضريب کشيدگی ضريب چولگی 22
23
کار عملی با SPSS Interquartile Range = Q3-Q1 جدول آمار توصيفی
در اين جدول محقق بايد شاخصهای مرکزي، شاخصهای پراکندگي، شاخصهای توزيع را در جدول امار توصيفی وارد کند. متريک و متقارن ميانگين و انحراف معيار متريک و نامتقارن ميانه و انحراف چارکی غيرمتريک و نامتقارن مد و دامنه تغييرات = انحراف چارکی Interquartile Range / 2 Interquartile Range = Q3-Q1 23
24
کار عملی با SPSS بررسی متقارن بودن توزيع از طريق:
(برآورد دامنه ای، ضريب کجی) اگر ميانه توزيع در بين حد بالا و حد پائين فاصله اطمينان ميانگين(براورد فاصله ای) قرار گيرد، ميتوان توزيع را متقارن فرض کرد. يعنی ميان ميانه و ميانگين تفاوت جزئی و ناچيز است. متقارن بودن از طريق ضريب چولگی(Skewness) و ضريب کشيدگی(Kurtosis) = ضريب چولگی = ضريب کشيدگی ميزان کجی خطای استاندارد کجی ميزان کشيدگی خطای استاندارد کشيدگی 24
25
کار عملی با SPSS ميزان کجی = ضريب چولگی خطای استاندارد کجی تفسير:
= ضريب چولگی تفسير: اگر ضريب کجی بالاتر از 1/96 باشد يعنی توزيع نامتقارن است و چنانچه پائين تر از 1/96 باشد توزيع متقارن است و منفی يا مثبت بودن ضريب، چوله به چپ يا راست را نشان ميدهد. اگر ضريب کشيدگی بالاتر از 1.96 باشد يعنی توزيع بطور معنی دار دارای کشيدگی است. و چنانچه پائين تر از 1.96 باشد توزيع تقريبا نرمال است. اگر از اوج بالا باشد کشيدگی مثبت و اگر از اوج پائين تر باشد کشيدگی منفی است. متقارن بودن مهم است که از طريق ضريب چولگی بدست می آيد و مهمتر از کشيدگی است. 25
26
کار عملی با SPSS تفسير: ضريب چولگی =
با توجه به ضريب بدست آمده که از لحاظ آماری معنی دار نيست و مقدار آن کمتر از1.96 است ميتوان مفروضه متقارن بودن توزيع را پذيرفت و از ميانگين به عنوان معرف گرايش مرکزی و انحراف معيار به عنوان معرف پراکندگی استفاده کرد. از اينرو از طريق تحليل توصيفی مفروضه آمار پارامتريک و انتخاب مدل مناسب اماری برای تحليل استنباطی مهيا ميشود. -.886 .512 -1.730 26
27
آزمون فرضيه : فرضيه: حدس و گمان احتمالی در مورد روابط پديده ها (متغيرها) فرضيه پاسخ به مسئله تحقيق است. توزيع نرمال، سطح اطمينان، آلفا (ناحيه رد فرض صفر) ، بتا(ناحيه پذيرش فرض صفر) مثال: ارائه آموزشهای عمومی (افراد معمولی) = β ارائه آموزشهای ويژه (افراد استثنائی) = α فرضيه صفر = H عدم رابطه، عدم تفاوت فرضيه يک = H داشتن رابطه، متفاوت بودن 27
28
آزمون فرضيه : خطای نوع اول و خطای نوع دوم چهار حالت ممکن:
فرض صفر در واقعيت درست است و پژوهشگر نيز فرض صفر را به درستی تائيد می کند. فرض صفر در واقعيت نادرست است و پژوهشگر نيز فرض صفر را به درستی رد می کند. فرض صفر در واقعيت تائيد شده است ولی پژوهشگر فرض صفر را به نادرستی رد می کند. (خطای نوع اول يا خطای آلفا) فرض صفر در واقعيت رد شده است و پژوهشگر فرض صفر را به نادرستی تائيد می کند.(خطای نوع دوم يا خطای بتا) 28
29
آزمون فرضيه : فرض صفر: فرض مقابل(يک):
تفاوت معنی داری بين نمره آمار دختران و پسران کلاس وجود ندارد. فرض مقابل(يک): تفاوت معنی داری بين نمره آمار دختران و پسران کلاس وجود دارد. انتخاب مدل آماری برای آزمون فرضيه: انواع مدلها: مدلهای آمار پارامتريک مدلهای آمار نا پارامتريک 29
30
مدلهای آماری : مدلهای آماری پارامتريک
مدلهای آماری : مدلهای آماری پارامتريک اگر متغير کمی و توزيع متغير متقارن باشد از مدلهای آماری پارامتريک استفاده ميکنيم. در غير اينصورت از مدلهای آماری ناپارامتريک استفاده ميشود. انواع مدلهای آماری پارامتريک برای آزمون فرضيه (آزمونهای مقايسه ميانگين): مدل آماری t تک نمونه ای(پارامتريک) مدل آماری t دو نمونه مستقل (پارامتريک) مدل آماری t دو نمونه همبسته (پارامتريک) مدل آماری تحليل واريانس يک طرفه ( چند گروه مستقل) (پارامتريک) 30
31
مدلهای آماری پارامتريک وناپارامتريک
مدل پارامتريک مدل ناپارامتريک ميانگين يک گروه (one t-test) دو جمله ای مقايسه ميانگين دو گروه مستقل(t مستقل) U مان - ويتنی مقايسه ميانگين دو گروه وابسته(t وابسته) ويل کاکسون مقايسه ميانگين چند گروه مستقل(ANOVA) کروسکال واليس 31
32
مدل آماریT تک گروهی (پارامتريک)
اگر فرضيه ای در خصوص ميانگين يک جامعه مطرح شد، اين مدل بکار ميرود. اگر توزيع متقارن و متغير کمی باشد از مدل آماری t تک نمونه ای به صورت زير استفاده ميشود. t= t= اگر t محاسباتی بين 1/96 و 1/96- باشد نميتوان فرض صفر را رد کرد. يعنی ميانگين تجربی شبيه ميانگين نظری است. اگر t محاسباتی بين 1/96 و 1/96- نباشد ميتوان فرض صفر را رد کرد. يعنی ميانگين تجربی بطور معنی دار متفاوت با ميانگين نظری است. بعبارتی شواهدی در دست هست که نشان دهد ميانگين نمونه متفاوت با ميانگين نظری است. ميانگين نظری - ميانگين نمونه خطای استاندارد ميانگين X- M Sx 32
33
مدل آماریT تک گروهی (پارامتريک)
برای آزمودن این فرضیه که آیا میانگین یک نمونه (X )با میانگین جامعه (µ ) که فرض بر این است دارای توزیع نرمال می باشد ، یکسان است ، از آزمون تک نمونه ای یا تک گروهی t استفاده می شود . از این آزمون در مواقعی استفاده کنید که می خواهید بدانید آیا میانگین برآورد شده ( X)با میانگین جامعه ( µ ) همخوانی دارد یا خیر ؟ در این آزمون از آماره ای موسوم به t که بصورت زیر است ، استفاده می شود . همیشه دغدغه محقق ، مقدار نمونه ای است که در اختیار دارد . معمولاً آماره t را هنگامی بکار می گیرند که تعداد نمونه ها کمتر از 30 و واریانس جامعه نا معلوم باشد . یکی از مشخصه های این آماره ، درجه آزادی آن است که با n-1 مشخص می شود . به مثالهای زیر توجه کنید : 1-با یک نمونه 20 تائی از جوانانی که اخیراً ازدواج کرده اند ، فرضیه زیر را آزمون کنید : فرضیه : میانگین سن ازدواج در بین جوانان یک منطقه که قبلاً 26 سال بوده است در سالهای اخیر افزایش داشته است . 2-با انتخاب 15 بیمار مرد که برای اولین بار آزمایش دیابت آنها مثبت بوده است ، فرضیه زیر را آزمون کنید : فرضیه : میانگین سن ابتلا به بیماری دیابت در مردان 34 سال است . 33
34
مدل آماریT تک گروهی (پارامتريک)
یک کارشناس علوم اجتماعی مدعی است میانگین سن مدیران در یک سازمان که در سالهای قبل حداکثر 45 سال بوده ، افزایش یافته ، برای بررسی این ادعا سن 15 مدیر که بصورت تصادفی از بین مدیران این سازمان انتخاب شده اند ،بصورت زیر در دست است . - ورود داده ها به نرم افزار SPSS داده ها را با متغیری به نام Sen در برگه Data View وارد کنید، سپس برای انجام آزمون تک گروهیt مراحل زیر را پیگیری کنید : متغیر سن (sen )را به فهرست متغیرهای آزمون Variable View منتقل کنید . 34
35
مدل آماریT تک گروهی (پارامتريک)
متغیرهای Variable View بشرح شکل ذیل وارد کنید : در چهارگوش Test Value مقدار 45 را بشرح شکل ذیل وارد کنید : OK کنید و نتیجه را در جدول خروجی SPSS ببینید . 35
36
مدل آماریT تک گروهی (پارامتريک)
Analyze / Compare Means / One Sample T Test / OK خروجی اول آمار استنباطی آزمون تک گروهیOne-Sample Test Test Value = 45 T آماره Df درجه آزادی Sig. (2-tailed) معیار تصمیم Mean Difference میانگین اختلاف فاصله اطمینان 95% اختلاف 95% Confidence Interval of the Difference Lower Upper SEN 1.894 14 .079 -.3356 5.4022 One-Sample Statistics N Mean Std. Deviation Std. Error Mean SEN 15 خروجی دوم آمار توصیفی توضیح اینکه در جدول One – Sample Statistics شاخص های میانگین و انحراف معیار سن مدیران مشاهده میشود . در جدول One- Sample Test می توانید نتایج آزمون را مشاهده کنید . برای قضاوت در مورد فرضیه صــفر ، می توانید در جدول One- Sample Test به مــعیار تصمیم ( (P-Value که با عنوان Sig.(2-tailed)آمده است ، نگاه کنید . چون در این مثال 079/ بیشتر از 5% است ، دلیل کافی برای رد کردن فرضیه H0 وجود ندارد . 36
37
مدل آماریT تک گروهی (پارامتريک)
روش تحليل SPSS: نتيجه اين آزمون شامل 2 خروجی است. خروجی اول آمار توصيفی مربوط به آزمون فرضيه است. خروجی دوم مربوط به آمار استنباطی و نتايج آزمون فرضيه را ارايه ميدهد. با توجه به مقادير حد بالا(Upper) و پائين(Lower) مي توان گفت: هرگاه حد پائين و بالا مثبت باشد، ميانگين از مقدار آزمون بزرگتر است. هرگاه حد پائين و بالا منفی باشد، ميانگين از مقدار آزمون کوچک تر است. هرگاه حد پائين منفی و حد بالا مثبت باشد، ميانگين با مقدار مورد آزمون تفاوت معنی داری ندارد. 37
38
مدل آماریT تک گروهی (پارامتريک)
مثال: بازده 90 شرکت پذيرفته شده در بورس اوراق بهادار تهران از طريق نمونه گيری جمع آوری شده است. محقق ادعا ميکند که: ”ميانگين جامعه آماری برابر 20 است.“ آزمون متقارن بودن توزيع داده ها را نشان دهيد. آيا در سطح خطای 0.05 (0.95 اطمينان) ميتوان اين فرضيه را پذيرفت؟ Ho: M = 20 H1: M ≠ 20 38
39
مدل آماریT تک گروهی (پارامتريک)
از آنجائی که sig بزرگتر از 5 درصد است، H0 رد نميشود. با توجه به اينکه t بدست امده از لحاظ اماری معنی دار نميباشد ميتوان به تفاوت جزئي بين ميانگين تجربی(نمونه) و ميانگين نظری تاکيد کرد. t پائين تر از 2 و sig بيشتر از 0.05 است يعنی معنی دار نيست. يعنی ميتوان يکسان تلقي کرد. توجه: برای ميانگين نظری و استاندارد ها بايد سالها تحقيق کرد و ادله علمی در زمان تحقيق وجود داشته باشد و در زمان تفسير به اين ادله اشاره کرد. 39
40
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
در اين مدل يک متغير در دو گروه مورد بررسی قرار مي گيرد. مثل : بازدهی در شرکتهای توليدی و خدماتی اگر فرضيه مطرح شده به مقايسه ميانگين دو گروه بپردازد، بايد از آزمون مقايسه ميانگين دو گروه استفاده کرد. نکته: توزيع متغيرها متقارن باشد. متغير وابسته کمی پيوسته باشد. متغير مستقل طبقه ای باشد. فرضيه: ميانگين بازدهی شرکتهای توليدی و شرکتهای خدماتی تفاوت دارد. (نوع شرکت بر ميزان بازدهی تاثير دارد) 40
41
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
برای آزمون مقايسه ميانگين دو گروه ابتد بايد بررسی کنيم که: آيا واريانس دو جامعه برابر است يا خير؟ F= بعبارتی ابتدا آزمون تساوی واريانس های F لون(levene) بصورت بالا برای فرضيه زير انجام ميگيرد. واريانس گروه2 = واريانس گروه 1 : H0 واريانس گروه2 ≠ واريانس گروه 1 : H1 در صورتيکه آزمون تساوی واريانسها تائيد شود. يعنی sig يا سطح معنی داری لون بزرگتر از 05/ 0 باشد. از رابطه زير برای آزمون مقايسه ميانگين دو گروه استفاده ميکنيم. ميانگين گروه2 = ميانگين گروه 1 : H0 ميانگين گروه2 ≠ ميانگين گروه 1 : H1 که به اين رابطه t دو گروه مستقل مي گويند. واريانس گروه 1 واريانس گروه2 41
42
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
در صورتيکه آزمون تساوی واريانسها تائيد نشود. يعنی sig يا سطح معنی داری لون کوچکتر از 05/ 0 باشد. از رابطه زير برای آزمون مقايسه ميانگين دو گروه استفاده ميکنيم. 42
43
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
در این گونه آزمونها فرضیه های صفر و یک به صورت زیر مطرح اند : H0 : µ1=µ2 H1 : µ1≠µ2 اگر 1µ و 2µ را میانگین های هر یک از دو جمعیت در نظر بگیرید ، فرضیه صفر بیان می کند که بین میانگین های دو جامعه هیچ تفاوتی وجود ندارد و فرضیه مقابل آن ، حکم به داشتن اختلاف بین میانگین های دو جمعیت می دهد . 43
44
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
Analyze/Copare Means/Independent-Samples T Test: -در این کادر محاوره متغیر آزمون را به کادر Test Variable(s) و متغیر گروه بندی را به کادر Grouping Varable: منتقل کنید . متغیر آزمون ، متغیری است که می خواهید میانگین آن را در دو گروه با یکدیگر مقایسه کنید . متغیر گروه بندی می تواند یک متغیر کیفی مانند جنسیت یا تأهل و مانند آن باشد . انتخاب این متغیر بسته به آزمونی دارد که انجام می دهید . مثلاً اگر می خواهید میانگین زمان استفاده از ایتنرنت در هر روز را در دو منطقه تهران مقایسه کنید ، متغیر آزمون ، متغیر مدت استفاده از اینترنت در روز است و متغیر گروه بندی ، متغیر منطقه خواهد بود . 44
45
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
-البته توجه داشته باشیم که ممکن است متغیر گروه بندی ( در این مثال منطقه ) شامل بیش از دو گروه باشد که می توانیم از گزینه Define Groups گروهای مورد نظرمان را انتخاب کنیم . گزینه Define Grops .. را کلیک کنید و هر یک از سطوح متغیر گروه بندی را در آن وارد کنید . مثلاً اگر متغیر گروه بندی شما ( مانند مثال بالا ) منطقه است ، کدهای مربوط به دو منطقه ای که می خواهید با هم مقایسه کنید ، در کادر محاوره Define Groups وارد کنید . می توانید متغیر گروه بندی را یک متغیر کمی در نظر بگیرید . در مثال بالا اگر به جای دو منطقه بخواهیدمیانگین زمان استفاده از اینترنت در هر روز را در دو گروه سنی با یکدیگر مقایسه کنید ، شما متغیر گروه بندی را یک متغیر کمی ( سن ) انتخاب کرده اید ، می توانید برای این متغیر یک نقطه برش در قسمت Cut Point معرفی کنید تا آنها را به دو گروه تقسیم کرده باشید . گزینه Cut Point را در کادر محاوره بالا علامت دار کنید تا به حالت فعال درآید . مثلاً اگر نقطه برش را 30 انتخاب کرده اید، عدد 30 را در این قسمت وارد کنید. به این ترتیب شما از نرم افزار خواسته اید تا یک گروه از افراد بالای 30 سال و گروه دیگر را افراد زیر 30 سال در نظر بگیرد . 45
46
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
برای ایجاد یک فاصله اطمینان برای میانگین متغیر آزمون ، گزینه Option را کلیک کنید و اگر فاصله اطمینان 95% که بطور پیش فرض انتخاب شده است ، مورد نظر نیست ، آن را به هر مقدار که نیاز دارید ، تغییر دهید. 46
47
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
روش تحليل SPSS: Analyze /Compare means / Independent-Sample / T-Test نتيجه آزمون شامل دو خروجی است. خروجی اول آمار توصيفی دو گروه است Group Statistics نوع شرکت N Mean Std. Deviation Std. Error Mean تولیدی بازده خدماتی 60 30 خروجی دوم آمار استنباطی است که شامل دو قسمت است. قسمت اول تساوی واريانس دو گروه است. و قسمت دوم نتايج آزمون تساوی ميانگين دو گروه را برای هر دو حالت تساوی و عدم تساوی واريانس ارايه می کند. 47
48
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
روش تحليل SPSS: Independent Samples Test دو گروه مستقل t جدول آزمون آزمون برابری واریانس ها Levene's Test for Equality of Variances t-test for Equality of Means f آماره Sig. معیارتصمیم برابری واریانس t df درجه آزادی Sig. (2-tailed) معیار تصمیم برابری میانگین بازده Equal variances assumed با فرض برابری واریانس ها 558- .457- .780- 88 437- Equal variances not assumed با فرض نا برابری واریانس ها .702- 44.679 486- آزمون برابری واریانس ها t-test for Equality of Means Mean Difference میانگین اختلافات Std. Error Difference خطای استاندارد اختلافات Lower Upper بازده Equal variances assumed با فرض برابری واریانس ها Equal variances not assumed با فرض نا برابری واریانس ها 48
49
مدل آماری t دوگروه مستقل(آزمون مقايسه ميانگين دو گروه)
با توجه به آزمون لون(levene) سطح معنی داری يا sig= بزرگتر از 05/ 0 است. در نتيجه فرض برابری واريانسها (H0 ) رد نميشود. لذا اطلاعات سطر اول در مورد مقايسه ميانگين مورد بررسی قرار ميگيرد. از آنجائيکه سطح معنی داری برای آزمون مقايسه ميانگين دو گروه يا Sig=0.437 پس فرض برابری ميانگين ها (H0 ) رد نميشود. يعنی نوع شرکتها در ميزان بازده آنها تاثير ندارد. با توجه به مقادير حد بالا(Upper) و پائين(Lower) ميتوان گفت: هرگاه حد پائين و بالا مثبت باشد، تفاوت ميانگين دو گروه بزرگتر از صفر است و ميانگين گروه اول از گروه دوم بزرگتر است. هرگاه حد پائين و بالا منفی باشد، تفاوت ميانگين دو گروه کمتر از صفر است و ميانگين گروه اول از گروه دوم کوچکتر است. هرگاه حد بالا مثبت و حد پائين منفی باشد، تفاوت ميانگين دو گروه معنی دار نبوده و تساوی ميانگين دو جامعه رد نميشود. بعبارت ديگر M1=M2 است 49
50
مدل آماری t دوگروه وابسته (جفت گونه)
اگر دو متغير در يک گروه مورد بررسی قرار گيرد بعبارتی دو متغير با هم در ارتباط باشند از اين مدل استفاده ميکنيم. مثل: مقايسه بازدهی دو سال نکته: 1- توزيع متغيرها متقارن باشد 2- هر دو متغير کمی پيوسته باشد فرضيه: بازدهی سال 84 با بازدهی سال 85 تفاوت ندارد. Md=0 : H0 Md≠0 : H1 آماره t اين آزمون با رابطه زير بدست مي آيد. تفاوت ميانگينها= Xd انحراف معيار ميانگينها= Sd 50
51
مدل آماری t دوگروه وابسته (جفت گونه)
Analyze Compare means Paired- Sample T Test نتيجه آزمون شامل سه خروجی است. خروجی اول آمار توصيفی دو متغير است. خروجی دوم همبستگی دو متغير را نشان ميدهد. 51
52
مدل آماری t دوگروه وابسته (جفت گونه)
برای بررسی رابطه(همبستگی) دو متغير ميتوان فرضيه های آماری را به صورت زير تعريف کرد: همبستگی معنی داری بين دو متغير وجود ندارد r = 0 : H0 همبستگی معنی داری بين دو متغير وجود دارد r ≠ 0 : H1 52
53
مدل آماری t دوگروه وابسته (جفت گونه)
با توجه به مقدار Sig= که برای ضريب همبستگی ارايه شده است، فرضيه H0 رد ميشود. در نتيجه بين دو متغير همبستگی معنی داری وجود دارد. خروجی سوم نتايج آزمون t دو گروه وابسته را نمايش می دهد. از آنجائيکه سطح معنی داری برای آزمون مقايسه تفاوت ميانگين دو گروه وابسته Sig=0.122 و بزرگتر از 0.05 است. تفاوت معنی داری بين دو متغير وجود ندارد Md = 0: H0 تفاوت معنی داری بين دو متغير وجود دارد Md ≠ 0 : H1 پس فرض برابری تفاوت ميانگين ها (H0 ) رد نميشود. همچنين حد بالا مثبت و حد پايين منفی است پس تفاوت ميانگين دو متغير برابر صفر است. 53
54
مدل آماری t دوگروه وابسته (جفت گونه)
برای مقايسه ميانگين چند گروه(بيش از دو گروه) از اين آزمون استفاده ميشود. متغير مستقل در چندين سطح(Factor) گروه بندی شده و متغير وابسته کمی است. مثال: مقايسه ميانگين بازدهی شرکتهای توليدی ، خدماتی و سرمايه گذاری فرضيه : بين ميانگين بازدهی شرکتهای توليدی ، خدماتی و سرمايه گذاری تفاوت وجود دارد. M1=M2=M3 : H0 دست کم ميانگين بازدهی دو گروه از شرکتها برابر نيست : H1 54
55
آزمون مقايسه ميانگين چند جامعه(مستقل) ANOVA
روش تحليل SPSS: Analyze compare means One Way ANOVA متغير وابسته را انتخاب و به کادر Dependent List منتقل مي کنيم. متغير مستقل در سطوح مختلف را انتخاب و به کادر Factor منتقل ميکنيم. برای نشان دادن وجود تفاوتهای معنی دار بصورت دو به دو بين گروه های مختلف روی دکمه Post Hoc يعنی آزمونهای تعقيبی کليک ميکنيم و در کادر آزمونهای LSD و Tukey را انتخاب ميکنيم و با Continue به کادر قبلی باز ميگرديم و سپس OK ميکنيم تا آزمون اجرا شود. نتيجه شامل سه خروجی است. M1 = M2 = M3 : H0 دست کم ميانگين بازدهی دو گروه از شرکتها برابر نيست : H1 55
56
آزمون مقايسه ميانگين چند جامعه(مستقل) ANOVA
خروجی اول نتيجه آزمون مقايسه ميانگين سه جامعه را نشان مي دهد. Sig بزرگتر از 0.05 است، بنابراين H0 رد نميشود. يعنی تفاوت معنی داری بين ميانگين گروهها وجود ندارد. اگر تفاوت وجود داشته باشد يعنی رد شود، بايد ببينيم که کدام گروهها متفاوت هستند لذا بايستی از آزمونهای تعقيبی(Post Hoc) استفاده کرد. 56
57
آزمون مقايسه ميانگين چند جامعه(مستقل) ANOVA
در خروجی دوم آزمونهای تعقيبی نشان داده ميشود و اگر H0 رد شود بکار ميبريم. در اين مثال گروهها تفاوتی با يکديگر ندارند. چرا که Sig برای کليه گروهها بزرگتر از 0.05 ميباشد. 57
58
آزمون مقايسه ميانگين چند جامعه(مستقل) ANOVA
در خروجی سوم گروهها بر حسب ميانگينها به زير گروههای همگن تقسيم ميشوند. گروههائی که زير هم قرار گيرند تفاوت معنی دار ندارند. در اين مثال هر سه گروه در يک زير گروه قرار دارد. 58
59
مدلهای آماری ناپارامتريک
در آزمونهای ناپارامتريک شکل توزيع (تقارن) اهميت ندارد. همچنين اگر نمونه ها کمتر از 30 باشد کاربرد دارد. اين آزمون ها از سطح دقت کمتری برخوردار هستند. مدل پارامتريک مدل ناپارامتريک ميانگين يک گروه (one t-test) دو جمله ای مقايسه ميانگين دو گروه مستقل(t مستقل) U مان - ويتنی مقايسه ميانگين دو گروه وابسته(t وابسته) ويل کاکسون مقايسه ميانگين چند گروه مستقل(ANOVA) کروسکال واليس 59
60
آزمون دو جمله ای(Binominal Test)
فرضيه: نابرابری نسبت شرکتهای با بازدهی بالا و بازدهی پائين P = : H0 P ≠ : H1 60
61
آزمون دو جمله ای(Binominal Test)
برای آزمون اين فرضيه مراحل زير طی ميشود: Analyze Nonparametric Test Binomial متغير مورد نظر را انتخاب و به کادر Test Variable List وارد ميکنيم. در کادر Test Proportion نسبت مورد نظر را که در اين مثال 0.50 است، وارد ميکنيم. در کادر Define Dichotomy گزينه Cut Point را انتخاب و سپس در همان کادر نقطه برش را (که در اين مثال نرخ بازدهی 20 درصد مد نظر است) وارد ميکنيم. و سپسOK را جهت اجرای آزمون انتخاب ميکنيم. نتيجه آزمون فقط يک خروجی است. از آنجائيکه Sig=0.000 و کمتر از 0.05 ميباشد، H0 رد ميشود. يعنی نسبت شرکتهای بازدهی بالا و بازدهی پائين برابر نيست. که در اين مثال نشان ميدهد که نسبت شرکتهای با بازدهی کمتر بيشتر است. 61
62
آزمون دو جمله ای(Binominal Test)
62
63
آزمون U مان- ويتنی(Mann-Whitney U)
فرضيه: ميانگين رتبه بازدهی شرکتهای توليدی و شرکتهای خدماتی متفاوت است (نوع شرکت بر ميزان بازدهی تاثير دارد) ميانگين رتبه گروه2 = ميانگين رتبه گروه 1 : H0 ميانگين رتبه گروه2 ≠ ميانگين رتبه گروه 1 : H1 63
64
آزمون U مان- ويتنی(Mann-Whitney U)
آزمون U من ویتنی ( Mann Whithney ) آزمون من – ويتني يك آزمون مقايسه اي براي مقايسه وضعيت دو گروه مستقل است و وقتي داد ه هاي يك مطالعه به صورت . كيفي ترتيبي باشند بهتر است از اين آزمون كه يك آزمون غير پارامتري و معادل آزمون دو نمونه مستقل t است، استفاده كرد در این حال از آزمون دو نمونه مستقل استفاده نمي كنيم زيرا ميانگين متغيري كه در مقياس ترتيبي اندازه گيري شده باشد، به علت يكسان نبودن فاصله واحدها، معني و مفهوم واقعي ميانگين را نخواهد داشت. مثلا وقتي مي خواهیم قد دو گروه از زنان و مردان را با هم مقايسه كنيم بهتر است از مرتب كردن افراد بر حسب قد و تعيين رتبه آن ها استفاده كنيم تا مقايسه ميانگين دانشجو را به قد آن ها. فرض كنيد مي خواهيم دو روش آموزش سنتي و جديد را با يكديگر مقايسه كنيم N دانشجو را به صورت تصادفي انتخاب و افراد نمونه را مجدداً به طور تصادفي به هر يك از دو روش اختصاص مي دهيم n1 دانشجو به روش اول n2 دانشجو در روش دوم به طوری n1+n2=N و پس از پايان دوره آموزش از همه آن ها آزمون واحدي اخذ مي كنيم، اينك نمرات آن ها را به ترتيب نوشته و به آن ها رتبه مي دهيم. سپس مجموع رتبه هاي هر گروه را محاسبه كرده و به ترتيب آنها را R1 و R2 می نامیم و در شاخص زير قرار مي دهيم. 64
65
آزمون U مان- ويتنی(Mann-Whitney U)
65
66
آزمون U مان- ويتنی(Mann-Whitney U)
برای آزمون اين فرضيه مراحل زير طی ميشود: Analyze Nonparametric Test Independent Samples متغير وابسته را انتخاب و به کادر Test Variable List وارد ميکنيد. در کادر Grouping Variable گروه را وارد ميکنيد. در کادر Define Groups گروهها را تعريف ميکنيم(کد 1 ، 2 ) و با Continue ادامه ميدهيد. در همان صفحه اصلی در Test Type مان-ويتنی انتخاب شده است. OK را جهت اجرای آزمون انتخاب ميکنيم. 66
67
آزمون U مان- ويتنی(Mann-Whitney U)
نتيجه آزمون شامل دو خروجی است: خروجی اول تعداد داده ها، ميانگين رتبه ها و مجموع رتبه های هر يک از دو گروه را نشان ميدهد. 67
68
آزمون U مان- ويتنی(Mann-Whitney U)
خروجی دوم آزمون فرضيه است: از آنجائيکه Sig=0.100 و بزرگتر از 0.05 ميباشد، H0 رد نمي شود. يعنی ميانگين بازدهی شرکتهای توليدی و شرکتهای خدماتی برابر است (نوع شرکت بر ميزان بازدهی تاثير ندارد). نکته: قبل از مان – ويتنی، فرانک ويل کاکسون برای مقايسه افراد از طريق روش رتبه بندی، مدل ناپارامتريک با تاکيد بر فرايند رتبه گذاری را پايه ريزی کرد و تا زمان حيات ايشان اين مدل تحت عنوان ويل کاکسون-مان-ويتنی(WMW) مطرح بود. در نرم افزار SPSS آماره Z تقريب نرمال آماره t می باشد. 68
69
آزمون ويل کاکسون (Wilcox on Test)
برای مقايسه دو گروه وابسته در مواقعی که متغيرها کمی و توزيع حداقل يکی از متغيرها نامتقارن باشد از مدل آماری ناپارامتريک ويل کاکسون استفاده ميشود. فرضيه: بازدهی به روش تکنيکال با بازدهی به روش بنيادی تفاوت دارد. Md=0 : H0 Md≠0 : H1 برای آزمون اين فرضيه مراحل زير طی ميشود: Analyze Nonparametric Test Related Samples 69
70
آزمون ويل کاکسون (Wilcox on Test)
هر دو متغير وابسته را انتخاب و به کادر Test Pair(s) List وارد ميکنيد. در کادر Test Type گزينه Wilcox on را انتخاب ميکنيد. OK را جهت اجرای آزمون انتخاب ميکنيم. نتيجه آزمون شامل دو خروجی است: خروجی اول به ترتيب تعداد حالاتی که متغير اول کمتر از متغير دوم است، تعداد حالاتی که متغير اول کمتر از متغير دوم است، تعداد حالاتی که دو متغير برابر است و تعداد کل داده ها نشان ميدهد. 70
71
آزمون ويل کاکسون (Wilcox on Test)
خروجی دوم آزمون فرضيه است: از آنجائيکه Sig=0.000 و کوچکتر از 0.05 ميباشد، H0 رد مي شود. يعنی بين ميزان بازدهی به روش تکنيکال با ميزان بازدهی به روش بنيادی تفاوت معنی داری وجود دارد. 71
72
آزمون مک نمار (McNmar) آزمون مك نمار ، براي معني دار بودن تغييرات ، به ويژه براي طرحهاي « قبل از/ بعد از » استفاده مي شود كه در آن هر فرد يا آزمودني به عنوان گواه خود به كار مي رود و در آن يافته ها به صورت اسمي يا رتبه اي هستند. از اين آزمون براي بررسي ميزان تاثير يك «... مقاله، كتاب، سخنراني، دوره آموزشي، ملاقات هاي فردي و » مانند هنگامي كه مي خواهيد نظر افراد را قبل از جلسه و بعد از يك جلسه سخنراني مقا يسه كنيد. چنين آزمايش هايي نمونه های وابسته از داده هاي اسمي يا ترتيبي را در اختيار مي گذارند. در اين گونه آزمون ها فرضيه هاي صفر و يك به صورت زير مطرح اند. فرض صفر بيان مي دارد كه اختلافي بين نظرات آزمون شوندگان در قبل و بعد وجود ندارد و در مقابل فرضيه يك بين دو حالت ، اختلاف قائل است 72
73
آزمون مک نمار (McNmar) برای سنجش معنی دار تغییرات با استفاده از این روش باید ابتدا پاسخ های دریافت شده از آزمودنی ها را در یک جدول دو در دو به صورتی که در زیر مشاهده می کنید قرار داد . در این جدول آزمودنی هائی که تغییر را نشان می دهند در خانه های A و D قرار داده شده اند A آنهائی هستند که از + به - و B آنهائی هستند که از – به + تغییر داشته اند همچنین خانه های C و D آزمودنی هائی هستند که تغییر نکرده اند . 73
74
آزمون مک نمار (McNmar) اگر داده های دو گروه به صورت دو ارزشی باشد، بعبارتی متغيرها کيفی دو ارزشی باشند از آزمون مک نمار (McNmar) استفاده ميشود. Analyze Nonparametric Test Related Samples مانند: نظرات موافق و مخالف دانشجويان قبل و بعد از ديدن فيلم آموزشی فرضيه: بين نظرات مديران قبل و بعد از انتخابات تفاوت معنی داری وجود دارد. Md = 0 : H0 Md ≠ 0 : H1 74
75
آزمون مک نمار (McNmar) شامل دو خروجی است. خروجی اول فراوانی ترکيبی دو متغير را نشان ميدهد. خروجی دوم فرضيه پژوهش را آزمون ميکند. از آنجائيکه Sig=0.760 و بيشتر از 5 درصد است، H0 رد نميشود. بعبارتی بين نظرات مديران قبل و بعد از انتخابات تفاوت معنی داری وجود ندارد. يعنی انتخابات در نظرات مديران تاثير ندارد. 75
76
آزمون کوکران(Cochran Test)
اگر داده در سه وضعيت و به صورت دو ارزشی باشد، از آزمون کوکران (Cochran's Test) استفاده ميشود. (مقايسه سه گروه وابسته دو ارزشي) Analyze / Nonparametric Test / K Related Samples مانند: نظرات موافق و مخالف دانشجويان: قبل از نمايش فيلم اول، بعد از نمايش فيلم اول و قبل از نمايش فيلم دوم، بعد از نمايش فيلم دوم نظرات دانشجويان در سه وضعيت يکسان است : H0 دست کم نظرات دانشجويان در دو وضعيت يکسان نيست : H1 76
77
آزمون کوکران(Cochran Test)
نتيجه آزمون شامل دو خروجی است. خروجی اول فراوانی تلفيقی سه متغير را نشان ميدهد. خروجی دوم فرضيه پژوهش را آزمون ميکند. از آنجائيکه Sig=0.656 و بيشتر از 5 درصد است، H0 رد نميشود. بعبارتی بين نظرات مديران در سه وضعيت تفاوت معنی داری وجود ندارد. 77
78
آزمون کروسکال - والیس(Kruskal - WallisTest)
اگر فرضيه مطرح شده به مقايسه ميانگين چند گروه مستقل بپردازد و استفاده از آزمون پارامتريک مقايسه ميانگين چندگروه به دليل متقارن نبودن توزيع حداقل يک گروه يا نمونه های کوچک امکانپذير نباشد از آزمون کروسکال-واليس استفاده ميکنيم. فرضيه: ميانگين رتبه بازدهی شرکتهای توليدی، شرکتهای خدماتی و شرکتهای سرمايه گذاری متفاوت است. ميانگين رتبه گروه3 = ميانگين رتبه گروه2 = ميانگين رتبه گروه 1 : H0 دست کم ميانگين رتبه بازدهی دو گروه شرکت يکسان نيست : H1 آزمون کروسکال - والیس(Kruskal - WallisTest) Analyze…Nonparametric Test …K Independent Samples… نتيجه آزمون شامل دو خروجی است. خروجی اول فراوانی و ميانگين رتبه سه متغير را نشان ميدهد. خروجی دوم فرضيه پژوهش را آزمون ميکند. از آنجائيکه Sig=0.008 و کمتر از 5 درصد است، H0 رد ميشود. بعبارتی دست کم ميانگين رتبه بازدهی دو گروه شرکت يکسان نيست. 78
79
بررسی نرمال بودن توزیع متغیرها
در اين خروجی Sig کمتر از 5 درصد يعني توزيع نرمال نيست بعبارتي H0 رد ميشود. 79
80
تحلیل همبستگی (Correlation) رگرسیون ( Regression )
همبستگی نوع رابطه دو متغير را نشان ميدهد، که برای تعيين آن از ضريب همبستگی استفاده ميشود. مقدار ضريب همبستگی بين عدد 1 و 1- است. در صورت نبودن رابطه همبستگي صفر است. ضريب همبستگی پيرسون (Pearson Correlation Coefficient): اگر توزيع متغيرها متقارن و تعداد داده ها زياد و متغير متريک باشد از اين ضريب استفاده ميشود(پارامتريك). ضريب همبستگی اسپرمن (Spearman Correlation Coefficient): اگر توزيع متغيرها نامتقارن و يا تعداد داده ها کم باشد از اين ضريب از طريق رتبه داده ها به جای مقادير واقعی استفاده ميشود(ناپارامتريك). فرضيه: بين دو متغير بازدهی تکنيکال و بازدهی بنيادی همبستگی(رابطه) وجود دارد. ضريب همبستگی كندال (Kendall's tau) اگر متغيرها در سطح رتبه اي باشند و يا متغيرها ناپارامتريك باشند كاربرد دارد. مثال: بين رده سني و سطح درآمد رابطه وجود دارد. 80
81
تحلیل همبستگی (Correlation) رگرسیون ( Regression )
بين دو متغير همبستگی معنی داری وجود ندارد r = 0 : H0 بين دو متغير همبستگی معنی داری وجود دارد r ≠ 0 : H1 Analyze Correlate bivariate اگر فرضيه پژوهش دو طرفه بيان شود در آنصورت گزينه Two-tailed را انتخاب کنيد و در صورتی که يک طرفه باشد گزينه One-tailed انتخاب ميشود. نتيجه هر آزمون شامل يک خروجی است. در خروجی همبستگی پيرسن از آنجائيکه همبستگی دو متغير است و Sig=0.048 و کمتر از 5 درصد است، H0 رد ميشود. بعبارتی بين دو متغير رابطه معنی دار وجود دارد. 81
82
تحلیل همبستگی (Correlation) رگرسیون ( Regression )
در خروجی همبستگی اسپرمن از آنجائيکه همبستگی دو متغير است و Sig=0.052 و بيشتر از 5 درصد است، H0 رد نميشود. بعبارتی بين دو متغير همبستگی و رابطه معنی دار وجود ندارد. 82
83
همبستگی جزئی یا تفکیکی (Partial Correlation)
در محاسبه همبستگی برای حذف آثار ساير متغيرها بر رابطه دو متغير از همبستگی جزئی استفاده ميشود. در اينصورت متغير ديگر را بايستی کنترل کرد. Analyze Correlate Partial پس از اجرای دستور بالا متغيرهای مورد نظر را به کادر منتقل ميکنيد. و از گزينه Option آماره Zero-order Correlations انتخاب ميشود. و پس از اجرا، يک خروجی به صورت زير نشان داده ميشود که شامل دو بخش است. در بخش اول اثر متغير کنترل در نظر گرفته نميشود ولی در بخش دوم اثر آن مورد بررسی قرار ميگيرد. در بخش دوم خروجی با کنترل اثر متغير بازده، همبستگی دو متغير بنيادگرا و تکنيکال برابر است و Sig=0.328 و بيشتر از 5 درصد، لذا H0 رد نميشود. بعبارتی بين دو متغير رابطه معنی دار وجود ندارد. بدون در نظر گرفتن متغير کنترل همبستگی دو متغير تکنيکال و بنيادگرا برابر 0.18 ميباشد که آن نيز در سطح 0.05 معنی دار نيست. 83
84
همبستگی جزئی یا تفکیکی (Partial Correlation)
85
رگرسیون خطی ساده با فرض آنکه رابطه علت و معلولی بين دو متغير کمی وجود داشته باشد و مقدار متغير وابسته به کمک متغير مستقل برآورد شود از مدل رگرسيون ساده زير استفاده ميشود. Y = α + βx Analyze Regression Linear پس از اجرای دستور بالا متغيرهای مورد نظر(وابسته و مستقل) را به کادر منتقل و سپس ok ميکنيد که نتيجه شامل چهار خروجی است. خروجی اول متغير مستقل وارد شده را نشان ميدهد. 85
86
رگرسیون خطی ساده خروجی دوم به ترتيب ضريب همبستگی، ضريب تعيين، ضريب تعيين تعديل شده و خطای معيار تخمين را ارايه ميکند. در صورتی که تعداد نمونه ها کوچک باشد ضريب تعيين تعديل شده برای تفسير مناسبتر است. 86
87
رگرسیون خطی ساده خروجی سوم تحليل واريانس رگرسيون(ANOVA) به منظور قطعيت وجود رابطه خطی بين دو متغير است. که از طريق آماره F معنی داری کل مدل را بيان ميکند. رابطه خطی بين دو متغير وجود ندارد : H0 رابطه خطی بين دو متغير وجود دارد : H1 87
88
رگرسیون خطی ساده از آنجائيکه Sig=0.169 و بيشتر از 0.05 است، پس فرض خطی بودن رابطه دو متغير رد ميشود. سطر Regression در جدول بيانگر ميزان تغييرات متغير وابسته است که از طريق متغير يا متغيرهای مستقل تبيين ميشود. سطر Residual نيز بيانگر ميزان تغييرات متغير وابسته است که توسط ساير عوامل (تصادفی) تبيين ميشود. در خروجی چهارم معادله رگرسيون برآورد ميشود. Y= X آزمون ضرايب جزئی مدل: 88
89
رگرسیون خطی ساده a = 0: H0 a ≠ 0 : H1 از آنجائيکه Sig= و بيشتر از 0.05 است، پس فرض تساوی ضريب ثابت با صفر رد نميشود. B = 0: H0 B ≠ 0 : H1 از آنجائيکه Sig=0.169 و بيشتر از 0.05 است، پس فرض تساوی ضريب معادله با صفر رد نميشود. 89
90
رگرسیون خطی ساده آزمون ضرايب جزئی مدل:
اگر تاثير دو يا چند متغير روی متغير وابسته مورد بررسی قرار گيرد از رگرسيون چند متغيره استفاده ميشود. Y= α + β1x1 + β 2x2 + ….+ β nxn آزمون ضرايب جزئی مدل: α = 0: H0 α ≠ 0 : H1 β1 = 0:H0 H0: β1 ≠ 0 β2 = 0 : H0 β2 ≠ 0 : H1 90
91
رگرسیون خطی ساده خروجی اول: خروجی دوم: 91
92
رگرسیون خطی چند متغیره خروجی سوم:
اين خروجی در کل خطی بودن مدل را تائيد ميکند. بعبارتی رابطه خطی بين متغيرهای مستقل از يک سو و متغير وابسته از سوی ديگر وجود دارد. SIG=0.000 فرضيه خطی بودن مدل را تائيد ميکند. 92
93
رگرسیون خطی چند متغیره خروجی چهارم:
معادله رگرسيون خروجی زير بدين صورت است: در اين مدل ضرايب متغيرهای MA و RSI معنی دار نيست بنابر اين بايستی از مدل خارج شوند. Y= MFI MFI* MA RSI 93
94
مفروضات رگرسیون خطی توزيع متغير وابسته بايد متقارن باشد.
توزيع خطاها(پسماندها) بايد دارای توزيع نرمال باشد. برای بررسی اين فرض بايستی نمودار نرمال استاندارد خطاها را مشاهده کرد. در توزيع نرمال ميانگين صفر و انحراف معيار برابر 1 است. در صورتی که خطاها دارای توزيع نرمال نباشد از لگاريتم متغيرها به جای خود متغيرها استفاده ميشود. روي گزينه PLOTS در پنجره LINER REGRESSION تا كادر مربوطه باز شود. متغير ZRESID(خطاي استاندارد شده) را انتخاب و به كادر Y منتقل كنيد. متغير ZPRED(مقادير پيش بيني شده استاندارد) را انتخاب و به كادر X منتقل كنيد و با انتخاب HISTOGRAM نمودار زير حاصل ميشود. 94
95
مفروضات رگرسیون خطی فرض هم خطی(Colinerity) هم خطی وضعيتی است که يک متغير مستقل تابعی از متغير مستقل ديگر است. در پژوهش به دنبال رد هم خطی هستيم. برای بررسی هم خطی ميتوان همبستگی بين متغيرهای مستقل را با يکديگر مورد بررسی قرار داد. چرا که ضريب تعيين بالا و به ظاهر مناسب، رگرسيون کاذب نشان ميدهد. لذا ضروری است آزمون هم خطی تست شود. آزمون هم خطی: Reg statistics Co linearity diagnostics continue ok هم خطی وجود ندارد(همبستگی داخلی وجود ندارد): H0 هم خطی وجود دارد(همبستگی داخلی وجود دارد): H1 هر چقدر تولرانس مربوط به متغيرها بيشتر باشد رگرسيون بهتر است. عامل تورم واريانسها (VIF) نيز هر چقدر بزرگتر باشد رگرسيون برای پيش بينی نامناسب است. 95
96
ضريب تولرانس بين 0 و 1 است. و نشان ميدهد كه متغيرهاي مستقل تا چه اندازه رابطه خطي با يكديگر دارد. به 1 نزديك باشد هم خطي كمتر است و بر عكس. هر چه قدر عامل تورم واريانس از عدد 2 بزرگتر باشد ميزان هم خطي بيشتر است . VIF از تقسيم عدد 1 بر مقدار تولرانس حاصل ميشود. 96
97
راههای رفع هم خطی خلاصه کردن متغيرهای مستقل در چند عامل
کنار گذاشتن متغيرهای دارای همبستگی بالا با بقيه متغيرها بازنگری داده ها وارد کردن متغيرهای مجازی استفاده از اولين تفاضل استفاده از لگاريتم متغيرها 97
98
مفروضات رگرسیون خطی خود همبستگی بين خطاها :
چنانچه آماره دوربين – واتسون بين 1/5 و 2/5 قرار گيرد HO پذيرفته ميشود. يعنی رگرسيون قابل استفاده است. برای رفع خود همبستگی متغير وابسته با يک دوره وقفه زمانی (سال قبل) در داخل مدل قرار ميگيرد. يا از اولين تفاضل کليه متغيرها استفاده شود. عدم همبستگی بين خطاها : H0 خود همبستگی بين خطاها : H1 98
99
مدل لوجیت ( Logit ) رگرسيون لجستيك نوعي تحليل رگرسيون است كه وقتي متغير وابسته طبقه اي و داراي دو ارزش باشد بكار ميرود، در حالي كه متغير مستقل ميتواند پيوسته يا گسسته باشد. در اين رگرسيون به جاي حداقل كردن مجذور خطاها (كه در رگرسيون معمولي انجام ميگرفت)، احتمالي را كه يك واقعه رخ ميدهد حداكثر ميكند. براي بررسي معني دار بودن مدل به جاي آماره F از آماره كاي دو ( Chi-square ) و براي بررسي معني داري ضرايب به جاي آماره t از آماره والد (wald ) استفاده ميشود. در رگرسيون لجستيك از مفهومي به نام نسبت برتري استفاده ميشود. مانند: شركتهاي ورشكسته، شركتهاي ورشكست نشده وضعيت اعتباري( مشتريان خوش حساب، مشتريان بد حساب) 99
100
مثال : با استفاده از متغيرهاي نسبت بدهي(debt)، نسبت جاري(current) و نسبت سودآوري(prof) ورشكستگي شركتها (bankrupt) را پيش بيني كنيد. Analyze Reg Binary logistic متغير وابسته(ورشكستگي) را به كادر Dependent منتقل كنيد. متغيرهاي مستقل را به كادر covariate منتقل كنيد. سپس Ok 100
101
Dependent Variable Encoding
Original Value Internal Value عدم ورشكستگي ورشكستگي 1 Omnibus Tests of Model Coefficients Chi-square df Sig. Step 1 Step 4 .000 Block Model Sig كاي دو مدل برابر و كمتر از 0.05 است، بنابراين متغيرهاي مستقل بر متغير وابسته تاثير داشته و نشان دهنده برازش مناسبي است. 101
102
Classification Table(a)
Model Summary Step -2 Log likelihood Cox & Snell R Square Nagelkerke 1 .000(a) .745 1.000 Nagelkerke R Square معادل ضريب تعيين در رگرسيون خطي است كه در اينجا برابر 1 است. يعني 100 درصد تغييرات متغير وابسته توسط متغيرهاي مستقل رگرسيون لجستيك تبيين ميشود. Classification Table(a) Observed Predicted وضعيت ورشكستگي Percentage Correct عدم ورشكستگي ورشكستگي Step 1 وضعيت 38 100.0 50 Overall Percentage اين خروجي مقادير مشاهده شده و مقادير پيش بيني شده را نشان ميدهد و بر اساس اين خروجي مشخص ميگردد كه چقدر پيش بيني مدل درست است. مدل صد درصد شركتها را به درستي طبقه بندي كرده است. 102
103
Variables in the Equation
S.E. Wald df Sig. Exp(B) Step 1(a) deb 36.672 .000 1 .999 current -.188 1.000 .829 prof .998 BAZAR -.001 53.772 Constant 12.260 اين خروجي ضرايب متغيرهاي وارد شده در مدل و نتايج آزمون والد را نشان ميدهد. با توجه به SIG آماره والد متغيرهاي مستقل در سطح 0.05 خطا معني دار نيستند. خروجي مدل لاجيت بصورت زير است. B ميزان تغيير در لگاريتم نسبت برتري را به ازاي يك واحد تغيير در متغير مستقل اندازه گيري ميكند. 103
104
پایان
105
چارچوب مقاله نویسی عنوان (Title) چكيده (Abstract)
1) مقدمه (Introduction) 2) مروري بر مباني نظري و پيشينه (Literature Review) 3) روش (Methodology) 4) داده ها و نتايج (Data and Result) 5) نتيجه گيري كلي (Conclusion) منابع (Reference) ضمايم (Apendex) 105
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.