מבחן t למדגמים בלתי תלויים

Slides:



Advertisements
Similar presentations
Completeness and Expressiveness. תזכורת למערכת ההוכחה של לוגיקה מסדר ראשון : אקסיומות 1. ) ) (( 2. )) ) (( )) ( ) ((( 3. ))) F( F( ( 4. ) v) ( ) v ((
Advertisements

מבוא למדעי המחשב לתעשייה וניהול
1 Formal Specifications for Complex Systems (236368) Tutorial #4 Refinement in Z: data refinement; operations refinement; their combinations.
©Silberschatz, Korth and Sudarshan4.1Database System Concepts סכימה לדוגמא.
1 Formal Specifications for Complex Systems (236368) Tutorial #2 Z introduction and notation (contd.); Birthday book example (Chapter 1 in the book); Z.
שיעור 6# Bayesian networks
מתמטיקה בדידה תרגול 3.
רקורסיות נושאי השיעור פתרון משוואות רקורסיביות שיטת ההצבה
משטר דינמי המשך – © Dima Elenbogen :55 חידה שכדאי לעבור עליה: 2011/ho/WCFiles/%D7%97%D7%99%D7%93%D7%94%20%D7%A2%D7%9D%20%D7%91%D7%95%D7%A0%D7%95%D7%A1.doc.
חורף - תשס " ג DBMS, Design1 שימור תלויות אינטואיציה : כל תלות פונקציונלית שהתקיימה בסכמה המקורית מתקיימת גם בסכמה המפורקת. מטרה : כאשר מעדכנים.
שיטות מחקר בתקשורת שיעור מס' 3- מדידה. מדידה -הגדרה מדידה - מתן ערך של משתנה לכל תצפית. מדידה - מתן ערך של משתנה לכל תצפית. דוגמא: מספר עיתונים שקורא.
מה החומר למבחן ? כל החומר שנלמד בהרצאות ובתרגולים. לגבי backtracking: לא תידרשו לממש אלגוריתם, אך כן להבין או להשלים מימוש נתון. אחת משאלות המבחן מבוססת.
1 שונות המשתנה. המודל : הנחות 1-3 מתקיימות. הנחה 4 אינה מתקיימת - כך שלפחות עבור תצפית אחת השונות שונה מהשונות של יתר התצפיות. לפחות עבור s ו t אחד. תוצאות.
אוטומט מחסנית הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 11.
אינטרפולציה רועי יצחק.
חורף - תשס " ג DBMS, צורות נורמליות 1 צורה נורמלית שלישית - 3NF הגדרה : תהי R סכמה רלציונית ותהי F קבוצת תלויות פונקציונליות מעל R. R היא ב -3NF.
Map-Reduce Input: a collection of scientific articles on different topics, each marked with a field of science –Mathematics, Computer Science, Biology,
1 Formal Specifications for Complex Systems (236368) Tutorial #5 Refinement in Z: data refinement; operations refinement; their combinations.
בהסתברות לפחות למצא בעיה במודל PAC עבור בהסתברות ε הפונקציה f טועה מודל ONLINE 1. אחרי כל טעות הפונקציה משתפרת 2. מספר הטעיות קטן.
מסדי נתונים תשס " ג 1 תכנון סכמות – אלגוריתם פירוק לתבניות בצורת BCNF מסדי נתונים.
עיבוד תמונות ואותות במחשב אלכסנדר ברנגולץ דואר אלקטרוני : שיטות קידוד שיטות קידוד אורך מלת קוד ואנטרופיה אורך מלת קוד ואנטרופיה קידוד.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
Formal Specifications for Complex Systems (236368) Tutorial #6 appendix Statecharts vs. Raphsody 7 (theory vs. practice)
תורת הקבוצות חלק ב'. קבוצה בת מניה הגדרה: קבוצה אינסופית X היא ניתנת למניה אם יש התאמה חד-חד ערכית בין X לבין .
תכנות תרגול 6 שבוע : תרגיל שורש של מספר מחושב לפי הסדרה הבאה : root 0 = 1 root n = root n-1 + a / root n-1 2 כאשר האיבר ה n של הסדרה הוא קירוב.
1 Formal Specifications for Complex Systems (236368) Tutorial #1 Course site : T.A. :Emilia Katz.
הרחבות המודל הבסיסי של היצע העבודה ד"ר אנליה שלוסר.
תחשיב הפסוקים חלק ג'. צורות נורמליות א. DF – Disjunctive Form – סכום של מכפלות. דוגמא: (P  ~Q  R)  (R  P)  (R  ~Q  ~P) הגדרה: נוסחה השקולה לנוסחה.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
ערכים עצמיים בשיטות נומריות. משוואה אופינית X מציין וקטור עצמי מציינת ערך עצמי תואם לוקטור.
הפקולטה למדעי המחשב אוטומטים ושפות פורמליות (236353)
Data Structures, CS, TAU, Perfect Hashing 1 Perfect Hashing בעיה : נתונה קבוצה S של n מפתחות מתחום U השוואה ל - Hash : * טבלה קבועה (Hash רגיל - דינאמי.
1 Data Structures, CS, TAU, Perfect Hashing בעיה: נתונה קבוצה S של n מפתחות מתחום U השוואה ל- Hash : * טבלה קבועה (Hash רגיל - דינאמי) * רוצים זמן קבוע.
תוחלת ושונות בהתפלגויות אחרות התפלגות בינומית : X~B(n,p) E(X)=np, σ 2 (x)=np(1-p) התפלגות היפרגיאומטרית : X~H(N,n,M) E(X)=n*M/N, σ 2 (x)=n*M/N(1-M/N)[(N-n)/N-1)]
רגרסיה קו רגרסיה הוא קו תיאורטי המאפשר לנו לבחון את השפעתו של משתנה מנבא אחד (או יותר) על המשתנה התלוי: במילים אחרות, מודל רגרסיה עוזר לנו לנבא על פי משתנה.
מערכים עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר int grade1, grade2, …, grade20; int grade1, grade2, …, grade20;
מודל הלמידה מדוגמאות Learning from Examples קלט: אוסף של דוגמאות פלט: קונסיסטנטי עם פונקציה f ב- C ז"א קונסיסטנטי עם S ז"א מודל הלמידה מדוגמאות Learning.
עקרון ההכלה וההדחה.
יחס סדר חלקי.
מבוא למדעי המחשב תרגול 3 שעת קבלה : יום שני 11:00-12:00 דוא " ל :
תחשיב היחסים (הפרדיקטים)
מדדי פיזור פיזור מצביע על מידת ההטרוגניות או ההומוגניות של ההתפלגות. פיזור הוא מדד יחסי, כיוון שאפשר לומר אם הפיזור בהתפלגות רחב או צר, רק ביחס לפיזור.
Markov Decision Processes (MDP) תומר באום Based on ch. 14 in “Probabilistic Robotics” By Thrun et al. ב"הב"ה.
מתמטיקה בדידה תרגול 2.
1 מבוא למדעי המחשב סיבוכיות. 2 סיבוכיות - מוטיבציה סידרת פיבונאצ'י: long fibonacci (int n) { if (n == 1 || n == 2) return 1; else return (fibonacci(n-1)
Safari On-line books. מה זה ספארי ספארי זו ספריה וירטואלית בנושא מחשבים היא כוללת יותר מ כותרים כל הספרים הם בטקסט מלא ניתן לחפש ספר בנושא מסוים.
פיתוח מערכות מידע Class diagrams Aggregation, Composition and Generalization.
1. Association Association JM Last: A dictionary of epidemiology 2 Statistical dependence between 2 or more events, characteristics, or other variables.
מבוא למדעי המחשב לתעשייה וניהול הרצאה 7. סברוטינות subroutines.
Population genetics גנים באוכלוסיות a population is a localized group of individuals belonging to the same species.
1 Formal Specifications for Complex Systems (236368) Tutorial #1 Course site:
1 ניתוח שונות: Post-hoc analysis ניתוח שונות חד-כיווני עם אפקטים קבועים: Post-hoc analysis ד"ר מרינה בוגומולוב מבוסס חלקית על ההרצאות של פרופ' יואב בנימיני.
מספרים אקראיים ניתן לייצר מספרים אקראיים ע"י הפונקציה int rand(void);
Formal Specifications for Complex Systems (236368) Tutorial #1
מבוא למדעי המחשב סיבוכיות.
SQL בסיסי – הגדרה אינדוקטיבית
שימוש בשיטה א-פרמטרית להשוואת תוחלות של שתי אוכלוסיות.
פקודות data לסדר את המקרים לפי סדר מסויים Sort cases.
השוואת נתונים למודל הסתברותי - כללית
Mediation and Moderation
פרוקטוז, C6H12O6 , חד-סוכר מיוחד
ממשקים - interfaces איך לאפשר "הורשה מרובה".
בדיקת השערות על השוואת שני סטטיסטים
בעיות נוספות ב-NPC.
Marina Kogan Sadetsky –
מבחן t למדגמים בלתי תלויים
השערות מחקר והשערות המבחן הסטטיסטי
מבחן t למדגם יחיד.
ניתוח מודלים היררכיים hlmעל ידי
Presentation transcript:

מבחן t למדגמים בלתי תלויים השוואת ערכיהן של שתי קבוצות נפרדות, שונות ובלתי תלויות במדגם לגבי אותו משתנה. לדוגמה, השוואת ממוצע המשכורות של הפקידים לעומת ממוצע המשכורות של המנהלים במדגם; דוגמה נוספת: השוואת ממוצע שעות צפייה של גברים לעומת שעות צפייה של נשים.

מתי נבצע מבחן t למדגמים בלתי תלויים כאשר המשתנה הבלתי תלוי הוא בעל שתי רמות בלבד. (הוא יכול להיות בעל יותר משתי רמות אך אנו יכולים לבצע את המבחן רק על שתי רמות מתוך כלל הרמות של המשתנה). כאשר המשתנה הבלתי תלוי הוא משתנה רציף מסולם קוואזי רווח ומעלה. כאשר נבדקים שונים נמצאים בשתי הרמות. (לא ייתכן כי יהיו לנו נבדקים שיימצאו בשני המדגמים).

analyze > compare means > independent sample t-test

דוגמא: האם קיים הבדל בין ממוצע שנות ההשכלה בקרב נשים מול הממוצע של אותו משתנה בקרב גברים. לצורך כך, נערוך מבחן t למדגמים בלתי תלויים. ההשערה שלנו היא, שקיים הבדל בין ממוצע שנות ההשכלה של נשים ובין הממוצע של גברים. 0= H0: μ1 - μ2 H1: μ1 - μ2 ≠ 0

ב spss: משתנה תלוי – שנות השכלה:המשתנה שאת הממוצעים שלו נרצה להשוות בין שתי הקבוצות משתנה בלתי תלוי – מין הנחקר: הבדל הממוצעים בין שתי רמותיו ייבדקו נפתח את חלונית Define groups על מנת להגדיר את ערכי המשתנה – 1: גברים, 2:נשים

סטיית התקן של כל אחד מהמדגמים: גודל כל אחד מהמדגמים הבלתי תלויים: Output – טבלה 1: סטיית התקן של כל אחד מהמדגמים: SD1 = 3.143 SD2 = 2.839 ממוצע שנות ההשכלה של הגברים: 13.23 = M ממוצע בנות ההשכלה של הנשים: 12.63 M = גודל כל אחד מהמדגמים הבלתי תלויים: n1= 633 n2= 877

טבלה 2: חלק א – מבחן לווין לפני מבחן ה t קיים מבחן מקדים – מבחן לווין. המבחן בודק האם קיים שוויון בשונויות בין הקבוצות (השערת האפס של לוין), או שאין שוויון בשונויות. עלינו לבדוק האם לדחות את השערת האפס של לווין או לא: 2 σ = 1σ H0: > שוויון בשונויות – שני המדגמים נגזרו מתוך אוכלוסיות שוות פיזור. 2σ ≠ 1σ H1: > אי שוויון בשונויות – שני המדגמים נגזרו מתוך אוכלוסיות בעלות פיזור שונה.

מבחן לווין ב spss: אם ה-F יצא מובהק, אזי אין שוויון בשונויות. כלומר – נדחה את השערת האפס של לווין ונתייחס לנתונים מהשורה התחתונה (המוצגים על בסיס ההנחה שאין שוויון בשונויות). אם ה-F יצא לא מובהק, אזי יש שוויון בשונויות. כלומר – לא נדחה את השערת האפס של לווין, ולכן נתייחס לנתונים מהשורה העליונה (המוצגים על בסיס ההנחה שקיים שוויון בשונויות).

מבחן לווין ב spss: equal variance assumed = השערת האפס, קיים שוויון שונויות בין הקבוצות. במקרה הזה אפשר לראות שה-F במבחן לווין יצא מובהק ולכן נדחה את השערת האפס של לווין – כלומר אין שוויון בשונויות של שתי הקבוצות, ולכן נעבור להסתכל בנתונים המוצגים בשורה התחתונה. equal variance not assumed = דחיית השערת האפס, לא קיים שוויון שונויות בין הקבוצות.

המשך טבלה 2: רווח בר סמך: במציאות, שלא כמו במדגם, ההפרש בין הממוצעים ינוע בין הגבולות הללו. חשוב: אם אחד מהם שווה 0, ההשערה שלנו תידחה. ערך ה t המחושב טעות התקן (סטיית התקן של התפלגות הדגימה) ערך דרגות החופש-n1 +n2 – 2 = df ההבדל (ההפרש) בין הממוצעים מובהקות מבחן t – אם מובהק נדחה את השערת האפס של המחקר ואם לא מובהק, לא נדחה אותה.

מסקנה: נערך מבחן t למדגמים בלתי תלויים, ונמצא הבדל מובהק בין גברים לנשים במספר שנות הלימוד שלהם [t(1277)=3.824, p<0.05], כך שממוצע שנות ההשכלה אצל גברים גבוה (M=13.23, SD=0.3.14) מממוצע שנות ההשכלה אצל נשים (M=12.63, SD=2.839 ).

דוגמא נוספת: האם קיים הבדל בין ממוצע החשיבות שנותנות נשים לפופולאריות ובין ממוצע החשיבות שנותנים גברים לשאלה עד כמה חשוב להם להיות פופולריים. לצורך כך, נערוך מבחן t למדגמים בלתי תלויים. ההשערה שלנו היא, שקיים הבדל בין ממוצע חשיבות הפופולאריות בין גברים לנשים. 0= H0: μ1 - μ2 H1: μ1 - μ2 ≠ 0

מסקנה: נערך מבחן t למדגמים בלתי תלויים, ונמצא הבדל מובהק בין גברים לנשים בחשיבות שהם נותנים לפופולאריות [[t(771) = -3.126, p < 0.05, כך שממוצע החשיבות שנותנות נשים לפופולאריות גבוה (M=4.66, SD=0.69) מהממוצע של הגברים (M=4.5, SD=0.83 ).

מבחן t למדגמים מזווגים: נבדקים ההבדלים בין ממוצעים שונים עבור אותן תצפיות. כלומר - השוואת הממוצעים של שני משתנים שונים בעבור אותה קבוצה. לדוגמה, השוואה בין ממוצע המשקל של המשתתפים במדגם לפני דיאטה ואחרי דיאטה, או השוואה בין משכורות של קבוצה אחת בנקודות זמן שונות (מחקרי אורך).

analyze > compare means > paired samples t-test

בחלונית שנפתחת: מעבירים את שני המשתנים שרוצים להשוות בין הממוצעים שלהם

דוגמא: נבקש להשוות בין הממוצעים של השכלת הנבדק להשכלת אביו. נבצע מבחן t למדגמים מזווגים כיוון שמדובר באותה קבוצת נבדקים – השכלתם והשכלת אביהם. ההשערה שלנו היא שקיים הבדל בין השכלת הנחקר להשכלת אביו. 0= H0: μ1 - μ2 H1: μ1 - μ2 ≠ 0

ב spss נבחר בשני המשתנים: educ ו-educfather, ונעביר אותם לשדה מימין.

טבלה 1: Out put הממוצע של כל אחד מהמשתנים מספר נבדקים בכל משתנה סטיית התקן של כל אחד מהממוצעים

טבלה 2 תוצאת מתאם פירסון – כיוון שהתקבל מתאם מובהק בין שני המשתנים ניתן לומר שיש קשר ביניהם ולכן הם מזווגים (תלויים זה בזה) מספר הנבדקים בהצלבה של שני המשתנים

טבלה 3 ההבדל בין הממוצעים תוצאת t מחושב מובהקות המבחן

מסקנה: על מנת לבדוק אם קיים הבדל מובהק בין שנות השכלתו של אדם לבין שנות השכלתו של אביו, נערך מבחן t למדגמים מזווגים, ונמצא הבדל מובהק [t(1064)= 22.04, p<0.01], כך שממוצע שנות השכלתו של אדם גבוה יותר (M=13.42, SD=2.86) מזו של אביו (M=10.87, SD=4.12).