Presentation is loading. Please wait.

Presentation is loading. Please wait.

אוכלוסייה ומדגם Population & Sample

Similar presentations


Presentation on theme: "אוכלוסייה ומדגם Population & Sample"— Presentation transcript:

1 אוכלוסייה ומדגם Population & Sample
השיעור מבוסס על הפרק בנושא מספר הקורס: Polit& Beck, (2010) ד"ר מיכל ליברגל PhD, CNM, RN בית הספר לסיעוד ע"ש הנרייטה סאלד במחקרים הכמותיים חשוב לנו לדעת מהו מספר הנחקרים שיש לקחת למחקר-המדגם שלו- כדי לראות שהתוצאות אכן נכונות, מתאימות למטרת המחקר, -מובהקות סטטיסטית.,,, מסקנות שנוכל להכליל, להגיד שמתאימות לאוכלוסיה אותה חקרנו (מדגם של הסבה, ונכון להסבה באופן כללי). בשיעור היום נלמד נלמד על מושגים, על צורות דגימה, על תהליך דגימת המשתתפים במחקר הכמותי (על איכותני תלמדו לחוד). ןלבסוף על חישוב גודל המדגם.

2 האם אנחנו משתמשים בדגימה בחיי היום-יום?
האם אנחנו משתמשים בדגימה בחיי היום-יום? מדף בסופר, איך תבחרו 4 גבינות? מאותה שורה? משורות שונות? ואולי כדי לכסות את המגוון ממספר חברות?

3 מושגים

4 אוסף של פרטים (לדוגמא: אנשים) שהחוקר מתעניין בהם
אוכלוסייה Population פרטים שיש להם קריטריון מסוים, מוגדר בתכונה, זמן ו/או מקום קשה לעשות מחקר על כל האחיות בעולם זמן, כסף..אז בוחרים רק חלק. כמו קופסא= אוכלוסייה ונשלוף מתוכה רק מספרים אחדים=מדגם אוכלוסייה קטנה/ גדולה/ אינסופית או סופית חשוב להגדיר בבירור את האוכלוסייה כי אז נוכל לשייך את תוצאות המחקר לאוכלוסייה אותה הגדרנו מראש אוסף של פרטים (לדוגמא: אנשים) שהחוקר מתעניין בהם

5 דוגמאות לאוכלוסייה - Population
אנשים שיש להם קריטריון מסוים, מוגדר בתכונה, זמן ו/או מקום אחיות מוסמכות בהדסה, בעלות תואר ראשון אחיות מוסמכות בארץ, בעלות תואר ראשון או אחיות מוסמכות בהדסה, בעלות ותק של 10 שנים לפחות אחיות מוסמכות בארץ, שנולדו בין

6 דוגמאות לאוכלוסייה - Population
פרטים שיש להם קריטריון מסוים מוגדר בתכונה , זמן ו/או מקום אוכלוסיה לא מוגבלת רק לבני אדם או ליצורים חיים אוכלוסיית הפינגוינים בעולם או אוכלוסיית הפינגוינים באנטרטיקה בלבד כל האנטיביוטיקה שיוצרה בארץ ב או כל האנטיביוטיקה שיוצרה במפעל בירוחם ב 2007

7 אוכלוסיית המטרה Target Population
אוסף הפרטים שעליהם ארצה להשליך את תוצאות המחקר (הכללה= generalization) כל הכלבים הדלמטיים בארץ

8 אוכלוסייה נגישה Accessible Population
פרטים המתאימים בתכונותיהם לאוכלוסיית המטרה ונגישים לחוקר יש אפשרות לחקור אותם דלמטיים מירושלים שבעליהם עובדים בהדסה

9 יכולת ההכללה Generalization
אפשרות השלכת התוצאות על אוכלוסייה יותר רחבה מזו שהשתתפה במחקר תוצאות המחקר יכולות להיות מושלכות גם על אוכלוסיות אחרות (של דלמטים בעולם, תלמידות לסיעוד בארץ/ בעולם). ככל שטיב המחקר עולה, יכולת ההכללה עולה צורת הדגימה תורמת לטיב המחקר

10 מי יכול להיכלל במחקר ?

11 הגדרת המאפיינים המתאימים להשתתפות במחקר
קריטריונים להכללה Eligibility/ Inclusion criteria הגדרת המאפיינים המתאימים להשתתפות במחקר לדוגמא, מחקר העוסק בשכיחות כאבי גב בקרב סטודנטים מצטיינים בסיעוד, הקריטריונים להכללה יהיו: סטודנטים לסיעוד גילאים: 20-35 ממוצע ציונים מעל 80.0 עובדים עד 16 שעות בשבוע

12 לאחר לידה (עד תום 12 שבועות מיום הלידה) עובדים מעל 16 שעות בשבוע
קריטריונים להרחקה Exclusion criteria הגדרת המאפיינים לאי השתתפות במחקר. לדוגמא, במחקר העוסק בשכיחות כאבי גב בקרב סטודנטים מצטיינים בסיעוד, הקריטריונים להרחקה יהיו: עברו ניתוחי גב בעבר בהריון לאחר לידה (עד תום 12 שבועות מיום הלידה) עובדים מעל 16 שעות בשבוע BMI>30 הקריטריונים להכללה או להרחקה מבטאים לעיתים עניני תקציב, פרקטיות, יכולת להשתתף במחקר

13 דגימה Sampling תהליך הבחירה של הפרטים המייצגים את האוכלוסייה אותה רוצים לבדוק

14 דגימה Sampling לדוגמא: במחקר אשר נערך ב-1976 רצו לבדוק את עמדות התלמידות בבית הספר לאחיות ביחס לאקדמיזציה של המקצוע מהי אוכלוסיית המטרה? מהי האוכלוסייה הנגישה? איך אבחר מי תשתתף במחקר?

15 על מי אני רוצה להכליל את התוצאות? אוכלוסיית היעד
לאיזו אוכלוסייה יש לי נגישות? אוכלוסייה נגישה באיזה דרך אוכל להגיע אליהם? רשימות בוגרים של בתי"ס לאחיות/ פרסום ב-Facebook מסגרת הדגימה מי משתתף במחקר? המדגם

16 מדגםSample אוסף הפרטים שנבחרו המייצגים את האוכלוסייה
במחקר בסיעוד בדרך כלל הפרטים הנחקרים יהיו אנשים אך יכול להיות גם מספר הקטטרים, ממדים כבדייקות דם וכד'

17 מדגם מייצג Representative Sample מדגם הדומה כמה שיותר לאוכלוסייה
אם האוכלוסייה כוללת רק נשים- במדגם יהיו רק נשים אם המדגם אינו מייצג, יכולת ההכללה generalization)) נפגמת

18 הטיה בדגימה Sampling Bias
מחקר הבודק הימצאות של כאבי גב בקרב סטודנטים לסיעוד. מהי ההטיה במדגם הנוכחי? לדוגמא: במחקר סטודנטים וכאבי גב יהיה ייצוג יתר לגבוהות וחוסר ייצוג לנמוכות (מהשורה הראשונה) דוגמא נוספת: המחקר על שביעות רצון מלימודי הסיעוד נחליט לקחת כל סטודנט עשירי. מתוך רשימת השמות או מתוך אלו המופיעים לשיעורים?

19 הטיה בדגימה Sampling Bias
המדגם לא מייצג את האוכלוסייה יש ייצוג יתר או תת ייצוג למאפיין מסוים החשוב למחקר הטיה נובעת מאוכלוסיית מחקר חד גונית (Homogeny) השונה מאוכלוסיית המטרה הרב גונית (Heterogenic) ככל שאוכלוסיית המחקר רב גונית יש פחות סיכוי להטיה

20 שכבות Strata אפשר להתייחס לאוכלוסייה כמורכבת ממספר תת אוכלוסיות, מאפשר ייצוג מתאים לדוגמא: כל האחיות והאחים בארץ (נקבל ייצוג יתר לנשים) נחליט על פרופורציה עפ"י מידע קודם ניצור תתי קבוצות: מוסמכות, תואר ראשון, שני, שלישי גילאי 41-65/24-40 אחת האפשרויות למנוע הטיה זה לכלול במדגם מספר מקומות ישוב (ייצוג סוציו אקונומי שונה)

21 צורות דגימה עיקריות

22 קיימות שתי צורות דגימה עיקריות :
1.דגימה לא הסתברותית Non Probability Sampling 2. דגימה הסתברותית Probability Sampling

23 צורות דגימה 1. דגימה לא הסתברותית Non Probability Sampling
בתהליך הדגימה לא מקפידים על המקריות (אקראיות) ולכן המדגם פחות מדויק מבחינת ייצוג האוכלוסייה אין לכל הפרטים את אותו הסיכוי להיכנס למחקר תהליך בחירת הפרטים למדגם ממהרת, בוחרת את כל הגזרים הראשונים הבאים לה לשקית

24 דגימה לא הסתברותית א. דגימת נוחות Convenience Sampling -
שיטה זו מתבססת על בחירת הנחקרים הנגישים ביותר לעורך המחקר. לדוגמא: מחקר: הימצאות כאבי הגב בקרב סטודנטים לסיעוד. איך כדאי לדגום כדי שיהיה ייצוג הולם ל... ול...? ולמען הנוחות נתפשר ונדגום.... שנות לימוד, שני המינים, נשואות,רווקות וכד' 20 סטודנטים משנה ג‘ אדגום את כל 10 הסטודנטים שהגיעו היום לשיעור ויושבים בשורות הראשונות (שונה מ- 10 סטודנטים מכלל רשימת הכיתה כאשר בוחרת כל שלישי מהרשימה)

25 דגימה לא הסתברותית דוגמא נוספת לדגימת נוחות: מתנדבים
דגימה לא הסתברותית דוגמא נוספת לדגימת נוחות: מתנדבים  פרסום קריאה לנחקרים, בחינם או תמורת תשלום, וקבלת כל הפונים המתאימים

26 דגימה לא הסתברותית ב. כדור שלג –Snowball
"חבר מביא חבר" החוקר פונה למעגל הראשון' של הנדגמים (מספר קטן) הם פונים לחבריהם ומפנים אותם לחוקר, וכך הלאה שיטה זו שימושית במיוחד בחקר תופעות שאינן פומביות, כמו שימוש בסמים חסרונה העיקרי הוא שהיא דוגמת רשת חברתית (Network/ chain sampling)

27 דגימה לא הסתברותית ג. דגימת מכסהQuata Sampling
החוקר מגדיר את: מספר השכבות (Strata) הרצויות כמה משתתפים צריך מכל שכבה (על פי מידע שיש לו על ייצוג השכבות באוכלוסייה) יתרון: משפר את ייצוג המיעוטים (למרות שמדובר עדיין על מדגם נוחות) לדוגמא: רוצה לדעת מי מהסטודנטים מוכן לעבוד עם חולי איידס. ידוע כי גברים נכונים יותר. אם לא אדאג לשכבות ורק אתבסס על נוחות ולא יהיה ייצוג לגברים, התוצאות יהיו מוטות.

28 דגימה לא הסתברותית ג. דגימת מכסהQuata Sampling דוגמא: סטודנטים המוכנים לעבוד עם חולי איידס
שכבה אוכלוסייה גברים 200 (20%) נשים 800 (80%) סה"כ 1000 (100%) באוכלוסיית העובדים בסיעוד יש 20% גברים העובדים בסיעוד אך האם במדגם נוחות יצא לי 20% גברים?

29 דגימה לא הסתברותית ג. דגימת מכסהQuata Sampling דוגמא: סטודנטים המוכנים לעבוד עם חולי איידס n= 200
שכבה אוכלוסייה מדגם נוחות מדגם מכסה גברים 200 (20%) 10 (5%) נשים 800 (80%) 190 (95%) סה"כ 1000 (100%) 200 (100%) יצא כי רק 5% גברים וכדי לשמור על ייצוג הולם צריכה לקחת מכסה של 20% גברים כמו חלקם באוכלוסיה זו

30 דגימה לא הסתברותית ג. דגימת מכסהQuata Sampling דוגמא: סטודנטים המוכנים לעבוד עם חולי איידס n= 200
שכבה אוכלוסייה מדגם נוחות מדגם מכסה גברים 200 (20%) 10 (5%) 40 (20%) נשים 800 (80%) 190 (95%) 160 (80%) סה"כ 1000 (100%) 200 (100%) חייבת להקפיד על ייצוג לדאוג לכך

31 דגימה לא הסתברותית ד. דגימה רציפה Consecutive Sampling
שיטה הכוללת את כל הפרטים העונים לקריטריונים להכללה של המחקר מתוך אוכלוסיה נגישה 50 פגים מונשמים מתוך כל המאושפזים בפגייה בשנת 2009 המשכי, עוקב

32 שיטה המסתמכת על מידע שיש לחוקר
דגימה לא הסתברותית ה. דגימה המכוונת למטרה Purposive/ Judgmental Sampling שיטה המסתמכת על מידע שיש לחוקר המידע עוזר להגדיר מראש את הקבוצה בה הוא מעוניין: למשל קבוצה המומחית בנושא הנחקר משמש למחקר איכותני מחקר שעסק בטראומה של מיילדות. ניקח מיילדות, לא רופאים.

33 לסיכום: דגימה לא הסתברותית Non Probability Sampling
במחקר כמותי: לא מייצגת היטב את האוכלוסייה נמצאת בשימוש רב במחקר בסיעוד נוחה זולה לא דורשת מיומנות רבה יש להיזהר בקבלת הממצאים כי מחקר דומה באותה שיטת דגימה עלול לתת ממצאים אחרים מקובלת כדגימה לפיילוט במחקר כמותי או למחקר איכותני

34 צורות דגימה 2. דגימה הסתברותית Probability Sampling

35 2. דגימה הסתברותית Probability Sampling
לכל אדם באוכלוסייה יש סיכוי שווה ולא תלוי להיבחר למדגם צורת דגימה (הכי) בלתי משוחדת

36 דגימה הסתברותית א.דגימה מקרית פשוטה Simple Random Sampling
30 20 43 15 40 24 55 12 6 52 37 1 41 3 2 31 32 5 4 22 35 8 7 23 36 9 45 מדגם אקראי, בו נבחרים הפרטים למדגם בהליך אקראי מתוך מסגרת הדגימה- Sampling frame- הכי בסיסי ופשוט החוקר יוצר מבנה לדגימה-Sampling frame- רשימת פרטים מהם יבחר המדגם לכל פרט יש מספר סידורי לוקחים רשימת מספרים מוכנה ומתחילים ממקום מסוים לקחת 20 מספרים (המספרים מותאמים לרשימת הסטודנטים) אם האוכלוסייה הנגישה תהיה סטןדנטים שנה ג לסיעוד בהדסה, ניקח את רשימת הסטודנטים

37 דגימה הסתברותית א.דגימה מקרית פשוטה Simple Random Sampling
1 אלה 2 יסמין 3 נעמי 4 שמואל 5 רחיק 6 הדר דגימה הסתברותית א.דגימה מקרית פשוטה Simple Random Sampling רשימת סטודנטים מהם יבחר המדגם לכל פרט יש מספר סידורי לוקחים רשימת מספרים מוכנה ומתחילים ממקום מסוים לקחת 20 מספרים (המספרים מותאמים לרשימת הסטודנטים) 6 42 37 1 41 43 3 2 31 32 5 4 22 35 8 7 23 36 9 45 אין השפעה של החוקר לא פשוט במדגם גדול (למשל כל תושבי ניו יורק) נעשה היום ע"י מחשב יתרונות: נותן ייצוג טוב של האוכלוסייה יש יכולת הכללה חסרונות: תת-אוכלוסיות קטנות אינן באות לידי ביטוי בו (אין כל בטחון שאכן תידגם כמות מספקת מאותה אוכלוסייה)

38 דגימה הסתברותית ב.דגימה שיטתית Systematic Sampling
לוקחים פרטים מתוך רשימה על פי החלטה בה רווח הדגימה נקבע מראש מרווח הדגימה ((sampling interval=המרחק התקני (standard) בין האלמנטים הנבחרים למדגם. לדוגמא: אם רוצים מדגם בן 200 איש מתוך 60,000 דוגמים כל אדם 300 מתוך רשימה ידועה (הראשון יילקח בצורה מקרית מתוך הרשימה) דומה למקרית פשוטה רק יותר מאורגן

39 דוגמא: מתוך 28 ניקח כל אדם רביעי
30 20 43 15 40 24 55 12 6 52 37 1 41 3 2 31 32 5 4 22 35 8 7 23 36 9 45 אם רוצים רק אחיות מהשורה, חשוב שרשימה כזו לא תכלול אחות ראשית כל מספר מסויים וכדומה

40 דגימה הסתברותית ג.דגימה מקרית שכבות Stratified Random Sampling
דגימת שכבות  כדי להבטיח ייצוג של קבוצות אוכלוסיה מסוימות במדגם, ניתן להשתמש בדגימת שכבות בעת בחירת המדגם, מבטיחים מכסה מסוימת של נדגמים מכל תת אוכלוסייה ניתן לחלק לשכבות לפי מין, גיל, קבוצות אתניות ועוד בעת הניתוח הסטטיסטי, משוקללות השכבות על מנת שלא ליצור הטיה בשל ייצוג יתר של תת הקבוצות

41 דגימה הסתברותית ב.דגימה מקרית שכבות (המשך) Stratified Random Sampling
Proportionate יחסית sample אותה השכיחות כמו באוכלוסייה לדוגמא: אוכלוסיית סטודנטים לסיעוד בארץ הכוללת חמשת אלפים איש עם 10% גברים ו-90% נשים המדגם: 100סה"כ סטודנטים, 10 גברים ו- 90 נשים .

42 דגימה הסתברותית ג. דגימה מקרית שכבות (המשך) Stratified Random Sampling
2. לא יחסית Disproportionate sample ללא התייחסות לשכיחות באוכלוסייה לדוגמא: אוכלוסיית הסטודנטים למשפטים בארץ הכוללת חמשת אלפים איש עם 10% גברים , ו-90% נשים. המדגם: 100 איש סה"כ, 50 גברים ו-50 נשים (יש לשקלל בעיבוד הסטטיסטי) אם לא דאגנו לכך באיסוף הנתונים למדגם, ניתן לתקן זאת הניתוח הסטטיסטי. שתי השיטות לעיל הן קשות ליישום באוכלוסיות גדולות (ברמת אוכלוסיית מדינה) ראשית, מסגרת דגימה אינה זמינה תמיד לאוכלוסיות כאלו ושנית - התפרסות של המדגם על כל אזורי הארץ גוררת הוצאות גבוהות. במקרה כזה נעשה שימוש במדגם אשכולות.

43 דגימה הסתברותית ד. דגימת אשכולות Cluster Sampling
שלב ראשון: האוכלוסייה הנדגמת מחולקת לאשכולות (גאוגרפים, גילאים) שלב שני: נערכת דגימה אקראית של אשכולות שלב שלישי: דגימה אקראית של פרטים מתוך כל אשכול שנבחר נקראת גם דגימה רב שלבית Multistage sampling מדגם אשכולות: דגימה בכמה שלבים

44 לדוגמא: כל האוניברסיטאות:
העברית/ באר שבע/ תל אביב / בר אילן / חיפה מתוכן נבחר שלוש: תל אביב / בר אילן / חיפה מתוכן נבחר 4 סטודנטים

45 לדוגמא: 14 ערים מתוכן נבחר 3 ערים מתוך כל עיר נבחר 2 שכונות

46 לסיכום: דגימה הסתברותית Probability Sampling
הצורה היחידה המאפשרת ייצוג של האוכלוסייה מאפשרת לחוקר לאמוד טעויות בדגימה הצורה היחידה המאפשרת ייצוג של האוכלוסייה מה זו טעות הדגימה?

47 מה זו טעות דגימה? Sampling error
קיים שוני בין משתני האוכלוסייה למשתני המדגם טעות דגימה מתייחסת להבדלים בין משתני האוכלוסייה למשתני המדגם גם אם ערכנו מדגם הסתברותי תתכן מידה מסוימת של טעות, אך ביכולתנו לאמוד את הטעות טעות דגימה מתייחסת להבדלים בין משתני האוכלוסייה למשתני המדגם קיים שוני בין משתני האוכלוסייה למשתני המדגם גם אם ערכנו מדגם הסתברותי תתכן מידה מסוימת של טעות, אך ביכולתנו לאמוד את הטעות כדי להקטין את ההבדל בין האוכלוסיה הנחקרת (מדגם) לאוכלוסיית המטרה לעיתים נדירות המדגם מייצג באופן מושלם את האוכלוסייה. לדוגמא: ממוצע גיל שונה בין המדגם שבחרנו לאוכלוסיית המטרה זה מה שקרה במחקר על טיפול הורמונלי בגיל המעבר. ממוצע גיל המשתתפות היה גבוה יחסית ולכן התוצאות על השלכותיהן -בעייתיות

48 דוגמא בבחירות בשנת 1936 בארה"ב בין לנדון (מושל קנזס) לרוזוולט (נשיא מכהן), נכללו 2.4 מיליון אנשים במדגם אשר נועד לחזות מי ינצח בבחירות. תוצאות הסקר היו: 57% ללנדון; 43% לרוזוולט. תוצאות הבחירות היו: 38% ללנדון; 62% לרוזוולט. מה הייתה הסיבה לחיזוי השגוי? כמה אנשים נדגמו? האם נדגמו מספיק אנשים? מדוע המדגם לא ניבא את תוצאות הבחירות? הרשימה כללה רק טלפונים וחברים במועדונים, בתקופת משבר כלכלי. לא היה ייצוג הולם לשכבות העניות שרובן נטו להצביע לרוזוולט הייתה הטייה, אוכלוסיית המטרה לא תאמה את אוכלוסיית הדגימה ולכן הסוקרים לא הצליחו לנבא מי הנשיא שייבחר כלומר, גודל המדגם עצמו, כמספר, לא מספיק . חשוב גם מי נכלל בו!

49 מחקר מבוקר ללא הקצאה אקראית
דירוג הראיות: סקירה שיטתית של RCT’s ניסוי קליני מבוקר עם הקצאה אקראית RCT’s מחקר מבוקר ללא הקצאה אקראית Clinical trial מחקר ללא התערבות Observational study רמה סוג І ראיות מוצקות מסקירה סיסטמית המרכזת מספר ניסויים קליניים באותו נושא ומגיעה למסקנות מעשיות (Cochrane Database, BMJ) І І ראיות מוצקות מניסוי קליני Clinical trial)) מבוקר, עם הקצאה אקראית של המשתתפים, ומדגם בגודל מתאים І І І ראיות ממחקרים מתוכננים היטב, עם התערבות , מספר קבוצות, אך ללא הקצאה אקראית. לדוגמא: ІV ראיות ממחקרים מתוכננים היטב ללא התערבות, (מחקר תיאורי) V פרסום ע"י ארגון הנשען על הוכחות קליניות, או דווח של קבוצת מומחים (Bury&Mead, 2000) דעת מומחים (Mantzoukas, 2008)

50 ניסוי קליני Clinical trial יעילות של התערבות אחת לעומת אחרת/ חוסר התערבות (ללא התערבות זה מחקר השוואתי)

51 ניסוי קליני מבוקר RCT-Randomized control trial
יש חשיבות לדמיון בין הקבוצות בקו ההתחלה ( (Baseline לכן: הקצאה אקראית מבוקרת (Randomization)

52 לבדוק האם יעילות הטיפול בדליפת שתן במאמץ ע"י שיטת פאולה דומה לטיפול הניתן לבעיה ע"י תרגול שרירי רצפת האגן, באוכלוסיית נשים מגוונת, בקהילה.

53 Flowchart of Participants

54 Mean Urine Leakage Decrease After Intervention

55 חישוב גודל מדגם Sample size calculation
איך נדע כמה אנשים עלינו לדגום? יש לעשות חישוב

56 איך נדע כמה משתתפים לגייס למחקר?
יש לערוך חישוב רוצים שהמדגם ייצג את אוכלוסיית המטרה ככל שמדגם גדול יותר, יש סיכוי גדול יותר שהוא ייצג את האוכלוסייה ואז נוכל להכליל את הממצאים על האוכלוסייה

57 חישוב גודל מדגם Sample size calculation
מספר המשתתפים במחקר= גודל המדגם ככל שמדגם גדול יותר, טעות הדגימה קטנה יותר ככל שהמדגם גדל, המחקר: יצריך יותר כסף, זמן בעיה אתית

58 חישוב גודל מדגם Power analysis and Sample size calculation
חוקרים יכולים לשער את גודל המדגם בהתאם להשערת המחקר מסתמכים על מידע קודם ממחקרים, מהסתכלות התהליך של חישוב גודל המדגם נקרא ניתוח עוצמה Power analysis (Choen, 1988). רוצים מדגם: קטן (זול, מהיר) שייתן תוצאות עם סיכון קטן לטעות חוקרים יכולים לשער את גודל המדגם בהתאם להשערת המחקר מסתמכים על מידע קודם ממחקרים, מהסתכלות התהליך של חישוב גודל המדגם נקרא ניתוח עוצמה Power analysis (Choen, 1988). רוצים מדגם: קטן (זול, מהיר) שייתן תוצאות עם סיכון קטן לטעות ז"א שסטטיסטית, מכל 100 ניסויים שבצענו, 5 יראו תוצאה חיובית למרות שבאמת לא קיים הבדל, 5% של טעות ולא יותר.

59 :חישוב גודל מדגם Power analysis and Sample size calculation
עוצמה סטטיסטית (β-1):טעות מסוג שני מדד פיזור מדד להומוגניות של הנבדקים σ גודל האפקט (δ)  הנוסחאות הקלסיות לחישוב גודל מדגם מתיחסות לארבעת הפרמטרים: טעות מסוג 1: α מקובל לאפשר 5%α= ז"א שסטטיסטית, מכל טעות מסוג זה (נקראת גם טעות מסוג ראשון) בהסתברות של 5% , או ניסויים שבצענו, 5 יראו תוצאה חיובית למרות שבאמת לא קיים הבדל. טעות מסוג 2: ו (β-1)=85%. הינה ההסתברות לאשש את שאלת המחקר, כאשר אכן יש לאשש את שאלת β) עוצמה סטטיסטית טעות מסוג שני) -ההסתברות לא לאשש השערת המחקר כאשר "באמת" היה צריך בעוד שמידת הפיזור- σ וגודל האפקט- δ נקבעים על סמך מחקרים קודמים. יש הנוהגים לבטא את גודל האפקט ביחידות של σ ובכך לבטל את הצורך להגדיר בנפרד את הפיזור וגודל האפקט. מידת הפיזור של המשתנה הנמדד (2σ) –הינה מדד להומוגניות של הנבדקים ולחזרתיות של המשתנה הנמדד בתוך כל קבוצה. אם קיים פיזור גבוה קשה לזהות הבדל משמעותי בין הקבוצות, ולכן ידרש מדגם גדול יותר. הפיזור יכול לנבוע מגורמים רבים: דיוק כלי המדידה, גורמים נלווים המשפיעים על המדידה, ומידת ההטרוגניות של קבוצת הנבדקים. 59

60 טעויות אפשריות התרופה איננה יעילה התרופה יעילה - + + +
המחקר מראה שהתרופה יעילה - - + - המחקר מראה שהתרופה איננה יעילה

61 טעויות אפשריות התרופה איננה יעילה התרופה יעילה - + + + יש התאמה
המחקר מראה שהתרופה יעילה - - + - המחקר מראה שהתרופה איננה יעילה

62 טעויות אפשריות התרופה איננה יעילה התרופה יעילה - + אין התאמה + +
כי המחקר אמר שהתרופה כן יעילה למרות שהיא איננה יעילה באמת + + המחקר מראה שהתרופה יעילה - - אין התאמה כי המחקר מראה שהתרופה איננה יעילה כשעצם היא כן יעילה המחקר מראה שהתרופה איננה יעילה טעות מסוג 1 -Type 1 error טעות מסוג 2 – Type 2 error

63 חישוב גודל מדגם Power analysis and Sample size calculation
מכל 100 ניסויים שנבצע, לא יהיו יותר מ-5 אשר יראו תוצאות מקריות/לא אמיתיות   טעות מסוג 1: α מקובל לאפשר 5%α=0.05 . ההסתברות לאשש את שאלת המחקר, למרות "שבאמת" לא היה צריך –לאשש כי מדובר בתוצאה מקרית. נמצא הבדל מובהק בין קבוצת טיפול לקבוצת בקורת, אבל כשחזרנו על הניסוי עוד הרבה פעמים ראינו כי התוצאה לא חוזרת על עצמה והתוצאה הראשונית היתה חריגה ולא מייצגת. מקובל לאפשר טעות מסוג זה (טעות מסוג ראשון) בהסתברות של 5% α=0.05 ז"א שסטטיסטית, מכל 100ניסויים שבצענו, 5 יראו תוצאה חיובית למרות שבאמת לא קיים הבדל. 63

64 חישוב גודל מדגם Power analysis and Sample size calculation
β עוצמה סטטיסטית (β-1):טעות מסוג שני ההסתברות לא להוכיח את השערת המחקר כאשר כן היה צריך להוכיח אותה. טעות מסוג שני, האפשרות לא למצוא הבדל בין קבוצת טיפול לקבוצת ביקורת, כאשר באמת ההבדל קיים. מקובל לקחת β של 5%-20% או במילים אחרות: עוצמה של 80%-95% -נהוג לחשב ע"י (β-1) מדגם קטן מדי יהיה עם עוצמה נמוכה לזהות את ההוכחה האמיתית, את האמת אותה רצינו להוכיח  טעות מסוג 2: ו (β-1)=85%. הינה ההסתברות לאשש את שאלת המחקר, כאשר אכן יש לאשש את שאלת המחקר β-ההסתברות לא לאשש השערת המחקר כאשר "באמת" היה צריך לאשש אותה. טעות זו משמעותה לא למצוא הבדל בין קבוצת טיפול לביקורת, כאשר ההבדל קיים. מקובל לדרוש β של של 5%-20%,. באופן אינטואיטיבי, ז"א טעות מסוג שני - עוצמה סטטיסטית של 80%-95% מדגם קטן מדי יהיה בעל עוצמה נמוכה, ז"א בעל יכולת נמוכה לאשש השערת מחקר, כאשר היא "האמת הנכונה". אותה השערה תאושש אם תבדק במחקר עם מספר רב יותר של נבדקים, ז"א בעל עוצמה גבוהה יותר. 64

65 דוגמא: מחקר הבודק יעילות ובטיחות של תרופה חדשה לעומת תרופה קיימת
הערת האפס: אין הבדל הין התרופה הישנה לחדשה השערת האחד: התרופה החדשה יעילה יותר השערת האפס: אין הבדל בין התרופה הישנה לחדשה, אם לא נדחה, נמשיך לספק את התרופה הישנה השערת האחד: נרצה לוודא שהתרופה שתתקבל כיעילה ביותר אכן טובה יותר והממצאים לא התקבלו בטעות, במקרה. אם הטעות שלנו נופלת מה pשקענו, זו רק תוצאה מקרית, אין בה אמת, נוכל לדחות את השערת האפס ולקבל את התרופה הניסיונית תרופה חדשה=ניסיונית תרופה קיימת

66 דוגמא : מחקר הבודק יעילות ובטיחות של תרופה חדשה לעומת תרופה קיימת
אפשרות לטעות - נתחיל לתת לאנשים תרופה חדשה, שהיא בעצם לא יותר טובה מהתרופה הקיימת: טעות מסוג אחד- Type 1 error במילים אחרות – התרופה באמת לא טובה יותר אך קיבלנו תוצאה במחקר שהיא כן טובה יותר (Type 1 error) לאחר איסוף הנתונים ועריכת המחקר, לו החלטנו כי ההשערה האלטרנטיבית היא זו הנכונה, אנו רוצים לדעת מה הסיכוי לקבל את הממצא שקיבלנו במדגם או קיצוני ממנו באוכלוסיה כולה, תחת הנחה שהשערת האפס נכונה. ככל שסיכוי זה קטן יותר, משמעות הדבר, כי הממצא שלנו הוא פחות מקרי ויותר משקף ממצא אמיתי שאכן מתקיים באוכלוסייה. סיכוי זה נקרא p value. אנו מעוניינים כי ערך זה יהיה קטן ככל האפשר ובפרט קטן יותר מאשר האלפא, או אז נאמר כי הממצא שלנו מובהק. באם ה-p value הינו גדול מאלפא נאמר כי הממצא איננו מובהק ולמעשה אין בידינו מספיק ממצאים על פיהם הטענה החדשה שלנו נכונה.

67 המשך: מחקר הבודק יעילות ובטיחות של תרופה חדשה לעומת תרופה קיימת
טעות מסוג 2– שהמחקר יראה שהתרופה החדשה לא טובה יותר אבל במציאות היא כן יותר טובה טעות מסוג שני Type 2 error יש לשים לב כי ערך גבוה של p value, אין משמעותו כי ההשערה האלטרנטיבית בהכרח אינה נכונה. ייתכן והכישלון לדחות את השערת האפס הוא תוצאה של מחקר שלא נערך כהלכה ולמרות שההשערה האלטרנטיבית תקפה במציאות, החוקר לא הצליח לגלות אותה במחקרו. זו נקראת ביתא, או טעות מסוג שני. יכולות להיות לכך סיבות שונות כגון גודל מדגם קטן מידי, שונות בינאישית גדולה מידי במדגם עצמו, אפקט קטן מידי וגורמים נוספים. . במציאות! ממצאי המחקר

68 חישוב גודל מדגם Power analysis and Sample size calculation
אם יש פיזור גבוה, קשה להוכיח הבדל מובהק בין הקבוצות מידת הפיזור של המשתנה הנמדד σ  מידת הפיזור של המשתנה הנמדד הנמדד בתוך כל קבוצה נחקרת. אם קיים פיזור גבוה קשה לזהות הבדל משמעותי בין הקבוצות, ולכן ידרש מדגם גדול יותר. לדוגמא: תוכנית כושר לירידה במשקל. אם בקבוצה נחקרת כולם יהיו שמנים מאוד, יהיה קל יותר להראות תןצאות.. אם ברבוצה יהיו שמנים קצת ושמנים הרבה...בכל המשקלים, יהיה לנו קשה יותר להראות שינוי, מצטרך מדגם גדול יותר. הפיזור יכול לנבוע מגורמים רבים כמו מהימנות של כלי המדידה, מי בודק, ומידת השונות hetrogenityהנבדקים. 68

69 חישוב גודל מדגם Power analysis and Sample size calculation
δ אפקט קליני מהי ההשפעה הקלינית אותה נרצה לזהות, להוכיח במחקר הבדל גס כמו יכולת הורדה במשקל בקבוצה של שמנים מאוד קל יותר להוכיח, לעומת יכולת הורדה במשקל בקרב בנות רזות...עד שמנות במידה  (δ) אפקט קליני: ההבדל בין הקבוצות או מידת המתאם שנצפה לראות במחקר, ויהיה בעל משמעות קלינית. גודל המדגם תלוי בגודל האפקט הקליני: זיהוי של אפקט קליני גס דורש מדגם קטן, בעוד שזיהוי של אפקט זעיר דורש מדגם גדול יותר המאפשר רגישות רבה יותר. לדוגמה כאשר נרצה להדגים שתוכנית כושר מסייעת להורדה במשקל, נבדוק בספרות ונתייעץ עם מומחים: איזה הבדל יתפס כתוצאה חיובית? האם ירידה ממוצעת של 2 ק"ג במשך 3 חודשים, או האם ירידה ממוצעת של 10 ק"ג ? איזו השפעה (אפקט) החוקר מצפה לראות, והאם יש לו משמעות קלינית. דוגמת מחקר השתן 69

70 מחקר הנעליים הגדול אפשר לקבוע סיכון של טעות מסוג 1 של עד 5%
מחקר הנעליים הגדול אפשר לקבוע סיכון של טעות מסוג 1 של עד 5%

71 ניסוי בתרופה חדשה לנשים הרות
ארצה לקבוע סיכון קטן יותר מ 5% רוצה שהתרופה תהיה בטוחה ב-99% אם קיבלנו תוצאה במקרה ולא בגלל שהתרופה בטוחה – שזה יכלול פחות מ- 1% מהנשים ההרות (p<0.01) פה הטעות תהרוג ! כל מה שנופל בשוליים וקטן מאלפא, יאפשר דחיית השערת האפס וקבלת השערה אלטרנטיבית

72 איפה לדעתכם צריך מדגם גדול יותר?
דוגמא שמאלית היא של טעות הקטנה מ 5% והדוגמא הימנית קטנה מ 1% זו גם הסיבה שמדגם עם P קטן דורש גודל מדגם גדול יותר p= 0.05 p= 0.01

73 סיכום: גודל מדגם במחקר כמותי Sample size
מספר הפרטים הנדרשים למדגם מדגם בגודל מתאים ייתן תוצאות היכולות להיכלל על האוכלוסייה ככל שהמדגם גדול יותר- פחות טעויות דגימה ככל שהמדגם במחקר דומה לאוכלוסיה התוצאות שיתקבלו ייצגו את המצב באוכלוסיה ככל שהפרטים באוכלוסייה יותר דומים (Homogeneity) המדגם יכול להיות יותר קטן ככל שהפרטים באוכלוסייה שונים יותר (Heterogeneity) יש אפשרות לטעות גדולה ודרוש מדגם גדול יותר (בניין עונה על צרכי הגרים בו העמידה שלו על היסודות איתנה דוגמא: בחירות 1936 בארה"ב בין לנדון לרוזבלט.2.5 מיליון אנשים נכללו במדגם. ענק. אלא...שהרשימה כללה רק בעלי מכוניןת וטלפונים בתקופת משבר כלכלי. הטייה bias

74


Download ppt "אוכלוסייה ומדגם Population & Sample"

Similar presentations


Ads by Google