מודל הרגרסיה הלוגיסטית.

Slides:



Advertisements
Similar presentations
Completeness and Expressiveness. תזכורת למערכת ההוכחה של לוגיקה מסדר ראשון : אקסיומות 1. ) ) (( 2. )) ) (( )) ( ) ((( 3. ))) F( F( ( 4. ) v) ( ) v ((
Advertisements

מבוא למדעי המחשב לתעשייה וניהול
A Model to Evaluate Recreational Management Measures Objective I – Stock Assessment Analysis Create a model to distribute estimated landings (A + B1 fish)
Logistic Regression I Outline Introduction to maximum likelihood estimation (MLE) Introduction to Generalized Linear Models The simplest logistic regression.
עיבוד תמונות ואותות בעזרת מחשב
1 Formal Specifications for Complex Systems (236368) Tutorial #2 Z introduction and notation (contd.); Birthday book example (Chapter 1 in the book); Z.
Presentation by Dudu Yanay and Elior Malul 1.  מה משותף לכל אלגוריתם המשתמש ב -Bucket Elimination: ◦ נתון מודל הסתברותי ורשת ביסיאנית מתאימה. ◦ נתונה.
מתמטיקה בדידה תרגול 3.
אינטרפולציה רועי יצחק.
רקורסיות נושאי השיעור פתרון משוואות רקורסיביות שיטת ההצבה
Inverse kinematics (Craig ch.4) ב"ה. Pieper’s solution נתבונן ברובוט עם 6 מפרקי סיבוב כאשר שלושת הצירים של המפרקים האחרונים נחתכים. נקודת החיתוך נתונה.
חורף - תשס " ג DBMS, Design1 שימור תלויות אינטואיציה : כל תלות פונקציונלית שהתקיימה בסכמה המקורית מתקיימת גם בסכמה המפורקת. מטרה : כאשר מעדכנים.
מערך מחקר " מקרה - בקרה " Case-Control Design High AD Low AD High AD ד " ר רענן סוליציאנו - קינן.
1 שונות המשתנה. המודל : הנחות 1-3 מתקיימות. הנחה 4 אינה מתקיימת - כך שלפחות עבור תצפית אחת השונות שונה מהשונות של יתר התצפיות. לפחות עבור s ו t אחד. תוצאות.
רקורסיות נושאי השיעור מהן רקורסיות פתרון רקורסיות : שיטת ההצבה שיטת איטרציות שיטת המסטר 14 יוני יוני יוני 1514 יוני יוני יוני 1514.
אוטומט מחסנית הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 11.
אינטרפולציה רועי יצחק.
חורף - תשס " ג DBMS, צורות נורמליות 1 צורה נורמלית שלישית - 3NF הגדרה : תהי R סכמה רלציונית ותהי F קבוצת תלויות פונקציונליות מעל R. R היא ב -3NF.
1 Formal Specifications for Complex Systems (236368) Tutorial #5 Refinement in Z: data refinement; operations refinement; their combinations.
(C) סיון טל גילוי מידע וזיהוי תבניות תרגול מס. 4 חזרה על בעיית השערוך, שיטות פרמטריות. שיטת MAP ( בייסיאנית ) לשערוך פרמטרים. שיטת הנראות המירבית. השיטה.
מרצה: פרופסור דורון פלד
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
תורת הקבוצות חלק ב'. קבוצה בת מניה הגדרה: קבוצה אינסופית X היא ניתנת למניה אם יש התאמה חד-חד ערכית בין X לבין .
מערכות הפעלה ( אביב 2009) חגית עטיה ©1 מערכת קבצים log-structured  ה log הוא העותק היחיד של הנתונים  כאשר משנים בלוק (data, header) פשוט כותבים את הבלוק.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
ערכים עצמיים בשיטות נומריות. משוואה אופינית X מציין וקטור עצמי מציינת ערך עצמי תואם לוקטור.
מבחן t למדגמים בלתי תלויים
כוחות משיכה בין מולקולריים כוחות חלשים כוחות וון דר וולס (Van der Vaals) בנוסף לכוחות החזקים שקיימים בקשרים הכימיים המחזיקים אטומים ביחד קיימים גם כוחות.
הפקולטה למדעי המחשב אוטומטים ושפות פורמליות (236353)
The Cyclic Multi-peg Tower of Hanoi מעגלי חד-כווני סבוכיות הפתרון בגרסאות עם יותר מ-3 עמודים.
טיב פני שטח (טפ"ש) טיב פני שטח- רמת החלקות של המשטח.
Ray 7 דוגמא אלגוריתם 1.קבל דוגמאות 2. פלט f a עבור הדוגמה a המינימלית החיובית ?
1 Data Structures, CS, TAU, Perfect Hashing בעיה: נתונה קבוצה S של n מפתחות מתחום U השוואה ל- Hash : * טבלה קבועה (Hash רגיל - דינאמי) * רוצים זמן קבוע.
רגרסיה קו רגרסיה הוא קו תיאורטי המאפשר לנו לבחון את השפעתו של משתנה מנבא אחד (או יותר) על המשתנה התלוי: במילים אחרות, מודל רגרסיה עוזר לנו לנבא על פי משתנה.
מודל הלמידה מדוגמאות Learning from Examples קלט: אוסף של דוגמאות פלט: קונסיסטנטי עם פונקציה f ב- C ז"א קונסיסטנטי עם S ז"א מודל הלמידה מדוגמאות Learning.
עקרון ההכלה וההדחה.
תחשיב היחסים (הפרדיקטים)
מדדי פיזור פיזור מצביע על מידת ההטרוגניות או ההומוגניות של ההתפלגות. פיזור הוא מדד יחסי, כיוון שאפשר לומר אם הפיזור בהתפלגות רחב או צר, רק ביחס לפיזור.
Markov Decision Processes (MDP) תומר באום Based on ch. 14 in “Probabilistic Robotics” By Thrun et al. ב"הב"ה.
מתמטיקה בדידה תרגול 2.
1 מבוא למדעי המחשב סיבוכיות. 2 סיבוכיות - מוטיבציה סידרת פיבונאצ'י: long fibonacci (int n) { if (n == 1 || n == 2) return 1; else return (fibonacci(n-1)
Linear statistical models 2009 Count data  Contingency tables and log-linear models  Poisson regression.
1 גילוי מידע וזיהוי תבניות תרגול מס. 3 התפלגות נורמלית רב - מימדית Kullback-Leibler Divergence - משפט קמירות - נגזרת שנייה משפט Log sum inequality משפט.
Logistic Regression II Simple 2x2 Table (courtesy Hosmer and Lemeshow) Exposure=1Exposure=0 Disease = 1 Disease = 0.
April 6 Logistic Regression –Estimating probability based on logistic model –Testing differences among multiple groups –Assumptions for model.
1 היחידה לייעוץ סטטיסטי אוניברסיטת חיפה פרופ’ בנימין רייזר פרופ’ דוד פרג’י גב’ אפרת ישכיל.
April 4 Logistic Regression –Lee Chapter 9 –Cody and Smith 9:F.
מהי אפיסתזה ? Epistasis come from the Greek –Epistasis come from the Greek – –“epi” means “upon” (מעל) –“histani” means “to place” (לעמוד) So it means.
1 Topic 4 : Ordered Logit Analysis. 2 Often we deal with data where the responses are ordered – e.g. : (i) Eyesight tests – bad; average; good (ii) Voting.
Population genetics גנים באוכלוסיות a population is a localized group of individuals belonging to the same species.
Applied Epidemiologic Analysis - P8400 Fall 2002 Labs 6 & 7 Case-Control Analysis ----Logistic Regression Henian Chen, M.D., Ph.D.
LOGISTIC REGRESSION Binary dependent variable (pass-fail) Odds ratio: p/(1-p) eg. 1/9 means 1 time in 10 pass, 9 times fail Log-odds ratio: y = ln[p/(1-p)]
Applied Epidemiologic Analysis - P8400 Fall 2002 Labs 6 & 7 Case-Control Analysis ----Logistic Regression Henian Chen, M.D., Ph.D.
1 ניתוח שונות: Post-hoc analysis ניתוח שונות חד-כיווני עם אפקטים קבועים: Post-hoc analysis ד"ר מרינה בוגומולוב מבוסס חלקית על ההרצאות של פרופ' יואב בנימיני.
מבוא למדעי המחשב סיבוכיות.
שימוש בשיטה א-פרמטרית להשוואת תוחלות של שתי אוכלוסיות.
פקודות data לסדר את המקרים לפי סדר מסויים Sort cases.
השוואת נתונים למודל הסתברותי - כללית
Mediation and Moderation
פרוקטוז, C6H12O6 , חד-סוכר מיוחד
בדיקת השערות על השוואת שני סטטיסטים
ביצוע רגרסיה לוגיסטית. פרק ה-2
מבחן t למדגמים בלתי תלויים
השערות מחקר והשערות המבחן הסטטיסטי
סוגי משתנים קרן כליף.
מבחן t למדגם יחיד.
עקרונות בסיסיים בתכנות Visual Basic
NG Interpolation: Divided Differences
Presentation transcript:

מודל הרגרסיה הלוגיסטית. פרק ה-1 מודל הרגרסיה הלוגיסטית. נעזר בחומר משקפים של ד"ר נויה גלאי וד"ר ניצה ברקן מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

מודל רגרסיה לוגיסטית (logistic regression model) מודל הרגרסיה הלוגיסטית מאפשר לתאר את ההסתברות למחלה תוך התייחסות בו זמנית למספר משתנים מסבירים. גישה זו היא יעילה ונוחה. המודל מציג את פונקצית Logit(הלוג'יט) של ההסתברות למחלה (תוצאה בינרית) כפונקציה לינארית של המשתנים המסבירים. מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

מודל רגרסיה לוגיסטית (logistic regression model) דוגמא: הקובץ heart_attack (ד"ר ניצה ברקן) מעוניינים לבדוק האם קיים קשר בין מקרים של התקף לב לבין טיפול מסוים ורמת החרדה של מטופל. משתנה תלוי: attack: 1= יקבל התקף לב, 0= לא יקבל התקף לב. משתנה בלתי תלוי: anxiety (רמת החרדה): ככל שהערך גבוה, רמת החרדה גדלה. מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

מודל רגרסיה לוגיסטית (logistic regression model) הצגה גרפית של הנתונים: משתנה תלוי: attack משתנה בלתי תלוי: anxiety מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

מודל רגרסיה לוגיסטית (logistic regression model) קיימת מגמה מסוימת עבור אותם האנשים שלא קיבלו התקף לב, ניתן לראות שרמת החרדה שלהם יותר קטנה מאשר אלה שכן קיבלו התקף לב. אבל הגרף הנה"ל אינו מספק תמונה ברורה לגבי מהות היחסים בין התקפי לב (attack) לבין רמת החרדה (anxiety). אחת השיטות להצגה ברורה יותר של הקשר בין התוצאה לבין משתנה בלתי תלוי, היא ליצור אינטרוולים עבור המשתנה הבלתי תלוי ולחשב ממוצעים של המשתנה התלוי בתוך כל אחד מהקטעים. הגרף המתקבל הינו מהצורה של אות S. מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי משמעות גרפית של המודל מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

הגדרת מודל הרגרסיה הלוגיסטית המודל המתאים לצורה כזו של עקומה הינו המודל הלוגיסטי (logistic model): נפעיל logit transformation ונקבל כאשר הביטוי נקרא odds של . מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

אינטרפרטציה של הפרמטרים הגדרה: odds ratio מסומן ב-OR ומוגדר כיחס בין odds עבור x=1 לבין odds עבור x=0 כדלקמן טענה: עבור המשתנה המסביר הבינארי x, הוכחה: מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

אומדי נראות מכסימלית למקדמים ברגרסיה לוגיסטית עבור תוצאה בינארית שנסמנה באופן כללי על ידי המודל כאשר כך שמתקיים מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

אומדי נראות מכסימלית למקדמים ברגרסיה לוגיסטית האמידה היא בשיטת הנראות המכסימלית עם תוצאה המתפלגת ברנולית, בהינתן הערכים של המשתנים המסבירים. פונקצית הנראות המלאה היא: כיוון שההתפלגות של גורמי הסיכון אינה תלויה בפרמטרים של המודל, מספיק למצוא את המכסימום של מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

אומדי נראות מכסימלית למקדמים ברגרסיה לוגיסטית נמצא בדרך הרגילה את אמדי הנראות המכסימלית עבור הפרמטרים , את האומדים לטעויות התקן דרך מטריצת האינפורמציה ומכאן מבחני מובהקות ורווחי סמך למקדמים. פונקצית הנראות הינה לוג פונקצית הנראות: את פונ' נגזור לפי ונקבל משוואות ה-score מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

אומדי נראות מכסימלית למקדמים ברגרסיה לוגיסטית את מערכת משוואות הנ"ל לא ניתן לפתור אנליטית וניתן לחשב רק פתרונות נומריים כדי לקבל את אומדי הנראות המכסימלית למקדמי הרגרסיה (למשל דרך שיטת Newton-Raphson). מטריצת האינפורמציה (Fisher Information Matrix) ממימד מתקבלת על ידי הנגזרות החלקיות השניות של ביחס ל- והמטריצה ההופכית נותנת את מטריצת השונות של מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

אומדי נראות מכסימלית ומטריצת השונות דוגמא: הקובץ heart_attack Analysis ← regression ← logistic dependent=attack, מימין לשנות את ה-response variable ל-1 ← להעביר לquantitative variables- את anxiety ← בלשונית statistics נסמן covariance matrix, על מנת לקבל את מטריצת השונויות ← finish מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

פלט SAS מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי Model Information Data Set ECLIB000.HEART_ATTACK   Response Variable attack Number of Response Levels 2 Number of Observations 20 Model binary logit Optimization Technique Fisher's scoring Response Profile Ordered Value attack Total Frequency 1 10 2 Analysis of Maximum Likelihood Estimates Parameter DF Estimate Standard Error Wald Chi-Square Pr > ChiSq Intercept 1 -7.0925 3.1710 5.0027 0.0253 Anxiety 0.1246 0.0553 5.0791 0.0242 Odds Ratio Estimates Effect Point Estimate 95% Wald Confidence Limits Anxiety 1.133 1.016 1.262 Estimated Covariance Matrix Variable Intercept Anxiety 10.05521 -0.17262 0.003058 מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

אומדי נראות מכסימלית ומטריצת השונות דוגמא: הקובץ heart_attack Analysis ← regression ← logistic dependent=attack, מימין לשנות את ה-response variable ל-1 ← להעביר לquantitative variables- את treat ואת anxiety ← בלשונית statistics נסמן covariance matrix, על מנת לקבל את מטריצת השונויות ← finish מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי

פלט SAS מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי Model Information Data Set ECLIB000.HEART_ATTACK   Response Variable attack Number of Response Levels 2 Number of Observations 20 Model binary logit Optimization Technique Fisher's scoring Response Profile Ordered Value attack Total Frequency 1 10 2 Analysis of Maximum Likelihood Estimates Parameter DF Estimate Standard Error Wald Chi-Square Pr > ChiSq Intercept 1 -6.3634 3.2139 3.9203 0.0477 Anxiety 0.1190 0.0550 4.6884 0.0304 treat -1.0241 1.1711 0.7647 0.3818 Estimated Covariance Matrix Variable Intercept Anxiety treat 10.32914 -0.172 -0.4743 0.003023 -0.0012 1.371425 Odds Ratio Estimates Effect Point Estimate 95% Wald Confidence Limits Anxiety 1.126 1.011 1.255 treat 0.359 0.036 3.565 מודלים סטטיסטים ב' ארתור צ'ירגייב, יוני נצרתי