יסודות סטטיסטיקה תיאורית

Slides:



Advertisements
Similar presentations
3.3 Measures of Position Measures of location in comparison to the mean. - standard scores - percentiles - deciles - quartiles.
Advertisements

1 Formal Specifications for Complex Systems (236368) Tutorial #4 Refinement in Z: data refinement; operations refinement; their combinations.
1 - 1 © 1997 Prentice-Hall, Inc. Statistical Methods.
©Silberschatz, Korth and Sudarshan4.1Database System Concepts סכימה לדוגמא.
Measures of Dispersion or Measures of Variability
Map-Reduce Input: a collection of scientific articles on different topics, each marked with a field of science –Mathematics, Computer Science, Biology,
מתמטיקה בדידה תרגול 3.
איכות התהליך ובקרת תהליך סטטיסטית (SPC)
מבני נתונים 1 – מבנה התרגולים
חורף - תשס " ג DBMS, Design1 שימור תלויות אינטואיציה : כל תלות פונקציונלית שהתקיימה בסכמה המקורית מתקיימת גם בסכמה המפורקת. מטרה : כאשר מעדכנים.
1 שונות המשתנה. המודל : הנחות 1-3 מתקיימות. הנחה 4 אינה מתקיימת - כך שלפחות עבור תצפית אחת השונות שונה מהשונות של יתר התצפיות. לפחות עבור s ו t אחד. תוצאות.
רקורסיות נושאי השיעור מהן רקורסיות פתרון רקורסיות : שיטת ההצבה שיטת איטרציות שיטת המסטר 14 יוני יוני יוני 1514 יוני יוני יוני 1514.
חורף - תשס " ג DBMS, צורות נורמליות 1 צורה נורמלית שלישית - 3NF הגדרה : תהי R סכמה רלציונית ותהי F קבוצת תלויות פונקציונליות מעל R. R היא ב -3NF.
Map-Reduce Input: a collection of scientific articles on different topics, each marked with a field of science –Mathematics, Computer Science, Biology,
1 Formal Specifications for Complex Systems (236368) Tutorial #5 Refinement in Z: data refinement; operations refinement; their combinations.
בהסתברות לפחות למצא בעיה במודל PAC עבור בהסתברות ε הפונקציה f טועה מודל ONLINE 1. אחרי כל טעות הפונקציה משתפרת 2. מספר הטעיות קטן.
מסדי נתונים תשס " ג 1 תכנון סכמות – אלגוריתם פירוק לתבניות בצורת BCNF מסדי נתונים.
שאילת שאלות שאלת חקר המפתח למנעול 1. שאילת שאלות – שאלת חקר מה ניתן לשנות ? :  בתנאים : טמפ ' או לחץ או הכלים, או הציוד  בחומרים : איכות או כמות או.
עיבוד תמונות ואותות במחשב אלכסנדר ברנגולץ דואר אלקטרוני : שיטות קידוד שיטות קידוד אורך מלת קוד ואנטרופיה אורך מלת קוד ואנטרופיה קידוד.
א " ב, מילים, ושפות הפקולטה למדעי המחשב אוטומטים ושפות פורמליות ( ) תרגיל מספר 1.
תורת הקבוצות חלק ב'. קבוצה בת מניה הגדרה: קבוצה אינסופית X היא ניתנת למניה אם יש התאמה חד-חד ערכית בין X לבין .
תכנות תרגול 6 שבוע : תרגיל שורש של מספר מחושב לפי הסדרה הבאה : root 0 = 1 root n = root n-1 + a / root n-1 2 כאשר האיבר ה n של הסדרה הוא קירוב.
מודל ONLINE לומדמורה 1. כל ניתן לחישוב בזמן פולינומיאלי 2. אחרי מספר פולינומיאלי של טעיות ( ) הלומד לא טועה ז"א שווה ל- Littlestone 1988.
ערכים עצמיים בשיטות נומריות. משוואה אופינית X מציין וקטור עצמי מציינת ערך עצמי תואם לוקטור.
מבחן t למדגמים בלתי תלויים
מבני בקרה לולאות. שאלה #1 שאלה ב' – תכתוב תוכנה הכותבת את תפריט הבאה Type 1 to find the area of a circle Type 2 to find the circumference of a circle.
הקיבול איננו תלוי במטען ובפוטנציאל
Ray 7 דוגמא אלגוריתם 1.קבל דוגמאות 2. פלט f a עבור הדוגמה a המינימלית החיובית ?
1 חקירת טרנזיסטור קוונטי הנשלט על ידי שינויי תדר Frequency Controlled Quantum Transistor מבצע : חן טרדונסקי מנחה : ד " ר אראל גרנות.
משטר דינמי – © Dima Elenbogen :14. הגדרת cd ו -pd cd - הזמן שעובר בין הרגע שראשון אותות הכניסה יוצא מתחום לוגי עד אשר אות המוצא יוצא מתחום.
תוחלת ושונות בהתפלגויות אחרות התפלגות בינומית : X~B(n,p) E(X)=np, σ 2 (x)=np(1-p) התפלגות היפרגיאומטרית : X~H(N,n,M) E(X)=n*M/N, σ 2 (x)=n*M/N(1-M/N)[(N-n)/N-1)]
רגרסיה קו רגרסיה הוא קו תיאורטי המאפשר לנו לבחון את השפעתו של משתנה מנבא אחד (או יותר) על המשתנה התלוי: במילים אחרות, מודל רגרסיה עוזר לנו לנבא על פי משתנה.
מערכים עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר עד היום כדי לייצג 20 סטודנטים נאלצנו להגדיר int grade1, grade2, …, grade20; int grade1, grade2, …, grade20;
מודל הלמידה מדוגמאות Learning from Examples קלט: אוסף של דוגמאות פלט: קונסיסטנטי עם פונקציה f ב- C ז"א קונסיסטנטי עם S ז"א מודל הלמידה מדוגמאות Learning.
עקרון ההכלה וההדחה.
יחס סדר חלקי.
מבוא למדעי המחשב תרגול 3 שעת קבלה : יום שני 11:00-12:00 דוא " ל :
מדדי פיזור פיזור מצביע על מידת ההטרוגניות או ההומוגניות של ההתפלגות. פיזור הוא מדד יחסי, כיוון שאפשר לומר אם הפיזור בהתפלגות רחב או צר, רק ביחס לפיזור.
Markov Decision Processes (MDP) תומר באום Based on ch. 14 in “Probabilistic Robotics” By Thrun et al. ב"הב"ה.
BPS - 5th Ed. Chapter 21 Describing Distributions with Numbers.
גיאולוגיה סטרוקטורלית מעגלי מוהר למעוות סופי (המשך...)
מתמטיקה בדידה תרגול 2.
A. Frank File Organization Hardware Size Parameters.
1 מבוא למדעי המחשב סיבוכיות. 2 סיבוכיות - מוטיבציה סידרת פיבונאצ'י: long fibonacci (int n) { if (n == 1 || n == 2) return 1; else return (fibonacci(n-1)
מבוא לאקונומטריקה - תיאור הקורס
1 גילוי מידע וזיהוי תבניות תרגול מס. 3 התפלגות נורמלית רב - מימדית Kullback-Leibler Divergence - משפט קמירות - נגזרת שנייה משפט Log sum inequality משפט.
STA Lecture 131 STA 291 Lecture 13, Chap. 6 Describing Quantitative Data – Measures of Central Location – Measures of Variability (spread)
Advanced Topics in Search Theory 3: Concurrent Search.
פיתוח מערכות מידע Class diagrams Aggregation, Composition and Generalization.
The Median of a Continuous Distribution
INVESTIGATION 1.
Compare the following heights in inches: BoysGirls
Data Structures Hanoch Levi and Uri Zwick March 2011 Lecture 3 Dynamic Sets / Dictionaries Binary Search Trees.
COMPUTATIONAL FORMULAS AND IQR’S. Compare the following heights in inches: BoysGirls
מבוא למדעי המחשב לתעשייה וניהול הרצאה 6. מפעל השעווה – לולאות  עד עכשיו  טיפלנו בייצור נרות מסוג אחד, במחיר אחיד  למדנו להתמודד עם טיפול במקרים שונים.
Measures of Central Tendency. Definition Measures of Central Tendency (Mean, Median, Mode)
1 ניתוח שונות: Post-hoc analysis ניתוח שונות חד-כיווני עם אפקטים קבועים: Post-hoc analysis ד"ר מרינה בוגומולוב מבוסס חלקית על ההרצאות של פרופ' יואב בנימיני.
Introduction Dispersion 1 Central Tendency alone does not explain the observations fully as it does reveal the degree of spread or variability of individual.
AP Statistics 5 Number Summary and Boxplots. Measures of Center and Distributions For a symmetrical distribution, the mean, median and the mode are the.
מספרים אקראיים ניתן לייצר מספרים אקראיים ע"י הפונקציה int rand(void);
Measures of dispersion
המכון למצב מוצק, הפקולטה לפיזיקה
עבודה עם נתונים באמצעות ADO.NET
השוואת נתונים למודל הסתברותי - כללית
בדיקת השערות על השוואת שני סטטיסטים
בחירת חומר גלם כתב: עמרי שרון.
ריבועים פחותים – מקרה כללי
למה רמת פרמי צריכה להיות קבועה בחומר שנמצא בשווי משקל?
מבחן t למדגם יחיד.
NG Interpolation: Divided Differences
Presentation transcript:

יסודות סטטיסטיקה תיאורית קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית מה לתאר ? אומדן מקום ("מרכז") אומדן פיזור צורת התפלגות סביב מרכז קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית אומדני מיקום ממוצע (Mean) חציון (Median) שכיח (Mode) נקודת אמצע (Midpoint) קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית משמעות המיצוע סט של n נתונים שונים מתחלף לסט של n נתונים שווים, אשר יגרמו לאותה תוצאה סופית. קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

ממוצע חשבוני ( דוגמה-משקל ) Formula: 2 8 3 4 1 Sample Mean = (2+8+3+4+1)/5 = 3.6 לא לעגל ! קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

סכום סטיות הנתונים יחסית לממוצע שווה אפס תכונת הממוצע סכום סטיות הנתונים יחסית לממוצע שווה אפס ממוצע – 3.6 2 8 3 4 1 (-1.6) + (4.4) + (-0.6) + (0.4) + (-2.6) = 0 קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

ממוצע הנדסי (דוגמה – תנובה ) Formula: 2 8 3 4 1 Geometrical Mean = קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

ממוצע הרמוני ( דוגמה – התנגדות בחיבור מקבילי) Formula: 2 8 3 4 1 Harmonic Mean קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית היחס בין הממוצעים קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית חציון ( 50/50 ) סדר נתונים מנמוך לגבוה ! 1. עבור מספר אי זוגי של נתונים כך נתון אמצעי 2 8 3 4 1 Ordered Data: 1 2 3 4 8 חציון קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית חציון -המשך 2. עבור מספר זוגי של נתונים כך נתון אמצעי כך ממוצע של שני נתונים אמצעיים 2 8 3 4 1 8 Ordered Data: 1 2 3 4 8 8 Median = (3+4)/2 = 3.5 קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

תכונת החציון סכום סטיות מוחלטות של הנתונים מהחציון מינימאלי ביותר קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית שכיח הנתון השכיח ביותר לאותו סט נתונים יתכן יותר משכיח אחד מתאים ביותר לנתונים קטגוריאליים קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית נקודת אמצע קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

Consider 7 observations: 4.2, 4.3, 4.7, 4.8, 5.0, 5.1, 9.0. Median = 4.8 Without extreme value-9.0 Median = 4.75 Extreme values in data set do not affect the median as strongly as they do the mean, but it is more complicate to update it and it doesn’t use all the information included in a set. Mean =5.3 Without extreme value-9.0 Mean =4.7 Is affected by extreme values that are not representative of the rest of the data, but easy to update and use all the information included in a set. קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית אומדני פיזור טווח (R - Range) מרחק בין רבעוני (Interquartile Range -IQR ) סכום ריבועי סטיות (SS - Sum of Squares) שונות (Dispersion, Var – Variation ) סטיית תקן (SD - Standard Deviation) קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית טווח R = X max - X min טווח לא לוקח בחשבון כל מידע הכלוא בין ערכים קיצוניים ומושפע חזק מהם קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

מרחק בין רבעוני IQR = Q3 - Q1 קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית מרחק בין רבעוני - דוגמה Data: 2, 3, 4, 5, 6, 6, 6, 7, 7, 8, 9 Upper quartile - 7 Lower quartile - 4 IQR = 7 - 4 = 3 קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

סכום ריבוי סטיות ופירוקו למרכיבים קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית משמעות הסימנים ni – מספר נתונים בקבוצה i (מתוך סה''כ k קבוצות) ממוצע קבוצתי ממוצע כולל קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית הגדרת השונות קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית פירוק השונות עבורk קבוצות שווי גודל n http://www.psych.utah.edu/stat/introstats/anovaflash.html קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

תכונות השונות-שינוי קנה מידה קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

תכונות השונות-שונות של סכום נגדיר מקדם מתאם מדגמי: קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית תכונות השונות-שונות של סכום (המשך) חוק הצטברות השונות רק כאשר X ו-Y בלתי תלויים  שווה אפס קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

תכונות השונות-שונות של ממוצע קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

מדוע שונות היא אויב האיכות ? קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

כיצד להתמודדות עם התפשטות השונות ? לנתח שונות ע''י פירוקה למרכיבים -ANOVA לטפל בגורמי שונות דומיננטיים גורמי שונות אפשריים: ח''ג ציוד מפעיל שיטת עבודה ... קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית סטיית תקן קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית סטיית תקן של ממוצע קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

השוואה בין אומדני פיזור שונים- יתרונות וחסרונות של כל מדד SD (S) Var (S2) IQR R כוללני, פחות רגיש לקיצוניות, בעל מימד של הנמדד כל בפירוק למרכיבים קבוצתיים, פחות רגיש לקיצוניות. פחות רגיש לקיצוניות, יחסית פשוט לחישוב פשוט לחישוב יתרונות דורש חישוב, לא ניתן לפירוק למרכיבים לא בעל מימד של הנמדד. לא מתחשב בכל הנתונים רגיש לקיצוניות, מזלזל בכל מידע למעט קיצוניים חסרונות קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות של משתנה מקרי בדיד דוגמאות של משתנה בדיד: כמות ילדים במשפחה,ציון במבחן,יום בשבוע, וכד' נסמן את הערכים האפשריים של מ''מ בדיד – xi ,למשל x1=1, x2=2,… או x1=Sunday, x2=Monday,… ונגדיר P(i) כי הסתברות לכך שמ''מ X יקבל את הערך xi . כמובן , ניתן להעריך את ההסתברות בעזרת שכיחות יחסית – f i בסדרה ארוכה של ניסויים. קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות של משתנה מקרי בינומי קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות של משתנה מקרי בינומי( n=100,p=0.3) קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית פונקצית התפלגות של משתנה מקרי פואסוני (יכול להיות קירוב לבינומי np = λ) קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות של משתנה מקרי פואסוני( λ=30) קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות מצטברת של משתנה מקרי בדיד-cdf קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות מצטברת של משתנה מקרי פואסוני( λ=30) קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות של משתנה מקרי רציף נסמן את הערכים האפשריים של מ''מ רציף – x , ונגדיר f(x)Δx כי הסתברות לכך שמ''מ X יקבל את הערך בטווח שבין x לבין x+Δx f(x) מכונה – pdf - פונקצית צפיפות הסתברות.כמובן: קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית פונקצית התפלגות אחידה Probability Density Function Cumulative Distribution Function קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות אחידה (המשך) Mean: Median: Mode: any value in [a,b] Variance: קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות אחידה (המשך) ע''י שינוי בקנה מידה מ''מ תמיד ניתן להביא לטווח [0,1] אם אזי קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות נורמלית-pdf Probability Density Function קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות נורמלית-cdf Cumulative Distribution Function F(x) קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות נורמלית מתוקנת ע''י שינוי בקנה מידה מ''מ תמיד ניתן להביא ל-N(0,1) אם: אזי ציון תקן: קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

פונקצית התפלגות נורמלית Mean: μ Median: μ Mode: μ Variance: σ2 קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית

התפלגות נורמלית מנקודת מבט של Six sigma קורס לסטטיסטיקה יישומית - נושא שני:יסודות סטטיסטיקה תיאורית