Presentation is loading. Please wait.

Presentation is loading. Please wait.

יסודות סטטיסטיקה יישומית

Similar presentations


Presentation on theme: "יסודות סטטיסטיקה יישומית"— Presentation transcript:

1 יסודות סטטיסטיקה יישומית
יסודות סטטיסטיקה יישומית קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

2 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
מטרת הקורס הקורס נועד להקנות כלים סטטיסטיים לפתרון בעיות נפוצות בתעשייה ולפתח יכולת חשיבה סטטיסטית. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

3 מה עשויה לעשות חשיבה סטטיסטית ?
להפריד בין עובדות למבדות. למקד תשומת לב בבעיה. לשכנע לעבור מתיקונים לכוונונים. להבין את המצב האמיתי שקיים. לעזור לקבוע מטרות ויעדים נכונים. לתרום לשיפור ערך. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

4 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
תיאור הקורס חלק I – יסודות גישה ובקרת איכות סטטיסטית (עבודה עם נתונים,יסודות סטטיסטיקה תיאורית,SPC ואיכות התהליך) חלק II – שיטות סטטיסטיות מתקדמות (ניתוח שונות,מידול בעזרת רגרסיה ותכנון ניסויים תעשייתיים) קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

5 חלק I – נושא ראשון: נתונים 1. אסוף 2. שיטות גראפיות
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

6 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

7 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
3 רמות ניהול תהליך כיבוי שריפות תפעולית אסטרטגית קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

8 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
הדרך מנתונים למידע אסוף נתונים. מבט ראשוני תוך שימוש בכלים גראפיים. ניפוי (ניקוי) נתונים. טיפול בנתונים תוך שימוש בכלים כמותיים. ניתוח (מסקנות והמלצות). מידע. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

9 תשובה: בעזרת כלים סטטיסטיים
כדי לקבל החלטות אנחנו זקוקים למידע. שאלה: " העולם מלא רעש,אז איך להפוך נתונים למידע ?" תשובה: בעזרת כלים סטטיסטיים קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

10 דוגמה לחוסר הבנה סטטיסטית
נומינל = ממוצע מעל ממוצע – טוב ! מתחת לממוצע – רע ! פיזור = אפס יש למנוע (לסלק) כל מה שסוטה מערך נומינלי קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

11 אסוף נתונים – מטרה Get the facts before you decide
ISO 9000: 2000 “ Eight Quality Management Principles” Principle 7: Factual approach to decision making Effective decisions are based on the analysis of data and information Organizations perform better when their decisions are based on facts. Therefore: Organizations must base decisions on the analysis of factual information and data. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

12 מטרת אסוף נתונים – דוגמות
FRACAS (Failure Reporting, Analysis, and Correction Action System) Quality Costs (effectiveness of the quality management system) Customer Satisfaction Survey קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

13 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
סוגי נתונים קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

14 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
4 סולמות של נתונים סולם תאור פעולות מותרות סולם שמי סולם דירוגי סולם מרווחי סולם יחסי קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

15 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Four types of data The four levels were proposed by Stanley Smith Stevens in his 1946 article.Different mathematical operations on variables are possible, depending on the level at which a variable is measured. Level of measurement scale of a variable is a classification method proposed in order to describe the nature of information contained within codes assigned to objects and, therefore, within the variable The four levels were proposed by Stanley Smith Stevens in his 1946 article.Different mathematical operations on variables are possible, depending on the level at which a variable is measured קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

16 Categorical Variables
1. Nominal scale: gender, race, religious affiliation, the number of a bus. Possible operations: In this classification, numerals are assigned to objects as labels or names. If two entities have the same code associated with them, they belong to the same category, and that is the only significance that they have. The only comparisons that can be made between variable values are equality and inequality. There are no "less than" or "greater than" relations among them, nor operations such as addition or subtraction. Examples include: gender, race, religious affiliation or the number of a bus. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

17 Categorical Variables(cont.)
2. Ordinal scale : results of internet page rank, alphabetic order, Mohs hardness scale (10 levels from talc to diamond) customer satisfaction grade , quality sort, customer importance (QFD) vendor’s priority, severity of failure or RPN (FMECA), the power of linkage (QFD) Possible operations: In this classification, the numbers/codes assigned to objects represent the rank order (1st, 2nd, 3rd etc ;or high, medium, low ; or alphabetic order etc.) of the entities measured. The concept of distance between two generic levels of the same scale is meaningless. Comparisons of greater and less can be made, in addition to equality and inequality. However operations such as conventional addition and subtraction are still without meaning קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

18 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Numerical data. 3. Interval scale: temperature in Celsius or Fahrenheit scale , object coordinate, electric potential. Possible operations: Last two levels of the Stevens classification are related to the numerical data. Interval variables : The numbers assigned to objects have all the features of ordinal measurements. In addition, differences between arbitrary pairs of measurements can be meaningfully compared. Operations such as addition and subtraction are therefore meaningful. However, the zero point on the scale is arbitrary, and so negative values on the scale can be used. Ratios between numbers on the scale are not meaningful, so operations such as multiplication and division cannot be carried out directly on the measurements. Variables measured at the interval level are referred to as interval variables. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

19 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Numerical data (cont.) 4. Ratio scale: most physical quantities, such as mass, or energy, temperature, when it is measured in kelvins, amount of children in family, age. Possible operations: Ratio scale. The numbers assigned to objects have all the features of interval measurement and also have meaningful ratios between arbitrary pairs of numbers. Operations such as multiplication and division are therefore meaningful. The zero value on a ratio scale is non-arbitrary. Most physical quantities, such as mass, or energy are measured on ratio scales; so is temperature when it is measured in kelvins, i.e. relative to absolute zero. Variables measured at the interval level are referred to as ratio variables. Social variables of ratio measure would include amount of children in family, age . קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

20 תוכנית אסוף נתוני איכות צריכה לספק תשובה ל-5 שאלות
מה ?- יש לזהות תכונות קריטיות לאיכות היכן ? – להגדיר נקודות קריטיות של התהליך כמה ?- להגדיר מדגם אופטימלי מתי ? – להגדיר תדירות הדגימה איך ? – להגדיר שיטת בדיקה (מדידה) וכלים נחוצים קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

21 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
3 עקרונות של אסוף נתונים בשלב התחלתי תוכנית אסוף נתונים צריכה להתייחס רק למטרות המחקר. בשלב סופי תוכנית אסוף נתונים צריכה להתייחס רק לתוצאות המחקר. תמיד תבדוק אישית את הנתונים שנאספו, אל תניח מראש שנתונים יאספו בדיוק בהתאם לתוכנית שפיתחת. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

22 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
שתי שיטות לאסוף נתונים קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

23 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
שיטה סבילה תשומות נבדקות (בחינת קבלה) תפוקות נבחנות (בדיקה סופית) פרמטרים של תהליך מבוקרים (מעקב אחר התהליך-SPC) קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

24 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
שיטה פעילה קלטים - should be changed תגובות - should be measured גורמים בלתי נשלטים – should be simulated גורמים נשלטים - should be changed קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

25 טכניקות איסוף נתונים אפשריות
ראיון מילוי טופס (גיליון) מדידה צילום Electronic Data Reporting ....- ולא לשכוח נקודות (ספרות)בקורת ! קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

26 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
ניתוח מדדים ל: מגמה (ממוצע, חציון, שכיח) – מדגם קטן יחסית פיזור (שונות,סטיית תקן,טווח) - מדגם בינוני צורת ההתפלגות (skewness, kurtosis)- מדגם גדול קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

27 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
בעיות של נתונים העדר נתונים מחסור נתונים נתון לא מזוהה נתונים לא רלוונטיים נתונים שגויים (למשל:בעקבות שגיאות מדידה כגון:דיוק,דייק,אמינות,אי יציבות,כושר הבחנה) נתונים מורעשים אי-שלמות של נתונים קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

28 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
איתור וניפוי חריגים חריג (outlier) – שונה לגמרי משאר האוכלוסייה/מדגם,לכן לגביו קיים חשד, שהוא בא מאוכלוסייה אחרת. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

29 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
ניפוי חריגים אם, כתוצאה של שימוש באיזשהו test , הנתון מזוהה כחריג, יש להוציא אותו מהמדגם.אחרי זה ניתן להפעיל את אותו test שוב על מה שנותר . מדיניות לגבי החריג שהוצא: פשוט להוריד אותו לנתח אותו בנפרד קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

30 שיטת ניפוי חריגים למשתנה חד מימדי
Grubbs’ Test: if T>Tcr קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

31 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
טבלה ל- Tcr גודל מדגם Tcr 3 1.15 5 1.67 10 2.18 15 2.41 20 2.56 25 2.66 50 2.96 100 3.21 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

32 Pareto's 80/20 rule "vital few and trivial many"
In anything a few (20 percent) are vital and many(80 percent) are trivial. 20 percent of the people owned 80 percent of the wealth. 20 percent of the defects causing 80 percent of the problems. 20 percent of the work (the first 10 percent and the last 10 percent) consume 80 percent of your time and resources. 20 percent of your stock takes up 80 percent of your warehouse space 80 percent of your stock comes from 20 percent of your suppliers. 80 percent of your sales will come from 20 percent of your sales staff. 20 percent of your staff will cause 80 percent of your problems, but another 20 percent of your staff will provide 80 percent of your production. How It Can Help You It reminds you to focus on the 20 percent that matters. Of the things you do during your day, only 20 percent really matter. Those 20 percent produce 80 percent of your results. Identify and focus on those things. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

33 שיטות גראפיות פשוטות להצגה וניתוח נתונים
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

34 Star/Radar/Spider Plot
                                                                                           Figure 1: A typical radar graph with two plots קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

35 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
דיאגראמה עכביש קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

36 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Purpose The star plot is a method of displaying multivariate data. Each star represents a single observation. Typically, star plots are generated in a multi-plot format with many stars on each page and each star representing one observation. Star plots are used to examine the relative values for a single data point (e.g., point 3 is large for variables 2 and 4, small for variables 1, 3, 5, and 6) and to locate similar points or dissimilar points קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

37 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Sample Plot The plot below contains the star plots of 16 cars. The variable list for the sample star plot is: 1. Price 2. Mileage (MPG) Repair Record (1 = Worst, 5 = Best) Repair Record (1 = Worst, 5 = Best) 5. Headroom 6. Rear Seat Room 7. Trunk Space 8. Weight 9. Length קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

38 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

39 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
We can look at these plots individually or we can use them to identify clusters of cars with similar features. We can look at the star plot of the Cadillac Seville : it is one of the most expensive cars, gets below average (but not among the worst) gas mileage, has an average repair record, and has average-to-above-average roominess and size. We can then compare the Cadillac models (the last three plots) with the AMC models (the first three plots). The AMC models tend to be inexpensive, have below average gas mileage, and are small in both height and weight and in roominess. The Cadillac models are expensive, have poor gas mileage, and are large in both size and roominess. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

40 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Questions The star plot can be used to answer the following questions: What variables are dominant for a given observation? Which observations are most similar, i.e., are there clusters of observations? Are there outliers? קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

41 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Weakness in Technique Star plots are helpful for small-to-moderate-sized multivariate data sets. Their primary weakness is that their effectiveness is limited to data sets with less than a few hundred points. After that, they tend to be overwhelming. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

42 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
דיאגראמת עוגה קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

43 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
דיאגראמת עוגה קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

44 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Pivot Chart קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

45 Histogram http://www.stat.sc.edu/~west/javahtml/Histogram.html
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

46 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Cumulative Histogram קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

47 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Bihistogram קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

48 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
דיאגראמה פארטו קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

49 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
דיאגראמה פארטו קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

50 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
דיאגראמה פארטו קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

51 Box-and-Whisker Plot (1)
68 is the median 52 is the lower quartile 87 is the upper quartile 35 is the interquartile range (IQR) קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

52 Box-and-Whisker Plot (2)
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

53 Box-and-Whisker Plot (3)
There is a useful variation of the box plot that more specifically identifies outliers. To create this variation: Calculate the median and the lower and upper quartiles. Plot a symbol at the median and draw a box between the lower and upper quartiles. Calculate the interquartile range (the difference between the upper and lower quartile) and call it IQ. Calculate the following points: L1 = lower quartile - 1.5*IQ L2 = lower quartile - 3.0*IQ U1 = upper quartile + 1.5*IQ U2 = upper quartile + 3.0*IQ The line from the lower quartile to the minimum is now drawn from the lower quartile to the smallest point that is greater than L1. Likewise, the line from the upper quartile to the maximum is now drawn to the largest point smaller than U1. Points between L1 and L2 or between U1 and U2 are drawn as small circles. Points less than L2 or greater than U2 are drawn as large circles. Questions The box plot can provide answers to the following questions: Is a factor significant? Does the location differ between subgroups? Does the variation differ between subgroups? Are there any outliers? Importance: Check the significance of a factor The box plot is an important EDA tool for determining if a factor has a significant effect on the response with respect to either location or variation. The box plot is also an effective tool for summarizing large quantities of information. קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

54 Box-and-Whisker Plot (4)
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

55 Box-and-Whisker Plot (5)
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

56 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
דיאגראמה פיזור קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

57 Scatter Plot: No Relationship
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

58 Scatter Plot: Strong Linear (positive correlation) Relationship
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

59 Scatter Plot: Strong Linear (negative correlation) Relationship
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

60 Scatter Plot: Exact Linear (positive correlation) Relationship
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

61 Scatter Plot: Quadratic Relationship
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

62 Scatter Plot: Sinusoidal Relationship (damped)
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

63 Scatter Plot: Variation of Y Does Not Depend on X
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

64 Scatter Plot: Variation of Y Does Depend on X
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

65 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Scatter Plot: Outlier קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

66 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

67 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
תרשים רץ (1) קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

68 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
תרשים רץ (2) קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

69 תרשים רץ + גבולות בקרה = תרשים בקרה
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

70 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Lag Plot-(1) קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

71 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Lag Plot (2) xt Interpolate these… To get the final prediction New Point xt-1 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

72 קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים
Lag Plot: Random Data קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

73 Lag Plot: Moderate Autocorrelation
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

74 Lag Plot: Strong Autocorrelation and Autoregressive Model
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים

75 Lag Plot: Sinusoidal Models and Outliers
קורס לסטטיסטיקה יישומית - נושא ראשון:נתונים


Download ppt "יסודות סטטיסטיקה יישומית"

Similar presentations


Ads by Google