1 איכות נתונים “By 2005, Fortune 1000 enterprises will lose more money in operational inefficiency due to data quality issues than they will spend on data warehouse and CRM initiatives (0.9 probability).” (Gartner Inc. T. Friedman April 2004).
2 נושאים מבוא המיקוד בלקוח בעיות בניהול נתוני הלקוח בנית אסטרטגיה ארגונית
3 איכות הנתונים בעידן הידע Businesses are completely dependent on their data. It is a critical corporate asset and needs to be treated that way. Customers, stakeholders and regulators hold businesses accountable for their data The onus of accountability has fallen on IT.
4 אין ארוחות חינם : איכות צריך לתכנן To realize the full benefits of their investments in enterprise computing systems, organizations must have a detailed understanding of the quality of their data — how to clean it, and how to keep it clean.
5 בעית שלמות
6 Low Quality
7 High Quality
8 במאה ה21 הידע הוא המשאב האסטרטגי החשוב ביותר ליצירת יתרון תחרותי
9 מבול הנתונים בארגונים כמות הנתונים בארגון ממוצע, גדלה בקצב של 30 אחוז לשנה כמות הנתונים מכפילה את עצמה כל 3 שנים הדאגות שהיו לנו לפני מספר שנים, מחווירות לעומת הדאגות כיום הדאגות היום יראו טריוויליות, לעומת הדאגות בעוד מספר שנים
10 כיצד משפיעה איכות הנתונים על עסקים כל החלטה אסטרטגית של הארגון תלויה בנתונים סקר שערכה קבוצת Meta בקרב 3000 משתמשים של מחסני נתונים מצא כי איכות הנתונים היא האתגר הגדול ביותר בהצלחת פרויקטים של BI במחקר שנערך לאחרונה אצל לקוחות DB2 גילה כי יותר מ 10 אחוז מהנתונים על לקוחות כפולים נתונים שגויים גורמים לעסקים לאבד אחוז מהמכירות שלהם / עלות התפעול שלהם מחלקות IT עלולות למצוא את עצמן משקיעות מזמנן בתיקון שגיאות שנגרמו עכב נתונים שגויים
11 המיקוד בלקוח מיקוד במוצר מיקוד בלקוח שירות ומכירות 24/7/365 שירות אישי 1/1 כל אינטראקציה עם הלקוח=הזדמנות עסקית
12 תקלות אופיניות בקשר עם לקוחות מסע שיווק : פניה ללקוח ותיק עם הצעה שמתאימה ללקוח חדש פניה שיווקית לעובדי הארגון עצמו שירות לקוי סירוב לתת שירות עקב שגיאה בנתוני הסכם השירות התראה על יתרה שלילית בחשבון אישי לבעל חשבון ענק בחברה עסקית כתובת שגויה המוצר לא מגיע ליעדו תאריך לידה שגוי הצעות לבני 16 שמתאימות לבני 61 מצב אישי שגוי הצעה לז " ל
13 מהיכן מגיעים הנתונים מערכות תפעוליות Legacy הזנה עצמית דרך האינטרנט
14 בעיות בהזנת נתונים באינטרנט כפילויות שגיאות כתיב שגיאות הקלדה תוארים לא תקניים כתובות נתונים חלקיים סנכרון עם מערכות תפעוליות
15 מאפיני נתונים בעיניים ניהוליות The right data With the right completeness In the right context With the right accuracy In the right format At the right time At the right place For the right purpose The data I need All the data I need Whose meaning I know I can trust and rely on it I can use it easily When I need it Where I need it I can accomplish our objectives and delight our customers
16 מאפיני Information Quality Business Value ערך עסקי Validity תקפות Accuracy דיוק Integrity שלמות Security בטיחות Privacy פרטיות Consistency עקביות Conformity תקניות Accountability אחריות availability זמינות Completness שלמות Presentation ייצוג Place מיקום Maintainability תחזוקתיות
17 Validity Input errors can have dire implications as well. Buy.com discovered this in 1999 when it inadvertently offered a $588 Hitachi monitor for $ – Presumably the person entering the web site data made a mistake. That “ input error ” ultimately cost Buy.com $575,000 when they settled the suit filed by the 7000 customers who demanded that Buy.com deliver on its advertised price.
18 Accountability Proving accountability requires not only that all data be monitored. It requires that complete records of access and use be kept. Those records create the audit trail. It is the audit trail that shows who did what to what, when and how. It is the audit trail that will snare the villain, detect anomalies prove compliance and provide assurance that data is used only in intended and appropriate ways. Creating a comprehensive, perpetual audit hardens an organization against many kinds of loss that often go undetected until it ’ s too late.
19 Maintainability Faulty software can cause data errors and loss as well. For example, if a discounting algorithm has been coded incorrectly, and the discount gets applied twice under certain conditions, the error might go unnoticed for a long time – how many customers complain that they paid too little? Once discovered, it ’ s often impossible to undo the damage that ’ s been done.
20 Conformity Sarbanes-Oxley ACT (SBA) HIPAA USA PATRIOT Act California Senate Bill 1386 Gramm-Leach-Bliley. Basel II SEC FRB FDIC OTS NCUA
21 Security Data Loss Corruption Destruction Theft Fraud
22 בנית אסטרטגיה ארגונית “ A cluster of decisions centered on organizational data quality goals that determine the data processes to improve, solutions to implement, and people to engage. ”
23 תכנון האיכות : מפת דרכים מטרות עסקיות אסטרטגיות מטרות איכות אסטרטגיות ניתוח 6 גורמי איכות החלטות ביצועיות לכל גורם פעולות נגזרות מכל גורם משאבים נגזרים מכל פעולה
24 דוגמא למטרה אסטרטגית ופירוקה למטרות איכות מטרה אסטרטגית : שיפור המכירות ב 5 אחוז על ידי : Cross Selling Up Selling מטרות איכות נגזרות : צמצום הזמן הנדרש להפקת דוח מכירות רבעוני ריכוז 13 מקורות מידע על מכירות לתוך קובץ מרכזי תאימות רגולציה בעניין זיהוי לקוחות איחוד קובץ ספקים חדש לתוך מערכת ה ERP
25 ששת גורמי האיכות Context — the type of data being cleansed and the purposes for which it is used Storage — where the data resides Data flow — how the data enters and moves through the organization Work flow — how work activities interact with and use the data Stewardship — people responsible for managing the data Continuous monitoring — processes for regularly validating the data
26 ששת גורמי האיכות
27 CONTEXT Context defines the type of data and how the data is used. Ultimately, the context of the data determines the necessary types of cleansing algorithms and functions needed to raise the level of quality.
28 דוגמאות ל CONTEXT Customer data — names, addresses, phone numbers, social security numbers, etc. Financial data — dates, loan values, balances, titles, account numbers, types of account (revocable or joint trusts, etc.) Supply chain data — part numbers, descriptions, quantities, supplier codes, etc. Telemetry data — height, speed, direction, time, measurement type, etc.
29 STORAGE Every data quality strategy must consider where the data physically resides. Considering storage as a data quality factor ensures the physical storage medium is included in the overall strategy. System architecture issues such as whether data is distributed or centralized, homogenous or heterogeneous are important. If the data resides in an enterprise application, the type (CRM, ERP, DW, etc.), vendor, and platform of the application will dictate connectivity options to the data.
30 DATA FLOW Data does not stay in one place. Even with a central data warehouse, data moves in and out just like any other form of inventory. The migration of data can present a moving target for a data quality strategy. Hitting that target is simplified by mapping the data flow. Once mapped, staging areas provide a “ freeze frame ” of the moving target. A data flow will indicate where the data is manipulated, and if the usage of the data changes context. Certainly the storage location will change, but knowing the locations in advance will make the strategy more effective as the best location can be chosen given the specific goals. Work evaluating data flow will provide iterative refinement of the results compiled in both the storage and context factors.
31 WORK FLOW Work flow is the sequence of physical tasks necessary to accomplish a given operation..
32 Stewardship No strategy is complete without the evaluation of the human factor and its effect on operations. Work flows and data flows are initiated by people. Data itself has no value except to fulfill purposes set forth by people. The people who manage data processes are, in the current data warehouse vernacular, called data stewards.
33 Continuous Monitoring The final factor in a data quality strategy is continuous monitoring. Adhering to the principals of Total Quality Management (TQM), continuous monitoring is measuring, analyzing, and then improving a system in a continuous manner. Continuous monitoring is crucial for the effective use of data, as data will immediately age after capture, and future capture processes can generate errors.
34 Questions ? P2080