Business Intelligence

Slides:



Advertisements
Similar presentations
OLAP Tuning. Outline OLAP 101 – Data warehouse architecture – ROLAP, MOLAP and HOLAP Data Cube – Star Schema and operations – The CUBE operator – Tuning.
Advertisements

Case Projects in Data Warehousing and Data Mining Mohammad A. Rob & Michael E. Ellis University of Houston-Clear Lake Houston, Texas
Data Warehousing CPS216 Notes 13 Shivnath Babu. 2 Warehousing l Growing industry: $8 billion way back in 1998 l Range from desktop to huge: u Walmart:
OLAP Services Business Intelligence Solutions. Agenda Definition of OLAP Types of OLAP Definition of Cube Definition of DMR Differences between Cube and.
Data Warehousing M R BRAHMAM.
Spatial data warehouses and SOLAP: a new GIS technology Geosciences, mapping day Jean-Paul KASPRZYK, phd student.
Chapter 15 Data Warehousing, OLAP, and Data Mining
COMP 578 Data Warehousing And OLAP Technology Keith C.C. Chan Department of Computing The Hong Kong Polytechnic University.
Data Warehousing. On-Line Analytical Processing (OLAP) Tools The use of a set of graphical tools that provides users with multidimensional views of their.
How Business Intelligence Software Works and a Brief Overview of Leading Products Jai Windsor MIS 5973 December 8, 2005.
DATA WAREHOUSE (Muscat, Oman).
Online Analytical Processing (OLAP) Hweichao Lu CS157B-02 Spring 2007.
Understanding Analysis Services Architecture. Microsoft Data Warehousing Overview OLTP Source DTS DW Storage Analysis Services Clients OLE DB for OLAP,
SQL Analysis Services Microsoft® SQL Server 2005 Analysis Services provides unified, fully integrated views of your business data to support online.
Data Warehouse to BI 1. Agenda  Review  Preparing the DW for Analysis  Microsoft BI Platform Overview  Building a Cube in SSAS 2.
SharePoint 2010 Business Intelligence Module 6: Analysis Services.
IST722 Data Warehousing Business Intelligence Development with SQL Server Analysis Services and Excel 2013 Michael A. Fudge, Jr.
DATA WAREHOUSING. Introduction Modern organizations have huge amounts of data but are starving for information – facing information gap! Reasons for information.
MSBI online training. MSBI Online Training Course Content : What Is Microsoft BI? Core concept – BI is the cube or UDM Example cube as seen using Excel.
Vidas Matelis, Toronto SQL Server User Group November 13, 2008.
OnLine Analytical Processing (OLAP)
Introduction to Analysis Services and OLAP Technology Tom Conlon and Rob Zare Program Managers SQL Server Business Intelligence Unit Microsoft Corp.
OLAP & DSS SUPPORT IN DATA WAREHOUSE By - Pooja Sinha Kaushalya Bakde.
Data Warehousing.
Module 1: Introduction to Data Warehousing and OLAP
BI Terminologies.
BUSINESS ANALYTICS AND DATA VISUALIZATION
CS 157B: Database Management Systems II April 3 Class Meeting Department of Computer Science San Jose State University Spring 2013 Instructor: Ron Mak.
DATABASES AND DATA WAREHOUSES
Business Intelligence Transparencies 1. ©Pearson Education 2009 Objectives What business intelligence (BI) represents. The technologies associated with.
Sales Dim Date Dim Customers Dim Products Dim Categories Dim Geography The data warehouse is a simple and standard one, after all we.
Centre of Competence on data warehouse Workshop Helsinki Database Cube and Browsing the Cube Mark Rantala.
SQL Server Analysis Services 2012 BI Semantic Model BISM.
What is OLAP?.
CSE 5331/7331 F'071 CSE 5331/7331 Fall 2007 Dimensional Modeling Margaret H. Dunham Department of Computer Science and Engineering Southern Methodist University.
Data Warehousing.
Advanced Database Concepts
CS 157B: Database Management Systems II April 10 Class Meeting Department of Computer Science San Jose State University Spring 2013 Instructor: Ron Mak.
1 Online Analytical Processing (OLAP) Anjali Gupta Mithun Arora Aameek Singh Kranthi Kumar.
11 SAP & SQL Server 2005 Analysis Services Integration Microsoft Corporation SAP-Microsoft Competence Center (Tokyo) Microsoft Corporation SAP-Microsoft.
SQL Server Analysis Services Understanding Unified Dimension Model (UDM)
1 Database Systems, 8 th Edition Star Schema Data modeling technique –Maps multidimensional decision support data into relational database Creates.
MSBI ONLINE TRAINING Techverze. Introduction to MSBI Microsoft Business Intelligence delivers quality data and analyst can measure, manage and improve.
Introduction to OLAP and Data Warehouse Assoc. Professor Bela Stantic September 2014 Database Systems.
Pindaro Demertzoglou Data Resource Management – MGMT 4170 Lally School of Management Rensselaer Polytechnic Institute.
Or How I Learned to Love the Cube…. Alexander P. Nykolaiszyn BLOG:
Data Warehousing and OLAP Outline u Models & operations u Implementing a warehouse u Future directions.
Chapter 3 Building Business Intelligence Chapter 3 DATABASES AND DATA WAREHOUSES Building Business Intelligence 6/22/2016 1Management Information Systems.
Extending and Creating Dynamics AX OLAP Cubes
Business Intelligence Overview
SQL Server Analysis Services Fundamentals
Intro to MIS – MGS351 Databases and Data Warehouses
Reporting and Analysis With Microsoft Office
Introduction to SQL Server Analysis Services
Data Warehousing CIS 4301 Lecture Notes 4/20/2006.
What is OLAP OLAP allows to model data in a multidimensional way like a data cube in order to look for the data from many perspectives.
Data Warehouse.
Databases & Data Warehouses
Buy Valid Microsoft Exam Study Guide Dumps Questions Answers Realexamdumps.com
SQL Server Analysis Services Fundamentals
Business Intelligence
Implementing Data Models & Reports with Microsoft SQL Server
ארכיטקטורה כלל ארגונית
Data Warehouse and OLAP
Databases and Data Warehouses
תוכנית. תוכנית לומדים רק ב- Blue Education IBM Cognos BI מודלים רב-מימדיים (DMR) Dimensionally Modeled Relational ויטלי מישייב לומדים רק ב- Blue Education.
Analytics, BI & Data Integration
Data Warehouse and OLAP
Online Analytical Processing
Presentation transcript:

Business Intelligence בינה עסקית Business Intelligence

What is “Business Intelligence”? בינה עסקית: מה היא? What is “Business Intelligence”?

בינה עסקית -Business Intelligence (BI) בינה עסקית: מה היא? בינה עסקית -Business Intelligence (BI) BI עוסקת בבניית מערכות, העוזרות לארגון להפיק מידע משמעותי, מבחינה עסקית. מערכות BI משתמשות במכלול הנתונים הנאספים על ידי העסק. משמשות לצורך תמיכה בקבלת החלטות.

מרכיבים של מערכת BI מערכת BI כוללת חמישה חלקים: מקורות נתונים, העברת נתונים או אנליזה בזמן אמת, אחסון נתונים, מנועי אנליזה ואפליקציות התמונה מהמאמר: http://cacm.acm.org/magazines/2011/8/114953-an-overview-of-business-intelligence-technology/fulltext

מקורות נתונים נתונים המשמשים לקבלת החלטות יכולים לנבוע מ: בסיסי נתונים תפעוליים אלו בסיסי נתונים שמשתמשים בהם לפעולות יומיומיים של החברה שימו לב שיכולים להיות הרבה בסיסי נתונים (של סניפים בינלאומיים, של מחלקות שונות) בעלי סמכויות שונות מקורות חיצוניים כגון: מידע על חברות מתחרות מן האינטרנט או מקבצים שחיברו אנשי מחקר אירועים בשוק (כגון שינוי במכיר ניירות ערך)

העברת נתונים העברת נתונים (בעזרת כלים בשם ETL) הנה תהליך שבה: מפיקים את הנתונים מן המקורות הנ"ל מכינים את הנתונים לאנליזה העתידית מאחדים את הפורמט של כל הנתונים (אטריבוטים, טיפוסים) מוודאים שלא יהיו נתונים עם טעויות (כגון רשומות חלקיות) מוודאים שלא יהיו נתונים עבור מקרים יוצאי דופן זה יכול גם לחכות עד שלב האנליזה מכניסים את הנתונים למחסן הנתונים לצורך אנליזה עתידית רשימה של כלי תוכנה

אנליזה בזמן אמת לפעמים יש צורך באנליזה של נתונים בזמן אמת. למשל: ירידה במחיר ניירות ערך (אולי צריך לקנות מהר!) מציאת פריט פגום – אולי יש צורך להחזיר את כל המוצרים מהשעות האחרונות ירידת פעילות באתר – יש לחפש סיבה במקרים כאלה יש צורך לנתח את זרם הנתונים בזמן אמת. לשם כך משתמשים ב: Complex Event Processing (עיבוד מורכב של אירועים). מידע נוסף: http://en.wikipedia.org/wiki/Complex_event_processing http://esper.codehaus.org/ http://esper.codehaus.org/tutorials/tutorial/feedmonitor_casestudy.html

מחסן הנתונים בקצרה מחסן הנתונים – הנו אוסף נתונים בפורמט, המתאים לאנליזה בעזרת כל הכלים הללו. בהמשך נדבר הן על הפורמט והן על הכלים

יתרונות של הפרדה בין בסיס הנתונים התפעולי ובין מחסן הנתונים ההפרדה בין בסיס הנתונים התפעולי ובין מחסן הנתונים מאפשרת: שתהליכי האנליזה הצורכים כמות גדולה של משאבים חישוביים, לא יאטו את הפעילויות היום-יומיות של החברה שמירת נתונים בפורמט המיועד לקריאה מהירה לצורך אנליזה בדרך כלל לא מוחקים ולא מעדכנים נתונים במחסן הנתונים

כלי אנליזה קיימים מספר סוגים של כלי אנליזה: מנוע OLAP – Online Analytical Processing מאפשר לבצע אנליזה של הנתונים השמורים במחסן הנתונים ע"י שימוש במודל הקובייה (נלמד בהמשך) מנוע כריית מידע מאפשר ללמוד דברים חדשים מהמידע הקיים (נלמד בהמשך) מנוע חיפוש (מסוג Google) כלים ליצירת דיווחים

OLAP מול OLTP יש להבדיל בין שני כלים שונים: OLTP – Online Transaction Processing טכנולוגיה כדי להפיק מידע מבסיסי נתונים תפעוליים דוגמה: משיכת מזומן מכספומט. כלי OLTP כוללים כלי תוכנה בכספומט וכו' עד בסיס הנתונים בשרת הבנק רוב יישומי OLTP מסתמכים על DBMS OLAP – Online Analytical Processing מבצע שאילתות מול מחסן נתונים

אפליקציות משתמשי BI נגשים לכלים הנ"ל דרך אפליקציות: חיפוש ממשק למנוע חיפוש גיליון אלקטרוני המשך עיבוד פלט שאילתות, כריית מידע ודיווחים לוח מחוונים וויזואליזציה של דיווחי סיכום שאילתות אד הוק ממשק להגשת שאילתות ל OLAP

דוגמת לוח מחוונים

מה נלמד בהמשך בהמשך ההרצאה נלמד: אנליזת נתונים השמורים במחסן נתונים בעזרת מודל ה "קובייה" כיצד מאורגן מידע במחסן נתונים שפת שאילתות MDX עבור הקובייה התפקיד של כריית מידע ב BI

קובייה ואופרטורים עליה The CUBE and Operators on It

מושג הקובייה זמן 1999 1998 1997 קובייה הנה ייצוג לוגי רב ממדי של נתונים השמורים במחסן נתונים. ייצוג זה מאפשר יישום שיטות אנליטיות בעלות עוצמה בדוגמה, הקובייה עבור מרכול היא בעלת שלושה ממדים: לקוח, מוצר ו זמן יכולים להיות מספר רב של ממדים $64,487 $245,764 $29,358 $0 מוצר אוכל שתייה אחרים כוהלי משקה חלבי לקוח קנדה מקסיקו ארה"ב

הממדים כל ממד מורכב מחברי הממד זמן 1999 1998 1997 כל ממד מורכב מחברי הממד לדוגמה, בממד מוצר ישנם חברים: שתייה, כוהלי, משקה, חלבי, אוכל ועוד חברים בממדים יכולים להיות מאורגנים בהיררכיות לדוגמה, החברים כוהלי, משקה ו חלבי הינם בנים של החבר שתייה (מכנים אותו אבא או הורה) $64,487 $245,764 $29,358 $0 מוצר אוכל שתייה אחרים כוהלי משקה חלבי לקוח קנדה מקסיקו ארה"ב

המידות והעובדות בתוך הבלוקים (הקוביות הקטנות) רשומות מידות דוגמאות של מידות: רווח ממכירות מספר המוצרים שנמכרו וכו' כל בלוק מייצג רשומת חברים חבר אחד עבור כל ממד הבלוק של 29,358$ מייצג את החברים ארה"ב, שתייה, 1997 מידות מכונות גם עובדות: נסביר את הכינוי בעזרת הדוגמה: העובדה היא שכל השתייה שנמכרה בארה"ב בשנת 1997 עלתה 29,358$ זמן 1999 1998 1997 $64,487 $245,764 $29,358 $0 מוצר אוכל שתייה אחרים כוהלי משקה חלבי לקוח קנדה מקסיקו ארה"ב

כמה בלוקים יש בקובייה? כמה בלוקים יש בקובייה? תלוי, כי אפשר להסתכל על כל היררכיה במפלסים שונים נניח שבדוגמה רק ממד המוצר מאורגן בהיררכיה ורק מתחת לחבר שתייה יש בנים אם נסתכל במפלס של שתייה, אז ישנם 3*3*3=27 בלוקים אם נסתכל במפלס של סוגי שתייה, אזי ישנם 3*5*3=45 בלוקים זמן 1999 1998 1997 $64,487 $245,764 $29,358 $0 מוצר אוכל שתייה אחרים כוהלי משקה חלבי לקוח קנדה מקסיקו ארה"ב

אופרטורים על קובייה Drill Down/Up Slice/Dice Pivot

Drill Down $64,487 $245,764 $0 אוכל אחרים $4,227 $16,679 $8,452 קנדה מקסיקו ארה"ב משקה כוהלי חלבי 1999 1998 1997 $64,487 $245,764 $29,358 $0 קנדה מקסיקו ארה"ב אוכל שתייה אחרים 1999 1998 1997 אופרטור Drill Down נכנס למפלס יותר מפורט בחבר מסוים של ממד מסוים של הקובייה בדוגמה ירדנו בהיררכיה בחבר ה שתייה של ממד ה מוצר יש לשים לב בדוגמה לתלות בין הסכומים בשתי הקוביות

Drill Up אופרטור Drill Up הנו ההפך מ Drill Down $64,487 $245,764 $0 אוכל אחרים $4,227 $16,679 $8,452 קנדה מקסיקו ארה"ב משקה כוהלי חלבי 1999 1998 1997 $64,487 $245,764 $29,358 $0 קנדה מקסיקו ארה"ב אוכל שתייה אחרים 1999 1998 1997 אופרטור Drill Up הנו ההפך מ Drill Down הוא מעלה אותנו למפלס כללי יותר בדוגמה: עלינו בחזרה בחבר ה שתייה של ממד ה מוצר

Slice/Dice $64,487 $245,764 $29,358 $0 קנדה מקסיקו ארה"ב אוכל שתייה אחרים 1999 1998 1997 1997 $64,487 $245,764 $29,358 $0 שתייה אוכל אחרים קנדה מקסיקו ארה"ב שימו לב שבתוצאה יכולים להישאר פחות ממדים ממה שהיו בקובייה המקורית אם נשארים פחות מ 3 ממדים, אזי האופרטור נכנה Slice ולא – Dice בדוגמה נשארו רק שני ממדים למעשה תמיד אומרים Slice אופרטור Slice/Dice פורס את הקובייה עבור חבר אחד או עבור מספר חברים בממד מסוים בדוגמה פרסנו עבור חבר 1997 של ממד הזמן

דוגמת Dice בדוגמה זאת פרסנו עבור חברים 1997 ו 1998 של ממד הזמן קנדה $64,487 $245,764 $29,358 $0 קנדה מקסיקו ארה"ב אוכל שתייה אחרים 1999 1998 1997 1998 $4,227 $16,679 $8,452 $0 1997 $64,487 $245,764 $29,358 $0 שתייה אוכל אחרים קנדה מקסיקו ארה"ב בדוגמה זאת פרסנו עבור חברים 1997 ו 1998 של ממד הזמן

Pivot אופרטור Pivot מחליף ממדים בדוגמה החלפנו ממדי המוצר והלקוח שתייה $64,487 $0 $245,764 $29,358 שתייה אוכל אחרים מקסיקו קנדה ארה"ב 1999 1998 1997 $64,487 $245,764 $29,358 $0 קנדה מקסיקו ארה"ב אוכל שתייה אחרים 1999 1998 1997 אופרטור Pivot מחליף ממדים בדוגמה החלפנו ממדי המוצר והלקוח

ארגון מידע במחסן הנתונים Organization of Data in the Data Warehouse

שלושה סוגי OLAP קיימים שלושה סוגי OLAP ההבדלים מתבטאים באופן שמירת הנתונים: ROLAP – מבוסס על מודל היחסים MOLAP – מבוסס על מודל הקובייה יתרון: ביצוע שאילתות באופן מהיר חסרון: שטח דיסק מבוזבז דוגמה: הלקוח יוסי קנה רק בשנת 1997 ורק חלב, אבל יש עבורו בלוקים בקובייה עבור כל המוצרים בכל השנים HOLAP – חלקי יחסים וחלקי קובייה רוב מערכות ה-BI של היום משתמשות ב HOLAP אנחנו נלמד רק על חלק היחסים (ROLAP)

סכמה עבור מחסן נתונים ב ROLAP אפשר להשתמש באחד משתי הסכמות הפשוטה שביניהם נקראת סכמת Star העובדות שמורות בטבלת העובדות טבלת העובדות מקושרת לטבלאות הממדים התמונה מהמאמר: http://en.wikipedia.org/wiki/Star_schema

הטבלאות אינן מנורמלות! האם שיכפול נתונים זה גורם לבעיות? בזבוז שטח דיסק? כן! אנומליות? לא! תרגיל: מדוע לא? (רמז: עיין בסוף שקופית 9) יתרון: ביצוע שאילתות על הקובייה בצורה מהירה כי לא צריכים לצרף טבלאות טבלאות הממדים אינן מנורמלות אינם ב BCNF! האם קיים שיכפול נתונים? כן!

סכמת Snowflake עבור הדוגמה אם לא יכולים לעמוד בצריכת שטח דיסק של סכמת Star, אזי משתמשים בסכמת Snowflake בסכמת Snowflake טבלאות הממדים מנורמלות (לא בהכרח עד BCNF) להיררכיה התמונה מהמאמר: http://en.wikipedia.org/wiki/Snowflake_schema

שפת שאילתות MDX The MDX Query Language

מה זה MDX? MDX – Multi-Dimensional eXpressions היא שפה מיוחדת בעלת עוצמה רבה לשאילתות על הקובייה MDX הנה בעלת דמיון עם SQL, אך קיימים הבדלים מהותיים Microsoft חידשו את השפה והיא נהיית לסטנדרט בעולם BI אנחנו נלמד תוכנת icCube, אפשר להוריד אותה: http://www.iccube.com/download יש צורך להתקין JRE 1.7 (או חדש יותר) קודם

פסיעות ראשונות ב icCube אחרי ההתקנה יש להריץ icCube Server נגשים לתוכנה על ידי ריצת icCube Web (Local) משאירים שם המשתמש והסיסמה ריקים יש לבחור סכמת "Sales" שהיא הקובייה המגיעה ביחד עם icCube

קובייה לדוגמה “Sales” הנה קובייה של מכירות של תוכנת icCube נעיין בממד Customers מפלסים (Levels) מאורגנים בהיררכיות (Hierarchies): מידות (Measures): ממדים (Dimensions):

קובייה לדוגמה ארגון חברים של ממד Customers:

קובייה לדוגמה בדוגמאות של ביטויי MDX נשתמש בשלושה ממדים: שימו לב שלכל ממד יכולים להיות כמה היררכיות בקוביית מכירות יש עוד היררכיות לממד זמן נסתפק בהיררכיות בתמונה בשביל הדוגמאות

המבנה הבסיסי של שאילתות MDX SELECT חברים של ממדים עבור שורות ועמודות של טבלת פלט FROM קובייה WHERE פריסה שורות ועמודות מכונים צירים (באנגלית: axes) SELECT מקביל ל Pivot ו Drill Down/Up WHERE מקביל לSlice/Dice סדר ביצוע של השאילתה הנו כמו ב SQL: FROM, WHERE, SELECT (בסדר משמאל לימין)

השאילתה הראשונה יש להציג סכום המכירות בקנדה בשנת 2009 שימו לב שהצבירה (כלומר, חישוב סכום) נעשתה עבורנו! SELECT[Customers].[Canada] on Rows, [Measures].[Amount] on Columns FROM [Sales] WHERE [Time].[2009]

חבר ברירת מחדל עבור אילו מוצרים היה מחושב הרווח? החבר ברירת מחדל חבר ברירת מחדל עבור אילו מוצרים היה מחושב הרווח? החבר ברירת מחדל Default member SELECT[Customers].[Canada] on Rows, [Measures].[Amount] on Columns FROM [Sales] WHERE [Time].[2009]

סטים של חברים יש להציג סכום המכירות, ומספר המכירות בקנדה וארה"ב. יש להציג מידע רק עבור שנת 2009. שימו לב שמנוע OLAP ידע לפרש חברים בלי שנפרש אנחנו: [Customers].[Geography].[All Regions].[North America].[Canada] SELECT {[Canada], [United States]} on Rows, {[Measures].[Count], [Measures].[Amount]} on Columns FROM [Sales] WHERE [Time].[2009]

חישוב סטים בעזרת פונקציות יש להציג את כל המידות עבור כל המדינות של צפון אמריקה. יש להציג מידע רק עבור שנת 2009. Members – כל החברים של היררכיה או מפלס מסוים Descendants – כל הצאצאים של החבר במפלס מסוים SELECT Descendants([North America],[Country]) on Rows, [Measures].members on Columns FROM [Sales] WHERE [Time].[2009]

סטים בעלי שם לפעמים נוח לתת לסט שם. הנה השאילתה כמו בשקופית הקודמת WITH SET [Amer.Countries] AS Descendants([North America],[Country]) SELECT [Amer.Countries] on Rows, [Measures].members on Columns FROM [Sales] WHERE [Time].[2009]

פריסה מול סינון יש להציג את כל המידות עבור מכירות במדינות של צפון אמריקה. יש להציג מידע רק עבור שנת 2009. יש להציג מידע רק עבור מדינות בעלות מכירות העולות על 13,000$ ב MDX לא מסננים ב WHERE. שם רק פורסים את הקובייה. WITH SET [Amer.Countries] AS Descendants([North America],[Country]) SELECT Filter([Amer.Countries],[Measures].[Amount]>13000) on Rows, [Measures].members on Columns FROM [Sales] WHERE [Time].[2009]

עוד דוגמה של סינון יש להציג את סכום המכירות (של כל השנים) עבור כל מדינה בעלת סכום מכירות בשנת 2010 שעולה על 80,000$ WITH SET [myset] AS Filter([Country].members, ([Measures].[Amount], [2010])>80000) select [myset] on rows, [Measures].[Amount] on columns from [sales] /* select order([Country].members, [measures].[amount], bdesc) on Rows, [measures].[Amount] on Columns where [2010] */

סטים של רשומות בצירים כל נקודה על הציר היא באמת רשומה! הציר מוגדר כסט של רשומות חברים ברשומות צריכים להיות מהיררכיות שונות (אפילו של אותו ממד) יש להציג את כל המידות עבור המכירות בקנדה בשנת 2009 ובארה"ב בשנת 2010. SELECT {([Canada],[2009]), ([United States],[2010])} on Rows, [Measures].members on Columns FROM [Sales]

סטים של רשומות בצירים מה קרה כאן? היררכיות של הפריטים בסט לא דומות אבל זה בסדר: SELECT {([Canada],[2009]), ([United States],[License])} on Rows, [Measures].members on Columns FROM [Sales] SELECT {([Ottawa],[2009]), ([United States],[Feb 2010])} on Rows, [Measures].members on Columns FROM [Sales]

רשומות של סטים בצירים הציר מוגדר כסט של רשומות רשומות של סטים בצירים הציר מוגדר כסט של רשומות כל רשומה היא רשומה של סטים יש להציג את כל המידות עבור המכירות בקנדה ובארה"ב בשנות 2009, 2010. SELECT ({[Canada], [United States]},{[2009],[2010]}) on Rows, [Measures].members on Columns FROM [Sales]

פריסה לפי רשומה של כמה חברים יש להציג את כל המידות עבור המכירות בקנדה. יש לחשב רק מכירות של רישיונות (license) icCube בשנת 2009 חברים ברשומות צריכים להיות מהיררכיות שלא מופיעות בצירים (כלומר, שורות ועמודות) SELECT [Canada] on Rows, [Measures].members on Columns FROM [Sales] WHERE ([Time].[2009], [Product].[License])

פריסה לפי רשומה של סטים יש להציג את כל המידות עבור המכירות בקנדה. יש לחשב רק מכירות של רישיונות (license) המוצרים בשנות 2009 ו 2010 SELECT [Canada] on Rows, [Measures].members on Columns FROM [Sales] WHERE ({[Time].[2009], [Time].[2010]}, [Product].[License])

פריסה לפי סטים של רשומות (של סטים) יש להציג את כל המידות עבור המכירות בקנדה. יש לחשב רק מכירות של רישיונות (license) המוצרים בשנות 2009/2010 ו תמיכת המוצרים בשנת 2010 SELECT [Canada] on Rows, [Measures].members on Columns FROM [Sales] WHERE {({[Time].[2009], [Time].[2010]}, [Product].[License]), ([Time].[2010], [Product].[Support])}

שימוש באופרטורים על סטים אפשר להשתמש באופרטורים על סטים: + (Union), - (Except), * (Crossjoin), Intersect יש להציג את כל המידות עבור המכירות במדינות של צפון אמריקה ודרום אמריקה בשנת 2009. WITH SET [NA] AS Descendants([North America],[Country]) SET [SA] AS Descendants([South America],[Country]) SELECT ([NA]+[SA], [2009]) on Rows, [Measures].members on Columns FROM [Sales]

שימוש באופרטורים על סטים אפשר להשתמש באופרטורים על סטים: + (Union), - (Except), * (Crossjoin), Intersect יש להציג את כל המידות עבור המכירות במדינות של צפון אמריקה חוץ מקנדה ודרום אמריקה בשנת 2010. WITH SET [NA] AS Descendants([North America],[Country]) SET [SA] AS Descendants([South America],[Country]) SELECT ([NA]+[SA]-[Canada], [2009]) on Rows, [Measures].members on Columns FROM [Sales]

שימוש באופרטורים על סטים אפשר להשתמש באופרטורים על סטים: + (Union), - (Except), * (Crossjoin), Intersect יש להציג את כל המידות עבור המכירות במדינות של צפון אמריקה בשנות 2009 ו 2010. WITH SET [NA] AS Descendants([North America],[Country]) SELECT [NA]*{[2009],[2010]} on Rows, [Measures].members on Columns FROM [Sales]

שימוש באופרטורים על סטים אפשר להשתמש באופרטורים על סטים: + (Union), - (Except), * (Crossjoin), Intersect יש להציג את כל המידות עבור המכירות במדינות של צפון אמריקה בעלות סכום המכירות יותר מ 80,000$ ומספר המכירות פחות מ 200. WITH SET [NA] AS Descendants([North America],[Country]) SET [NA_HighAmount] AS Filter(NA,[Amount]>80000) SET [NA_LowCount] AS Filter(NA,[Count]<200) SELECT Intersect([NA_HighAmount],[NA_LowCount]) on Rows, [Measures].members on Columns FROM [Sales]

סיכום על MDX MDX היא שפה בעלת עוצמה אפשר לראות עוד דוגמאות מתקדמות בסוף המצגת בכתובת: http://www.slideshare.net/markginnebaugh/mdx-what-bi-developers-need-to-know תיאור של כל הפונקציות תמצאו בכתובת: http://technet.microsoft.com/en-us/library/ms145970.aspx

The Role of Data Mining in BI

כלי אנליזה (תזכורת) מנוע כריית מידע מאפשר ללמוד דברים חדשים מהמידע הקיים

מה זה כריית מידע. (כמה ביטויים לוקחו מגרסת עברית של http://en מה זה כריית מידע? (כמה ביטויים לוקחו מגרסת עברית של http://en.wikipedia.org/wiki/Datamining) כריית מידע או כריית נתונים (באנגלית: Data Mining ) היא גילוי מידע חדש בבסיסי נתונים או מחסני נתונים קיימים גילוי דפוסים תקפים חדשים ובעלי משמעות פירוש המילים "בעלי משמעות": מקבלי ההחלטות יכולים להבין את הדפוסים מקבלי ההחלטות יכולים להשתמש בדפוסים שהתגלו כדי לשפר תהליכים קיימים

בעיות שכריית מידע פותרת סיווג (באנגלית: Classification) – בהתאם לדוגמאות שנאספו בעבר, אפשר להסיק מודל סיווג המשמש לסווג מקרים חדשים בנק יכול לבנות מודל סיווג של לווי משכנתא בהתאם לדוגמאות שנאספו בעבר. כאשר מגיע לקוח חדש המבקש משכנתא, הוא מסווג לפי מידת הוודאות שהוא אכן יצליח לעמוד בעתיד בהחזרי ההלוואה

בעיות שכריית מידע פותרת ניתוח אשכולות (באנגלית: Clustering) – פילוח של הרשומות לאשכולות, כך שבכל אשכול נמצאות רשומות בעלות מאפיינים דומים ניתן להיעזר באלגוריתם לניתוח אשכולות כדי לפלח את לקוחות החברה כדי לשלוח פרסום יותר מכוון בעתיד

הבעיות הנפוצות של כריית מידע רגרסיה (באנגלית: Regression) – מציאת פונקציה הממדלת את הנתונים הקיימים תוך מזעור שגיאת הניבוי מה יהיה מחיר של מניות Google מחר? למידת חוקי אסוציאציה (באנגלית: Association Rule Learning) – מציאת קשרים בין פריטים שונים של נתונים ניתוח סל קניות (באנגלית: Market Basket Analysis) . אילו מוצרים נרכשים בדרך כלל יחדיו (כגון ממרח שוקולד ולחם)? בהתאם לתוצאות ניתן לסדר את המוצרים במרכול בצורה האופטימלית

כריית מידע מול למידת מכונה למידת מכונה (באנגלית: Machine Learning) היא תחום AI. מטרת למידת מכונה היא שהסוכן ילמד מניסיון הקודם או ידע הנתון כדי לשפר ביצועים בעתיד לעתים רבות שני התחומים משתמשים באותם אלגוריתמים ולכן מתבלבלים ביניהם מקור של רוב האלגוריתמים האלה הינו בתחום למידת מכונה שם של הספר על מערכת WEKA לכריית מידע הוא: "Data Mining: Practical Machine Learning Tools and Techniques" לכן, ניתן להגדיר: כריית מידע משתמשת באלגוריתמים של למידת מכונה למטרת מציאת ידע חדש בנתונים הקיימים

סיכום למדנו על: מושג BI ארגון מידע במחסן הנתונים קובייה ושפת שאילתות MDX