Multidimenzionálny databázový model a OLAP Autor: Juraj Fehér Vedúci dipl. práce: RNDr. Ján Šturc, CSc.
Agenda Teoretické zmapovanie problematiky Situácia v praxi Definície, rozdelenie, vysvetlenie pojmov Business Intelligence, Data Warehouse Multidimenzionálny model OLAP Situácia v praxi MS SQL Server 2005, Oracle 10g, Cognos Nástroje, architektúra, zmeny Porovnanie OLAP nástrojov Porovnanie DB systémov
Oblasť diplomovej práce Business Intelligence Hierarchia, nástroje, produkty Databázové systémy Klasifikácia (OLTP, OLAP), Dátový sklad (DWH), Dátové tržnice
Oblasť diplomovej práce Dátové pumpy Výber, Transformácia, Prenos dát, Synchronizácia Metadáta Využitie, rozdelenie
OLTP vs OLAP Podľa účelu, koncepčnej schémy, technologických rozdielov Hlavná funkcia Automatizácia operácii alebo procesov, dennodenné operácie Poskytovanie optimálnych informácií pre rozhodovanie Orientácia Customer-oriented Application-oriented Market-oriented Subject-oriented Dotazy Relatívne štandardizované a jednoduché dotazy. Návratová hodnota je niekoľko záznamov. Komplexné dotazy umocňované agregáciami Databázový design ER dátový model, vysoko normalizovaný s viacerými tabuľkami Denormalizovaný s menej tabuľkami, Star alebo Snowflake dátový model Počet transakcií Spracovávajú veľké množstvo transakcií Malý počet zložitých dotazov Užívatelia Tisíce, úradník, IT pro Stovky, znal. analytik
Multidimenzionálny databázový model Definícia MD databázového modelu Formálna, fakty & dimenzie, schémy Schémy tabuliek dimenzií Porovnanie relačného a MD modelu Výhody a nevýhody, charakteristika
OLAP Voľne definovaná množina princípov, ktoré poskytujú dimenzionálny rámec pre podporu rozhodovania Funkcionalita OLAP Výpočty, modelovanie, analýza, drill-down/ drill-up, prieniky, rotácie, odozva Pravidlá OLAP Implementačné varianty OLAP MOLAP, ROLAP, HOLAP Charakteristika, výhody & nevýhody
MOLAP využíva OLAP server s vnútornou architektúrou DB opt. Pre MD data dvojvrstvová architektúra klient/server dáta ukladané do MDBMS v n–rozmernom priestore riedke zaplnenie potreba alokácie priestoru veľká rýchlosť spracovania dotazov potrebná stála rekompilácia automatický výpočet agregovaných dát načítavanie dát je zdĺhavé
ROLAP Dáta sú uložené v štandardnej relačnej databáze trojvrstvová architektúra klient/server Prístupnosť SQL report. Nástrojov vylepšenia jazyka SQL, operácii ako CUBE, ROLLUP schéma snehovej vločky, nie je normalizovaná ROLAP nástroje vykazujú nižšiu výkonnosť ako MOLAP nástroje. Načítavanie dát je rýchlejšie Nie je dostupné hierarchické indexovanie
MS SQL Server 2005 MS SQL Server Management Studio správa DB servera zlučuje nástroje: administrácia, konzolová aplikácia, manipulácia s MDB a modelmi BI Development Studio podmnožina MS VS 2005, špecifikácia tabuliek, pohľadov, atribútov ukladanie, výpočet a cacheovanie MD dát manipulácia s dátami bezpečnosť khkhjkh
MS SQL Server 2005 zjednotenie rozhrania XMLA UDM - jeden dim. model stačí pre generovanie zostáv a aj OLAP kociek proaktívne cacheovanie MDX – práca a dotazovanie MD dát
Funkcionalita Integračné služby Reportovacie služby Analytické služby ETL, DTS Designer - návrh, modelovanie Reportovacie služby Report Server, Rep. Model Designer, Rep. Designer, Rep. Manager, Rep. Builder Architektúra, životný cyklus, RDL jazyk Analytické služby Cube Builder - vytváranie kocky MS Office Gfd hgsd gsdkôhg f G hdg hdfg hdfg hhjj gfjh J gfjgf hjgf hjfgh jgf
Oracle 10g Infraštruktúra pre analýzu dát Porovnanie Oracle Database 10g ETL, MD sklad, datamining Oracle Business Intelligence 10g Oracle Business Intelligence Tools 10g Warehouse Builder, Discover Administration Knižnice pre Java JDeveloper Porovnanie Architektúry Predchádzajúcich verzií Discoverer Plus a Discoverer Plus OLAP
Oracle 10g
Cognos Architektúra Nástroje produktové riešenie nezávislé na DBMS Service Oriented Architecture Webové užívateľské a admin. rozhranie Nástroje Analysis Studio Query Studio Report Studio Data Manager Event Studio Porovnanie z čoho vychádza a čo prináša
Porovnanie OLAP nástrojov Porovnanie vzhľadom na prostredie Podpora DBMS, natívna podpora .NET, Java, podpora kancelárskych balíkov, OS, webové služby, Dotazovanie multidimenzionálnych dát Podpora relačných, MD DWH, ich funkcie a možnosti dotazovací jazyk MDX, DDL, OLAP DML Využitie XML systémové rozhranie XMLA, OLAP API
Porovnanie OLAP nástrojov Porovnanie na základe ETL Nástroje OWB, SSIS, Cognos Data Manager Porovnanie Metadát vlastná vs spoločná množina metadát Porovnanie reportovacích možností Nástroje, prístup, výstup, doručenie, formátovanie Ďalšie možné Business Intelligence riešenia Analýza podielu na trhu Podiel a pozícia, využívanie, zameranie
Porovnanie DB systémov Benchmark TPC-H Transaction Processing Performance Council zameranie na podporu rozhodovania a výkon dátového skladu Query-per-Hour Performance Metric $/QphH@Size Kategórie 100, 300, 1000, 3000, 10000 GB
Cieľ diplomovej práce Definovať, predviesť štruktúru, použitie a funkčnosť MD databáz Porovnať s fungovaním transakčných databáz, ich účel a vhodnosť použitia Zadefinovať OLAP, porovnať varianty Analyzovať nástroje OLAP, ich architektúru, funkcionalitu, použitie Porovnať silu a podporu rozhodovania na databázových systémoch
Prínos diplomovej práce Uvedenie a analýza problematiky dátových skladov a OLAP Porovnanie možností, metodík a pohľadov v oblasti Analýza podpory BI v MS SQL 2006, Oracle 10g, Cognos Analýza dostupných nástrojov v praxi, ich architektúry a možností Porovnanie OLAP nástrojov navzájom Výsledok porovnania DB systémov vzhľadom na podporu rozhodovania a výkonu analytického spracovania
Možnosti rozpracovania práce Implementácia fyzickej úrovne multidimenzionálneho dátového modelu Porovnanie ďalších poskytovateľov OLAP nástrojov Indexovanie v multidimenzionálnych štruktúrach Multidimenzionálne clusterovanie
Diskusia Ďakujem za pozornosť