Presentation is loading. Please wait.

Presentation is loading. Please wait.

Andmeladu ja Mitmemõõtmeline vaade andmetele

Similar presentations


Presentation on theme: "Andmeladu ja Mitmemõõtmeline vaade andmetele"— Presentation transcript:

1 Andmeladu ja Mitmemõõtmeline vaade andmetele
SEMINAR POLITSEIAMETIS HENN SARV

2 Ariprotsess versus analüüs
Andmed tekivad äriportsessis Neid talletatakse Andmeid analüüsitakse otsustusprotsessis Otsused mõjutavad äriprotsessi

3 Infosüsteemi ootused Äriprotsessis – Business Support Systems
Hõlbutsada äriprotsess Kiiresti leida üksikuid Kiiresti talletada toiminguid Täpsus ja kiirus andmete muutmisel Reaalajas toimingud - OLTP Otsustusprotsessis – Desicion Support Systems Hõlbutsada otsustusprotsessi Kiiresti leida seoseid, hulki Kiiresti teha üldistusi Reaalajas analüüs - OLAP

4 OLAP versus OLTP OLTP OLAP Äriprotsess Palju tabeleid Normaliseeritud
Jooksvad andmed Muutuvad andmed Mõõdukalt indekseid Analüüs Vähe tabeleid Denormaliseeritud Andmed ajas Staatilised andmed Palju indekseid

5 Normaliseerimine 3-normaalkuju denormaliseeritud Kiired muudatused
Väike andmemaht Optimeeritud kindlatele muudatustele (toimingutele) Kiired päringud Suur andmemaht Optimeeritud “suvalistele” päringutele

6 Andmelao komponendid Kasutaja rakendus Lähteandmed Andmeaidad
Andmete poole pöördumine (vaade) Kasutaja rakendus Lähteandmed Data Warehouse Andmeaidad Andmete liikumine (ülekanne) Andmehoidla

7 DW terminid Lähteandmed (OLTP-süsteemid)
Andmeladu (andmete kogumiskoht, ka kogu DW) Andmeait (spetsiaalselt korrastatud analüütilised andmed) Andmekaevandus – kogutud andmete baasil uue info loomine

8 Andmeülekanne Andmete reorganiseerimine Andmete teisendused
Andmete vääristamine Andmete valideerimine

9 Andmekaevamise võtted
Kruvimine, puurimine, drill Down – sisse, detailiseerimine Up – välja, üldistamine Läbi – cross, kõrvutamine Üle – through, lähteandmete lappamine Statistilised meetodid Klastrid Otsustusteed

10 Andmelao ülesehitus Dimensioonid Faktitabelid
Kirjeldavad tabelid andmete mingi aspekti kohta Palju veerge (tunnuseid) Keskmiselt või palju kirjeid Faktitabelid Andmetabelid ühe või mitme äriportsessi tegelike andmetega Vähe veerge (võtmed ja faktid) Väga palju ridu

11 Tähtskeem Employee_Dim Dimension Table Fact Table Time_Dim Product_Dim
EmployeeKey EmployeeID ... Dimension Table Fact Table Time_Dim TimeKey TheDate ... Product_Dim ProductKey ProductID ... Sales_Fact TimeKey EmployeeKey ProductKey CustomerKey ShipperKey Sales Amount Unit Sales ... Shipper_Dim ShipperKey ShipperID ... Customer_Dim CustomerKey CustomerID ...

12 Dimensioonid Liikmed Tasemed Hierarhiad

13 Dimensioonid, tasemed, liikmed
Product Dimension Neli taset: All, Category, Sub-Category, Product Category taseme liikmed: Bread, Dairy, Meat

14 Faktitabel Suur, kitsas ja lame Välisvõtmed Faktid
Naturaalvõti versus surrogaatvõti Faktid Liidetavad Loendatavad Osaliselt liidetavad Degenereeritud dimensioonid

15 Mitmedimensiooniline vaade andmetele
Sales Fact Atlanta Chicago Markets Dimension Denver Grapes Cherries Dallas Melons Apples Products Dimension Q1 Q2 Q3 Q4 Time Dimension

16 Mõned tüüpilised dimensioonid
Aeg Võti Erinevad kalendrid Erinevad skaalad Erinevad tunnused Isik Isikukood Nimed Muud jaotused


Download ppt "Andmeladu ja Mitmemõõtmeline vaade andmetele"

Similar presentations


Ads by Google