Presentation is loading. Please wait.

Presentation is loading. Please wait.

Systém riadenia bázy dát Database Management System

Similar presentations


Presentation on theme: "Systém riadenia bázy dát Database Management System"— Presentation transcript:

1 Systém riadenia bázy dát Database Management System
Ján GENČI PDT 2009

2 Obsah RAID 2-phase multiway sort-merge Fyzická organizácia dát
Systémový katalóg Operácie relačnej algebry (len prehľad) Implementácia operácií relačnej algebry Query plány – optimalizácia dotazov

3 Obsah (ak výjde čas) Transakčné spracovanie Paralelné spracovanie
Zotavenie po chybách

4 Literatúra [1] Hector Garcia-Molina, Jeffrey D. Ullman, Jennifer D. Widom: Database System Implementation, Prentice Hall, ISBN-10: Database Systems: The Complete Book, 2001

5 Literatúra [2] Elmasri R., Navathe S. B. : Fundamentals of database systems. 4th ed., Pearson Education, 2001. 5th ed. – 2006

6 Literatúra [3] Ramakrishnan R., Gehrke J.: Database Management Systems. McGraw-Hill Science/Engineering/Math; 3rd ed., 2002

7 Literatúra [4] Abraham Silberschatz, Henry Korth, S. Sudarshan: Database System Concepts. McGraw-Hill Science/Engineering/Math; 5th ed., 2005.

8 RAID Originally - Redundant Arrays of Inexpensive Disks.
Current - Redundant Array of Independent Disks Chen, Lee, Gibson, Katz, and Patterson (1994), ACM Computing Survey, Vol. 26, No.2 (June 1994). (pekne názorne spracované)

9

10 1, 2

11 3, 4, 5, 6

12 RAID 10, 01 - Kombinácie základných RAIDov Preformance:
Block-inter-leaved distributed-parity disk arrays have the best small read, large read, and large write performance of any redundant disk array. Small write requests are somewhat inefficient compared with redundancy schemes such as mirroring.

13 Two phase, multiway sort-merge
Partially based on presentation of Simonas Šaltenis - Advanced Algorithm Design and Analysis

14 Purpose of Algorithm Sorting of very large collection of data (Data>Memory) Classic algorithm – With’s sort-merge algorithm (Wirth C.: Algoritmy a dátové štruktúry.)

15 Princíp Vytvoriť maximálne možné veľké „behy“ (utriedené postupnosti elementov) – najlepšie načítaním do dostupnej pamäte a zotriedením napr. quick-sortom Spájanie behov (mergovanie)

16 Princíp File Y: File X: Run 1 Run 2 Bf1 Bf2 Bfo Run k=n/m Bfk
Current page EOF Bf1 p1 Bf2 p2 Bfo po min(Bf1[p1], Bf2[p2], …, Bfk[pk]) Read, when pi = B Write, when Bfo full Run k=n/m Bfk pk

17 Phase 1: O(n), Phase 2: O(n) Total: O(n) I/Os!
The catch: files only of “limited” size can be sorted Phase 2 can merge a maximum of m-1 runs (m – number of buffers). Which means: N/M (number of runs) < m-1

18 (m-1)2M (m-1)3M = N Phase 2 Phase 1 M (m-1)M . . .

19 Primárne (fyzické) organizácie

20 O čom budeme hovoriť Podporované dátové typy Formovanie záznamov
Organizácia (radenie) záznamov fyzická logická „Umiestnenie“ DBMS v rámci OS

21 Podporované dátové typy
Tzv. built-in dátové typy Pre účely ukladania dát, je pre nás zaujímavá veľkosť dátového typu (sizeof(typ)) „Sémantika“ typu je podporená implementáciou (HW alebo SW) relevantných operácií (out of scope)

22 Storage Record Formats
A fixed-length record A record with variable-length fields A variable-field record with separator characters.

23 Storage Record Formats [2]

24 Fixed length record Size of items is recorded in the system catalog

25 Variable length records
Result of item(s) of variable length

26 NULL value representation
Prakticky väčšina zdrojov o spôsobe implementácie „mlčí“ Pri záznamoch premenlivej dĺžky sa dá využiť null pointer na prvok záznamu ORACLE v dokumentácii pre ORA7 prezentoval ukladnie NULL hodnoty cez bitmapový prefix záznamu

27 Fyzická organizácia záznamov

28 Fyzická organizácia záznamov 2

29 Umiestňovanie záznamov do fyzických blokov
Spanned Unspanned

30 Logické organizácie záznamov
Sekvenčná Hašovaná Heap (hromada) Zhodnotenie z pohľadu operácií insert, find a delete

31 Sekvenčná organizácia

32 Zhodnotenie – sekvenčná org.
Insert – drahá operácia (potreba posunúť priemerne N/2 záznamov) – overflow areas Find – možnosť binárneho vyhľadávania podľa usporiadavajúceho atribútu - O(log2N), ináč O(N) Delete – drahá operácia (potreba posunúť priemerne N/2 záznamov) – možnosť označovať záznamy ako zmazané pack

33 Interné Hashovanie

34 Zhodnotenie – hashovanie
Insert – O(1) ak neuvažujeme konflikty; ak uvažujeme = najhorší prípad O(N) Find – O(1) – hashovací atribút, O(N) ostatné atribúty Delete – O(1) Štruktúra musí byť dimenzovaná na maximálny počet záznamov

35 Externé hashovanie

36 Zhodnotenie - externé hashovanie
Ako interné hashovanie Konflikty sa riešia blokmi pretečenia (viď ďalší slajd )

37 Ext. Hashovanie – overflow bloky

38 Extendible hashing

39 Zhodnotenie – ext. Hashing
Ako externé hashovanie Plusom je možnosť dynamického rozširovania „veľkosti hashovacieho poľa“

40 Miesto DBMS v rámci OS Raw devices Cooked files

41 Summary primárne organizácie


Download ppt "Systém riadenia bázy dát Database Management System"

Similar presentations


Ads by Google