Download presentation
Presentation is loading. Please wait.
Published byArthur Meissner Modified over 6 years ago
1
Systém riadenia bázy dát Database Management System
Ján GENČI PDT 2009
2
Obsah RAID 2-phase multiway sort-merge Fyzická organizácia dát
Systémový katalóg Operácie relačnej algebry (len prehľad) Implementácia operácií relačnej algebry Query plány – optimalizácia dotazov
3
Obsah (ak výjde čas) Transakčné spracovanie Paralelné spracovanie
Zotavenie po chybách
4
Literatúra [1] Hector Garcia-Molina, Jeffrey D. Ullman, Jennifer D. Widom: Database System Implementation, Prentice Hall, ISBN-10: Database Systems: The Complete Book, 2001
5
Literatúra [2] Elmasri R., Navathe S. B. : Fundamentals of database systems. 4th ed., Pearson Education, 2001. 5th ed. – 2006
6
Literatúra [3] Ramakrishnan R., Gehrke J.: Database Management Systems. McGraw-Hill Science/Engineering/Math; 3rd ed., 2002
7
Literatúra [4] Abraham Silberschatz, Henry Korth, S. Sudarshan: Database System Concepts. McGraw-Hill Science/Engineering/Math; 5th ed., 2005.
8
RAID Originally - Redundant Arrays of Inexpensive Disks.
Current - Redundant Array of Independent Disks Chen, Lee, Gibson, Katz, and Patterson (1994), ACM Computing Survey, Vol. 26, No.2 (June 1994). (pekne názorne spracované)
10
1, 2
11
3, 4, 5, 6
12
RAID 10, 01 - Kombinácie základných RAIDov Preformance:
Block-inter-leaved distributed-parity disk arrays have the best small read, large read, and large write performance of any redundant disk array. Small write requests are somewhat inefficient compared with redundancy schemes such as mirroring.
13
Two phase, multiway sort-merge
Partially based on presentation of Simonas Šaltenis - Advanced Algorithm Design and Analysis
14
Purpose of Algorithm Sorting of very large collection of data (Data>Memory) Classic algorithm – With’s sort-merge algorithm (Wirth C.: Algoritmy a dátové štruktúry.)
15
Princíp Vytvoriť maximálne možné veľké „behy“ (utriedené postupnosti elementov) – najlepšie načítaním do dostupnej pamäte a zotriedením napr. quick-sortom Spájanie behov (mergovanie)
16
Princíp File Y: File X: Run 1 Run 2 Bf1 Bf2 Bfo Run k=n/m Bfk
Current page EOF Bf1 p1 Bf2 p2 Bfo po min(Bf1[p1], Bf2[p2], …, Bfk[pk]) Read, when pi = B Write, when Bfo full Run k=n/m Bfk pk
17
Phase 1: O(n), Phase 2: O(n) Total: O(n) I/Os!
The catch: files only of “limited” size can be sorted Phase 2 can merge a maximum of m-1 runs (m – number of buffers). Which means: N/M (number of runs) < m-1
18
(m-1)2M (m-1)3M = N Phase 2 Phase 1 … M (m-1)M . . .
19
Primárne (fyzické) organizácie
20
O čom budeme hovoriť Podporované dátové typy Formovanie záznamov
Organizácia (radenie) záznamov fyzická logická „Umiestnenie“ DBMS v rámci OS
21
Podporované dátové typy
Tzv. built-in dátové typy Pre účely ukladania dát, je pre nás zaujímavá veľkosť dátového typu (sizeof(typ)) „Sémantika“ typu je podporená implementáciou (HW alebo SW) relevantných operácií (out of scope)
22
Storage Record Formats
A fixed-length record A record with variable-length fields A variable-field record with separator characters.
23
Storage Record Formats [2]
24
Fixed length record Size of items is recorded in the system catalog
25
Variable length records
Result of item(s) of variable length
26
NULL value representation
Prakticky väčšina zdrojov o spôsobe implementácie „mlčí“ Pri záznamoch premenlivej dĺžky sa dá využiť null pointer na prvok záznamu ORACLE v dokumentácii pre ORA7 prezentoval ukladnie NULL hodnoty cez bitmapový prefix záznamu
27
Fyzická organizácia záznamov
28
Fyzická organizácia záznamov 2
29
Umiestňovanie záznamov do fyzických blokov
Spanned Unspanned
30
Logické organizácie záznamov
Sekvenčná Hašovaná Heap (hromada) Zhodnotenie z pohľadu operácií insert, find a delete
31
Sekvenčná organizácia
32
Zhodnotenie – sekvenčná org.
Insert – drahá operácia (potreba posunúť priemerne N/2 záznamov) – overflow areas Find – možnosť binárneho vyhľadávania podľa usporiadavajúceho atribútu - O(log2N), ináč O(N) Delete – drahá operácia (potreba posunúť priemerne N/2 záznamov) – možnosť označovať záznamy ako zmazané pack
33
Interné Hashovanie
34
Zhodnotenie – hashovanie
Insert – O(1) ak neuvažujeme konflikty; ak uvažujeme = najhorší prípad O(N) Find – O(1) – hashovací atribút, O(N) ostatné atribúty Delete – O(1) Štruktúra musí byť dimenzovaná na maximálny počet záznamov
35
Externé hashovanie
36
Zhodnotenie - externé hashovanie
Ako interné hashovanie Konflikty sa riešia blokmi pretečenia (viď ďalší slajd )
37
Ext. Hashovanie – overflow bloky
38
Extendible hashing
39
Zhodnotenie – ext. Hashing
Ako externé hashovanie Plusom je možnosť dynamického rozširovania „veľkosti hashovacieho poľa“
40
Miesto DBMS v rámci OS Raw devices Cooked files
41
Summary primárne organizácie
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.