Дистрибуиране базе података

Slides:



Advertisements
Similar presentations
Индиректна питања користимо када некога љубазно питатмо за информацију, почевши са изразима као нпр.:
Advertisements

1 БЕЗБЕДНОСТ НА РАДУ ПРИ РАДУ СА МОСТОВСКИМ И ДРУГИМ ВРСТАМА ДИЗАЛИЦА.
1 Научни радови - рецензирање - Горан Ненадић School of Computer Science, University of Manchester Математички институт, Београд.
ДАВАЧИ ПОМЕРАЈА 2. Садржај  Синхроуређаји  Разлагачи  Индуктосини  Енкодери  Дифракционе решетке  Двобрзински мерни системи  Двоположајни давачи.
ДАВАЧИ ПРИТИСКА, ПРОТОКА, НИВОА, ГУСТИНЕ, pH ВРЕДНОСТИ, ВЛАЖНОСТИ И ДИМЕНЗИЈА (слике: Д. Станковић “Мерење неелектричних величина електричним путем” и.
УСПОСТАВЉАЊЕ МОНИТОРИНГ СИСТЕМА ОТПАДА У РЕПУБЛИЦИ СРБИЈИ Славица Лекић Љиљана Станојевић Светлана Парежанин САСТАНАК РАДНЕ ГРУПЕ ЗА ОТПАД Агенција за.
КОНКУРС МИНИСТАРСТВА ЗА ТЕЛЕКОМУНИКАЦИЈЕ И ИНФОРМАЦИОНО ДРУШТВО „Дигитални час“ Основна школа “Јован Поповић “ Сусек одељење у Баноштору Аутор: Ђурђица.
Кеш меморијa Приципи рада кеш меморија Величина кеша
Јава - RMI Дизајн симулатора дискретних догађаја опште намене обухвата пројектовање више различитих структурних нивоа. Унутар сваког од структурних нивоа.
Увод у WEB програмирање
ОДРЖАВАЊЕ И ЗАШТИТА СИСТЕМА
Промена Устава РС Београд, 21. јул 2017.
учитељица Лала, ОШ "АнтаБогићевић", Лозница
ОПЕРАТИВНИ СИСТЕМ Оперативни систем представља колекцију програма који омогућавају коришћење рачунарског система.
Увод у информатику и рачунарство
Матична Плоча Миле Станковић
Методика наставе рачунарства
Инструменти који могу олакшати примену Уредбе о биоцидним производима
Проналажење мултимедијалних информација
Архитектура рачунарских система
Рачунарске мреже Александар Картељ
Механичка енергија.
Објектно орјентисано програмирање
38. Серво мотори. Захтеви и примена. ДС серво мотори. АС серво мотори
Референтни модели Поређење референтних модела OSI и TCP/IP
Међународни стандард за систем менаџмента квалитетом ISO 9001:2015
Аутори: Славко Марковић Игор Јанковић
Дигитални репозиторијуми докторских дисертација
Рачунарске мреже Александар Картељ
ОСНОВНИ ЕЛЕМЕНТИ ГРАФИЧКОГ ИНТЕРФЕЈСА
РАЧУНАРСКЕ КОМУНИКАЦИЈЕ
Увод у VHDL.
Рачунарски ВЛСИ системи
Рачунарске мреже Александар Картељ
Александра Поповић Александра Настић
Секундарна меморија Типови записа код секундарних меморијских медијума
Оперативни системи и Рачунарске мреже
Рачунарске мреже Александар Картељ
ОДРЖАВАЊЕ И ЗАШТИТА СИСТЕМА
Коначни аутомати.
Фон-Нојманов модел рачунарског система
Стандарди за заштиту животне средине
DSP Алгоритми и Архитектуре
Рачунарске мреже Александар Картељ
Оптички конектори.
Програмски језик C Структура програма, типови података,
РАЧУНАРСТВО ИЗМЕЂУ ПРАКСЕ И ИСТРАЖИВАЊА
ОСНОВИ ИНФОРМАЦИОНИХ ТЕХНОЛОГИЈА
Информатиче технологије -Коришћење интернета-
Računarska grafika.
Оперативни системи и рачунарске мреже
Слој апликација DNS – систем именовања домена Електронска пошта
Финансијски инструменти
Сабирање и одузимање троцифреног и двоцифреног броја
Оптички систем преноса
Подешавање радног окружења програма Microsoft Word
INTERNET MARKETING.
Рачунарске мреже Александар Картељ
СУБЈЕКТИВНЕ ГРАНИЦЕ АРБИТРАЖНОГ СПОРАЗУМА
Стандарди за заштиту животне средине
СОФТВЕР.
Објектно орјентисано програмирање
Суштина и концепције курикулума
Увод доц. др Гордана Пејовић, дипл. фарм. спец.
Увод у организацију и архитектуру рачунара 2
Аритметичке и логичке операције
Оператор надовезивања
Oрганизација и архитектура рачунара
Архитектура и програмирање микропроцесора Intel 8086 (3)
Глобални барометар корупције 2009
Presentation transcript:

Дистрибуиране базе података Александар Чедић Милан Ђорђевић Бојана Љутић

Кориснику, дистрибуирани систем треба да изгледа исто као и недистрибуирани систем

Предности дистрибуираних база података Локална аутономија података Већи капацитет Сигурност Смањивање потребе за удаљеном комуникацијом

12 изведених правила (циљева) Локална аутономија Не ослањати се на централни чвор више него што је потребно Континуиран рад Локална независност Фрагментисање података Репликација података Дистрибуирана обрада упита Дистрибуирано управљање трансакцијама Хардверска независност Оперативни систем независност Мрежна независност Независност система за управљање базама података

Проблеми дистрибуираних база података Основни проблем је брзина преноса података у WAN – у. Брзине које се постижу су и до хиљаду пута лошије него на једном рачунару LAN мреже могу да постигну те брзине Проблем се може свести на проблем смањења коришћења мреже.

Из овог проблема настеје низ проблема у следећим областима: Обрада упита Управљање каталогом Пренето ажурирање Опоравак Конкурентност 1. Обрада упита Због смањења употребе мреже оптимизација мора да буде дистрибуирана Оптимизација се обавља у два корака: глобална и локална оптимизација

Пример 1: Упит Q постављен на локацији X представља спајање релације од 10 хиљада n-торки које се налазе на локацији Y са релацијом која има 10 милиона n-торки које се налазе локацији Z. Задатак оптимизатора на локацији X је да изабере глобалну стратегију за извршење упита. Пожељно је да изабере стратегију да пребаци 10 хиљада n - торки са Y на Z и тамо изврши спајање (уместо 10 милиона на локацију Y). У зависности од кардиналности резултата можда је боље да пребаци обе n-торке на локацију X и онда изврши спајање. Овај корак зависи у потпуности од оптимизатора на локацији Z.

Пример 2: Свака n-торка је величине од 25 бајтова (200 битова) S [SNABDEVAC, GRAD] 10.000 n – торки на лок. A P [DEO, BOJA] 100.000 n – торки на лок. B SP[SNABDEVAC, DEO] 1.000.000 n – торки на л. A Свака n-торка је величине од 25 бајтова (200 битова) Брзина преноса података у мрежи је 50.000 битова у секунди, а кашњење је 0.1 секунда. Упит: Пронаћи све снабдеваче из Лондона који испоручују неки црвени део. Претпоставимо да таквих снабдевача има 100.000, а да црвених делова има 10.

Разматрамо шест стратегија за извршење овог упита. Време комуникације рачунамо на следећи начин: (укупно кашњење) + (укупна количина података / брзина преноса) или (број порука * 0,1) + (број битова / 50.000)

Пример 2: Закључак

Пример 2: Закључак Разлике у брзинама су огромне За брзину су важни и брзина преноса и кашњење. Време извршавања упита је занемарљиво у односу на времена комуникација за лош избор стратегија У примерима није узето у обзир која локација добија крајњи резултат Неке стратегије дозвољавају паралелно процесуирање на више локација.

2. Управљање каталогом Због фрагментације података каталог мора имати и додатне информације. Проблем смештања. Каталог може бити: Централизован (на једној локацији) Потпуно поновљен (свака локација има копију) Партиционисан (свака локација има само оне податке који се односе на њене објекте) Комбинован (партиционисан, једна локација има комплетан каталог) Недостаци су зависност од једне локације или време приступа и зато се у пракси користи нешто другачији приступ.

Имплементација на систему R* Глобално именовање објеката Гарантована је непроменљивост имена. Кориснику се имена објеката представљају или локалним именом или синонимом. Синоними (CREATE SYNONYM)

Каталог на систему R* има следеће информације: Слог за сваки објекат направљен на тој локацији (и тренутну локацију, ако је премештен) Слог који садржи све објекте који се тренутно налазе на тој локацији Табелу синонима за сваког корисника која пресликава синониме објеката у глобална системска имена. Претрага функционише на следећи начин: Корисник унесе синоним за неки објекат Систем проналази глобално име у табели синонима Из глобалног имена узима локацију где је направљен објекат (у којој пише и где се тренутно налази објекат) Ако није премештан знамо његову локацију, а ако јесте потребна је још највише једна промена локације да бисмо га лоцирали. DB2 поседује сличну шему назива као R*.

3. Пренето ажурирање Понављањем података јавио се проблем како ажурирати исте податке на различитим локацијама. Прва идеја је ажурирати све податке од једном. али ово није добро ако је нека локација недоступна Концепт примарне копије: Једна копија сваког поновљеног објекта проглашава се примарном копијом (све остале су секундарне) Примарне копије различитих објеката чувају се на различитим локацијама Ажурирање се сматра логички завршеним када се ажурира примарна копија

Неки системи користе методу асинхроне репликације Ажурирање секундарних копија је у надлежности локације где се налази примарна копија (оно се мора обавити пре завршетка трансакције) Ажурирање секундарних копија се извршава протоколом двофазног комплетирања трансакције Могуће неизвршавање трансакције у случају да је локација примарне копије недоступна Неки системи користе методу асинхроне репликације Ажурирање после комплетирање трансакције Не може се гарантовати конзистентност података Већа брзина извршавања

4. Опоравак Заснива се на методи двофазног комплетирања трансакције или некој варијанти тог протокола Захтеви: Да свака локација буде способна да буде координатор трансакције Координатор трансакције мора да комуницира са учесницима трансакције Учесници трансакције, по потреби, морају да буду под привременом контролом координатора Опис двофазне COMMIT операције: Координатор шаље поруку учесницима да ажурирају објекте Када координатор добије потврду од учесника да су извршили ажурирање он шаље поруку да се изврши COMMIT, у супротном шаље поруку за ROLLBACK

Ово је сложеније у пракси због могућности пада неке локације У случају пада координатора дилема се избегава читањем података из системског лога Координатор мора да памти своје одлуке (COMMIT или ROLLBACK) у случају пада неке локације Немогуће је гарантовати да ће ова процедура бити отпорна на падове Побољшања: Претпостављени COMMIT Претпостављени ROLLBACK

Претпостављени COMMIT: Ако је издата ROLLBACK порука он чека потврду свих учесника да су извршили ROLLBACK У случају пада неке локације она проверава лог координатора Ако има информација о трансакцији онда треба да изврши ROLLBACK, у супротном COMMIT Претпостављени ROLLBACK: Претпоставља се да је извршен ROLLBACK, лог се чува на сличан начин као и за претпостављени COMMIT Претпостављени ROLLBACK даје боље резултате

5. Конкурентност Заснива се на закључавању Оно мора бити дистрибуирано Претпоставимо да за трансакцију Т постоји n локација са поновљеним објектима. Уобичајна имплементација би захтевала 5n порука: n порука за закључавање n повратних порука n порука за ажурирање n порука за откључавање Ефикасније је слати поруке за закључавање и ажурирање заједно, али ни ово није добро

Решење је да се користи стратегија примарне копије: Локација која садржи примарну копију одговорна је за слање порука о закључавању Сада имамо 2n+3 поруке (једна за закључавање, једна повратна, n порука за ажурирање, n повратних порука, једна порука за откључавање) Трансакција се неће извршити ако је локација са примарном копијом у паду Смањење перформанси због обавезног закључавања примарне копије

Проблем који такође настаје је проблем узајамног блокирања трансакције (тј. deadlock-а) У њему може да учествује више две или више локација Ниједна локација не може да открије проблем на основу својих информација Морају се спојити учесници трансакције да би се открила блокада Неки системи за откривање користе timeout механизам

Пример deadlock-a (блокаде)

КЛИЈЕНТ / СЕРВЕР СИСТЕМ Клијент/сервер је дистрибуиран систем у ком: неке локације су клијент локације, а неке сервер локације сви подаци се налазе на сервер локацијама све апликације се извршавају на клијент локацијама није могућа потпуна локациона независност

Неколико клијената могу да деле исти сервер Један клијент може да приступи неколико сервера, одакле имамо два случаја: клијент је ограничен да приступа само једном серверу клијент може да приступи већем броју сервера истовремено

КЛИЈЕНТ/ СЕРВЕР СТАНДАРДИ Разликујемо неколико стандарда: Одређене клијент/сервер карактеристике су укључене у SQL стандард. ISO Remote Data Access (RDA) стандард. Distributed Relational Database Architecture (DRDA) стандард.

КЛИЈЕНТ/ СЕРВЕР АПЛИКАТИВНО ПРОГРАМИРАЊЕ Релациони системи су set – level системи Мора што више функционалности бити упаковано у set-level захтеве

ПРОЛАЗ (GАТЕWАY)

DATA ACCESS MIDDLEWARE SQL СРЕДСТВА