Download presentation
Presentation is loading. Please wait.
Published byBrett Rodgers Modified over 9 years ago
1
بهينه سازي پرس جو هاي سرويس هاي وب علي رهبري
2
سرويس هاي وب روشي استاندارد براي به اشتراک گذاري اطلاعات و قابليت ها 2 Data, کاربرد توصيف و پيدا کردن WSDL,UDDI کاربران / کلاينت ها SOAP ارتباطات سرويس وب
3
مثال سرويس وب 3 Reuters WS 1 سمبول بورس NASDAQ اطلاعات شرکت WS 2 سمبول بورس فعاليت بورس
4
پرس و جوهاي وب سرويس ها 4 WS 1 سمبول بورس NASDAQ اطلاعات شرکت WS 2 سمبول بورس فعاليت بورس دريافت اطلاعت از همه شرکت هاي با تبادل با کاربران / کلاينت ها پرس و جو نتايج Reuters ساده شفاف کارا
5
برخي از اهداف ابتدايي به عنوان DBSM هاي مرسوم 5 داده سيستم مديريت پايگاه داده پرس و جو نتايج کاربران / کلاينت ها واسط توصيفي ساده شفاف کارا
6
سيستم مديريت وب سرويس WSMS 6 سيستم مديريت وب سرويس پرس و جو کاربران / کلاينت ها نتايج WS 1 NASDAQ WS 2 Reuters روترها ساده شفاف کارا
7
معماري WSMS 7 کلاينت WS 1 WS 2 WS n پرس و جو + داده ورودي خروجي واسط توصيفي WS Invocations مولفه ابر داده ثبت وب سرويس نگاشت شما مولفه پردازش پرس و جو اجراي طرح پروفايلر زمان پاسخ ترکر آماري مولفه آماري WSMS انتخاب طرح
8
مثال يک شرکت کارت اعتباري مي خواهد پيشنهادي براي مشترياني با مشخصات زير ارسال کند : a) credit rating > 600 b) payment history = “good” شرکت موارد زير را در اختيار دارد : L : List of potential recipients (identified by SSN) WS 1 : SSN credit rating WS 2 : SSN cc number(s) WS 3 : cc number payment history 8
9
طرح 1 9 کلاينت WS 1 WS 2 WS 3 WSMS L(SSN) SSN cr SSN ccn ccn ph Filter on cr, keep SSN SSN SSN,cr SSN,ccn SSN,ccn,ph Filter on ph, keep SSN توجه : پردازش پايپلايني SSNcr 1500 2700 SSNccn 2123 2456 ccnph 123bad 456good SSN 1 2 2 طرح پرس و جو
10
بيان ساده طرح 1 10 L نتايج WS 1 WS 3 WS 2 SSN crSSN ccn ccn ph
11
طرح 2 11 کلاينت WS 1 WS 2 WS 3 WSMS L(SSN) SSN cr SSN ccn ccn ph Filter on cr, keep SSN SSN SSN,cr SSN,ccn SSN,ccn,ph Filter on ph, keep SSN SSNcr 1500 2700 SSNccn 2123 2456 ccnph 123bad 456good SSN 1 2 2 Join SSN
12
بيان ساده طرح 2 12 L نتايج WS 1 WS 2 WS 3 SSN cr SSN ccnccn ph
13
کدام طرح بهتر است؟ 13 L نتايج WS 1 WS 2 WS 3 L نتايج WS 1 WS 3 WS 2 طرح 2 طرح 1 طرح 1 هيچگاه بدتر نيست !
14
بهينه سازي پرس و جو طرح هاي پرس و جوي ممکن : P 1, …, P n آمار دسترسي به داده : S معيار هزينه اجرا : cost(P i, S) هدف پيدا کردن طرحي با کمترين هزينه است. 14
15
آمار 1) زمان پاسخ دهي سرويس هاي وب 2) انتخاب هاي وب سرويس ها 15
16
آمار : زمان پاسخ r i : براي زمان پاسخ هر تاپل از وب سرويس I ام 16 WS 1 SSN cr کلاينت SSN cr r1r1 r i ≈ 1/throughput, can be reduced by batching, parallel calls batching (see paper) فرض انتخاب مستقل در طرح هاي پرس و جو
17
آمار : انتخاب ها s i : selectivity of WS i Average # output tuples per input tuple to WS i including post-filtering in query plan WS 1 : SSN cr, filter cr > 600 If 90% of SSNs have cr > 600 then s 1 = 0.9 WS 2 : SSN ccn If on average each SSN has 2 credit cards then s 2 = 2.0 17 فرض انتخاب مستقل در طرح هاي پرس و جو
18
معيار هزينه تنگنا 18 Conference Lunch Buffet Dish 1Dish 2Dish 3Dish 4 Average per-tuple processing time = response time of slowest (bottleneck) stage in pipeline Note: selectivities=1 in this example
19
معادله هزينه براي طرح P R i (P): Predecessors of WS i in plan P 19 Fraction of input tuples seen by WS i = WS i response time per input tuple = (assumes WSMS processing is not the bottleneck) Bottleneck cost metric: Π j ∈ R i (P) s j (Π j ∈ R i (P) s j ) r i cost(P) = max 1 ≤i≤n ( ( Π j ∈ R i (P) s j ) r i )
20
مقايسه با معيار هزينه کل 20 Dish 1Dish 2Dish 3Dish 4 Stream filter ordering Expensive predicate placement “Polite” Lunch Buffet cost(P) = ∑ 1 ≤i≤n ( ( Π j ∈ R i (P) s j ) r i )
21
بيان مسئله ورودي : – Web services WS 1, …, WS n – Response times r 1, …, r n – Selectivities s 1, …, s n – Precedence constraints among web services خروجي : – Web services arranged into a plan P – P respects all precedence constraints – cost(P) is minimized 21
22
بدون قيد اولويت All selectivities ≤ 1 Theorem: Optimal to order linearly by r i (selectivities irrelevant) General case (optimal): 22 … join at WSMS “selective” web services ordered by response-time “proliferative” web services Results
23
با قيود اولويت 23 cost(P) = max 1 ≤i≤n ( ( Π j ∈ R i (P) s j ) r i )
24
با قيود اولويت Sum cost metric – Hard to even obtain a factor O(n ) of optimal 24 cost(P) = ∑ 1 ≤i≤n ( ( Π j ∈ R i (P) s j ) r i )
25
با قيود اولويت Bottleneck (max) cost metric – Surprisingly, optimal solution in polynomial time – O(n 5 ) algorithm in paper Add one WS at a time to the plan WS chosen by solving a linear program 25 cost(P) = max 1 ≤i≤n ( ( Π j ∈ R i (P) s j ) r i )
26
بررسي دوباره مثال 26 LResults WS 1 WS 2 WS 3 L Results WS 1 WS 3 WS 2 طرح 2 طرح 1 SSN cr SSN ccn ccn ph WS 2 WS 1 WS 3 WS 1 WS 2 WS 3 Selective Proliferative WS 2 WS 3 Precedence constraint max 1 ≤i≤n ( ( Π j ∈ R i (P) s j ) r i )
27
پياده سازي Built prototype WSMS query processor – Optimizer and execution engine – Assumes schema issues resolved, statistics provided – Written in Java and uses Apache Axis (open-source SOAP implementation) – Experiments (see paper) validate analytical results 27
28
مراجع [1] S. Abiteboul et al. Lazy query evaluation for active XML. In Proc. of the 2004 ACM SIGMOD Intl. Conf. on Management of Data, pages 227–238, 2004. [2] Apache Axis. http://ws.apache.org/axis/. [3] S. Babu et al. Adaptive ordering of pipelined stream filters. In Proc. of the 2004 ACM SIGMOD Intl. Conf. on Management of Data, pages 407–418, 2004. [4] Business Process Execution Language for Web Services. ftp://www6.software.ibm.com/software/developer/library/ws-bpel.pdf ftp://www6.software.ibm.com/software/developer/library/ws-bpel.pdf [5] N. Bruno, S. Chaudhuri, and L. Gravano. STHoles: A multidimensional workload-aware histogram. In Proc. of the2001 ACM SIGMOD Intl. Conf. on Management of Data, pages 211–222, 2001. [6] J. Burge, K. Munagala, and U. Srivastava. Ordering pipelined operators with precedence constraints. Available at http://dbpubs.stanford.edu/pub/2005-40. 28
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.