Download presentation
Presentation is loading. Please wait.
1
מרץ 2002אלן אזאגורי ©1 ניהול דיסקים Disk Management
2
מרץ 2002 אלן אזאגורי ©2עמוד נושאים מבוא –מבנה דיסק (חזרה) זימון גישות לדיסק אמינות וביצועים בדיסקים –RAID אבולוצית דיסקים ומערכות בעשרות השנים האחרונות –מבוסס על המאמר Jim Gray, Prashant Shenoy, Rules of Thumb in Data Engineering, Technical Report MS-TR-99-100, March 2000, Microsoft Research
3
מרץ 2002 אלן אזאגורי ©3עמוד מבנה הדיסק head sector track cylinder
4
מרץ 2002 אלן אזאגורי ©4עמוד שימו לב! מעבר מ-track ל-track הסמוך משמעותית מהיר יותר מאשר מעבר ל-track מרוחק ביצועים של דיסק "שרת" דוגמא - Seagate r – סיבובים לדקה l – זמן ממוצע מהגעה ל-track עד להגעה לסקטור s – זמן ממוצע להזזת זרוע מ- track ל-track tr – קצב העברת נתונים פנימי
5
מרץ 2002 אלן אזאגורי ©5עמוד זימון גישות לדיסק הקדמה רקע –דיסק מסוגל לשרת רק בקשה אחת בו-זמנית –לכן הדיסק (בעצם בקר הדיסק) מנהל תור של בקשות לכל בקשה ידועים (1) הכתובת בדיסק (2) גודל הכתיבה/קריאה וכו' המטרה –זימון אופטימלי של בקשות מהו קריטריון האופטימליות? –מינימיזציה זמן גישה ממוצע –מינימיזציה מרחק תנועות הראש –מקסימיזציה של קצב העברת נתונים
6
מרץ 2002 אלן אזאגורי ©6עמוד זימון גישות לדיסק First Come First Serve בקשות לפי track (משמאל לימין) –98, 183, 37, 122,14, 124, 65, 67 –בהתחלה הראש נמצא ב-track 53 יתרונות/חסרונות הוגן הזזות ארוכות של הזרוע 640
7
מרץ 2002 אלן אזאגורי ©7עמוד זימון גישות לדיסק Shortest Seek Time First הגדרה –משרתים את הבקשה שדורשת seek קצר ביותר יתרונות/חסרונות מקטין את מרחק התנועה של הראש (אך לא בהכרח אופטימלי!) עלול לגרום להרעבה 236
8
מרץ 2002 אלן אזאגורי ©8עמוד זימון גישות לדיסק אלגוריתם המעלית – SCAN הגדרה –משרתים את הבקשה הכי קרובה לפי כיוון תזוזת הראש יתרונות/חסרונות מונע הרעבה כאשר הראש מתקרב לקצה אחד, הבקשות ל-tracks בקצה השני מופלות לרעה תזוזה מיותרת לקצה הדיסק 236
9
מרץ 2002 אלן אזאגורי ©9עמוד זימון גישות לדיסק אלגוריתם המעלית מעגלי – C-SCAN הגדרה –משרתים את הבקשה הכי קרובה לפי כיוון תזוזת הראש יתרונות/חסרונות זמן המתנה הוגן יותר מ- SCAN תזוזה מיותרת לקצה הדיסק 382
10
מרץ 2002 אלן אזאגורי ©10עמוד זימון גישות לדיסק LOOK (ו-C-LOOK) הגדרה –דומה ל-SCAN (ו-C- SCAN) אך לא מזיז את הזרוע לקצה הדיסק אלא רק עד למיקום הבקשה ל-track הקיצוני ביותר גישה שבד"כ ממומשת 208
11
מרץ 2002 אלן אזאגורי ©11עמוד אמינות של הדיסק Disk Reliability הבעיה –הדיסק הוא יחידה עיקרית במחשב עם חלקים מכניים סיכוי לנפילה גבוה מדד – זמן עד לנפילה –Mean Time To Failure – עבור דיסק בודד כ- 200000 שעות –במערך של 100 דיסקים – כ-2000 שעות
12
מרץ 2002 אלן אזאגורי ©12עמוד פיזור ויתרות – Striping/Redundancy איך נתגבר על בעיות האמינות של מערך דיסקים? –Redundancy נשמור מידע נוסף שיאפשר שיחזור מידע במקרה של נפילת דיסק או שיבוש בלוק..וכיצד נשפר ביצועי מערך דיסקים (יחסית לדיסק יחיד)? –Disk Striping נפזר בלוקים בין דיסקים שונים כדי לאפשר קריאות/כתיבות במקביל
13
מרץ 2002 אלן אזאגורי ©13עמוד RAID – Redundant Array of Independent Disks הגדרה –משפחה של פתרונות המשלבים פיזור (striping) ויתרות (redundancy) מעל מספר דיסקים כדי להשיג ביצועים יותר טובים ואמינות גבוהה יותר הנחת יסוד –שימוש ביחידות פשוטות וזולות, במקום להפוך את הדיסק למורכב ויקר יותר
14
מרץ 2002 אלן אזאגורי ©14עמוד RAID 0 Striping הגדרה –מפזר בלוקים לפי הסדר בין הדיסקים השונים מכפיל את מהירות הקריאה/כתיבה הסידרתית פי n אינו משפר (אפילו מריע) את אמינות מערך הדיסקים … 2n n 0 … 2n+1 n+1 1 … 3n-1 2n-1 n-1
15
מרץ 2002 אלן אזאגורי ©15עמוד RAID 1 Mirrorring הגדרה –מעתיק כל בלוק בדיסק אחד (או יותר) משפר את האמינות קריאות אקראיות מהירות יותר (יכול לנצל את שתי הזרועות בו זמנית) כתיבות דורשות כתיבה נוספת מכפיל (לפחות) את מספר הדיסקים – ולכן את עלות הפיתרון RAID 0+1 (או RAID 1+0) –פיתרון משולב של RAID 0 ו-RAID 1, Mirrored Striping או Striped Mirroring … 2 1 0 … 2 1 0
16
מרץ 2002 אלן אזאגורי ©16עמוד RAID 2 קוד מתקן שגיאות (כגון Hamming) הגדרה –כל בלוק מפורק לחתיכות שנכתבות כל אחת בדיסק נפרד –רושם קוד מתקן שגיאות בדיסק/ים האחרון/נים עבור כל הבתים באותו מקום בכל הדיסקים משפר את אמינות עלות הפיתרון סביר יותר – דיסק נוסף ל-n דיסקים רוב הדיסקים כבר מממשים ECC ברמת דיסק בודד דורש סנכרון בין הדיסקים … b, … … … … … ecc 0,...
17
מרץ 2002 אלן אזאגורי ©17עמוד RAID 3 Byte Interleaved Parity הגדרה –מפזר חלקי בלוקים לפי הסדר בין הדיסקים השונים –שימוש בדיסק האחרון כ-Parity Disk: בית Parity עבור כל הבתים באותו מקום בכל הדיסקים משפר את האמינות עלות הפיתרון סבירה יותר – דיסק parity נוסף ל-n דיסקים קריאות/כתיבות איטיות – דורשות גישה מסונכרנת לכל הדיסקים … b, … … … … … p 0,...
18
מרץ 2002 אלן אזאגורי ©18עמוד RAID 4 Block Interleaved Parity הגדרה –מפזר בלוקים לפי הסדר בין הדיסקים השונים –שימוש בדיסק האחרון כ-Parity Disk: בלוק Parity עבור כל הבלוקים באותו מקום בכל הדיסקים משפר את האמינות עלות הפיתרון סבירה יותר – דיסק parity נוסף ל-n דיסקים כתיבה לבלוק דורשת רק גישה לשני דיסקים דיסק ה-parity הינו צוואר בקבוק כתיבה לבלוק בודד דורשת עד ארבע פעולות ק"פ –ניתן לבצע אופטימיזציה בכתיבות סדרתיות … n … n+1 … n+2 … 2n-1 … P1P1 012n-1P0P0
19
מרץ 2002 אלן אזאגורי ©19עמוד RAID 5 - Block Interleaved Distributed Parity הגדרה –מפזר בלוקים לפי הסדר בין הדיסקים השונים –פיזור בלוקים ה-Parity בין הדיסקים השונים משפר את אמינות עלות הפיתרון סבירה יותר – דיסק parity נוסף ל-n דיסקים כתיבה לבלוק דורשת רק גישה לשני דיסקים מסיר צוואר בקבוק של RAID-4 כתיבה לבלוק בודד דורשת עד ארבע פעולות ק"פ –ניתן לבצע אופטימיזציה בכתיבות סדרתיות …… n … n+1 … n+2 … 2n-1P1P1 012n-1P0P0
20
מרץ 2002אלן אזאגורי ©20 Data Engineering לאן?
21
מרץ 2002 אלן אזאגורי ©21עמוד קצב העברת נתונים 40x/15yrs צפיפות בסיביות לשטח 1000x/15yrs צפיפות tracks/inch צפיפות בתוך track ב-kbits/inch
22
מרץ 2002 אלן אזאגורי ©22עמוד הערות עליה בצפיפות בדיסק הינו הגורם הדומיננטי –עלתה מ-20Mbpsi ב-1985 למעל 100Gbpsi היום פער בין צפיפות לבין קצב העברה עולה פי 10 כל 10 שנים –גם הפער בין צפיפות לזמן גישה עולה בקצב דומה –היום לוקח בערך שעה לסרוק דיסק –בעוד כשלוש שנים, סריקה תיקח כשעתיים; לפני עשר שנים, זה לקח חמש דקות! הנתונים בדיסק "קרים" יותר –אם נחלק את נפח הדיסק בגישות לשניה, הפער עולה עם הזמן
23
מרץ 2002 אלן אזאגורי ©23עמוד מסקנות גישות לדיסק הופכות יקרות יותר (יחסית) ולכן עדיף: –שימוש בבלוקים גדולים יותר –שימוש בהעברות נתונים סדרתיות –שימוש ב-Mirroring מאשר ב-RAID-5 –רצוי להרבות בדיסקים –שימוש במטמון גדול יותר להחזיק בלוקים חמים
24
מרץ 2002 אלן אזאגורי ©24עמוד פירוט רצוי להפחית גישות לדיסק –כתיבת שינויים ב-logs (סידרתיים) במקום כתיבות אקראיות קיבוץ שינויים לכתיבה אחת גדולה וסדרתית log-structured file systems! RAID-1 או RAID-5? –שניהם מעלים את האמינות –RAID-5 חוסך במקום על חשבון גישות לדיסק –RAID-1 מכפיל את קצב הקריאות על חשבון גישה נוספת לדיסק בכתיבה –RAID-5 עלול לדרוש 4 גישות לכתיבה אחת!
25
מרץ 2002 אלן אזאגורי ©25עמוד ומה לגבי מהירות תקשורת? קצב העברה על קו בודד גדל פי 4 כל 3 שנים –דומה לקצב גידול הצפיפות בדיסקים –לכן, מתרחב הפער בין התקשורת לבין קצב העברת נתונים מדיסק זמן גישה ממוצע לדיסק ומה לגבי latency – פרק זמן משליחת בית עד להגעתו ליעד? –מוגבל ע"י מהירות האור... 60 msec להלוך ושוב בתוך ארה"ב
26
מרץ 2002 אלן אזאגורי ©26עמוד מסקנות רצוי להעביר כמה שיותר נתונים ללקוח (caching) –כולל מספר רמות caching בין הלקוח לשרת דוגמא –Cooperative Caching לקוחות משתפים פעולה ומחברים את ה-caches שלהם כדי לקבל cache אחד גדול –מערכות קבצים peer-to-peer
27
מרץ 2002 אלן אזאגורי ©27עמוד צווארי בקבוק גידול מהיר
28
מרץ 2002 אלן אזאגורי ©28עמוד סיכום כאשר ההתקדמות הטכנולוגית אינה אחידה –גדלי זכרונות, מהירויותיהם, מהירות תקשורת, מהירות מעבדים, דיסקים,... רצוי לבחון מחדש את ארכיטקטורת המערכות –איפה נוצרים צווארי בקבוק חדשים? –אילו חלקים הופכים זולים יחסית? יכולות להיות השפעות משמעותיות על מבנה מערכת ההפעלה...
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.