מבוא למערכות מידע מנהל עסקים שנה א הרצאה 4: תשתיות מידע (3)- מסד הנתונים נערך ע"י ד"ר דיצה ביימל
סיכום השיעור הקודם חומרה – קלט/פלט, יחידות אחסון, CPU תוכנה – מערכת הפעלה, אפליקציות מי המוח
איפה אנחנו בציר הזמן 1 2 3 4 5 6 7 8 9 10 11 12 13 14 פיתוח ויישום תשתיות מידע מבוא תשתיות מידע תשתיות מידע פיתוח ויישום מעבדה מעבדה מעבדה אינטרנט 1 2 3 4 5 6 7 8 9 10 11 12 13 14
תוכן ההרצאה מוטיבציה, הגדרה, ותכונות של מסד הנתונים סכימה קונספטואלית עיצוב מסד הנתונים סיכום
מוטיבציה בארגון מודרני, נוסף למשאבים קלאסיים כמו עבודה, הון ונכסים, קיים משאב חשוב נוסף – המידע. מידע על פעילויות, מוצרים, מתחרים, לקוחות, מצב פיננסי ועוד. שימוש יעיל במידע זמין ואמין עוזר לארגון בהשגת מטרותיו. אנשי מ"מ עוסקים בארגון וניהול הנתונים, לשם אבטחת גישה נוחה ומהירה, לאחסנה, לעדכון, ולאחזור הנתונים. המידע הוא תוצאה של עיבוד וניתוח הנתונים מידע של משתמש אחד יכול לשמש נתון למשתמש אחר על מנת להפיק מידע נוסף.
ניהול מידע - כיצד? פעם.... כל מחלקה ניהלה את נתוניה שלה, תוכניות יישום ייצור תוכניות יישום משאבי אנוש תוכניות יישום שיווק כל מחלקה ניהלה את נתוניה שלה, באמצעות תוכניות נפרדות ונתונים נפרדים לכל מחלקה. מהן הבעיות העולות מניהול כזה?
חסרונות השימוש תלות בין תוכנית היישום לנתונים כפילות נתונים על כל תוכנית לנהל מטא נתונים על כל הקבצים בהם היא משתמשת כפילות נתונים מערכות/תוכניות שונות מחזיקות עותקים שונים של אותם נתונים שיתוף נתונים מוגבל אין בקרה מרכזית של הנתונים זמני פיתוח ארוכים יותר ואחזקה יקרה של התוכניות תכנתים חייבים לתכן ולממש את פורמטי הקבצים שלהם 80% מתקציב מערכת המידע התלות הרבה בין הנתונים לבין תהליכי עיבוד הנתונים חייבו פיתוח טכנולוגיה חדשה לניהול נתונים - DBMS
מערכת לניהול מסד נתונים DBMS – DataBase Management System היום: ייצור מערכת לניהול מסד נתונים מסד נתונים משאבי אנוש מנהל מסד נתונים שיווק מענה טכנולוגי לדרישות של שילוב קבצי נתונים למערכת משולבת אחת, המאפשר נגישות גבוהה ומהירה לנתונים במגוון חתכים נרחב.
העיקרון החשוב ביותר במסד נתונים! אי תלות בנתונים: היכולת להשתמש בנתונים המאוחסנים בבסיס הנתונים מבלי להכיר את פרטי שיטת אחסונם, ולבצע שינויים מסוימים בבסיס הנתונים מבלי שתוכניות היישום יושפעו מכך. הפרדה ברורה בין המבנה הלוגי והמבנה הפיזי של מסד הנתונים המבנה הלוגי מיוצג באמצעות מודל נתונים ישנם מספר מודלים שמיושמים במערכות לניהול מסדי נתונים מודל הנתונים ההיררכי מודל הנתונים הרשתי מודל הנתונים הרלציוני (טבלאי)
המודל הרלציוני (טבלאי) Relational Model הוצג לראשונה ע"י Codd בשנת 1970 (זוכה פרס טיורינג ב- 1981) מערכות מבוססות המודל הרלציוני הוצגו לראשונה ב 1975 ע"י יב"מ ואוניברסיטת ברקלי כיום, הרוב המוחלט של המערכות מבוסס על המודל הרלציוני. המודל מציג את מסד הנתונים כאוסף של רלציות, כאשר כל רלציה היא בעצם טבלה עם שורות ועמודות מודל פשוט ואלגנטי
המודל הרלציוני (טבלאי) Relational Model רלציה מורכבת מסכימה (Schema) ומופעים (Instances) סכימה של רלציה: שם הרלציה, אוסף השמות של העמודות של הרלציה, וסוגיהם מופע של רלציה (טבלה): אוסף של רשומות (שורות בטבלה) Students year sname sid 3 white 240 jones 202 1 adams 450 מהי הסכימה של הרלציה?
דוגמא לטבלאות במסד נתונים טבלאי עובדים פרויקטים משכורת שם עובד מספר עובד חיים E1 דליה E2 רינה E3 משה E4 תאריך פתיחה שם פרויקט מספר פרויקט שמיים P1 אוקיינוס P2 אדמה P3 אש P4 עובדים בפרויקט שעות עבודה בחודש ינואר מספר עובד מספר פרויקט 100 E1 P1 70 E2 P3 50 P2 מה הרווחנו?
הדרך שבה המפתחים והמשתמשים רואים את הנתונים ומתייחסים אליהם מבנה לוגי מבנים לוגיים: הדרך שבה המפתחים והמשתמשים רואים את הנתונים ומתייחסים אליהם מסד הנתונים חברת הנוטע טבלה טבלה טבלת לקוחות רשומה רשומה לקוח: "חיים", "כהן", "חיפה" שדה שדה שם פרטי: "חיים" תו תו "ח", "י", "י","ם"
מטופלים ע"י המערכת ושקופים למפתח ולמשתמש מבנה פיזי מבנים פיזיים : מטופלים ע"י המערכת ושקופים למפתח ולמשתמש קובץ גוש גוש מילה מילה בית מה הרווחנו? בית סיבית סיבית
הגדרה ל DBMS מערכת לניהול בסיסי נתונים: מערכת תוכנה ייעודית המאפשרת את ניהול הנתונים תוך תמיכה במגוון רחב של שירותים. המערכת תומכת בשלוש פונקציות בסיסיות: הגדרת נתונים, טיפול בנתונים, אילוצי אמינות
תכונות מערכת לניהול מסד הנתונים אי תלות בנתונים: היכולת להשתמש בנתונים המאוחסנים בבסיס הנתונים מבלי להכיר את פרטי שיטת אחסונם, ולבצע שינויים מסוימים בבסיס הנתונים מבלי שתוכניות היישום יושפעו מכך. בטיחות הנתונים שיתוף הנתונים סיוע בעיבוד הנתונים והפקת דוחות אי תלות בנתונים (הפרדת הנתונים מהתוכניות) מניעת כפילות נתונים שירותי גיבוי והתאוששות אמינות, שלמות ואיכות
תוכן ההרצאה מוטיבציה, הגדרה, ותכונות של מסד הנתונים סכימה קונספטואלית עיצוב מסד הנתונים סיכום
סכימה קונספטואלית- Conceptual Scheme סכימה קונספטואלית: התיאור הפורמאלי והמלא של כל הנתונים המנוהלים במסד אחד מהמאפיינים העיקריים של מערכת ה RDBMS תכונות: מתארת את כל היחידות הלוגיות המרכיבות את מסד הנתונים טבלאות, אטריבוטים, קשרים לוגיים, אילוצים, ועוד היחידות הלוגיות מקבלות שמות סימבוליים המאפשרים למשתמשים לפנות אל הנתונים באופן לוגי: "הצג שם סטודנט מתוך טבלת סטודנטים"
סכימה קונספטואלית - המשך כל מערכת RDBMS מספקת אוסף של פקודות מיוחדות להגדרת הסכימה הגדרת הטבלאות (למשל, Students) הגדרות העמודות בטבלה (StudentID, StudentName) טיפוסי הנתונים (String) מפתח עיקרי (StudentID) תחומי ערכים מותרים קשרים לוגיים בין הטבלאות כללי הגנה ועוד.. Create Table Students (StudentID Char(5) NOT NULL, Name Char (30), City Char (40), Primary Key (StudentID))
תוכן ההרצאה מוטיבציה, הגדרה, ותכונות של מסד הנתונים סכימה קונספטואלית בניית מסד הנתונים סיכום
שלושת השלבים בתהליך בניית מסד הנתונים מתיאור מילולי של מערכת מידע להגדרה של סכמה של מסד טבלאי : בנית מודל מופשט של הבעיה- שימוש במודל ניתוח הנקרא מודל ישויות-קשרים ERD בניית מודל לוגי: המרת מודל ERD למודל הטבלאי ממודל לוגי למימוש: שימוש ב- DBMS (לדוגמא: Access)
1. דיאגראמת ישויות-קשרים דיאגראמת ישויות-קשרים ERD (Entity Relationship Diagram) מתעדת את מבני הנתונים והקשרים ביניהם מרכיבי הדיאגראמה הבסיסיים: ישויות - דבר שניתן לזהות בסביבת העבודה תכונות - מידע שנרצה לאסוף אודות הישות קשרים - היחסים בין הישויות השונות
תרשים ישויות - קשרים ERD שם הכיתה רחוב שם מס' מחנך שכבה מס זיהוי עיר לומד ב - תלמיד כיתה מלבנים - לייצוג קבוצות של ישויות מעוינים - לייצוג קשר בין קבוצות הישויות אליפסות - לייצוג תכונות
יצירת קשרי גומלין יחיד אל רבים יחיד אל יחיד רבים אל רבים הקשר הנפוץ ביותר. קשר בין שתי קבוצות של ישויות כך שלכל ישות מקבוצה אחת יכול להיות קשר עם הרבה ישויות מהקבוצה השנייה. יחיד אל יחיד קשר בין שתי קבוצות של ישויות כך שלכל ישות מקבוצה אחת יש קשר לישות אחת בלבד בקבוצה השנייה. מקובל להשתמש אם יש צורך להפריד את המידע לחלק גלוי וחלק חסוי. רבים אל רבים קשר בין שתי קבוצות של ישויות כך שלכל ישות מקבוצה אחת יכול להיות קשר להרבה ישויות בקבוצה השנייה, וגם לכל ישות בקבוצה השנייה יכול להיות קשר להרבה ישויות בקבוצה הראשונה.
סוגי קשרים יום ושעה קשר אחד-לאחד 1 1 מור ה כיתה מחנך של קשר אחד-לרבים N כיתה תלמיד לומד ב- יום ושעה קשר רבים-לרבים N M מורה כיתה מלמד ב-
2. כללים להמרת ERD לסכימה כל קבוצת ישויות מומרת לסכימה קבוצת ישויות המורים לטבלה מורים התכונות הפשוטות הן תכונות של סכימה שם המורה הוא תכונה בטבלת מורים המרת קשרים: קשר 1:1 מורה מחנך כתה – כיתה הופכת לתכונה בטבלת מורים או להיפך קשר 1:N - מורה מחנך תלמידים - מורה הופך לתכונה בטבלת תלמידים קשר M:N – טבלה נוספת המורכבת מנתונים על שתי קבוצות הישויות: מורים מלמדים בכיתות – טבלה נוספת של "מורים בכיתות". תכונות הקשר – הן שדות בטבלה
דוגמא – הספרייה הממוחשבת בונים מודל של ספריה קטנה: שלוש טבלאות מינימאליות טבלת 'ספרים' טבלת 'מנויים' טבלת 'מעקב אחרי השאלות הספרים'. מבנה היררכי בראש המבנה: 'ספרים' ו-'מנויים'. טבלאות אלו מזינות נתונים לטבלת 'מעקב אחרי השאלות הספרים '. טבלאות נוספות (אופציונאליות) 'הוצאה לאור' 'קטגוריה' 'אמצעי תשלום'
סיכום : תהליך עיצוב מסד הנתונים יצירת ERD – על פי המידע שנאסף מהלקוח (משתמש המסד). ארגון המידע לתוך טבלאות הגדרת כל טבלה בנפרד: מהם השדות, מהם סוגי הנתונים, המאפיינים הגדרת קשרי העבודה (קשרי גומלין) בין הטבלאות. בנייה אל תוך המחשב (למשל ב Access) בניית הטבלאות במחשב: בניית מסד הנתונים, הגדרות הטבלה ומפתחות ראשיים ובניית הקשרים שביניהם. הגדרת השאילתות: תכנון ובניית השאילתות, הגדרת פילוחים וחתכים שונים, חישובים ועוד. הגדרת טפסים: יש להגדיר ולבנות את טפסי הטבלאות, טפסים משניים, מערכות אוטומציה של המסד ועוד. בניית הדוחות: דוחות שונים להדפסה הנשענים על טבלאות, שאילתות או טפסים.
תוכן ההרצאה מוטיבציה, הגדרה, ותכונות של מסד הנתונים סכימה קונספטואלית עיצוב מסד הנתונים סיכום
סיכום עקרון הפרדת הנתונים מכתיב מבנה לוגי ומבנה פיזי המודל הטבלאי מאפשר את התכונה הזו והוא גאוני בפשטותו בניית מסד הנתונים מתחיל בהקשבה ללקוח ממשיך בדיאגראמת ישויות-קשרים, בניית המודל הלוגי ולבסוף - יישום במערכת. מסד הנתונים הוא לב מערכת המידע