資料庫系統概論
資料庫系統概觀 資料庫(Database) 本身可視為一種電腦化檔案的儲存處所,並且是長期儲存於電腦中、有組織的、可分享共用的資料集合。 資料庫系統(Database System) ,提供一些工具給使用者存取或操作資料庫中的資料: 新增資料到資料庫中。 從資料庫中刪除資料。 從資料庫中更新資料。 從資料庫中查詢資料。 Database System = DBMS + DB
資料庫系統的組成 使用者:使用者乃資料庫系統的主要服務對象。 資料:資料乃資料庫系統的主體 (in DB)。 軟體:在資料庫系統中,介於實際儲存的資料與使用者之間的是資料庫軟體或資料庫伺服器 (指DBMS)。 硬體:資料庫系統的硬體包含電腦主機與存放資料的儲存媒體。
使用資料庫系統的目的/優點 目的: 優點: 透過電腦化方式將資料集中控制與管理。 以集中方式來維護資料並且提供使用者存取或操作資料庫中的資料。 達到「資料獨立」。 優點: 簡潔 節省人力 快速 即時性 重複性資料的消除 可以避免資料不一致 整合性的維持 提供資料庫異動交易的功能 資料的安全性可以確保 資料獨立
資料處理的演進 資料處理的演進主要是因為處理的工具與儲存媒體的進步和處理單元的不同,而分成不同階段。 人工檔案處理 電腦化檔案處理 以記錄為處理單元的資料庫管理系統 階層式(Hierarchical) 網路式(Network) 關聯式(Relational)
關聯式(Relational) 資料模式 建立在嚴格的數學理論基礎上。 由IBM的E. F. Codd所提出之資料庫的邏輯結構。為目前最普遍的結構。如:SQL Server, Oracle, Access, MySQL, Informix…等。 資料以二維表格的型式所組成: 水平是Tuple (值組,或稱為記錄,即橫列資料) 垂直是Column (欄位,或稱為直行資料) 屬性 (Attribute)是用來描述一個實體的一些特徵。如:學生可以用學號、姓名、系別…等屬性來描述。
Domain Attribute 學號 姓名 系別 年級 生日 地址 001 張三 資管 2 3.18 台北 002 李四 企管 3 char(10) char(8) char(6) int date char(20) 表頭 學號 姓名 系別 年級 生日 地址 001 張三 資管 2 3.18 台北 002 李四 企管 3 3.19 台中 003 王五 人管 4 3.20 台南 Tuple、 Row、 Record 主體 Column、 Field
關聯式資料庫的特性 沒有重複的Tuple。 在定義域中,每一個Attribute的值均為Atomic (基元值),即不可再分割的值。 任兩個檔案間有相同的資料欄位時,這兩個檔案便可以相連。 (外來鍵) 表格 A 外來鍵 表格 B 主鍵
優點: 缺點: 理論簡單、易實作 接近使用者角度 (∵Table) 可達到資料獨立性。 它的運作是建立於嚴謹的數學概念基礎上。 不適合處理大量資料 查詢效率不如非關聯式資料模式。
Schema 綱要(Schema)是對資料庫邏輯結構和特徴的描述。 只涉及到類型(Type)的描述 ,不涉及到具體的記錄值。 資料型態 資料項名稱 相關的表格限制 各個關聯表格之間的關係 … 綱要中的一個具體記錄值,稱為該綱要的一個實例 (Instance)。
若整個學生基本資訊資料庫中只有一個表格,則: 表頭的部份即為Schema。 主體的部份包含了三筆Instance. 學號 姓名 系別 年級 生日 地址 001 張三 資管 2 3.18 台北 002 李四 企管 3 3.19 台中 003 王五 人管 4 3.20 台南
比喻: Schema就好像一支程式中的所有變數,有著不同的Type Instance就好像該程式執行時,對所有變數指定不同的資料
ANSI/SPARC 架構 ANSI/SPARC架構是由「ANSI/X3/SPARC Study Group on Data Base Management Systems」所發表的。該組織成立於1972年,其宗旨即在於制定資料庫相關技術的標準並提供資料庫技術標準化的相關建議。 ANSI/SPARC架構主要分成三層綱要: 外部層 (External Level) 概念層 (Conceptual Level) 內部層 (Internal Level)
External View (View) Conceptual Schema Internal Schema End Users 外部層 (External Level) 軟體工程師 (SE)的工作 所關心的是使用者(User)或應用程式(Application)的觀點。 (External/Conceptual Mapping) 邏輯資料獨立性 (Logical Data Independence) 概念層 (Conceptual Level) Conceptual Schema 資料庫設計師 (DBD)的工作 從全組織角度。如:表格 (Table; 或稱基礎表格Base Table). (Conceptual/Internal Mapping) 實體資料獨立性 (Physical Data Independence) 內部層 (Internal Level) Internal Schema 資料庫管理師 (DBA)的工作 所關心的是資料實際儲存結構。如:索引方式, 樹狀結構…等. 所關心的是真正的硬體結構。如:Cylinder, Sector, Track. 真正的儲存體。如:硬碟
何謂 View (觀點; 視觀)? 老闆 男/女朋友 父母 … … … 虛擬表格 學生資料庫 實際表格 工作經驗 修習課程 成績 姓名 興趣 住址 個性 男女朋友 電話 姓名 … 修習課程 男女朋友 成績 姓名 … 虛擬表格 學生資料庫 … 工作經驗 興趣 修習課程 住址 個性 男女朋友 成績 電話 姓名 實際表格
又稱ANSI/SPARC 架構, 1970年代提出。
Defines the Three Levels Internal schema (內部綱要) At the internal level 描述有關資料庫的資料儲存結構與存取路徑的完整細節 紀錄資料儲存格式 最接近機器,但不涉及真正儲存媒體的硬體結構 使用內部資料定義語言 (Internal DDL)
Conceptual schema (概念綱要) At the conceptual level 以組織中之全體使用者為主,描述資料庫整體的架構與限制 (Describe the structure and constraints for the whole database for a community of users.) 屬於群體使用者觀點,表示資料庫全部資訊的內容 使用概念資料定義語言 (Conceptual DDL)
External schemas (外部綱要) At the external level 描述個別使用者的觀點 (Describe the various user views)。使用者可以是應用程式或是終端使用者。 最接近使用者的層次,資料於不同使用者有不同的呈現,即:涉及資料的個別使用方法。 隱藏不需要的部份,對個別使用者只顯示其感興趣、或有權限讀取的部份。 使用外部資料定義語言 (External DDL)
Data Independence (資料獨立性) 指改變資料庫系統的某一層次的綱要,不會影響到較高層次的綱要,即:不需要跟著修改較上層的綱要。 某一層綱要與其上層綱要間相互獨立,相關的改變只需透過DBMS從事適當的管理或修改即可,不用更改資料庫的相關程式。
Two types of data independence: Logical Data Independence (邏輯資料獨立性) 當改變概念綱要時,不需要跟著改變外部綱要及其應用程式。(Change the conceptual schema without having to change the external schemas and their application programs.) 外部層與概念層之間獨立 時機:如,擴大資料庫規模時 Physical Data Independence (實體資料獨立性) 當改變內部綱要時,不需要跟著改變概念綱要和外部綱要。 (Change the internal schema without having to change the conceptual schema and external schema.) 外部層與內部層之間獨立且概念層與內部層之間獨立 時機:如,重組某些實體檔案結構
資料庫管理者(DBA) 資料庫管理者的職責主要為: 定義資料庫的綱要。 監督並調整資料庫的效能。(資料庫的監督與調校) 決定資料庫的資訊內容 (概念層工作) 決定儲存結構、存取策略 (內部層工作) 支援使用者以適當的DDL寫出其所需的外部綱要 (External Schema) 監督並調整資料庫的效能。(資料庫的監督與調校) 安全性控制(Security Control) 與整合性檢查(Integrity Checking)。 資料備份(Backup) 與回復(Recovery)。
資料庫規劃與設計步驟 需求收集與分析(Requirements Collection and Analysis)。 概念設計(Conceptual Design)。 選用合適的資料庫管理系統(DBMS)。 邏輯設計(Logical Design)。 實體設計(Physical Design)。 系統實作(Implementation)。