第三章 統計資料的呈現:統計圖表
學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 利用統計圖表作資料的呈現,讓人有一目了然的 感覺。 2. 繪製屬質資料的統計圖表:次數分配表、長條圖 與圓形圖。 3. 繪製屬量資料的統計圖表:有序枝葉圖、次數分 配表、直方圖、多邊形圖與時間數列圖。 4. 介紹未分組資料與分組資料。 5. 學習如何利用 Excel 的指令來製作統計圖表。
本 章 架 構本 章 架 構本 章 架 構本 章 架 構 3.1 統計圖表 3.1 統計圖表 3.2 屬質資料的統計圖表 3.2 屬質資料的統計圖表 3.3 屬量資料的統計圖表 3.3 屬量資料的統計圖表
3.1 統計圖表 統計圖表的功能 統計圖表的功能 將數據以系統性方法呈現,使讀者一目了然, 故為 描述資料的重要工具之一。 將數據以系統性方法呈現,使讀者一目了然, 故為 描述資料的重要工具之一。 使用統計圖表之前 使用統計圖表之前 需確定資料為屬質資料或是屬量資料,資料屬性不 同,其適用的統計圖表亦不同。 需確定資料為屬質資料或是屬量資料,資料屬性不 同,其適用的統計圖表亦不同。
3.2 屬質資料的統計圖表 屬質資料的次數分配表 屬質資料的次數分配表 (frequency distribution table) (frequency distribution table) 長條圖 (bar chart) 長條圖 (bar chart) 圓形圖 (pie chart) 圓形圖 (pie chart)
3.2.1 屬質資料的次數分配表 屬質資料的次數分配表 屬質資料的次數分配表 (frequency distribution table) : (frequency distribution table) : 依照資料的原始分類,分別計數各類的出現次數, 並分門別類地將各類次數以表呈現即稱之。 依照資料的原始分類,分別計數各類的出現次數, 並分門別類地將各類次數以表呈現即稱之。
樂透彩券開出號碼前十名次數分配表 獎號最常開出號碼前十名次數分配表 ( 包含特別號 ) ~ 統計至 期 ~ 統計至 期
例 3.1 選修高等統計學的各系人數 假設表 3.1 為 40 位選修高等統計學課程的學生所屬系別,若選修本課程 是以報考研究所為主要目的,該任課老師欲瞭解哪一系學生的報考風 氣較盛,任課老師可將表 3.1 的資料,編製成表 3.2 選修高等統計學課程 的次數分配表,從中得到選修高等統計學課程學生系別的分布情形。 假設表 3.1 為 40 位選修高等統計學課程的學生所屬系別,若選修本課程 是以報考研究所為主要目的,該任課老師欲瞭解哪一系學生的報考風 氣較盛,任課老師可將表 3.1 的資料,編製成表 3.2 選修高等統計學課程 的次數分配表,從中得到選修高等統計學課程學生系別的分布情形。 表 3.2 選修高等統計學課程的次數分配表
3.2.2 長條圖 長條圖 (bar chart) : 長條圖 (bar chart) : 是由若干長條狀所構成,每一長條所代表的是該 組的發生次數。 是由若干長條狀所構成,每一長條所代表的是該 組的發生次數。
民國 91 年台灣地區十大癌症死因 資料來源:行政院衛生署
例 3.2 血型分布情形 圖 3.6 呈現某系一年級全體同學的血型分布情形。 圖 3.6 呈現某系一年級全體同學的血型分布情形。 圖 3.6 血型分布長條圖
例 3.3 人身保險業務員的教育程度 表 3.3 是民國 88 年人身保險業務員的教育程度,依男性、女性及 總人數繪製教育程度長條圖,如圖 3.7 。 表 3.3 是民國 88 年人身保險業務員的教育程度,依男性、女性及 總人數繪製教育程度長條圖,如圖 3.7 。 圖 3.7 人身保險業務員教育程度長條圖 ( 民國 88 年 ) 資料來源:壽險公司(民國 89 年)
3.2.3 圓形圖 圓形圖 (pie chart) : 圓形圖 (pie chart) : 以圓形的三百六十度為百分之百,而各分類所占的 百分比即為扇形的角度。事實上,只要欲表達某類 別佔全部的比例,都以圓形圖的呈現最為合適。 以圓形的三百六十度為百分之百,而各分類所占的 百分比即為扇形的角度。事實上,只要欲表達某類 別佔全部的比例,都以圓形圖的呈現最為合適。
求職者學歷分布 台灣地區求職者學歷分布 — 調查期間 2003 年 5 月 10 日 資料來源:中時人力網
例 3.4 飲料種類的消費情形 表 3.4 呈現某校大一 200 位學生對飲料的喜好情形。 表 3.4 呈現某校大一 200 位學生對飲料的喜好情形。 表 3.4 學生對飲料種類的喜好情形
例 3.4 飲料種類的消費情形 ( 續 ) 將表 3.4 之數據以圓形圖表示各類的分布情形,如圖 3.8 所示。 圖 3.8 飲料種類的圓形圖
例 3.5 選修高等統計學課程的各系人數 表 3.2 呈現選修高等統計學的學生所屬系別分布情形,將 此數據繪製各系選修高等計學的圓形圖,如圖 3.9 。 表 3.2 呈現選修高等統計學的學生所屬系別分布情形,將 此數據繪製各系選修高等計學的圓形圖,如圖 3.9 。 表 3.2 表 3.2 圖 3.9 選修高等統計學課程的圓形圖
3.3 屬量的統計圖表 有序枝葉圖 (ordered stem and leaf plot) 有序枝葉圖 (ordered stem and leaf plot) 屬量資料的次數分配表 屬量資料的次數分配表 (frequency distribution table) (frequency distribution table) 直方圖 (histogram) 直方圖 (histogram) 多邊形圖 (polygon) 多邊形圖 (polygon) 時間數列圖 (time series plot) 時間數列圖 (time series plot)
3.3.1 有序枝葉圖 有序枝葉圖 (ordered stem and leaf plot) 有序枝葉圖 (ordered stem and leaf plot) 將資料由大到小依序排列,將每一觀察值分成兩部 分,一部分屬於「枝」 (stem) , 其餘的屬於「葉」 (leaf) ,完整呈現資料的基本特性。 將資料由大到小依序排列,將每一觀察值分成兩部 分,一部分屬於「枝」 (stem) , 其餘的屬於「葉」 (leaf) ,完整呈現資料的基本特性。 有序枝葉圖的重要性 有序枝葉圖的重要性 可以洞悉資料的集中與分散情形,對於資料特性的 掌握相當有幫助。 可以洞悉資料的集中與分散情形,對於資料特性的 掌握相當有幫助。
管理學院統計學期成績有序枝葉圖 九十一學年度下學期管理學院統計學期成績有序枝葉圖
例 3.6 您的統計成績如何? 某校抽樣 50 位同學的統計學期中考成績,將資料以十位數 為枝、個位數為葉繪製有序枝葉圖,如圖 3.10 所示。 某校抽樣 50 位同學的統計學期中考成績,將資料以十位數 為枝、個位數為葉繪製有序枝葉圖,如圖 3.10 所示。 圖 3.10 統計學期中考成績的有序枝葉圖
例 3.7 驚人的銀行逾放比 最近幾年國內的經濟持續惡化,尤其是銀行的呆帳漸多, 因而造成逾放比的節節上升,表 3.5 為國內二十家銀行的逾 放比資料。將表 3.5 資料取個位數為枝,小數點第一位為葉 繪製成有序枝葉圖,如圖 3.11 所示。 最近幾年國內的經濟持續惡化,尤其是銀行的呆帳漸多, 因而造成逾放比的節節上升,表 3.5 為國內二十家銀行的逾 放比資料。將表 3.5 資料取個位數為枝,小數點第一位為葉 繪製成有序枝葉圖,如圖 3.11 所示。 圖 3.11 銀行逾放比的有序枝葉圖
3.3.2 屬量資料的次數分配表 建立屬量資料的次數分配表的步驟 建立屬量資料的次數分配表的步驟 1. 資料排序 2. 求全距 (range) R =最大值 - 最小值 R =最大值 - 最小值 3. 決定組數 取 k 等於 的整數。 求最小的 k 值,使得 2 k n 。 Sturge’s formula: k = 1 + 3.32log 10 n 。
3.3.2 屬量資料的次數分配表(續) 建立屬量資料的次數分配表的步驟 建立屬量資料的次數分配表的步驟 4. 決定組距 (class interval) 組距 (d) = 全距 (R)∕ 組數 (k) 組距 (d) = 全距 (R)∕ 組數 (k) 5. 決定組限 (class limit) 6. 劃記並計算次數 (frequency)
例 3.8 統計成績的次數分配表 根據例 3.6 的資料編製統計學成績的次數分配表。 根據例 3.6 的資料編製統計學成績的次數分配表。 1. 排序資料可以根據圖 3.10 的有序枝葉圖得知。 圖 3.10圖 最大值為 94 ,最小值為 34 ,故全距 R = 94 - 34 = 60 。 3. 利用最簡單的公式, k 約等於 ,所以取 7 組。 4. 根據資料得知最小計算單位為 1 分,由前兩項得知全距 /組 數,取組距 d=9 。 5. 因為最小值為 34 ,依此我們決定最小一組由 33 開始且 組距為 9 ,所以各組的組限分別是 , , , , , , 。 6. 劃記並計算次數,利用前述的過程,得表 3.6 為統計學 成績的次數分配表。
例 3.8 統計成績的次數分配表 ( 續 ) 表 3.6 統計學成績之次數分配表
例 3.9 節節上升的失業率 試依表 3.7 的每月失業率統計數據編製次數分配表。 試依表 3.7 的每月失業率統計數據編製次數分配表。解: 1. 將資料排序後,求全距為 2.88 。 2. 我們利用公式計算 k 使得 ,本例 n = 44 ,因此 k =6 。 3. 計算公式為組距=全距/組數,因此組距為 0.48 , 為了方便計算取為組距 0.5 。 4. 資料中最小值為 2.29 ,因此我們以 2.20 為第一組之 組下限,再者組距為 0.5 ,所以 2.69 為第一組的上限, 其餘各組依此類推。 5. 劃記並計算各組次數,最後結果如表 3.8 所示。
例 3.9 節節上升的失業率 ( 續 ) 表 3.8 每月失業率次數分配表 ( 民國 87 年 1 月至 90 年 8 月 ) 資料來源:行政院主計處
名 詞 釋 義 相對次數 (relative frequency) 相對次數 (relative frequency) 第 i 組的相對次數 = , i = 1, 2, …, k 百分比 (percentage) 百分比 (percentage) 第 i 組的百分比 = 第 i 組相對次數 100% , i = 1, 2, …, k 累積次數 (cumulative frequency) 累積次數 (cumulative frequency) F i = f 1 + f 2 + … + f i , i = 1, 2, …, k 組中點 (class mid-point) 組中點 (class mid-point) 組中點 = (組下限 + 組上限) ∕2 = (組下界 + 組上界) ∕2 = (組下界 + 組上界) ∕2
3.3.3 直方圖 直方圖 (histogram) 直方圖 (histogram) 與長條圖非常類似,適用於連續的屬量資料,作法 如同長條圖。橫軸代表各組的組界,縱軸代表各組 的次數。 與長條圖非常類似,適用於連續的屬量資料,作法 如同長條圖。橫軸代表各組的組界,縱軸代表各組 的次數。 組界 (class boundary) 組界 (class boundary) 組下界 = 組下限-最小計算單位 ∕2 組下界 = 組下限-最小計算單位 ∕2 組上界 = 組上限 + 最小計算單位 ∕2 組上界 = 組上限 + 最小計算單位 ∕2
例 3.10 統計學成績的直方圖 利用例 3.6 的資料,編製統計學成績的直方圖。 利用例 3.6 的資料,編製統計學成績的直方圖。例 3.6例 3.6 圖 3.12 統計學成績直方圖
例 3.11 失業率的分佈情形 根據例 3.9 之資料畫出我國在民國八十七年一月至九十 年八月的失業率直方圖。 根據例 3.9 之資料畫出我國在民國八十七年一月至九十 年八月的失業率直方圖。例 3.9例 3.9 圖 3.13 失業率之直方圖 ( 民國 87/01 至 90/08)
3.3.4 多邊形圖 多邊形圖 (ploygon) : 多邊形圖 (ploygon) : 可以由直方圖中直接得到,其作法是將在第一組之前及最後 一組之後各加一組當作假想組,此兩組的次數皆設為 0 ,之 後再將各組組中點及次數所構成的點連接而成,如此可得一 封閉的曲線,即由橫軸出發,最後再回到橫軸。 可以由直方圖中直接得到,其作法是將在第一組之前及最後 一組之後各加一組當作假想組,此兩組的次數皆設為 0 ,之 後再將各組組中點及次數所構成的點連接而成,如此可得一 封閉的曲線,即由橫軸出發,最後再回到橫軸。 肩形圖 (ogive) : 肩形圖 (ogive) : 若是我們以各組上界與累積次數為座標,並將所得的點連接 起來,其中曲線的起點以第一組下界與次數為 0 的座標開始, 則可得一累積次數曲線圖,此圖形稱為肩形圖 (ogive) 。 若是我們以各組上界與累積次數為座標,並將所得的點連接 起來,其中曲線的起點以第一組下界與次數為 0 的座標開始, 則可得一累積次數曲線圖,此圖形稱為肩形圖 (ogive) 。
例 3.12 統計學成績的多邊形圖 利用表 3.9 之資料,繪製統計學成績的多邊形圖。 利用表 3.9 之資料,繪製統計學成績的多邊形圖。表 3.9表 3.9 圖 3.14 統計學成績多邊形圖
例 3.13 統計學成績的肩形圖 試利用表 3.9 的累積次數資料,繪製統計學成績的肩形圖。 試利用表 3.9 的累積次數資料,繪製統計學成績的肩形圖。表 3.9表 3.9 圖 3.15 統計學成績肩形圖
3.3.5 時間數列圖 時間數列圖 (time series plot) : 時間數列圖 (time series plot) : 將時間因素置於橫軸,然後將另一變數的數據置於 縱軸。這樣的圖形可讓我們瞭解經過一段時間的影 響,另一變數的消長趨勢情形等。 將時間因素置於橫軸,然後將另一變數的數據置於 縱軸。這樣的圖形可讓我們瞭解經過一段時間的影 響,另一變數的消長趨勢情形等。
例 3.14 外匯存底消長趨勢為何? 表 3.10 是台灣與中國大陸自民國 80 年至 89 年的外匯存底金額, 將其以時間數列圖表示十年間的變化趨勢,如圖 3.16 所示。 表 3.10 是台灣與中國大陸自民國 80 年至 89 年的外匯存底金額, 將其以時間數列圖表示十年間的變化趨勢,如圖 3.16 所示。 圖 3.16 台灣與大陸外匯存底之時間數列圖 資料來源:國際金融統計 (IMF) 月報。
金融機構逾放比 資料來源:台灣經濟研究院
壽險業年利率走勢 台灣地區壽險業年利率走勢圖資料來源:台灣經濟研究院