第二章 統計圖表
第二章 統計圖表 2.1 統計資料的型態 統計資料(statistical data)是指在某個特定的時間和空間中,依資料的特性,加以計數(count)或量測(measure)所欲研究的全部個體或樣本所得的資料。
資料的型態
2.1 統計資料的型態(續) 統計資料依其屬性則可分為質的資料和量的資料 定義2.1.1 質的資料(qualitative data) 質的資料又稱屬性資料,依據其性質或類別的尺度的不同而加以區分,故亦稱類別資料(category data)。 定義2.1.2 量的資料(quantitative data) 量的資料又稱為屬量資料,是以計量的特性而劃分的,亦即可以用尺度衡量的數據資料。
2.1 統計資料的型態(續) 量的資料又可分為離散資料(discrete data)與連續資料(continuous data) 定義2.1.3 離散資料(discrete data) 離散資料是可計數的(countable),具有最小的計數單位,離散資料又稱為不連續資料。 定義2.1.4 連續資料(continuous data) 連續資料是可以無限制細分的,即在任意兩個數值間可插入無限多個數值。
2.1 統計資料的型態(續) 資料依其發生時間則可分為橫斷面資料(cross-section data)和時間數列資料(time-series data)。 定義2.1.5 橫斷面資料(cross-section data) 發生於同一時間或同一期間的資料稱為橫斷面資料。 定義2.1.6 時間數列資料(time-series data) 發生於不同時間點或不同時期的資料稱為時間數列資料。
2.2 資料測量的尺度 一般我們測量資料的尺度可分為四種 (1)名目尺度(nominal scale) (2)順序尺度(ordinal scale) (3)區間尺度(interval scale) (4)比率尺度(ratio scale)
2.2 資料測量的尺度(續) 定義2.2.1 名目尺度(nominal scale) 它是最低的測量水準(level of measurement),因它只是我們用來作為分類之用而已,通常我們會給予特別的數字或代號來標示其屬性,但注意的是,它不能用來做加減乘除的運算。 定義2.2.2 順序尺度(ordinal scale) 其特性除了具有類別尺度的數字或代號性質外,還可以依資料的重要性、等級或強度來作一個順序的關係。
2.2 資料測量的尺度(續) 定義2.2.3 區間尺度(interval scale) 區間尺度除了具有順序尺度的性質外,它還可以測量各順序位置之間的距離,也就是說可作加減的運算,所以區間尺度必須要為數值才行。區間尺度不具有絕對零點;區間尺度又稱為等距尺度。 定義2.2.4 比率尺度(ratio scale) 比率尺度是總合了前述三種尺度的性質,因此具有最高的測量水準,而且具有絕對原點,所以可作加減乘除的運算。
2.3 資料的種類 統計資料可依照下列三種標準來分類 依資料是否已經過整理可分為原始資料及次級資料 依資料是否隨時間變動而分為靜態資料與動態資料 依資料調查登記的對象可分為普查資料及抽查資料
2.3 資料的種類(續) 定義2.3.1 原始資料(raw or primary data) 研究對象決定之後,首先收集必要的資料,由收集者直接由資料來源處調查或登記而得之資料稱為原始資料,所以,它是一堆零散而未經過整理的資料。 定義2.3.2 次級資料(secondary data) 次級資料(secondary data)是原始資料已經過整理或分析簡化的資料,這類資料通常取自於政府機關或社會團體之工作報告或研究報告。
2.3 資料的種類(續) 定義2.3.3 靜態資料(static data) 靜態資料表示現象在某一特定時間與空間所呈現的情況。 定義2.3.4 動態資料(dynamic data) 若將靜態資料按時間的先後排列就構成動態資料。
2.3 資料的種類(續) 定義2.3.5 普查資料(census data) 普查資料是對母體中的每一個體(元素)均進行調查所獲得的資料。 定義2.3.6 抽查資料(sampling data) 相對地,抽查資料是只對母體中的部分進行調查所獲得的資料。
2.4 次數分配 所謂次數分配(frequency distribution)是指將資料依數量大小或類別種類而分成若干組,並列出各組所含次數(即各組所含觀測值的個數),最後再以次數分配圖表(或其他的處理方式)表示之。
2.4.1 製作次數表 次數表(frequency table)又稱次數分配表,可分成簡單次數表和分組次數(分配)表 簡單次數表的製作過程: 步驟1:排序(sorting) 步驟2:劃記 步驟3:計算次數 步驟4:總計
2.4.1 製作次數表(續) 資料編成分組次數分配表時,有兩個非常重要的基本假設: 1. 集中分配:各組觀測值都等於組中點。 2. 均勻分配:各組觀測值都是以均勻分佈在組內。
2.4.1 製作次數表(續) 分組次數分配表製作步驟過程如下: 步驟1:排序 步驟2:求全距(range),R= Xmax -Xmin 步驟3:決定組數(class number) 適當的組數,宜由個人判斷或經驗決定之 統計學家史塔基(H. A. Sturges)建議我們使用下列公式來求組距: 其中k為組數,N 為總次數,log2= 0.301
2.4.1 製作次數表(續) 步驟4:決定組距(class interval) 步驟5:界定組限(class limit)及組界(class boundary) 組限形式劃分方法之遵循原則 一、周延原則 二、互斥原則
2.4.1 製作次數表(續) 步驟6:劃記 步驟7:計算次數 步驟8:總計 定義2.4.1 組界 上組界=上組限+基本單位差 ÷2 下組界=下組限-基本單位差 ÷2 其中,基本單位差(unit difference)是指觀測值的最小單位。 步驟6:劃記 步驟7:計算次數 步驟8:總計
【例2.3】
【例2.3】(續) (4) 界定組限與組界
【例2.3】(續)
2.4.2 相對次數分配表 相對次數分配(relative frequency distribution)是指各組次數佔總次數的比例分配。
2.4.3 累積次數分配表 累積次數分配有兩個重要的用途 累積次數分配可分成二類: 指出落在某一特定值之上或之下的累積次數有若干 方便計算某些特定的敘述統計量,如中位數、四分位數等。 累積次數分配可分成二類: 以下累積次數分配 以上累積次數分配
【例2.4】 續【例2.3】,試編製出相對次數分配表與以下和以上的累積次數分配表。
2.5 次數分配的圖示法 藉由統計圖之陳示,可以引起閱讀者的興趣,讓人一眼即知該組資料所要傳達的意義 統計圖中最常見的有直方圖、多邊形圖、累積次數曲線圖、長條圖、圓餅圖等等
2.5.1 直方圖 直方圖是以組界為橫座標 ,資料的次數為縱座標所形成的矩形圖 在此所採用的組界並非原來的組限,採用組界的原因在使資料連續化 無論採用組限或組界,組中點都是相等的。
【例2.5】 試繪製例2.3之直方圖
【例2.5】(續)
2.5.2 多邊形圖 多邊形圖(polygon)又稱為次數曲線圖(frequency curve) 多邊形圖是以各組組中點為橫座標,各組次數為縱座標所繪製成的次數分配圖 若將縱座標改為相對次數即為相對次數多邊形圖
【例2.7】
【例2.7】(續)
2.5.3 累積次數曲線 累積次數曲線(cumulative frequency curve)又稱為肩形圖(ogive) 累積次數曲線可分為以上累積次數曲線和以下累積次數曲線 以上累積次數曲線是以各組之下組界為橫座標 以下累積次數曲線是以各組之上組界為橫座標
【例2.8】 承例題2.6, 試編製累積次數曲線圖 解: 欲繪出累積次數曲線圖,則先求算出以上及以下累積次數。即可繪出兩種形式累積次數曲線圖,如圖所示:
【例2.8】(續)
2.5.4 長條圖 當統計資料為類別或間斷型資料時,則通常會使用長條圖(bar chart)表示之,其又可簡稱為條圖
2.5.4 長條圖(續) 長條圖依排列方式可分為縱條圖與橫條圖 橫條圖 5% 15% 17% 50% 13% 0% 10% 20% 30% 40% 60% 愛情小說 武俠小說 電玩雜誌 漫畫 其他 課外讀物之喜愛度
2.5.4 長條圖(續) 長條圖的種類有分段條圖、條線混合圖等
2.5.5 圓餅圖 圓餅圖又稱為面積圖(pie chart) 圓形的面積代表總數,圖形內的各扇形面積代表各部分數量 例如1998年1-12月我國前五大貿易國
2.6 次數分配的型態 次數分配的型態可分為下列幾種: 單峰對稱分配 ,又稱為鐘形分配 單峰不對稱分配 右偏分配 ,又稱正偏分配 左偏分配 ,又稱負偏方配 J型分配 其他分配 :U型分配、雙峰分配