Download presentation
Presentation is loading. Please wait.
1
統計緒論 _2008 1 Chap2 資料整理 2.1 基本的資料整理 排序,例: length of 60 sea trouts ( 課本 p13 ) ( 可用 EXCEL) 長條圖,例 2.1 number of times of delay in a week for the 48 flights ( 課本 p14 ) 長條圖,質性資料常用之圖 例 2.2 favorite color for 30 persons ( 課本 p14 )
2
統計緒論 _2008 2 2.2 Stem-and-Leaf Displays 莖葉圖 Tukey 在 1977 年提出 莖葉圖有許多優點,它很容易製作,讓閱 覽者能很快地抓住變數分佈的形狀, 缺點是無法指定圖形的組距 對大型資料,莖葉圖並不適用,必須還是 得用傳統的分佈圖 --- 直方圖。
3
統計緒論 _2008 3 例: 55 49 37 57 46 40 64 35 73 62 61 43 72 48 54 69 45 78 46 59 40 58 56 52 49 42 62 53 46 81
4
統計緒論 _2008 4 Stem Leaf 3 | 5 7 4 | 0 0 2 3 5 6 6 6 8 9 9 5 | 2 3 4 5 6 7 8 9 6 | 1 2 2 4 9 7 | 2 3 8 8 | 1 Double-stem display 是一衍伸圖形
5
統計緒論 _2008 5 莖葉圖製作方法 選擇適當的數字為莖,通常是起首數位數 字。 每列標出所有可能的莖的數字。 由第一筆資料,在對應的莖之列,順序寫 下莖後的一位數字為葉,直到最後一筆資 料 ; 需排列整齊。 轉向後,可由莖葉圖概估母體分佈。
6
統計緒論 _2008 6 2.3 Frequency Table 作直方圖之前,要製作次數表,步驟如 下: 決定組數 → 找出範圍 → 決定組界 → 統計各組次數、相對次數、累積次 數、相對累積次數。
7
統計緒論 _2008 7 組數為 6 組數為 14 組數為 3 60 筆魚身長資料,應分幾組?
8
統計緒論 _2008 8 建立次數表 (frequency table) 1. 決定組數。 直方圖是否能正確地展現出母體分佈的形狀,決定於分組的 個數及組界,原則上 5~15 組,依據 Sturges 法則,組數 k 滿 足 2 k > N, N 是樣本數。 2. 找出範圍 (range) 。 range = 最大資料值 - 最小資料值。 3. 決定組界。 需使每一資料點都能明確地落入唯一的組內,邊界值的小數位 數可多取一位,且組寬度稍微大於 range/ 組數。 4. 統計各項次數 (Frequency) 。 5. 計算出相對次數 (Ralative frequency) ,累積次數 (Cumulative frequency) ,相對累積次數 (Relative cumulative frequency) 。
9
統計緒論 _2008 9 Frequency Table for trout length 組界 midpoint Frequen cy Relative Frequen cy Cumulativ e frequencyr.c.f. below 17.5516.9530.0503 17.55 - 18.75 18.1580.133110.183 18.75 - 19.95 19.35230.383340.567 19.95 - 21.15 20.55170.283510.850 21.15 - 22.35 21.7560.100570.950 22.35 - 23.55 22.9530.050601.000
10
統計緒論 _2008 10 2.3 資料分配圖 用於呈現連續型資料之圖形 Histogram 直方圖 Frequency polygon Ogive 肩形圖 Exercise :由前一頁的表,製作肩形圖
11
統計緒論 _2008 11 你是否能由以下的肩形圖估計出第 30 及第 80 百分位數?
12
統計緒論 _2008 12 莖葉圖和直方圖 莖葉圖和直方圖都用來觀察母體的分配 莖葉圖的製作簡易,但分組的方法受限,可能誤導 分佈,直方圖是比較正式的分配圖,若能選出適當 的組界,能正確的估計出母體的分配。 肩形圖提供累積的機率,可由圖形估計百分位數。 許多軟體皆有提供製作直方圖的功能,如:可由 EXCEL 的 資料分析 → 直方圖 得到 ( 使用 EXCEL 需由使用者設定組界 ) SAS 統計軟體有功能較強,選項較多的製圖工具, 可得到比較理想的直方圖。
13
統計緒論 _2008 13 Exp2.4 Waiting time (in minutes) between eruptions of the Old Faithful geyser (p24) 110 simulated data (33 to 118) 81 83 94 … 91 73 108 選擇組距 30-39 , 40-49 , … , 110- 119 可由 excel 得到 frequency, 及直方圖
14
統計緒論 _2008 14 Histogram & Ogive
15
統計緒論 _2008 15 Freq. polygon & ogive
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.