Chapter 2 Frequency Distributions 次數分配

Slides:



Advertisements
Similar presentations
第二章 研究主題(研究題 目)與研究問題.
Advertisements

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
:Word Morphing ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10508:word morphing 解題者:楊家豪 解題日期: 2006 年 5 月 21 日 題意: 第一行給你兩個正整數, 第一個代表下面會出現幾個字串,
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
Chapter Two Data Summary and Presentation. Statistics II2 敘述統計 Vs. 推論統計 n 敘述統計 : 使用分析方法或圖形來描述一組來自於母 體或樣本之資料 n 推論統計 : 利用抽樣方法取得一樣本, 並針對此樣本 計算樣本統計量, 以推論未之母體之參數.
序列分析工具:MDDLogo 謝勝任 林宗慶 指導教授:李宗夷 教授.
第二章 敘述統計:表格與圖形法 定性資料的彙總 定量資料的彙總 探究性的資料分析 交叉表格與散佈圖 CH2-
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
第三章 統計資料的呈現:統計圖表. 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 利用統計圖表作資料的呈現,讓人有一目了然的 感覺。 2. 繪製屬質資料的統計圖表:次數分配表、長條圖 與圓形圖。 3. 繪製屬量資料的統計圖表:有序枝葉圖、次數分 配表、直方圖、多邊形圖與時間數列圖。
: ShellSort ★★☆☆☆ 題組: Problem D 題號: 10152: ShellSort 解題者:林一帆 解題日期: 2006 年 4 月 10 日 題意:烏龜王國的烏龜總是一隻一隻疊在一起。唯一改變烏龜位置 的方法為:一隻烏龜爬出他原來的位置,然後往上爬到最上方。給 你一堆烏龜原來排列的順序,以及我們想要的烏龜的排列順序,你.
Section 2.3 Least-Squares Regression 最小平方迴歸
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
Part 1 Understanding Data Chapter 1 Examining Distributions Chapter 2 Examining Relationships Chapter 3 Producing Data.
第二章 統計圖表.
Chapter 9 Hypothesis tests with the t statistic. 當母體  為未知時 ( 我們通常不知 ) ,用樣本 s 來取代 因為用 s 來估計  ,所呈現出來的分佈已不 是 z distribution ,而是 t distribution.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
: The Playboy Chimp ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10611: The Playboy Chimp 解題者:蔡昇宇 解題日期: 2010 年 2 月 28 日 題意:給一已排序的數列 S( 升冪.
模式要適配,需符合絕對、比較及精簡,加上內在結構標準
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
第 3 章 敘述統計II:數值方法.
1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
南投縣社區大學 Excel 實務應用入門 講師 : 林泉成
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
1 第四章 多變數函數的微分學 § 4.1 偏導數定義 定義 極限值 ■. 2 定理 極限值的基本定理 (1) 極限值的唯一性 : 若 存在,則 其值必為唯一。 (2) 若 且 ( 與 為常數 ) , 則 且 為常數且.
:Problem D: Bit-wise Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10232: Problem D: Bit-wise Sequence 解題者:李濟宇 解題日期: 2006 年 4 月 16.
2003/09/12 第三章 統計資料的呈現:統計圖表. 2003/09/12 學 習 目 標學 習 目 標學 習 目 標學 習 目 標 1. 利用統計圖表作資料的呈現,讓人有一目了然 的感覺。 2. 繪製屬質資料的統計圖表:次數分配表、長條 圖與圓形圖。 3. 繪製屬量資料的統計圖表:有序枝葉圖、次數.
7.1 背景介紹 7.2 多解析度擴展 7.3 一維小波轉換 7.4 快速小波轉換 7.5 二維小波轉換 7.6 小波封包
Fourier Series. Jean Baptiste Joseph Fourier (French)(1763~1830)
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
Fugacity Coefficient and Fugacity
生物統計學 期中報告 組員 : 醫放一 A 王小明 醫放一 A 王小明 醫放一 A 王大明 醫放一 A 王大明 2009/04/14.
1 Excel 講授內容 ( 進階 ) 授課教師 : 吳槐桂 最後更新 : 2008/05/01.
生產系統導論 生產系統簡介 績效衡量 現代工廠之特徵 管理機能.
Analysis of Variance (ANOVA) CH 13 變異數分析. What is ANOVA? n 檢定 3 個或 3 個以上的母體平均數是否相等的統計檢定 n 檢定多個母體平均數是否相同 n 比較大二、大三、大四學生實習滿意度是否一樣 ? ( 來 自相同的 population)
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
第七章 連續機率分配.
研究資料的分析. 資料分析的基本策略  General data analysis strategies 1.Sketching ideas 2.Taking notes 3.Summarize field nores 4.Getting feedback on ideas 5.Working with.
變異數分析 迴歸分析 因素分析 區別分析 集區分析
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
Chapter 3 Entropy : An Additional Balance Equation
Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.
Chapter 10 m-way 搜尋樹與B-Tree
民意調查的分析 I 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 名目變數之描述性統 計 連續變數之描述性統 計 順序變數.
03/05/2003 Week #2 江支弘 Chapter Two Describing, Displaying, and Exploring Statistical Data.
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data : k 組資料,樣本數為 n 1,…, n k. x ij --- 第 i 組的第 j 個觀察值 N =
Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組 基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.
Ch 3 Central Tendency 中央集中趨勢測量.
連續隨機變數 連續變數:時間、分數、重量、……
統計緒論 _ Chap2 資料整理 2.1 基本的資料整理  排序,例: length of 60 sea trouts ( 課本 p13 ) ( 可用 EXCEL)  長條圖,例 2.1 number of times of delay in a week for the 48 flights.
: Place the Guards ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11080: Place the Guards 解題者:陳盈村 解題日期: 2008 年 3 月 26 日 題意:有一個國王希望在他的城市裡佈置守衛,
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
幼兒行為觀察與記錄 第八章 事件取樣法.
1 Chemical and Engineering Thermodynamics Chapter 1 Introduction Sandler.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或 大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設,利用樣本資料,決定接受或 不接受該假設的方法.
: How many 0's? ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11038: How many 0’s? 解題者:楊鵬宇 解題日期: 2007 年 5 月 15 日 題意:寫下題目給的 m 與 n(m
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
1 Slide Slide 第 2 章 敘述統計I:表格與圖形法. 2 Slide Slide 敘述統計 I :表格與圖形法 類別資料的彙總 定量資料的彙總 探究性資料分析:莖葉圖 交叉表格與散佈圖.
Statistics for Education Research Statistics for Education Research Lecture 1 Scales/Graph/Central Tendency Instructor: Dr. Tung-hsien He
Presentation transcript:

Chapter 2 Frequency Distributions 次數分配 Statistics Chapter 2 Frequency Distributions 次數分配

資料整理 How do we turn “a bunch of numbers” into something meaningful? 整理資料的第一步驟 統計表 統計圖

統計表 內容 標題 (Title) 表身 (Body) 資料來源及附註

統計圖 種類 條圖 (bar chart) 餅圖 (pie chart) 直方圖 (histogram) 多邊圖 (polygon) 枝葉圖 (stem-and-leaf display)

次數分配 Frequency Distributions 最基本的統計方法 依據資料原始分數按照大小,發生次數予以分類,以利觀察分析&解釋。 Frequency distribution table (表) Frequency distribution chart (圖)

次數分配 for categorical data 依照類別分類,計算各組次數,顯示資料分佈情形 次數分配基本統計值 類別 次數 frequency 相對次數 proportion 百分比 percentage

Frequency distribution table (cont’) Table 1 Frequency distribution of the Pilot Study Sample (N=117) Category Frequency (f) Percentage % Cumulative Percentage(%) Gender Male Female Sub total 57 60 117 48.7 51.3 100 Industry experience Yes No 07 10 91.5 8.5 If yes, length of industry experience (n=107) Less than one year 1~ less than 2 years 2~ less than 3 years more than 3 years 24 35 38 107 22.3 32.8 35.5 9.3 55.1 90.6

Raw data 20 個學生(N=20) 考試成績 (滿分10分) 8 9 8 7 10 9 6 4 9 8 8 9 8 7 10 9 6 4 9 8 7 8 10 9 8 6 9 7 8 8

次數分配 for continuous data 連續資料的次數分配 需將資料加以歸類以便讀者能一目了然資料分配狀況 將連續資料分成若干組,計算各組次數 原始組數 rows=highest – lowest + 1 將原始組數縮減到較易manage的組數 分組原則 決定組數 10組 決定組距 (interval width) 大小為 2,5 或 10的倍數 Each interval should start with a score that is a multiple of the width All interval should be the same width

排序 全距 (range) 決定組數 (# of interval) 組距 (interval width) = 全距/組數 決定組限(real limit)

Example 2.3 25位學生成績 (N=25) 82 75 88 93 53 84 87 58 72 94 69 84 61 91 64 87 84 70 76 89 75 80 73 78 60

最低 53 最高 94 全距= 94-53=41 組數= = 5 組距=41/5=8.2  10 區間組限 X f % 排序 全距 (range) 決定組數 (# of interval) 組距 (interval width) = 全距/組數 決定區間組限(real limit) 最低 53 最高 94 全距= 94-53=41 組數= = 5 組距=41/5=8.2  10 區間組限 X f % 50-60 3 12 61-70 4 16 71-80 7 28 81-90 8 32 91-100 3 12 Total 25 100

Real limits vs. Apparent limits Continuous variable creates continuous data Infinite numbers Real limits 區間組限 界定出continuous data的上下界 Upper real limit Lower real limit Real limits vs. Apparent limits

Apparent limit Lower real limit Upper real limit

Exercise 30位學生體重 33 62 47 54 40 51 66 55 48 42 64 71 69 38 61 59 48 55 44 69 35 43 53 46 68 56 54 52 69 73 N=30

組別 組限 組界 組中點 f % c.p 1 30-34 29.4-34.5 32 3 2 35-39 34.5-39.5 37 7 10 40-44 39.5-44.5 42 4 13 23 45-49 44.5-49.5 47 33 5 50-54 49.5-54.5 52 17 50 6 55-59 54.4-59.5 57 63 60-64 59.4-64.5 62 73 8 65-69 64.5-69.5 67 20 93 9 70-74 69.5-74.5 72 100 30

Histogram 直方圖 適用於 continuous data 以呈現出連續資料的特質 Difference between a bar chart and a histogram: Bar chart: distances between each bar. Histogram: no distance among bars. Bar chart is for categorical data

Histogram

多邊圖 polygon

Stem-and-Leaf Displays An alternative to histograms Display distributions using actual data values Advantage is that no information is lost since all values are shown Stem-first digit of each number Leaf-second digit

Stem-and-leaf example English test scores: 78 66 98 93 72 83 67 32 77 92 47 79 83 76 74 82 53 89 30 82

3 4 5 6 7 8 9 2 0 7 3 6 7 8 9 7 6 2 4 3 2 3 9 2 8 3 2 3 4 5 6 7 8 9 0 2 6 7 2 4 6 7 8 9 2 2 3 3 9 2 3 8 重將leaves 按照次序排好 OK!

3 4 5 6 7 8 9 0 2 6 7 2 4 6 7 8 9 2 2 3 3 9 2 3 8 3 4 5 6 7 8 9 2 4 6 7 8 9 2 2 3 3 9 2 3 8 0 2 6 7

Exercise 53 92 67 84 90 71 76 65 58 82 84 79 60 58 61 89 98 75 64 59 55 71 93 86 68 76 54 62 69 80

Example of Histogram

資料的圖形分佈 Data distribution 資料分佈的三種特質 Shape 資料分佈形狀 Symmetrical distribution Skewed distribution Central tendency 資料集中趨勢 峰度 Variability資料散佈狀態

資料形狀 Skewed distributions 不對稱分佈 Symmetric distributions 對稱分佈 are similar on both sides of the center Skewed distributions 不對稱分佈 do not look the same on both sides of the center Positive skew 右偏 Negative skew 左偏

Degree of skewness displayed by a histogram

資料集中趨勢 當次數分配有集中的趨勢: 峰度 (Modality) 峰度高低平坦 Unimodal distributions 單峰 Multimodal distributions 多峰 峰度高低平坦 Distributions can be described as flat (platykurtic), peaked (leptokurtic), or normal (mesokurtic) 常態峰度 mesokurtosis 高狹峰 leptokurtosis 低闊峰 platykurtosis

Modality displayed by a histogram

Distributional Spread Any distribution of scores can be described in terms of its spread or dispersion Kurtosis is another term associated with the spread or peakedness of the data

Illustration of degree of spread