統計實務 Fall 2003 授課教師:統計系余清祥 日期:2003年10月30日 第七週:統計分析.

Slides:



Advertisements
Similar presentations
資料蒐集的方法(三):實驗法(實驗設計) (第七章)
Advertisements

第五章 卡方檢定 5-1 卡方檢定 (X2 test) 5-2 適配度檢定 (good-of-fit test)
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Chapter 10 馬可夫鏈 緒言 如果讀者仔細觀察日常生活中所發生的 諸多事件,必然會發現有些事件的未來 發展或演變與該事件現階段的狀況全然 無關,這種事件稱為獨立試行過程 (process of independent trials) ;而另一些 事件則會受到該事件現階段的狀況影響。
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點 行為 清楚掌握主題 - 當「事件」出現時才開 始記錄 記錄程序 等待目標事件的發生 開始記錄 事件結束,停止記錄.
Advanced Chemical Engineering Thermodynamics
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
1 政治大學財政所與東亞所選修 -- 應用計量分析 -- 中國財政研究 黃智聰 政治大學財政所與東亞所選修 課程名稱:應用計量分析 -- 中國財政研究 授課老師:黃智聰 授課內容: 簡單線性迴歸模型: 共線性與虛擬變數 參考書目: Hill, C. R., W. E. Griffiths, and G.
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
©Ming-chi Chen 社會統計 Page.1 社會統計 第十講 相關與共變. ©Ming-chi Chen 社會統計 Page.2 Covariance, 共變量 當 X, Y 兩隨機變數不互為獨立時,表示 兩者間有關連。其關連的形式有很多種, 最常見的關連為線性的共變關係。 隨機變數 X,Y.
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
Chapter 2 聯立線性方程式與矩陣 緒言 線性方程式組 (systems of linear equations) 出現 在多數線性模式 (linear model) 中。根據以往解 題的經驗,讀者們也許已發現方程式的解僅與 該方程式的係數有關,求解的過程也僅與係數 的運算有關,只要係數間的相關位置不改變,
Section 2.3 Least-Squares Regression 最小平方迴歸
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
1 政大公企中心產業人才投資課程 -- 企業決策分析方法 -- 黃智聰 政大公企中心產業人才投資課程 課程名稱:企業決策分析方法 授課老師:黃智聰 授課內容:利用分公司之追蹤資料進行企業決策分析 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge,
1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段,試用程 式設計的技巧,使此敘述經此改 寫的動作後,具有與 “ 捷徑計算 ” 之 處理方法相同之處理模式。 if and then E1 else E2 endif.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
平均值檢定 假設 檢定 One Sample 平均值 是否為 u. One Sample—1 工廠甲過去向 A 公司購買原料, 平均交貨日約為 4.94 日, 標準差 現在 A 公司改組, 甲工廠繼續向 A 公司 購買, 隨機抽取 8 次採購, 平均日數為 4.29 日, 請問 A 公.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
基礎物理總論 基礎物理總論 熱力學與統計力學(三) Statistical Mechanics 東海大學物理系 施奇廷.
CH22 可靠性加速測試方法 目的 基本假設 加速試驗模式 Inverse Power Model
2-group1 第十一章 二組平均數的比較 【應用】 暴露在一氧化碳和暴露在一般空氣下,發生狹心 症情況是否有差異? 新藥的治療是否比較有效? 健康孩童與罹病孩童血清鐵濃度是否不同? 兩種測量儀器的準確性是否有差異? 洗腎病人透析前後體重比較.
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
1 政治大學東亞所選修 -- 計量分析與中國大陸研究黃智聰 政治大學東亞所選修 課程名稱:計量分析與中國大陸研究 (量化分析) 授課老師:黃智聰 授課內容:時間序列與橫斷面資料的共用 參考書目: Hill, C. R., W. E. Griffiths, and G. G. Judge, (2001),
1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
民意調查的分析 II 蔡佳泓 政大選舉研究中心 副研究員. 課程大綱 假設的檢定 研究假設 H1: 研究假設 ( 例: X 與 Y 相關 ) H0: 虛無假設 ( 例: X 與 Y 無關 ) 檢定結果:接受虛無假設或拒斥虛無假 設,但不代表接受研究假設.
1 政治大學財政所與東亞所選修 -- 應用計量分析 -- 中國財政研究 黃智聰 政治大學財政所與東亞所選修 課程名稱:應用計量分析 -- 中國財政研究 授課老師:黃智聰 授課內容: 簡單線性迴歸模型:報告結果 與選擇函數型式 參考書目: Hill, C. R., W. E. Griffiths, and.
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
1 政治大學公企中心必修課 -- 社會科學研究方法(量化分析) -- 黃智聰 政治大學公企中心必修課 課程名稱:社會科學研究方法(量化分析) 授課老師:黃智聰 授課內容: 簡單線性迴歸模型: 共線性與虛擬變數 參考書目: Hill, C. R., W. E. Griffiths, and G. G.
1 第四章 多變數函數的微分學 § 4.1 偏導數定義 定義 極限值 ■. 2 定理 極限值的基本定理 (1) 極限值的唯一性 : 若 存在,則 其值必為唯一。 (2) 若 且 ( 與 為常數 ) , 則 且 為常數且.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳 研究設計.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
: The largest Clique ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11324: The largest Clique 解題者:李重儀 解題日期: 2008 年 11 月 24 日 題意: 簡單來說,給你一個 directed.
第三部分:研究設計 ( 二): 研究工具的信效度 與研究效度 (第九章之第 306 頁 -308 頁;第四章)
第二章 供給與需求 中興大學會計學系 授課老師:簡立賢.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
第二十一章 研究流程、論文結構        與研究範例 21-1  研究流程 21-2  論文結構 21-3  研究範例.
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
政治大學公企中心必修課-- 社會科學研究方法(量化分析)--黃智聰
Structural Equation Modeling Chapter 1 模式存在與否之需,見仁見智; 但是,人無模式,就無決策 SEM 概論.
1 政治大學國務院國安碩專班選修課 -- 社會科學研究方法(量化分析) -- 黃智聰 政治大學國務院國安碩專班選修課 課程名稱:社會科學研究方法(量化分析) 授課老師:黃智聰 授課內容: 簡單線性迴歸模型: 共線性與虛擬變數 參考書目: Hill, C. R., W. E. Griffiths, and.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
JAVA 程式設計與資料結構 第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法,此演 算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
Chapter 3 Entropy : An Additional Balance Equation
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
演算法課程 (Algorithms) 國立聯合大學 資訊管理學系 陳士杰老師 Course 7 貪婪法則 Greedy Approach.
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
統計計算與模擬 政治大學統計系余清祥 2010 年 2 月 23 日 第一週:導論
Unit 3 : 變異數分析 --ANOVA 3.1 範例說明 行銷研究方面, One-Way ANOVA 可 用以研擬市場區隔及目標選擇策略。 教育研究方面,此一模式可用以評估 教師之教學績效。 農業研究方面,此一模式則可用以挑 選使玉米收穫量極大化的肥料。
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
第十二章 變異數分析 12.1 單因子變異數分析 1-way ANOVA Subject : 比較三組以上的母體平均數 k 組資料,母體平均數為 μ 1, …, μ i, …, μ k Data : k 組資料,樣本數為 n 1,…, n k. x ij --- 第 i 組的第 j 個觀察值 N =
連續隨機變數 連續變數:時間、分數、重量、……
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
單因子變異數分析 多重比較 雙因子變異數分析
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
Ch 11 建立研究工具的效度與信度.
幼兒行為觀察與記錄 第八章 事件取樣法.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Presentation transcript:

統計實務 Fall 2003 授課教師:統計系余清祥 日期:2003年10月30日 第七週:統計分析

統計分析的原則 確定問題的定義 化繁為簡(反璞歸真) 結合相關知識 發揮聯想力(大膽假設) 勿驟下結論(小心求證)

基本資料分析 基本資料分析的首要目的在於資料偵錯、獲得資料的大略資訊、驗證已知結果。 因此,圖形、表格在基本資料分析中扮演重要的角色;並由基本資料分析的結果中尋找合適的下一步分析方法。  使用任何的統計方法前,先確定該方法需要的假設條件是否滿足。

甚麼分析方法合適?

連線之後較易看出端倪!

迴歸分析 迴歸分析是最常見的統計方法之一,但也是最容易被誤用的方法。  迴歸測量解釋變數與反應變數間的線性關係,但兩者不見得具有因果關係。  測量資料配適的吻合度,數值大者不代表迴歸模型正確;變數顯著者也不代表整體的迴歸模型可用。

迴歸分析(續) 猜猜看 的大小。 相關係數=–0.985 !!!

迴歸分析(續):何者 較大?

迴歸分析(續) 你相信嗎?!  由四個圖形中的資料,配適出截距及斜率完全相同的迴歸方程式。 (Anscombe, 1973, 文章中的資料) 但你/妳覺得哪一個圖形中的資料較合適使用迴歸分析?

分析範例(一) 教學方法是否存有差異?  進行變異數分析前可用的方法?

箱型圖是不錯的選擇!

Individual 95% CIs For Mean Based on Pooled StDev Analysis of Variance Source DF SS MS F P Factor 4 722.7 180.7 15.27 0.000 Error 40 473.3 11.8 Total 44 1196.0 Individual 95% CIs For Mean Based on Pooled StDev Level N Mean StDev ---+---------+---------+---------+--- A 9 19.667 4.213 (---*----) B 9 18.333 3.571 (----*---) C 9 27.444 2.455 (----*----) D 9 23.444 3.087 (----*----) E 9 16.111 3.621 (---*----) ---+---------+---------+---------+--- Pooled StDev = 3.440 15.0 20.0 25.0 30.0

分析範例(二) 種子發芽與哪些因素有關?

箱型圖中先找出趨勢!

折線圖中看出交互作用!

分析範例(三) 兩種栽種方式是否有相同的效果?  p-value = 0.11 >  = 0.01,不拒絕 

分析範例(四) 頭髮顏色是否與眼睛顏色相關? (不藉助統計分析工具的前提下!)

另一個範例:

時間數列(Time Series) 蒐集的資料具時間先後順序,且每一個觀察值的數值大小與其前後的觀察值有關。  股票價格  木柵的每天最高、低、平均溫度  飯店的住房率(淡、旺季之分) 如何判斷資料具前後相關性?

時間數列(範例) 如何判斷下列資料具時間先後關係?

試試看畫出Xi vs. Xi+1 !  是否有明顯的正相關?

存活分析(Survival Analysis) 存活分析在於研究個體的生存(或損壞)情形,例如:死亡率、產品的壽命等。 簡言之,研究隨機變數的分配函數及相關的資訊。 例如:如果 X 代表死亡時間的隨機變數,則 E(X) 即為平均壽命,而我們通常定義 存活函數 S(x) = P(X  x) = 1 – F(x)。

範例(存活分析) 以下為兩種癌症病人在使用兩種治癌藥物的存活時間,請問兩種藥物是否有療效上的差異? 第一組 第二組 第一組 第二組 17 108 197 464 1174 1 301 394 675 1245 42 122 208 484 1214 63 342 408 676 1271 44 144 234 528 1232 105 354 460 748 1420 48 167 235 542 1366 125 356 489 778 1460 60 170 254 567 1455 182 358 523 786 1516 72 183 307 577 1585 216 380 524 797 1551 74 185 315 580 1622 250 383 535 955 1690 95 193 401 795 1626 262 383 562 968 1694 103 195 445 855 1736 301 388 569 977

無論用箱型圖、長條圖,都可看出第二組的存活時間稍微高一些,但可能不顯著。 是否有別的方法可看出更進一步的資訊?

存活分析(續) 存活曲線是另一種可能。

存活分析(續) 如何估計樣本存活函數? 樣本分配函數的估計為 因此,  樣本存活(及分配)函數為階梯函數。

存活分析(續) 如何比較兩條存活函數是否相同? 無母數方法!!! (a) Chi-square Goodness-of-fit (b) Kruskall-Wallis Test (c) Mann-Whitney Test (d) Kolmogorov-Simrov Test  這些方法的特性與限制?