描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
相關性測量 基本邏輯-proportionate reduction of error (PRE) (消減錯誤的比例) → 一變項的資訊也許可減少推測另一變項數值時可能產生的錯誤.
散佈圖(Sattergram) 如何看散佈圖呢? 1.Form(形式):直線還是曲線?集中還是分散? 2.Direction(方向): 正相關還是負相關? 3.Precision:圖中各點的分佈是趨向一直線還是曲線呢?
相關 兩量化變數直線關係的強度和方向 數值介於-1~1之間
相關係數圖表
(線性)迴歸分析 目的: 1.瞭解自變數與依變數的關係及影響方 向和程度 2.利用自變數和估計的方程式對依變項作預測
迴歸模型的評判 迴歸模型配適度(迴歸模型解釋力如何?) → R2 :可解釋變異佔總變異的比例 → F檢定:檢定整個迴歸模型的解釋能力 對迴歸係數作檢定,以瞭解各自變數對依變數是否有解釋能力(自變數對依變數是否有直線性的影響) → t值檢定
迴歸係數的解讀 簡單迴歸 y_hat=α +βx → 當x變動一單位時,y變動β單位 複迴歸 y_hat=α +β1x1+ β2x2 解釋係數時,千萬記得加入“單位”.
(題目範例請參見考古題,作業一,及迴歸分析考題) 迴歸分析其他注意要點 為避免加入過多的自變項所產生的R-square值提高,我們會加入自由度來進行調整R-square值.(Spss結果顯示為“調整後的R2 ”) 自變數間的共線性問題,可透過相關係數的檢驗來取得初步的認識.若自變數間具有共線性,擇一放入迴歸模型中即可.變項選擇的標準可斟酌研究所需及遺漏值多寡. 若想比較各自變數對依變數影響的相對重要性,須採用“標準化迴歸係數”來進行比較.(因各自變項的單位不一,故須將係數標準化後才能進行比較) (題目範例請參見考古題,作業一,及迴歸分析考題)
推論統計 推論統計(Inferential Statistics)-以從樣本獲得的資料和統計量來對母體進行推論. 區間估計:對未知的母體參數估計出一個上下限的區間,並指出該區間包含母體參數的可靠程度. → 信賴區間;信賴水準 假設檢定:對母體參數(特性)提出假設,並利用樣本統計量去檢定,以決定接受或拒絕該假設.
統計顯著性 為何要做假設檢定? → 機率樣本由隨機過程產生,多少與母體有所差異,然而,樣本結果是因機率因素或抽樣誤差所導致的,還是母體本身的問題,則必須進一步透過假設檢定來檢驗. 統計顯著性-結果不是因為機率因素或抽樣誤差所產生的.
顯著程度 顯著程度:樣本結果由機率因素產生的機會 Results are significant at the 0.05 level: 像這樣的結果是因機率因素產生的,在100次中只會出現5次 樣本產生的結果有百分之95的機會不是由機率因素產生的,而是正確反應出母體的情形 像這樣的結果是因機率因素產生的機會是5% 我們有95%的信心母體內真實的相關性造成了觀察到的結果,而不是由機率造成的
Type I and Type II Errors 實際情況 H0為真 H1為真 決策 不拒絕H0 No error Type II Errors 拒絕H0 Type I error
卡方檢定 描述統計的意義:兩變數相關性的強度 推論統計的意義:我們發現的相關性,是由機率因素造成的可能性 實際範例請參見“迴歸分析考試”的題目1,或者課程ppt.
其他提醒 量化與質化分析的異同比較 測量的品質-信度和效度 編碼簿的製作及編碼方式 變數類型與統計方式 小組的研究簡述 (研究題目,研究問題,研究發現與限制,未來如何繼續進行..)