統計緒論 _ Chap1 導 論 Domain of statistics 資料收集 (collection) 資料處理 (processing) 資料詮釋 (interpretation) 資料呈現 (presentation) Statistics :統計工作、統計方法 Statistician :統計工作者、統計學家 Statistic :統計量,特定的衡量標準或計算 公式
統計緒論 _ 例:台灣受僱者疲勞的分布狀況與相關因素 資料:源自 2004 年全國受僱員工調查 共計男性 8906 人,女性 6382 人。 如何測量疲勞? 以「哥本哈根疲勞量表」做為測量的工具 包括「一般疲勞」與「工作相關疲勞」 測量因素包括工作時數、工作負荷、工作控制感、 教育程度、職業等級、家庭照顧負荷等。
統計緒論 _ 哥本哈根疲勞量表 你常覺得疲勞 常覺得體力上體力透支 常覺得情緒上心力交瘁 常覺得快撐不下去 常覺得精疲力竭 常覺得虛弱、快生病了
統計緒論 _ 結果: 12.7% 的男性與 9.1% 的女性在調查前一週中工 作 49 小時或以上。 在所有年齡層與職等中,女性受僱者的疲勞指數皆 顯著高於男性。 當依性別分析,我們發現在女性受僱者中,高職等、 高教育程度者的疲勞指數高於低職等、低教育程度 者。然而在男性受僱者中,疲勞指數並沒有清楚的 社會階層分布。 疲勞的高危險族群:每週工時 49 小時或以上者、 工作心理負荷量較高者、以及家中有六歲以下幼兒 或失能老人者。
統計緒論 _ 現代統計學的發展 Descriptive statistics 描述、彙整、分析資料的方法,通常利用圖表來呈 現,並沒有進行任何的推論。 Inferencial statistictics 藉由分析少量的資料來瞭解整體的情況,判斷所得 資訊的價值、選擇最佳的預測方式、或是決定最合 理的(報酬最高的)因應方案。 將樣本 (sample) 得到的特性推廣 (generalize) 母體 (population)
統計緒論 _ 統計學的應用 對 1000 位民眾的訪問結果,有 400 位支持甲,有 410 位 支持乙,請問乙是否一定當選。 有人宣稱有百分之七十以上的某型飛機的尾舵上,出現 因金屬疲勞而造成的裂縫。倘若在隨機選取的 18 架該型飛 機上,有 15 架的確出現因金屬疲勞而造成的裂縫,請檢定 上述的說法。 金屬疲勞而造成的裂縫 可換成醫師對薪資的不滿,或汽 車排放廢氣超過標準值。 了解國內受僱工作者疲勞狀況及相關因素。
統計緒論 _ 統計資料來源 internal data or external data primary data or secondary data 中華民國統計年報 etc.
統計緒論 _ 因為調查人員有引導答案 已經明白表示該政策是「鋪張浪費」的。 資料是客觀公正的嗎?
統計緒論 _ 倘若該冷凍食品的正好頗受單身貴族或是雙薪家庭 的歡迎,那麼這種訪查方式所得出來的結論顯然 會出現偏差 (bias) 。
統計緒論 _ 統計資料的本質 數值資料 (numerical data) 透過測量或計數而得來的,又稱為數量資料 (quantitative data) 類別資料 (categorical data) 類別資料又稱為定性資料 (qualitative data) 註: 為了便利性,類別資料通常都會進行編碼,不同的 類別給予不同的數字編號,藉此將類別資料轉換成 數值資料。
統計緒論 _ 又細分為 名目資料 (nominal data) ,如:婚姻狀況 順序資料 (ordinal data) ,如:礦物的硬度 區間資料 (interval data) ,如:溫度 比例資料 (ratio data) ,如:長度、金錢 註:區間資料與比例資料可視為同一類資料,在統計 理論上為 continuous variable.
統計緒論 _ 同一件事可用不同的測值 四個學生的總成績分別是 180 、 171 、 165 ,及 162 Linda 的成績最好,接著依次是 Tom 、 Henry ,及 Rose 。 四個學生參加三項歷史科綜合測驗的成績:
統計緒論 _ 四個學生參加三項歷史科綜合測驗的名次: 表現最好的是 Rose ,接著依次是 Henry 、 Tom ,及 Linda 這個結果跟之前的結果完全相反! 你覺得那一種比較法才合理?
統計緒論 _ 注意: 1 、不同的測值會產生不同的結論,應針對研究的目的來 選擇合適的測值。 2 、在應用統計學方法的時候,必須要先明辨資料本身在 性質上的限制,不能永遠用同一套;也就是說,必須 根據資料本身的性質,選擇適當的統計分析方法。