社會統計 第三講 機率、常態分配與抽樣分配 ©Ming-chi Chen 社會統計.

Slides:



Advertisements
Similar presentations
Chapter 10 馬可夫鏈 緒言 如果讀者仔細觀察日常生活中所發生的 諸多事件,必然會發現有些事件的未來 發展或演變與該事件現階段的狀況全然 無關,這種事件稱為獨立試行過程 (process of independent trials) ;而另一些 事件則會受到該事件現階段的狀況影響。
Advertisements

本章結構 前言 符號介紹與立透法則 指數機率分配 基本無限來源模式 基本有限來源模式 等候系統的經濟分析-最佳化 進階等候模式 16-1.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
: A-Sequence 星級 : ★★☆☆☆ 題組: Online-judge.uva.es PROBLEM SET Volume CIX 題號: Problem D : A-Sequence 解題者:薛祖淵 解題日期: 2006 年 2 月 21 日 題意:一開始先輸入一個.
Ch05 點估計與抽樣分配 授課老師 薛欣達. 學習目標 估計母體參數的樣本統計量 應用中央極限定理 根據估計式的需求性質判斷估計式的好壞 應用自由度的概念 利用樣板計算抽樣分配與相關的結果.
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
Advanced Chemical Engineering Thermodynamics
3Com Switch 4500 切VLAN教學.
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
第四章 評價股票選擇權的數值方法 蒙地卡羅模擬與二項式模型 財務工程 呂瑞秋著.
Stat_chi21 類別資料 (Categorical data) 一種質性資料, 其觀察值可歸類於數個不相交的項目內, 例 : 性別, 滿意度, …, 一般以各項的統計次數表現. 分析此種資料,通常用卡方檢定 類別資料分析 卡方檢定 卡方檢定基本理論 一個含有 k 項的試驗,設 p i.
©Ming-chi Chen 社會統計 Page.1 社會統計 第十講 相關與共變. ©Ming-chi Chen 社會統計 Page.2 Covariance, 共變量 當 X, Y 兩隨機變數不互為獨立時,表示 兩者間有關連。其關連的形式有很多種, 最常見的關連為線性的共變關係。 隨機變數 X,Y.
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
Chapter 2 聯立線性方程式與矩陣 緒言 線性方程式組 (systems of linear equations) 出現 在多數線性模式 (linear model) 中。根據以往解 題的經驗,讀者們也許已發現方程式的解僅與 該方程式的係數有關,求解的過程也僅與係數 的運算有關,只要係數間的相關位置不改變,
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
平均值檢定 假設 檢定 One Sample 平均值 是否為 u. One Sample—1 工廠甲過去向 A 公司購買原料, 平均交貨日約為 4.94 日, 標準差 現在 A 公司改組, 甲工廠繼續向 A 公司 購買, 隨機抽取 8 次採購, 平均日數為 4.29 日, 請問 A 公.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
基礎物理總論 基礎物理總論 熱力學與統計力學(三) Statistical Mechanics 東海大學物理系 施奇廷.
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
Integrated single vendor single buyer model with stochastic demand and variable lead time 指導教授:林燦煌 博士 指導教授:林燦煌 博士 研 究 生:黃笙源 研 究 生:黃笙源 M. Ben-Daya, M. Hariga.
信度.
1 第四章 多變數函數的微分學 § 4.1 偏導數定義 定義 極限值 ■. 2 定理 極限值的基本定理 (1) 極限值的唯一性 : 若 存在,則 其值必為唯一。 (2) 若 且 ( 與 為常數 ) , 則 且 為常數且.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
:Problem D: Bit-wise Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10232: Problem D: Bit-wise Sequence 解題者:李濟宇 解題日期: 2006 年 4 月 16.
: The largest Clique ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11324: The largest Clique 解題者:李重儀 解題日期: 2008 年 11 月 24 日 題意: 簡單來說,給你一個 directed.
: Happy Number ★ ? 題組: Problem Set Archive with Online Judge 題號: 10591: Happy Number 解題者:陳瀅文 解題日期: 2006 年 6 月 6 日 題意:判斷一個正整數 N 是否為 Happy Number.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
短缺,盈餘與均衡. 遊戲規則  老師想出售一些學生喜歡的小食。  老師首先講出價錢,有興趣買的請舉手。
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
公司加入市場的決定. 定義  平均成本 = 總成本 ÷ 生產數量 = 每一單位產量所耗的成本  平均固定成本 = 總固定成本 ÷ 生產數量  平均變動成本 = 總變動成本 ÷ 生產數量.
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
第七章 連續機率分配.
資料結構實習-一 參數傳遞.
觀測量的權 權的觀念與計算.
公用品.  該物品的數量不會因一人的消費而受到 影響,它可以同時地被多人享用。 角色分配  兩位同學當我的助手,負責:  其餘各人是投資者,每人擁有 $100 , 可以投資在兩種資產上。  記錄  計算  協助同學討論.
宏觀經濟學之均衡點. 定義  非自願性失業 當工人預備以現有的名義工資水平去接受工作,但 未能找到工作時,這種稱為非自願性失業。  通貨膨脹 所有名義價格持續上升。
: Beautiful Numbers ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11472: Beautiful Numbers 解題者:邱經達 解題日期: 2011 年 5 月 5 日 題意: 若一個 N 進位的數用到該.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
函式 Function Part.2 東海大學物理系‧資訊教育 施奇廷. 遞迴( Recursion ) 函式可以「呼叫自己」,這種動作稱為 「遞迴」 此程式的執行結果相當於陷入無窮迴圈, 無法停止(只能按 Ctrl-C ) 這給我們一個暗示:函式的遞迴呼叫可以 達到部分迴圈的效果.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
: Expect the Expected ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11427: Expect the Expected 解題者:李重儀 解題日期: 2008 年 9 月 21 日 題意:玩一種遊戲 (a game.
Chapter 3 Entropy : An Additional Balance Equation
Chapter 10 m-way 搜尋樹與B-Tree
C7_prob_2 1 Chap 7 機率論 隨機變數 (random variable) :一群數量的 代表,它們的值是由機會決定的,通常以 大寫英文字母表示 隨機變數分為離散型與連續型兩種。 機率分布 (probability distribution) : 描述 隨機變數值的機率變化 離散型變數的分布直接以.
演算法課程 (Algorithms) 國立聯合大學 資訊管理學系 陳士杰老師 Course 7 貪婪法則 Greedy Approach.
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
1 © 2011 台灣培生教育出版 (Pearson Education Taiwan). 2 學習目標 1. 當面對可預測的變異性時,同步管理並改善供應鏈 中的供給。 2. 當面對可預測的變異性時,同步管理並改善供應鏈 中的需求。 3. 當面對可預測的變異性時,使用總體規劃將利潤最 大化。
Chapter 6 Introduction to Inference 推論簡介. Chapter 6 Introduction to Inference 6.1 Estimating with Confidence 6.2 Tests of Significance 6.3 Making Sense.
連續隨機變數 連續變數:時間、分數、重量、……
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
: Wine trading in Gergovia ★★☆☆☆ 題組: Contest Volumes with Online Judge 題號: 11054: Wine trading in Gergovia 解題者:劉洙愷 解題日期: 2008 年 2 月 29 日 題意:在 Gergovia.
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
:Problem E.Stone Game ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10165: Problem E.Stone Game 解題者:李濟宇 解題日期: 2006 年 3 月 26 日 題意: Jack 與 Jim.
第十一章 卡方檢定 陳順宇 教授 成功大學統計系.
幼兒行為觀察與記錄 第八章 事件取樣法.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
Chapter 12 Estimation 統計估計. Inferential statistics Parametric statistics 母數統計 ( 母體為常態或 大樣本 ) 假設檢定 hypothesis testing  對有關母體參數的假設,利用樣本資料,決定接受或 不接受該假設的方法.
: How many 0's? ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11038: How many 0’s? 解題者:楊鵬宇 解題日期: 2007 年 5 月 15 日 題意:寫下題目給的 m 與 n(m
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Presentation transcript:

社會統計 第三講 機率、常態分配與抽樣分配 ©Ming-chi Chen 社會統計

機率與統計推論 某民調機構選前電話訪問1000位合格選民,結果顯示40%的民眾支持A候選人,60%支持B候選人。這代表什麼? 如果A會贏B的話(母體參數未知),那在樣本中只有40%的人支持A是不是極不尋常? 我們要討論的是如果全體合格選民真的比較支持A的話,那我們得到這個40/60的樣本機率有多大? 推論統計是建立在機率上的 ©Ming-chi Chen 社會統計

Random Variable隨機變數 如果我們在事前無法正確的預測某變數X的結果,那X是一個隨機變數。 定義 如果我們在事前無法正確的預測某變數X的結果,那X是一個隨機變數。 擲一枚銅板1000次,頭像出現的次數。 擲骰子100次總共的點數 ©Ming-chi Chen 社會統計

Random Variable隨機變數 定義 取一個三十個人的隨機樣本並詢問其就業狀況(失業與就業),樣本中的就業人數為一隨機變數X。X的可能值為? X的值可以是0至30的任意整數,每一個數值χi都代表此實驗(問三十個人)的一特定結果。 一個隨機變數所有可能的數值稱為「變量」,隨機變數中的每一個變量皆代表一種事件。 習慣上以大寫字母X, Y, Z表隨機變數,以小寫字母x, y, z來代表其相對應的變量。 ©Ming-chi Chen 社會統計

Random Variable隨機變數 丟銅板三次,樣本空間為: 例題 丟銅板三次,樣本空間為: Ω={HHH, HHT, HTH, THH, HTT, THT, TTH, TTT} 定義X為丟三次銅板出現反面的次數,隨機變數X為將上面樣本空間對應到實數的函數,此隨機變數的變量為: S={0, 1, 2, 3} ©Ming-chi Chen 社會統計

Discrete Random Variable 間斷型(不連續)隨機變數 定義 A random variable X is discrete if X can assume only a finite or countably infinite number of different values. 一隨機變數之變量若為有限個或無限但可數,稱為discrete r.v. 台北十月份下雨的天數。 高速公路一天的死亡人數。 ©Ming-chi Chen 社會統計

Discrete Random Variable 連續隨機變數 定義 A random variable X is continuous if it can assume all the values in some interval. 如果隨機變數在某區間的變量為無限個,則稱為連續隨機變數。 身高。 飛機往來北高所需的飛行時間。 計程車司機每月行駛的里程數。 Note: 連續隨機變數無法精確的測量,僅能求近似值。 ©Ming-chi Chen 社會統計

Discrete Random Variable 間斷隨機變數 定義 If X is a discrete random variable, the probability function (p.f.)機率函數 of X is defined as the function f such that for each real number x, ©Ming-chi Chen 社會統計

Discrete Probability Distributions P(X = xi)代表隨機變數等於某特定變量的機率,如P( X = 2)銅板出現兩次反面的機率,有時候會簡化為P(xi) 或f(xi)。 將一個間斷隨機函數的所有可能變量xi所相對應的機率P(X=xi)列出,稱為間斷機率分配(discrete probability distribution)。 ©Ming-chi Chen 社會統計

Properties of Discrete Probability Distributions 所有非連續機率分配必須滿足下列兩個條件: 假設X為一discrete r.v.,且函數P(X)滿足上述條件,我們說P(X) 為X的p.m.f (probability mass function)機率質量函數 ©Ming-chi Chen 社會統計

例題 某汽車經銷商營業員負責賣$10,000, $15,000, $20,000三種價格的車可得5%的佣金抽成。 消費者購買各種車款的機率分別為: $10,000  30% $15,000  20% $20,000  10% 不買車  40% 某顧客走入店中,以隨機變數X代表此營業員可能獲得的佣金,列出X的機率分配(probability distribution) ©Ming-chi Chen 社會統計

例題 x1=$0, x2=$500, x3=$750, x4=$1000 樣本空間S={$0, $500, $750, $1000} 與其相對應的機率為.4, .3, .2, .1* The probability distribution of a random variable is a theoretical model for the relative frequency distribution of a population. ©Ming-chi Chen 社會統計

例題 擲一個公正的骰子一次,令x為所得的點數,則x的分配為何? 函數表達: ©Ming-chi Chen 社會統計

例題 隨機變數X,其機率函數為: 求c=? ©Ming-chi Chen 社會統計

Cumulative Distribution Function Let X be a discrete or continuous random variable and let x be any real number. The cumulative distribution function (CDF) of X is the function 則稱F(X)為隨機變數X的累加機率函數 ©Ming-chi Chen 社會統計

Properties of Cumulative Distribution Function Let X be a discrete r.v. that can assume the values x1, x2, …xn, where x1<x2<…<xn. Then F(x) denote the probability that X assumes a value that is less than or equal to xr, and is given by: ©Ming-chi Chen 社會統計

累加百分比(Cumulative Percentage) ©Ming-chi Chen 社會統計

Properties of Cumulative Distribution Function ©Ming-chi Chen 社會統計

例題 續前例: F(500) = .4 + .3 =.7 F(750) = .4 + .3 +.2 =.9 ©Ming-chi Chen 社會統計

間斷變數的期望值 The expected value, or mean, of a discrete random variable is the weighted average of the possible values of the random variable where the weight assigned to xi is the probability P(X=xi) ©Ming-chi Chen 社會統計

例題 計算營業人員commission的期望值。 E(X) = (0)(.4)+(500)(.3)+(750)(.2)+(1000)(.1) = $400 ©Ming-chi Chen 社會統計

例題 一賭徒玩輪盤,輪盤共有38個號碼,其中18個為「紅」,18個為「黑」,另有兩個號碼為「綠」,壓$1於「紅」,可贏$1,如果出現「黑」,則$1全輸,如果出現「綠」,則輸$.5,求賭徒壓紅的期望值。 ©Ming-chi Chen 社會統計

Expected value of a function of X Let X be a discrete random variable, and let Y be any function of X such that Y = g(X). Then the expected value of Y, or the expected value of g(X), is ©Ming-chi Chen 社會統計

例題 若上例賭徒壓$100於「紅」,求期望值。 ©Ming-chi Chen 社會統計

例題 隨機函數X的變量 機率函數 隨機函數X = 生三個小孩中,女孩的人數 間斷機率分配Discrete prob. distribution 假設生三個小孩各種情況所相對應的機率為: ©Ming-chi Chen 社會統計

例題 P(X<2) = F(1) = P(X ≦ 1) = .14 +.39 =.53 ©Ming-chi Chen 社會統計

例題 E(X) =  x.f(x) = (0)(.14) + (1)(.39) + (2)(.36) + (3)(.11) =1.44 = (0)(.14) + (1)(.39) + (2)(.36) + (3)(.11) =1.44 請問1.44代表的意義為? ©Ming-chi Chen 社會統計

Properties of Expectations Property 1: E(c) = c 若c為任意常數,求E(c) =? ©Ming-chi Chen 社會統計

Properties of Expectations Property 2: if Y=a.X+b, where a and b are constant, then E(Y) = a.E(X) + b =1 E(X) ©Ming-chi Chen 社會統計

Properties of Expectations 例題:若E(X)=5, 求 E(3X-5)=? E(3X-5) = 3E(X) – 5 = 15-5 =10 ©Ming-chi Chen 社會統計

Joint Probability Tables 聯合機率表 複習 如果兩個變數都屬於間斷型的類別變數,則可以用聯合機率表來表示其發生的機率 ©Ming-chi Chen 社會統計

聯合機率函數 複習 設X,Y為二元間斷隨機變數,X之值為x1,x2,x3,…xn,Y之值為y1,y2,y3…ym,若f(xi, yj)滿足下列兩條件: 則f(xi, yj)成為聯合機率函數 ©Ming-chi Chen 社會統計

邊際機率函數 設X,Y為二元間斷隨機變數,其機率函數為f(xi,yi),則X, Y的邊際機率函數分別為fx(xi)與fy(yj) 複習 ©Ming-chi Chen 社會統計

X,Y的聯合機率分配表 複習 ©Ming-chi Chen 社會統計

Properties of Expectations property 3: if X1, X2, X3…Xn are n random variable such that each expectation E(Xi) exists (i = 1,2, …n), then E(X1+X2…+Xn) = E(X1) +E(X2) +… E(Xn) ©Ming-chi Chen 社會統計

Properties of Expectations It follows from property 2 and property3 that for any constant a1, a2, …an and b, E(a1X1+a2X2…+anXn) = a1E(X1) +a2E(X2) +… +anE(Xn) ©Ming-chi Chen 社會統計

Properties of Expectations Property 4: If X1, …Xn are n independent variables such that each expectation E(Xi) exists, then E(X1.X2.X3…Xn)=E(X1)E(X2)…E(Xn) ©Ming-chi Chen 社會統計

Properties of Expectations Proof X and Y are independent variables, P(XY)= P(X)P(Y) ©Ming-chi Chen 社會統計

Rules for Means Property 1: c is a constant, then E(c) = c Property 2: if Y=a.X+b, where a and b are constant, then E(Y) = a.E(X) + b Property 3: if X1, X2, X3…Xn are n random variable such that each expectation E(Xi) exists (i = 1,2, …n), then E(X1+X2…+Xn) = E(X1) +E(X2) +… E(Xn) Property 4: If X1, …Xn are n independent variables such that each expectation E(Xi) exists, then E(X1.X2.X3…Xn)=E(X1)E(X2)…E(Xn) ©Ming-chi Chen 社會統計

Variance of Discrete Random Variable 非連續隨機變數的變異數 ©Ming-chi Chen 社會統計

Variance of Discrete Random Variable ©Ming-chi Chen 社會統計

Variance of Discrete Random Variable = 2.82 – (1.44)2 = ΣX2f(x) – u2 ©Ming-chi Chen 社會統計

Properties of the variance Var(c)=0, c 為常數項 更正式的陳述:Var(X)=0 if and only if there exists a constant c such that P(X=c)=1. ©Ming-chi Chen 社會統計

Properties of the variance Property 5: Var(aX+b)=a2Var(X) Proof. 因為E(aX+b)=aE(X)+b=au+b Var(aX+b)=E[((aX+b) – E(aX+b))2] =E[(aX+b – au –b)2]=E[(aX-au)2] =a2E[(X-u)2] ©Ming-chi Chen 社會統計

Properties of the variance Property 6: If X1, …Xn are independent random variables, then Var(X1+…+Xn) = Var(X1)+ …+Var(Xn) ©Ming-chi Chen 社會統計

Properties of the variance Proof. 以n=2為例,If E(X1) = u1 and E(X2) = u2 E(X1+X2)=u1+u2 Var(X1+X2)=E[(X1+X2-u1-u2)2] =E[(X1-u1)2+(X2-u2)2+2(X1-u1)(X2-u2)] =Var(X1) + Var(X2) +2E[(X1-u1)(X2-u2)] X1, X2 are independent, 根據property 4 E[(X1-u1)(X2-u2)]=E(X1-u1)E(X2-u2)=0 ©Ming-chi Chen 社會統計

例題 X,Y,Z are independent and E(X)=1, E(Y)=4, E(Z)=3 Var(X)=3, Var(Y)=7, Var(Z)=2 What is the mean and variance of U=3X+4Y E(U)=E(3X+4Y)=3E(X) + 4E(Y) =3·1+4·4 = 19 Var(U) = Var(3X+4Y) = 9Var(X) + 16Var(Y) =9*3+16*7 = 139 ©Ming-chi Chen 社會統計

例題 成功機械公司之生產經理欲推計該公司某一長期客戶,訂購其產品之生產成本。若經由多年之銷售記錄,訂立了該客戶每月訂購量X之機率分配如下: X =1 f(X) = .5 X =2 f(X) = .3 X=3 f(X) = .2 (1) 求隨機變數(訂購量)X的期望值及變異數。 (2)若生產經理認為該產品的生產成本為:固定成本每月20,000元,每單位之變動成本為40,000。試求該項交易每月期望總生產成本為?(成大企研) ©Ming-chi Chen 社會統計

例題 E(X)=(x)f(x)=1(.5)+2(.3)+3(.2)=1.7 Var(X)=E(X2)-[E(X)]2 =3.5-(1.7)2=0.61 令Y= 20000+40000X E(Y)=20000+40000E(X)=88000 ©Ming-chi Chen 社會統計

第3.1講 連續變數的機率分配 ©Ming-chi Chen 社會統計

Properties of Continuous probability distributions 觀念 嚴格來說,因為測量的侷限,所有的變數皆為「非連續」discrete。 但當某一個變數的變量的數目很多,每一個變量出現的機率很低時,我們通常把它當作「連續」變數來處理。 例如:收入、所得、學校成績等。 ©Ming-chi Chen 社會統計

Approximating a continuous distribution 觀念 取100人的樣本並紀錄其完成工作的時間如下: ©Ming-chi Chen 社會統計

Approximating a continuous distribution 觀念 以直方圖來表達: ©Ming-chi Chen 社會統計

Approximating a continuous distribution 觀念 將樣本擴大至1,000 ©Ming-chi Chen 社會統計

Approximating a continuous distribution 觀念 將樣本擴大至10,000 ©Ming-chi Chen 社會統計

Approximating a continuous distribution 觀念 將樣本擴大至100,000,隨著樣本數的增加,每一個變量之間的間隔愈小,曲線愈趨於平滑。 這個曲線可以被視為是根據母體(試驗重複很多次)的相對次數分配所畫出來的直方圖。 ©Ming-chi Chen 社會統計

Density Function 觀念 若某一連續隨機變數X的機率分配可以用數學函數f(x)及其所對應的平滑的曲線表達,則f(x)為X的機率密度函數(density function)。 ©Ming-chi Chen 社會統計

Density Function 設X為一連續r.v.,若函數f(x)滿足下列條件: 則稱f(x)為機率密度函數。 定義 ©Ming-chi Chen 社會統計

Density Function 任何機率分配所有的“相對次數”的和為? 也就是說,曲線底下的面積和為1 觀念 ©Ming-chi Chen 社會統計

Density Function 界於a與b之間曲線下的面積如何計算? 步驟一,先將a至b的區間切割成n等分: x1 x2 a b 觀念 ©Ming-chi Chen 社會統計

Density Function 第一塊長方形區域的面積為: f(x2) f(x1) 第二塊長方形區域的面積為: x1 x2 a b 觀念 ©Ming-chi Chen 社會統計

Density Function 觀念 若將a至b之間的區間做更細的切割,則長方形的面積和將為愈來愈趨近於曲線下的面積。如將上圖的五等分再細分成十等分。 f(x1) x1 x2 a b ©Ming-chi Chen 社會統計

Density Function 若再進一步細分成n份,則 f(x1) 當n趨近於無限大時,則 a b 觀念 ©Ming-chi Chen 社會統計

Density Function 如果f在[a,b]的區間中為連續,且c,d介於a與b之間,則x介於c與d之間的機率為: a b c d 定義 如果f在[a,b]的區間中為連續,且c,d介於a與b之間,則x介於c與d之間的機率為: a b c d ©Ming-chi Chen 社會統計

Density Function 在連續隨機函數中,任意單獨變量所相對應的機率為 0。 a b 定義 在連續隨機函數中,任意單獨變量所相對應的機率為 0。 a b 因為連續函數的變量x有無限個不同的值,任一特定變量a出現的機率等於1/∞ ©Ming-chi Chen 社會統計

Expected value 觀念 一非連續隨機變數(discrete r.v.)的變量為x1,x2,…xn,且每個變量的相對應的機率為p1,p2,…pn,則此隨機變數的期望值為: f(x1)=p1 x1 x2 a b ©Ming-chi Chen 社會統計

Expected value 將非連續隨機函數的期望值算法推演至連續隨機變數: f(x1) 先將a與b之間的區間分成n等分: x1 x2 a 觀念 將非連續隨機函數的期望值算法推演至連續隨機變數: f(x1) 先將a與b之間的區間分成n等分: x1 x2 a b n個區間的範圍分別為: ©Ming-chi Chen 社會統計

Expected value p1為x落在[x0,x1]之間的機率,p2為x落在[x1,x2]區間的機率… 觀念 p1為x落在[x0,x1]之間的機率,p2為x落在[x1,x2]區間的機率… P2=f(x2) P1 p2為函數f曲線介於x1與x2之下的面積 x1 x2 x0 b p1為函數f曲線介於xo與x1之下的面積 ©Ming-chi Chen 社會統計

Expected value 觀念 P2=f(x2) P1 x1 x2 x0 b ©Ming-chi Chen 社會統計

Expected value 當n趨於無限大,x趨近於0時: x1 x2 x0 a b P2=f(x2) P1 定義 ©Ming-chi Chen 社會統計

Variance 非連續變數的變異數: 連續變數的變異數: x1 x2 x0 a b P2=f(x2) P1 定義 ©Ming-chi Chen 社會統計

第3.2講 常態分配/標準常態分配/標準化 ©Ming-chi Chen 社會統計

Normal Distribution常態分配 定義 常態分配的機率密度函數PDF為: We say that X is normally distributed with parameter μ and σ, denote X~N(μ, σ2) ©Ming-chi Chen 社會統計

常態分配之重要性質 The curve is bell shaped and symmetric about the value X=μ 觀念 X=μ The curve is bell shaped and symmetric about the value X=μ The curve extends from -∞ to +∞ ©Ming-chi Chen 社會統計

常態分配之重要性質 觀念 X=μ The total area under the curve is 1. (this is required for all density function) The curve is always above X-axis (f(x) ≧0, for all x) μ=.Md=Mo ©Ming-chi Chen 社會統計

常態分配之重要性質 不同μ,相同σ 相同μ,不同σ μ為位置參數,σ為形狀參數 μ1 μ2 μ3 μ 觀念 ©Ming-chi Chen 社會統計

常態分配之重要性質 μ為位置參數,σ為形狀參數 若X~N(μ, σ2),令Y=aX + b,則 Y~ N(aμ+b, a2σ2) 觀念 μ為位置參數,σ為形狀參數 若X~N(μ, σ2),令Y=aX + b,則 Y~ N(aμ+b, a2σ2) 若X~N(μ1, σ12) ,Y~N(μ2, σ22),且X與Y獨立,則Z=X+Y之分配為 Z~N(μ1+μ2, σ12+ σ22) ©Ming-chi Chen 社會統計

標準常態分配 Standard normal distribution 觀念 A random variable is said to have the standard normal distribution if it has the normal distribution with mean μ=0 and σ2=1. Z~N(0, 1) σ=1 μ=0 ©Ming-chi Chen 社會統計

標準常態分配曲線下的面積 觀念 34.1% 34.1% 13.6% 2.1% ©Ming-chi Chen 社會統計

標準常態分配曲線下的面積 P(Z<0) = 0.5 P(Z>0) = 0.5 P(Z< -z) = 1-P(Z  z) 觀念 P(Z<0) = 0.5 P(Z>0) = 0.5 P(Z< -z) = 1-P(Z  z) P(Z< -z) = P(Z > z) ©Ming-chi Chen 社會統計

Z介於零與一正數之間 例題 例題:Find P(0≦Z≦0.62)=? z =0.62 ©Ming-chi Chen 社會統計

標準常態分配曲線下的面積 P(Z>0.62) =0.5-P(0≦Z≦0.62) 例題 查表Table A Area under the standard normal distribution from 0 to z 小數點第二位 小數點第一位 P(Z>0.62) =0.5-P(0≦Z≦0.62) ©Ming-chi Chen 社會統計

Z介於零與一負數之間 Z~N(0,1), find P(-1.67Z 0)? 例題 Z~N(0,1), find P(-1.67Z 0)? 查表可知, P(0<Z<1.67) =.4525 Z=-1.67 ©Ming-chi Chen 社會統計

Z介於一負數與正數之間 Z~N(0,1), find P(-1.21Z 2.15)? 例題 Z~N(0,1), find P(-1.21Z 2.15)? P(-1.21Z 2.15) =P(-1.21<Z<0)+ P(0<Z<2.15) = .4842+.3869=.8711 Z=2.15 Z=-1.21 ©Ming-chi Chen 社會統計

Z介於兩正數之間 Z~N(0,1), find P(1.21Z 2.15)? P(0<Z<2.15) =.4842 例題 Z~N(0,1), find P(1.21Z 2.15)? P(0<Z<2.15) =.4842 P(0<Z<1.21) =.3869 P(1.21Z 2.15) =P(0<z<2.15) – P(0<Z<1.21) =.4842-.3869 Z=2.15 Z=1.21 ©Ming-chi Chen 社會統計

Z介於兩負數之間 Z~N(0,1), find P(-2.15  Z  -1.21)? 例題 Z~N(0,1), find P(-2.15  Z  -1.21)? P(-2.15<Z<-1.21) =P(1.21Z 2.15) =.4842-.3869 Z=-2.15 Z=-1.21 ©Ming-chi Chen 社會統計

Z大於一正數 Z~N(0,1), find P(Z >1.64)? P(0Z 1.64) =.4495 例題 Z~N(0,1), find P(Z >1.64)? P(0Z 1.64) =.4495 P(Z>1.64) = 0.5-.4495 =.0505 Z=1.64 ©Ming-chi Chen 社會統計

Z小於一負數 Z~N(0,1), find P(Z -2.02)? 例題 Z~N(0,1), find P(Z -2.02)? P(-2.02<Z<0) =P(0<Z<2.02) = 0.4783 P(Z<-2.02) = 0.5-0.4783 Z=-2.02 ©Ming-chi Chen 社會統計

Z大於或小於4 Z~N(0,1), find P(Z >4.63)? P(Z<4.63) =1 P(Z>4.63) =0 例題 Z~N(0,1), find P(Z >4.63)? P(Z<4.63) =1 P(Z>4.63) =0 ©Ming-chi Chen 社會統計

給定面積,求Z? 例題 Z~N(0,1), find value z1 and z2 such that the area to the right of z2 is 0.025 and the area to the left of z1 is 0.025? P(Z>z2)=0.025 P(0<Z<z2)=.4750 查表得知z2=1.96 z1 z2 ©Ming-chi Chen 社會統計

標準常態分配中常用的累積機率 例題 右表為常用的數據,可以熟記 ©Ming-chi Chen 社會統計

求一般常態分配的面積 已知標準常態分配N(0,1)的面積,可以設法將任意常態分配N(μ, σ2)轉換成N(0,1),利用查表即可求面積 觀念 ©Ming-chi Chen 社會統計

標準化standardizing transformation 觀念 X ~N(μ, σ2),then standardized score or Z score = Z ~N(0, 1) Z score或是標準化分數的意義就是某數離均數有幾個標準差 ©Ming-chi Chen 社會統計

給定常態分配,求介於兩數的機率? 例題 Suppose X~N(10,25), find the area under the curve between x1=12 and x2=16? 10 12 16 P(.4<Z<1.2)=.3849 -.1554 =.2295 u=0 z1=0.4 z2=1.2 ©Ming-chi Chen 社會統計

給定常態分配,求介於兩數的機率? 一隧道工程每週的進度X~N(100,400), 求下週進度介於80 至120的機率 ? 例題 一隧道工程每週的進度X~N(100,400), 求下週進度介於80 至120的機率 ? 400 80 100 120 P(80<X<120) =P(-1<Z<1) = .3413 +.3413 ©Ming-chi Chen 社會統計

給定面積,求原始分數? 高普考的成績為常態分配,平均分數為250,標準差為11.5,如果只錄取求2.5%,求最低錄取分數為何? 例題 高普考的成績為常態分配,平均分數為250,標準差為11.5,如果只錄取求2.5%,求最低錄取分數為何? 11.5 P(Z<z0) = 0.975 250 ©Ming-chi Chen 社會統計