Download presentation
Presentation is loading. Please wait.
1
社會統計 第三講 機率、常態分配與抽樣分配 ©Ming-chi Chen 社會統計
2
機率與統計推論 某民調機構選前電話訪問1000位合格選民,結果顯示40%的民眾支持A候選人,60%支持B候選人。這代表什麼?
如果A會贏B的話(母體參數未知),那在樣本中只有40%的人支持A是不是極不尋常? 我們要討論的是如果全體合格選民真的比較支持A的話,那我們得到這個40/60的樣本機率有多大? 推論統計是建立在機率上的 ©Ming-chi Chen 社會統計
3
Random Variable隨機變數 如果我們在事前無法正確的預測某變數X的結果,那X是一個隨機變數。
定義 如果我們在事前無法正確的預測某變數X的結果,那X是一個隨機變數。 擲一枚銅板1000次,頭像出現的次數。 擲骰子100次總共的點數 ©Ming-chi Chen 社會統計
4
Random Variable隨機變數 定義 取一個三十個人的隨機樣本並詢問其就業狀況(失業與就業),樣本中的就業人數為一隨機變數X。X的可能值為? X的值可以是0至30的任意整數,每一個數值χi都代表此實驗(問三十個人)的一特定結果。 一個隨機變數所有可能的數值稱為「變量」,隨機變數中的每一個變量皆代表一種事件。 習慣上以大寫字母X, Y, Z表隨機變數,以小寫字母x, y, z來代表其相對應的變量。 ©Ming-chi Chen 社會統計
5
Random Variable隨機變數 丟銅板三次,樣本空間為:
例題 丟銅板三次,樣本空間為: Ω={HHH, HHT, HTH, THH, HTT, THT, TTH, TTT} 定義X為丟三次銅板出現反面的次數,隨機變數X為將上面樣本空間對應到實數的函數,此隨機變數的變量為: S={0, 1, 2, 3} ©Ming-chi Chen 社會統計
6
Discrete Random Variable 間斷型(不連續)隨機變數
定義 A random variable X is discrete if X can assume only a finite or countably infinite number of different values. 一隨機變數之變量若為有限個或無限但可數,稱為discrete r.v. 台北十月份下雨的天數。 高速公路一天的死亡人數。 ©Ming-chi Chen 社會統計
7
Discrete Random Variable 連續隨機變數
定義 A random variable X is continuous if it can assume all the values in some interval. 如果隨機變數在某區間的變量為無限個,則稱為連續隨機變數。 身高。 飛機往來北高所需的飛行時間。 計程車司機每月行駛的里程數。 Note: 連續隨機變數無法精確的測量,僅能求近似值。 ©Ming-chi Chen 社會統計
8
Discrete Random Variable 間斷隨機變數
定義 If X is a discrete random variable, the probability function (p.f.)機率函數 of X is defined as the function f such that for each real number x, ©Ming-chi Chen 社會統計
9
Discrete Probability Distributions
P(X = xi)代表隨機變數等於某特定變量的機率,如P( X = 2)銅板出現兩次反面的機率,有時候會簡化為P(xi) 或f(xi)。 將一個間斷隨機函數的所有可能變量xi所相對應的機率P(X=xi)列出,稱為間斷機率分配(discrete probability distribution)。 ©Ming-chi Chen 社會統計
10
Properties of Discrete Probability Distributions
所有非連續機率分配必須滿足下列兩個條件: 假設X為一discrete r.v.,且函數P(X)滿足上述條件,我們說P(X) 為X的p.m.f (probability mass function)機率質量函數 ©Ming-chi Chen 社會統計
11
例題 某汽車經銷商營業員負責賣$10,000, $15,000, $20,000三種價格的車可得5%的佣金抽成。
消費者購買各種車款的機率分別為: $10,000 30% $15,000 20% $20,000 10% 不買車 40% 某顧客走入店中,以隨機變數X代表此營業員可能獲得的佣金,列出X的機率分配(probability distribution) ©Ming-chi Chen 社會統計
12
例題 x1=$0, x2=$500, x3=$750, x4=$1000 樣本空間S={$0, $500, $750, $1000}
與其相對應的機率為.4, .3, .2, .1* The probability distribution of a random variable is a theoretical model for the relative frequency distribution of a population. ©Ming-chi Chen 社會統計
13
例題 擲一個公正的骰子一次,令x為所得的點數,則x的分配為何? 函數表達: ©Ming-chi Chen 社會統計
14
例題 隨機變數X,其機率函數為: 求c=? ©Ming-chi Chen 社會統計
15
Cumulative Distribution Function
Let X be a discrete or continuous random variable and let x be any real number. The cumulative distribution function (CDF) of X is the function 則稱F(X)為隨機變數X的累加機率函數 ©Ming-chi Chen 社會統計
16
Properties of Cumulative Distribution Function
Let X be a discrete r.v. that can assume the values x1, x2, …xn, where x1<x2<…<xn. Then F(x) denote the probability that X assumes a value that is less than or equal to xr, and is given by: ©Ming-chi Chen 社會統計
17
累加百分比(Cumulative Percentage)
©Ming-chi Chen 社會統計
18
Properties of Cumulative Distribution Function
©Ming-chi Chen 社會統計
19
例題 續前例: F(500) = .4 + .3 =.7 F(750) = .4 + .3 +.2 =.9 ©Ming-chi Chen
社會統計
20
間斷變數的期望值 The expected value, or mean, of a discrete random variable is the weighted average of the possible values of the random variable where the weight assigned to xi is the probability P(X=xi) ©Ming-chi Chen 社會統計
21
例題 計算營業人員commission的期望值。
E(X) = (0)(.4)+(500)(.3)+(750)(.2)+(1000)(.1) = $400 ©Ming-chi Chen 社會統計
22
例題 一賭徒玩輪盤,輪盤共有38個號碼,其中18個為「紅」,18個為「黑」,另有兩個號碼為「綠」,壓$1於「紅」,可贏$1,如果出現「黑」,則$1全輸,如果出現「綠」,則輸$.5,求賭徒壓紅的期望值。 ©Ming-chi Chen 社會統計
23
Expected value of a function of X
Let X be a discrete random variable, and let Y be any function of X such that Y = g(X). Then the expected value of Y, or the expected value of g(X), is ©Ming-chi Chen 社會統計
24
例題 若上例賭徒壓$100於「紅」,求期望值。 ©Ming-chi Chen 社會統計
25
例題 隨機函數X的變量 機率函數 隨機函數X = 生三個小孩中,女孩的人數
間斷機率分配Discrete prob. distribution 假設生三個小孩各種情況所相對應的機率為: ©Ming-chi Chen 社會統計
26
例題 P(X<2) = F(1) = P(X ≦ 1) = =.53 ©Ming-chi Chen 社會統計
27
例題 E(X) = x.f(x) = (0)(.14) + (1)(.39) + (2)(.36) + (3)(.11) =1.44
= (0)(.14) + (1)(.39) + (2)(.36) + (3)(.11) =1.44 請問1.44代表的意義為? ©Ming-chi Chen 社會統計
28
Properties of Expectations
Property 1: E(c) = c 若c為任意常數,求E(c) =? ©Ming-chi Chen 社會統計
29
Properties of Expectations
Property 2: if Y=a.X+b, where a and b are constant, then E(Y) = a.E(X) + b =1 E(X) ©Ming-chi Chen 社會統計
30
Properties of Expectations
例題:若E(X)=5, 求 E(3X-5)=? E(3X-5) = 3E(X) – 5 = 15-5 =10 ©Ming-chi Chen 社會統計
31
Joint Probability Tables 聯合機率表
複習 如果兩個變數都屬於間斷型的類別變數,則可以用聯合機率表來表示其發生的機率 ©Ming-chi Chen 社會統計
32
聯合機率函數 複習 設X,Y為二元間斷隨機變數,X之值為x1,x2,x3,…xn,Y之值為y1,y2,y3…ym,若f(xi, yj)滿足下列兩條件: 則f(xi, yj)成為聯合機率函數 ©Ming-chi Chen 社會統計
33
邊際機率函數 設X,Y為二元間斷隨機變數,其機率函數為f(xi,yi),則X, Y的邊際機率函數分別為fx(xi)與fy(yj) 複習
©Ming-chi Chen 社會統計
34
X,Y的聯合機率分配表 複習 ©Ming-chi Chen 社會統計
35
Properties of Expectations
property 3: if X1, X2, X3…Xn are n random variable such that each expectation E(Xi) exists (i = 1,2, …n), then E(X1+X2…+Xn) = E(X1) +E(X2) +… E(Xn) ©Ming-chi Chen 社會統計
36
Properties of Expectations
It follows from property 2 and property3 that for any constant a1, a2, …an and b, E(a1X1+a2X2…+anXn) = a1E(X1) +a2E(X2) +… +anE(Xn) ©Ming-chi Chen 社會統計
37
Properties of Expectations
Property 4: If X1, …Xn are n independent variables such that each expectation E(Xi) exists, then E(X1.X2.X3…Xn)=E(X1)E(X2)…E(Xn) ©Ming-chi Chen 社會統計
38
Properties of Expectations
Proof X and Y are independent variables, P(XY)= P(X)P(Y) ©Ming-chi Chen 社會統計
39
Rules for Means Property 1: c is a constant, then E(c) = c
Property 2: if Y=a.X+b, where a and b are constant, then E(Y) = a.E(X) + b Property 3: if X1, X2, X3…Xn are n random variable such that each expectation E(Xi) exists (i = 1,2, …n), then E(X1+X2…+Xn) = E(X1) +E(X2) +… E(Xn) Property 4: If X1, …Xn are n independent variables such that each expectation E(Xi) exists, then E(X1.X2.X3…Xn)=E(X1)E(X2)…E(Xn) ©Ming-chi Chen 社會統計
40
Variance of Discrete Random Variable
非連續隨機變數的變異數 ©Ming-chi Chen 社會統計
41
Variance of Discrete Random Variable
©Ming-chi Chen 社會統計
42
Variance of Discrete Random Variable
= 2.82 – (1.44)2 = ΣX2f(x) – u2 ©Ming-chi Chen 社會統計
43
Properties of the variance
Var(c)=0, c 為常數項 更正式的陳述:Var(X)=0 if and only if there exists a constant c such that P(X=c)=1. ©Ming-chi Chen 社會統計
44
Properties of the variance
Property 5: Var(aX+b)=a2Var(X) Proof. 因為E(aX+b)=aE(X)+b=au+b Var(aX+b)=E[((aX+b) – E(aX+b))2] =E[(aX+b – au –b)2]=E[(aX-au)2] =a2E[(X-u)2] ©Ming-chi Chen 社會統計
45
Properties of the variance
Property 6: If X1, …Xn are independent random variables, then Var(X1+…+Xn) = Var(X1)+ …+Var(Xn) ©Ming-chi Chen 社會統計
46
Properties of the variance
Proof. 以n=2為例,If E(X1) = u1 and E(X2) = u2 E(X1+X2)=u1+u2 Var(X1+X2)=E[(X1+X2-u1-u2)2] =E[(X1-u1)2+(X2-u2)2+2(X1-u1)(X2-u2)] =Var(X1) + Var(X2) +2E[(X1-u1)(X2-u2)] X1, X2 are independent, 根據property 4 E[(X1-u1)(X2-u2)]=E(X1-u1)E(X2-u2)=0 ©Ming-chi Chen 社會統計
47
例題 X,Y,Z are independent and E(X)=1, E(Y)=4, E(Z)=3
Var(X)=3, Var(Y)=7, Var(Z)=2 What is the mean and variance of U=3X+4Y E(U)=E(3X+4Y)=3E(X) + 4E(Y) =3·1+4·4 = 19 Var(U) = Var(3X+4Y) = 9Var(X) + 16Var(Y) =9*3+16*7 = 139 ©Ming-chi Chen 社會統計
48
例題 成功機械公司之生產經理欲推計該公司某一長期客戶,訂購其產品之生產成本。若經由多年之銷售記錄,訂立了該客戶每月訂購量X之機率分配如下:
X =1 f(X) = .5 X =2 f(X) = .3 X=3 f(X) = .2 (1) 求隨機變數(訂購量)X的期望值及變異數。 (2)若生產經理認為該產品的生產成本為:固定成本每月20,000元,每單位之變動成本為40,000。試求該項交易每月期望總生產成本為?(成大企研) ©Ming-chi Chen 社會統計
49
例題 E(X)=(x)f(x)=1(.5)+2(.3)+3(.2)=1.7
Var(X)=E(X2)-[E(X)]2 =3.5-(1.7)2=0.61 令Y= X E(Y)= E(X)=88000 ©Ming-chi Chen 社會統計
50
第3.1講 連續變數的機率分配 ©Ming-chi Chen 社會統計
51
Properties of Continuous probability distributions
觀念 嚴格來說,因為測量的侷限,所有的變數皆為「非連續」discrete。 但當某一個變數的變量的數目很多,每一個變量出現的機率很低時,我們通常把它當作「連續」變數來處理。 例如:收入、所得、學校成績等。 ©Ming-chi Chen 社會統計
52
Approximating a continuous distribution
觀念 取100人的樣本並紀錄其完成工作的時間如下: ©Ming-chi Chen 社會統計
53
Approximating a continuous distribution
觀念 以直方圖來表達: ©Ming-chi Chen 社會統計
54
Approximating a continuous distribution
觀念 將樣本擴大至1,000 ©Ming-chi Chen 社會統計
55
Approximating a continuous distribution
觀念 將樣本擴大至10,000 ©Ming-chi Chen 社會統計
56
Approximating a continuous distribution
觀念 將樣本擴大至100,000,隨著樣本數的增加,每一個變量之間的間隔愈小,曲線愈趨於平滑。 這個曲線可以被視為是根據母體(試驗重複很多次)的相對次數分配所畫出來的直方圖。 ©Ming-chi Chen 社會統計
57
Density Function 觀念 若某一連續隨機變數X的機率分配可以用數學函數f(x)及其所對應的平滑的曲線表達,則f(x)為X的機率密度函數(density function)。 ©Ming-chi Chen 社會統計
58
Density Function 設X為一連續r.v.,若函數f(x)滿足下列條件: 則稱f(x)為機率密度函數。 定義
©Ming-chi Chen 社會統計
59
Density Function 任何機率分配所有的“相對次數”的和為? 也就是說,曲線底下的面積和為1 觀念 ©Ming-chi Chen
社會統計
60
Density Function 界於a與b之間曲線下的面積如何計算? 步驟一,先將a至b的區間切割成n等分: x1 x2 a b 觀念
©Ming-chi Chen 社會統計
61
Density Function 第一塊長方形區域的面積為: f(x2) f(x1) 第二塊長方形區域的面積為: x1 x2 a b 觀念
©Ming-chi Chen 社會統計
62
Density Function 觀念 若將a至b之間的區間做更細的切割,則長方形的面積和將為愈來愈趨近於曲線下的面積。如將上圖的五等分再細分成十等分。 f(x1) x1 x2 a b ©Ming-chi Chen 社會統計
63
Density Function 若再進一步細分成n份,則 f(x1) 當n趨近於無限大時,則 a b 觀念 ©Ming-chi Chen
社會統計
64
Density Function 如果f在[a,b]的區間中為連續,且c,d介於a與b之間,則x介於c與d之間的機率為: a b c d
定義 如果f在[a,b]的區間中為連續,且c,d介於a與b之間,則x介於c與d之間的機率為: a b c d ©Ming-chi Chen 社會統計
65
Density Function 在連續隨機函數中,任意單獨變量所相對應的機率為 0。 a b
定義 在連續隨機函數中,任意單獨變量所相對應的機率為 0。 a b 因為連續函數的變量x有無限個不同的值,任一特定變量a出現的機率等於1/∞ ©Ming-chi Chen 社會統計
66
Expected value 觀念 一非連續隨機變數(discrete r.v.)的變量為x1,x2,…xn,且每個變量的相對應的機率為p1,p2,…pn,則此隨機變數的期望值為: f(x1)=p1 x1 x2 a b ©Ming-chi Chen 社會統計
67
Expected value 將非連續隨機函數的期望值算法推演至連續隨機變數: f(x1) 先將a與b之間的區間分成n等分: x1 x2 a
觀念 將非連續隨機函數的期望值算法推演至連續隨機變數: f(x1) 先將a與b之間的區間分成n等分: x1 x2 a b n個區間的範圍分別為: ©Ming-chi Chen 社會統計
68
Expected value p1為x落在[x0,x1]之間的機率,p2為x落在[x1,x2]區間的機率…
觀念 p1為x落在[x0,x1]之間的機率,p2為x落在[x1,x2]區間的機率… P2=f(x2) P1 p2為函數f曲線介於x1與x2之下的面積 x1 x2 x0 b p1為函數f曲線介於xo與x1之下的面積 ©Ming-chi Chen 社會統計
69
Expected value 觀念 P2=f(x2) P1 x1 x2 x0 b ©Ming-chi Chen 社會統計
70
Expected value 當n趨於無限大,x趨近於0時: x1 x2 x0 a b P2=f(x2) P1 定義
©Ming-chi Chen 社會統計
71
Variance 非連續變數的變異數: 連續變數的變異數: x1 x2 x0 a b P2=f(x2) P1 定義
©Ming-chi Chen 社會統計
72
第3.2講 常態分配/標準常態分配/標準化 ©Ming-chi Chen 社會統計
73
Normal Distribution常態分配
定義 常態分配的機率密度函數PDF為: We say that X is normally distributed with parameter μ and σ, denote X~N(μ, σ2) ©Ming-chi Chen 社會統計
74
常態分配之重要性質 The curve is bell shaped and symmetric about the value X=μ
觀念 X=μ The curve is bell shaped and symmetric about the value X=μ The curve extends from -∞ to +∞ ©Ming-chi Chen 社會統計
75
常態分配之重要性質 觀念 X=μ The total area under the curve is 1. (this is required for all density function) The curve is always above X-axis (f(x) ≧0, for all x) μ=.Md=Mo ©Ming-chi Chen 社會統計
76
常態分配之重要性質 不同μ,相同σ 相同μ,不同σ μ為位置參數,σ為形狀參數 μ1 μ2 μ3 μ 觀念 ©Ming-chi Chen
社會統計
77
常態分配之重要性質 μ為位置參數,σ為形狀參數 若X~N(μ, σ2),令Y=aX + b,則 Y~ N(aμ+b, a2σ2)
觀念 μ為位置參數,σ為形狀參數 若X~N(μ, σ2),令Y=aX + b,則 Y~ N(aμ+b, a2σ2) 若X~N(μ1, σ12) ,Y~N(μ2, σ22),且X與Y獨立,則Z=X+Y之分配為 Z~N(μ1+μ2, σ12+ σ22) ©Ming-chi Chen 社會統計
78
標準常態分配 Standard normal distribution
觀念 A random variable is said to have the standard normal distribution if it has the normal distribution with mean μ=0 and σ2=1. Z~N(0, 1) σ=1 μ=0 ©Ming-chi Chen 社會統計
79
標準常態分配曲線下的面積 觀念 34.1% 34.1% 13.6% 2.1% ©Ming-chi Chen 社會統計
80
標準常態分配曲線下的面積 P(Z<0) = 0.5 P(Z>0) = 0.5 P(Z< -z) = 1-P(Z z)
觀念 P(Z<0) = 0.5 P(Z>0) = 0.5 P(Z< -z) = 1-P(Z z) P(Z< -z) = P(Z > z) ©Ming-chi Chen 社會統計
81
Z介於零與一正數之間 例題 例題:Find P(0≦Z≦0.62)=? z =0.62 ©Ming-chi Chen 社會統計
82
標準常態分配曲線下的面積 P(Z>0.62) =0.5-P(0≦Z≦0.62)
例題 查表Table A Area under the standard normal distribution from 0 to z 小數點第二位 小數點第一位 P(Z>0.62) =0.5-P(0≦Z≦0.62) ©Ming-chi Chen 社會統計
83
Z介於零與一負數之間 Z~N(0,1), find P(-1.67Z 0)?
例題 Z~N(0,1), find P(-1.67Z 0)? 查表可知, P(0<Z<1.67) =.4525 Z=-1.67 ©Ming-chi Chen 社會統計
84
Z介於一負數與正數之間 Z~N(0,1), find P(-1.21Z 2.15)?
例題 Z~N(0,1), find P(-1.21Z 2.15)? P(-1.21Z 2.15) =P(-1.21<Z<0)+ P(0<Z<2.15) = =.8711 Z=2.15 Z=-1.21 ©Ming-chi Chen 社會統計
85
Z介於兩正數之間 Z~N(0,1), find P(1.21Z 2.15)? P(0<Z<2.15) =.4842
例題 Z~N(0,1), find P(1.21Z 2.15)? P(0<Z<2.15) =.4842 P(0<Z<1.21) =.3869 P(1.21Z 2.15) =P(0<z<2.15) – P(0<Z<1.21) = Z=2.15 Z=1.21 ©Ming-chi Chen 社會統計
86
Z介於兩負數之間 Z~N(0,1), find P(-2.15 Z -1.21)?
例題 Z~N(0,1), find P(-2.15 Z -1.21)? P(-2.15<Z<-1.21) =P(1.21Z 2.15) = Z=-2.15 Z=-1.21 ©Ming-chi Chen 社會統計
87
Z大於一正數 Z~N(0,1), find P(Z >1.64)? P(0Z 1.64) =.4495
例題 Z~N(0,1), find P(Z >1.64)? P(0Z 1.64) =.4495 P(Z>1.64) = =.0505 Z=1.64 ©Ming-chi Chen 社會統計
88
Z小於一負數 Z~N(0,1), find P(Z -2.02)?
例題 Z~N(0,1), find P(Z -2.02)? P(-2.02<Z<0) =P(0<Z<2.02) = P(Z<-2.02) = Z=-2.02 ©Ming-chi Chen 社會統計
89
Z大於或小於4 Z~N(0,1), find P(Z >4.63)? P(Z<4.63) =1 P(Z>4.63) =0
例題 Z~N(0,1), find P(Z >4.63)? P(Z<4.63) =1 P(Z>4.63) =0 ©Ming-chi Chen 社會統計
90
給定面積,求Z? 例題 Z~N(0,1), find value z1 and z2 such that the area to the right of z2 is and the area to the left of z1 is 0.025? P(Z>z2)=0.025 P(0<Z<z2)=.4750 查表得知z2=1.96 z1 z2 ©Ming-chi Chen 社會統計
91
標準常態分配中常用的累積機率 例題 右表為常用的數據,可以熟記 ©Ming-chi Chen 社會統計
92
求一般常態分配的面積 已知標準常態分配N(0,1)的面積,可以設法將任意常態分配N(μ, σ2)轉換成N(0,1),利用查表即可求面積 觀念
©Ming-chi Chen 社會統計
93
標準化standardizing transformation
觀念 X ~N(μ, σ2),then standardized score or Z score = Z ~N(0, 1) Z score或是標準化分數的意義就是某數離均數有幾個標準差 ©Ming-chi Chen 社會統計
94
給定常態分配,求介於兩數的機率? 例題 Suppose X~N(10,25), find the area under the curve between x1=12 and x2=16? 10 12 16 P(.4<Z<1.2)= =.2295 u=0 z1=0.4 z2=1.2 ©Ming-chi Chen 社會統計
95
給定常態分配,求介於兩數的機率? 一隧道工程每週的進度X~N(100,400), 求下週進度介於80 至120的機率 ?
例題 一隧道工程每週的進度X~N(100,400), 求下週進度介於80 至120的機率 ? 400 80 100 120 P(80<X<120) =P(-1<Z<1) = ©Ming-chi Chen 社會統計
96
給定面積,求原始分數? 高普考的成績為常態分配,平均分數為250,標準差為11.5,如果只錄取求2.5%,求最低錄取分數為何?
例題 高普考的成績為常態分配,平均分數為250,標準差為11.5,如果只錄取求2.5%,求最低錄取分數為何? 11.5 P(Z<z0) = 0.975 250 ©Ming-chi Chen 社會統計
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.