C7_prob_2 1 Chap 7 機率論 隨機變數 (random variable) :一群數量的 代表,它們的值是由機會決定的,通常以 大寫英文字母表示 隨機變數分為離散型與連續型兩種。 機率分布 (probability distribution) : 描述 隨機變數值的機率變化 離散型變數的分布直接以 P(X = x i ) 表示
C7_prob_2 2 二項分布 (binomial distribution) (Bernoulli) 白努力隨機變數: 當一變數只有兩種可能,通常是 Y=1 or 0 P(Y=1) = p 獨立重複 n 次,成功率為 p 的白努力試驗, X 是 n 次中成功的次數,則 X 是二項隨機變數 例:三人中有 X 人抽菸的機會,假設 P( 抽菸 )= p x0123 P(X=x)
C7_prob_2 3 二項分布特性 二項分布的平均數 = np 標準差 = sqrt [np(1-p)] p=0.5 時,分布對稱 p 0 時,左偏分布 可藉由附表 A.1 ,求得機率值。 例: p=0.3 , 10 人中有超過 5( 含 ) 人抽菸的機會多 少?平均抽菸人數與標準差為何?
C7_prob_2 4 二項分布趨近鐘形分布 二項分布,當 n 愈 來愈大時,分布的 形狀接近對稱的鐘 形 右為 n=30 , p=0.5
C7_prob_2 5 連續隨機變數 連續變數:時間、分數、重量、 …… 討論連續隨機變數的機率時,所討論的機率是某一 段區間或某一塊區域的機率,如: P(a<X<a) 而不是某一點的機率,因為 P(X=a) = 0 直方圖 → 連續曲線 → 機率密度函數 (probability density function) 依據什 麼求機 率值? →
C7_prob_2 6 連續隨機變數之 pdf 曲線的高度代表相對發生機會 (density) 連續曲線下方介於 a 與 b 之間的面積,即是其可 能值出現在 a 與 b 之間的機率。 曲線下全面積 = 1 P (a<X<b)= 藍色面積
C7_prob_ 常態分布 常態分布也稱為高斯分 布 (Gauss distribution) 常態分布 pdf 的圖形 是一個鐘型曲線,中心 點為 μ ,左右對稱 常態曲線的數學方程式 如右式 平均數是 μ ,標準差是 σ
C7_prob_2 8 常態分布由兩個參數決定 記作 N(μ, σ 2 ) 不論參數如何變,形狀都是鐘形,中心點是 μ , σ 是寬度的代 表值 μ 不同 σ 相同 μ 相同 σ 不同 μ 不同 σ 不同
C7_prob_2 9 標準常態分布 μ= 0 , σ= 1 時,稱為標準常態分布 此變數通常記作 Z 如何求機率值? 可藉由附表 A.3 ,求得 標準常態分布右尾之面積 ( P[Z>z] 之值 ) 曲線下方, z 值右邊的面積 ( 機率值 ) N(0, 1 ) 之 pdf
C7_prob_2 10 P(Z>0.53) = ? 小數第二位 Z-table for P( Z>z ) z
C7_prob_2 11 求標準常態的機率 P(Z>0.53) = 0.53 之右尾的面積 = 利用對稱性求: P(Z<0.53) P(Z<-0.25) P(-0.25<Z<0.53) P(|Z|<0.53) P(|Z|>0.53) P(Z> -0.25)
C7_prob_2 12 P(|Z|<1) = ? P(|Z|<2) = ? P(|Z|<3) = ?
C7_prob_2 13 常態變數與 Z 的關係 若 X ~ N (μ, σ 2 ), 則 (X-μ) / σ = Z X-μ :資料減 µ ,則中心點為 0 (X-μ) / σ :資料除以 σ ,則單位長度為 1
C7_prob_2 14 變數標準化 標準化:
C7_prob_2 15 求任一常態變數的機率 若 X 遵循一常態分布, μ= 5 , σ = 2 , 求: P(5<X<8) P(7<X) P(X>3) P(3<X<9) P(|X-5|<3) P(|X-5|>1)
C7_prob_2 16 由機率求得對應的資料 (percentile) (a) P(Z>a) = 0.2, 問 a= ? (b) 求 Z 之 80 percentile (c) P(Z <b) = 0.7 ,問 b= ? (d) P(|Z|<c) = 0.95 ,問 c= ? (e) P(|Z|>d) =0.10 ,問 d= ? 範例 9.6 :定義 z α 為其右側面積為 α 之 z 值,求 (a) z.01 , (b) z.05
C7_prob_2 17 求機率對應的 x 值 若 X 遵循一常態分布, μ= 5 , σ = 2 , P(X>x)=0.05 , x=? P(x<X)=0.75, x=? P(X<x) = 0.2, x=? P(|X-5|<x)=0.9, x=? P(|X-5|>x)=0.95, x=?
C7_prob_2 18 X 是表示收縮壓的隨機變數,假設 18~74 歲男 性的收縮壓呈常態分布,平均值是 129 mmHg , 標準差是 19.8 mmHg 。 有多少百分比的人收縮壓大於 150 ? 收縮壓曲線右尾 2.5% 處的值,即屬於 2.5% 的高 壓族群,其收縮壓有多高?
C7_prob_2 19 舒張壓 未採取藥物治療的群體:平均值 80.7 ,標準差 9.2 使用高血壓的群體:平均值 94.9 ,標準差 % 服用藥物的舒張壓為多少? 偽陽性的比例多少? 偽陰性的比例多少?
C7_prob_2 20 常態分布特性
C7_prob_ 深入應用 被 B 肝感染針頭插到的病人罹患 B 肝的機率多少? 若暴露於 B 肝的病人有 30% 得病, p=0.3 有 5 人被 B 肝感染針頭插到,至少有 3 人罹患 B 肝 的機率
C7_prob_2 22 X 是表示女性身高,假設女性身高呈常態分布, 平均值是 162 c m ,標準差是 6.6 cm 。 隨機選取一位婦女,身高介於 152~172 之間的機 率多少? 屬於高的 5% 的婦女,其身高多少?