The Chernoff bound Speaker: Chuang-Chieh Lin Coworker: Chih-Chieh Hung

Slides:



Advertisements
Similar presentations
: Arrange the Numbers ★★★☆☆ 題組: Contest Archive with Online Judge 題號: 11481: Arrange the Numbers 解題者:李重儀 解題日期: 2008 年 9 月 13 日 題意: 將數列 {1,2,3, …,N}
Advertisements

第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
: A-Sequence 星級 : ★★☆☆☆ 題組: Online-judge.uva.es PROBLEM SET Volume CIX 題號: Problem D : A-Sequence 解題者:薛祖淵 解題日期: 2006 年 2 月 21 日 題意:一開始先輸入一個.
:Word Morphing ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10508:word morphing 解題者:楊家豪 解題日期: 2006 年 5 月 21 日 題意: 第一行給你兩個正整數, 第一個代表下面會出現幾個字串,
Section 1.2 Describing Distributions with Numbers 用數字描述分配.
Chapter 2 Random Vectors 與他們之間的性質 (Random vectors and their properties)
活動時間: 99 年 05 月 07 號 ( 五 ) 上午 9.20~12.10 活動地點:校本部科技大樓 4 樓 3401 E 化教學教室 電子系 - 光電實驗室 即時實驗現場互動.
Using High and Low Level Communication in Agile Method Presenter: 花金地.
What is static?. Static? 靜態 ? class Test { static int staticX; int instanceX; public Test(int var1, int var2) { this.staticX = var1; this.instanceX =
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
: Boxes ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 11003: Boxes 解題者:蔡欣燁 解題日期: 2007 年 3 月 19 日.
Chapter 4 教學軟體融入教學  教學軟體有哪幾大類 ? 可以如何在教學上被 應用 ? 各有什麼優缺點 及使用要領 ?  教學軟體是是一種輔工具 能不能發揮功用取 決於教師如何運用 ( 淑珠 ) 以你認教科目 你覺 得哪些教學軟體可以配合你的教學需要 ? 你 要如何運用 ?  你對反覆練習軟體和遊戲軟體的看法.
Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學 資訊管理系 李麗華 教授.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
5.1 Rn上之長度與點積 5.2 內積空間 5.3 單範正交基底:Gram-Schmidt過程 5.4 數學模型與最小平方分析
MATLAB 程式設計 第 11 章 多維陣列 多維陣列的定義 在 MATLAB 的資料型態中,向量可視為 一維陣列,矩陣可視二維陣列,對於維 度 (Dimensions) 超過 1 的陣列則均可視 為「多維陣列」 (Multidimesional Arrays , 簡稱 N-D Arrays)
Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點 兩座標軸的刻度不同,散佈圖的外觀呈 現的相聯性強度,會有不同的感受。 散佈圖 2 相聯性看起來比散佈圖 1 來得強。 以統計數字相關係數做為客觀標準。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
基礎物理總論 基礎物理總論 熱力學與統計力學(三) Statistical Mechanics 東海大學物理系 施奇廷.
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
Hint of Homework 4 jinnjy. Outline Hint of exercise 3.18.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
STST0_C31 2  母體 (population)  樣本 (sample)  例: The trial of flipping a coin  The weights of a baby  由 400 ceramic tiles 抽出 20 片測量強 度 3.1 母體與樣本.
: The largest Clique ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11324: The largest Clique 解題者:李重儀 解題日期: 2008 年 11 月 24 日 題意: 簡單來說,給你一個 directed.
: War on Weather ★★☆☆☆ 題組: Contest Volumes Archive with Online Judge 題號: 10915: War on Weather 解題者:陳明凱 題意:題目總共會給你 k 個點座標代表殺手衛星的位置, 距離地球表面最少 50 公里以上,並且會給你.
Digital Signal Processing with Examples in M ATLAB ® Chap 1 Introduction Ming-Hong Shih, Aug 25, 2003.
3.1 矩陣的行列式 3.2 使用基本運算求行列式 3.3 行列式的性質 3.4 特徵值介紹 3.5 行列式的應用
Monte Carlo Simulation Part.1 Dept. Phys., Tunghai Univ. Numerical Methods, C. T. Shih.
: Playing War ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11061: Playing War 解題者:陳盈村 解題日期: 2008 年 3 月 14 日 題意:在此遊戲中,有一類玩家一旦開始攻擊, 就會不停攻擊同一對手,直到全滅對方或無法再.
: Problem A : MiniMice ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11411: Problem A : MiniMice 解題者:李重儀 解題日期: 2008 年 9 月 3 日 題意:簡單的說,題目中每一隻老鼠有一個編號.
自動機 (Automata) Time: 1:10~2:00 Monday: practice exercise, quiz 2:10~4:00 Wednesday: lecture Textbook: (new!) An Introduction to Formal Languages and Automata,
短缺,盈餘與均衡. 遊戲規則  老師想出售一些學生喜歡的小食。  老師首先講出價錢,有興趣買的請舉手。
: Multisets and Sequences ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11023: Multisets and Sequences 解題者:葉貫中 解題日期: 2007 年 4 月 24 日 題意:在這個題目中,我們要定義.
: Selfdescribing Sequence ★★★ 題組: Problem Set Archive with Online Judge 題號: Problem C: Selfdescribing Sequence 解題者:林峰世 解題日期: 2006 年 3 月 21 日 題意:
The application of boundary element evaluation on a silencer in the presence of a linear temperature gradient Boundary Element Method 期末報告 指導老師:陳正宗終身特聘教授.
7.4 Lookback Options 指導教授:戴天時 報告者:陳博宇. 章節結構 Floating Strike Lookback Black-Scholes-Merton Equation Reduction of Dimension Computation.
: Beautiful Numbers ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11472: Beautiful Numbers 解題者:邱經達 解題日期: 2011 年 5 月 5 日 題意: 若一個 N 進位的數用到該.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
函式 Function Part.2 東海大學物理系‧資訊教育 施奇廷. 遞迴( Recursion ) 函式可以「呼叫自己」,這種動作稱為 「遞迴」 此程式的執行結果相當於陷入無窮迴圈, 無法停止(只能按 Ctrl-C ) 這給我們一個暗示:函式的遞迴呼叫可以 達到部分迴圈的效果.
Image Interpolation Use SSE 指導教授 : 楊士萱 學 生 : 楊宗峰 日 期 :
JAVA 程式設計與資料結構 第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法,此演 算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.
資料結構實習-二.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
: Expect the Expected ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11427: Expect the Expected 解題者:李重儀 解題日期: 2008 年 9 月 21 日 題意:玩一種遊戲 (a game.
-Antidifferentiation- Chapter 6 朝陽科技大學 資訊管理系 李麗華 教授.
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Chapter 10 m-way 搜尋樹與B-Tree
學習理論與整合模式 這章節所討論的兩大教學理論 ( 指導 / 建構 ) 有 何差異性 ? 當學習愈上瓶頸 指導是與建構式的解決方式各 是什麼 ? 指導式的教學理論解決什麼樣的教學問題 ? 科 技在教學上的運用又如何這樣的理想 ? 建構式的教學理論解決什麼樣的教學問題 ? 科 技在教學上的運用又如何這樣的理想.
第五章 內積空間 5.1 Rn上之長度與點積 5.2 內積空間 5.3 單範正交基底:Gram-Schmidt過程
第4章 有限體.
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
Chapter 7 Sampling Distribution
2005/7 Linear system-1 The Linear Equation System and Eliminations.
連續隨機變數 連續變數:時間、分數、重量、……
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
葉子─樹的名片 你能不能看到樹上的葉子,就知道是什麼植物?.
: Wine trading in Gergovia ★★☆☆☆ 題組: Contest Volumes with Online Judge 題號: 11054: Wine trading in Gergovia 解題者:劉洙愷 解題日期: 2008 年 2 月 29 日 題意:在 Gergovia.
:Commandos ★★★☆☆ 題組: Contest Archive with Online Judge 題號: 11463: Commandos 解題者:李重儀 解題日期: 2008 年 8 月 11 日 題意: 題目會給你一個敵營區內總共的建築物數,以及建築物 之間可以互通的路有哪些,並給你起點的建築物和終點.
資料結構實習-六.
:Count the Trees ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10007:Count the Trees 解題者:楊家豪 解題日期: 2006 年 3 月 題意: 給 n 個點, 每一個點有自己的 Label,
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
:Problem E.Stone Game ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10165: Problem E.Stone Game 解題者:李濟宇 解題日期: 2006 年 3 月 26 日 題意: Jack 與 Jim.
Introduction to Probability Theory ‧ 2- 2 ‧ Speaker: Chuang-Chieh Lin Advisor: Professor Maw-Shang Chang National Chung Cheng University Dept. CSIE, Computation.
Introduction to Probability Theory ‧ 3- 1 ‧ Speaker: Chuang-Chieh Lin Advisor: Professor Maw-Shang Chang National Chung Cheng University Dept. CSIE, Computation.
題目 : 真好運客運 南臺科技大學 機械工程系 班級 : 奈米一乙 學號 :4A 姓名 : 李宗益 授課教師 : 謝慶存 計算機程式及實習 期末報告.
Introduction to Probability Theory ‧ 2- 1 ‧ Speaker: Chuang-Chieh Lin Advisor: Professor Maw-Shang Chang National Chung Cheng University Dept. CSIE, Computation.
微分器與積分器 類比電子實驗 單元二 教材投影片放在
Chernoff bounds The Chernoff bound for a random variable X is
Chernoff bounds The Chernoff bound for a random variable X is
Presentation transcript:

The Chernoff bound Speaker: Chuang-Chieh Lin Coworker: Chih-Chieh Hung Advisor: Maw-Shang Chang National Chung-Cheng University and National Chiao-Tung University

Outline Introduction The Chernoff bound Markov Inequality The Moment Generating Functions The Chernoff Bound for a Sum of Poisson Trials The Chernoff Bound for Special cases Set Balancing Problem References

Introduction Goal: The Chernoff bound can be used in the analysis on the tail of the distribution of the sum of independent random variables, with some extensions to the case of dependent or correlated random variables. Markov Inequality and Moment generating functions which we shall introduce will be greatly needed.

Math tool Professor Herman Chernoff’s bound, Annal of Mathematical Statistics 1952

Chernoff bounds I n i t s m o g e r a l f , h C ® b u d - v X w : y > P [ ¸ ] · E q ¡ + T z p . A moment generating function 一開始大家並不熟悉E[e^{tX}],慢慢就會比較了解

Markov’s Inequality F o r a n y d m v i b l e X ¸ > , P [ ] · E : W > , P [ ] · E : W c u s M k I q t h f C j ¡ = ( ) 2 V ’ ’ 跟前面的 Chernoff bound 是不是很像?

Proof of the Chernoff bound ’ I t f o l w s d i r e c y m M a k v n q u : P [ X ¸ ] = · E So, how to calculate this term?

Moment Generating Functions X ( t ) = E [ e ] : T h i s f u n c o g a m b w r y d ® v l j T h e i t m o n f r . v X

Moment Generating Functions (cont’d) W e c a n s i l y w h t m o g r f u k : d M X ( ) j = E [ P ]

Moment Generating Functions (cont’d) : I f M X ( ) = Y o r l 2 ¡ ; s m e > , h n d v i b u . w p + L 1 k g T P y ’

Chernoff bound for the sum of Poisson trials The distribution of a sum of independent 0-1 random variables, which may not be identical. Bernoulli trials: The same as above except that all the random variables are identical.

Chernoff bound for the sum of Poisson trials (cont’d) X i : = 1 ; n m u t a l y d e p - r o v b s w h P [ ] ¡ . L + E ¹ ) M ( ¢ · (Since 1 + y ≤ e y.) F M X ( t ) = E [ e ] 1 2 : n · p + ¡ ¹ , s i c . We will use this result later.

Chernoff bound for the sum of Poisson trials (cont’d) 1 : L t X = + ¢ n , w ; a i d p l s u c P [ ] f 2 . ( ) y > ¸ ¹ · ³ ´ ¡ 3 R 6

Proof of Theorem 1: B y M a r k o v i n e q u l t , f > w h P [ X ¸ d m v i - b l e X ¸ > , P [ ] · E : B y M a r k o v i n e q u l t , f > w h P [ X ¸ ( 1 + d ) ¹ ] = · E ¡ . F s T p 2 < 3 g m b c R 6 5 H (2)和(3)分別可由(1)以微積分的證明方式和簡單的代數運算推導而得, 所以重要的是要會推導(1)。 from (1)

Similarly, we have: T h e o r m L t X = P , w ; : a d p - s l u c [ ] ¹ + d ¡ X probability Similarly, we have: T h e o r m L t X = P n i 1 , w ; : a d p - s l u c [ ] . ¹ E f < ( ) · ¡ ³ ´ 2 C y F j ¸ 3

Example: Let X be the number of heads of n independent fair coin flips Example: Let X be the number of heads of n independent fair coin flips. Applying the above Corollary, we have: P r [ j X ¡ n = 2 ¸ p 6 l ] · e x ( 1 3 ) : 4 B y C h b s v i q u a t , . E V w Better!! ’

Better bounds for special cases h e o r m L t X = 1 + ¢ n , w ; : a i d p v b l s P [ ] ¡ 2 . F y > ¸ · f E ( ) S c ! u g Q B

Better bounds for special cases (cont’d) y L e t X = 1 + ¢ n , w h ; : i d p m v b s P [ ] ¡ 2 . F > j ¸ · Y ( ) f g c

Better bounds for special cases (cont’d) y L e t Y = 1 + ¢ n , w h ; : i d p m v b s P [ ] 2 . ¹ E ( ) F > ¸ · ¡ 3 4 Note: The details can be left for exercises. (See [MU05], pp. 70-71.)

Exercise L e t X b a r n d o m v i l s u c h » G ( p ) . P C ® f , y > [ ] · K ¡

An Application: Set Balancing Given an n  m matrix A with entries in {0,1}, let Suppose that we are looking for a vector v with entries in {1, 1} that minimizes B @ a 1 2 : m . n C A v = c 當||Av||_{\infty}的值愈小,表示該feature的正和負差不多,那麼這分法(即v)對於這feature就是balance了 k A v 1 = m a x i ; : n j c

Set Balancing (cont’d) The problem arises in designing statistical experiments. Each column of matrix A represents a subject in the experiment and each row represents a feature. The vector v partitions the subjects into two disjoint groups, so that each feature is roughly as balanced as possible between the two groups. 當||Av||_{\infty}的值愈小,表示該feature的正和負差不多,那麼這分法(即v)對於這feature就是balance了

Set Balancing (cont’d) For example, A: v: 斑馬 老虎 鯨魚 企鵝 肉食性 1 陸生 哺乳類 產卵 1 1 A v : 1 2 1 希望對每個特性都能分得均勻。 W e o b t a i n h k A v 1 = 2 .

Set Balancing (cont’d) : G v £ m r x A w h s o 1 , - d f ; ¡ u = . T F y q p P [ j ¸ 4 ] · 2 randomly chosen A v m n c  = n

Proof of Set Balancing: d e t h - w A a = ( ; 1 ¢ m ) . S u p k I · 4 l , c y j v > z Z b / 2 g + ¡ B ® ¸ [ ] P r [ n S i = 1 ( j Z > p 4 m l ) ] A v m n ai

References [MR95] Rajeev Motwani and Prabhakar Raghavan, Randomized algorithms, Cambridge University Press, 1995. [MU05] Michael Mitzenmacher and Eli Upfal, Probability and Computing - Randomized Algorithms and Probabilistic Analysis, Cambridge University Press, 2005. 蔡錫鈞教授上課投影片