Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.

Slides:

Advertisements

Similar presentations

1 生物計算期末作業暨南大學資訊工程系 2003/05/13. 2 compare f1 f2  只比較兩個檔案 f1 與 f2 ，比完後將結果輸出。 compare directory  以兩兩比對的方式，比對一個目錄下所有檔案的相似程度。  將相似度很高的檔案做成報表輸出，報表中至少要.

Advertisements

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

Chapter 10 馬可夫鏈緒言如果讀者仔細觀察日常生活中所發生的諸多事件，必然會發現有些事件的未來發展或演變與該事件現階段的狀況全然無關，這種事件稱為獨立試行過程 (process of independent trials) ；而另一些事件則會受到該事件現階段的狀況影響。

第三講 Recode、missing value、假設檢定與信賴區間

布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式

第七章抽樣與抽樣分配蒐集統計資料最常見的方式是抽查。這牽涉到兩個問題：抽出的樣本是否具有代表性?是否能反應出母體的特徵?

1 Q10276: Hanoi Tower Troubles Again! 星級 : ★★★ 題組： Online-judge.uva.es PROBLEM SET Volume CII 題號： Q10276: Hanoi Tower Troubles Again! 解題者：薛祖淵解題日期： 2006.

Section 1.2 Describing Distributions with Numbers 用數字描述分配.

Event Sampling 事件取樣法. 關心重點為「事件」本身明確的焦點行為清楚掌握主題 - 當「事件」出現時才開始記錄記錄程序等待目標事件的發生開始記錄事件結束，停止記錄.

指導教授：陳淑媛學生：李宗叡李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換，以方便使用者來找出所要的片段。

亂數產生器安全性評估之統計測試 SEC HW7 姓名：翁玉芬學號：

Review of Chapter 3 - 已學過的 rules( 回顧 )- 朝陽科技大學資訊管理系李麗華教授.

:New Land ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 11871: New Land 解題者：施博修解題日期： 2011 年 6 月 8 日題意：國王有一個懶兒子，為了勞動兒子，他想了一個辦法，令他在某天早上開始走路，直到太陽下山前，靠.

消費者物價指數反映生活成本。當消費者物價指數上升時，一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹（inflation）來描述一般物價持續上升的現象，而物價膨脹率（inflation rate）為物價水準的變動百分比。

STAT0_sampling Random Sampling  母體： Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣本，若每一樣本被抽出的機率是一樣的，這樣本稱為隨機樣本 (random sample)

1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段，試用程式設計的技巧，使此敘述經此改寫的動作後，具有與 “ 捷徑計算 ” 之處理方法相同之處理模式。 if and then E1 else E2 endif.

MATLAB 程式設計第 11 章多維陣列多維陣列的定義在 MATLAB 的資料型態中，向量可視為一維陣列，矩陣可視二維陣列，對於維度 (Dimensions) 超過 1 的陣列則均可視為「多維陣列」 (Multidimesional Arrays ，簡稱 N-D Arrays)

Section 2.2 Correlation 相關係數. 散佈圖 1 散佈圖 2 散佈圖的盲點兩座標軸的刻度不同，散佈圖的外觀呈現的相聯性強度，會有不同的感受。散佈圖 2 相聯性看起來比散佈圖 1 來得強。以統計數字相關係數做為客觀標準。

第 18 章名稱空間與例外處理 18-1 名稱空間 18-1 名稱空間 18-2 例外處理 18-2 例外處理.

8.1 何謂高度平衡二元搜尋樹 8.2 高度平衡二元搜尋樹的加入 8.3 高度平衡二元搜尋樹的刪除

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.

Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.

2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ，才能代表母體 Sample mean 是一隨機變數，隨著每一次抽出來的樣本值不同，它的值也不同，但會有規律性為了要知道估計的精確性，必需要知道樣本平均數.

JAVA 程式設計與資料結構第十章 GUI Introdution III. File Chooser  File Chooser 是一個選擇檔案的圖形介面，無論我們是要存檔還是要開啟檔案，使用這個物件都會讓我們覺得容易且舒適。

Chapter 13 塑模靜態觀點：物件圖 Static View : Object Diagram.

Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.

:Problem D: Bit-wise Sequence ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 10232: Problem D: Bit-wise Sequence 解題者：李濟宇解題日期： 2006 年 4 月 16.

24-6 設定開始與結束場景中的程式最後我們要替這個遊戲收個尾, 幫它把開始的等待畫面跟結束畫面處理一下。

: The largest Clique ★★★★☆ 題組： Contest Archive with Online Judge 題號： 11324: The largest Clique 解題者：李重儀解題日期： 2008 年 11 月 24 日題意：簡單來說，給你一個 directed.

Matlab Assignment Due Assignment 兩個 matlab 程式 : Eigenface ： Eigenvector 和 eigenvalue 的應用. Fractal ： Affine transform( rotation, translation,

Chapter 20 塑模動態觀點：狀態圖 Statechart Diagram. 學習目標  說明狀態圖的目的  定義狀態圖的基本記號  展示狀態圖的建構  定義活動、內部事件及遞延事件的狀態圖記號.

: Fast and Easy Data Compressor ★★☆☆☆ 題組： Problem Set Archive with Online Judge 題號： 10043: Fast and Easy Data Compressor 解題者：葉貫中解題日期： 2007 年 3.

第三章自動再裝載運用篇使用時機：裝載計劃完成時，尚有剩餘空間的情形，維持已固定計劃而繼續做裝載最佳化。以支持次日裝載計劃而提前調整作業模式。裝載物品設定和裝載容器設定如前兩章介紹，於此不再重複此動作，直接從裝載計劃設定開始，直接從系統內定的物品和容器選取所需.

Fourier Series. Jean Baptiste Joseph Fourier (French)(1763~1830)

: Count DePrimes ★★★★☆ 題組： Contest Archive with Online Judge 題號： 11408: Count DePrimes 解題者：李育賢解題日期： 2008 年 9 月 2 日題意：題目會給你二個數字 a,b( 2 ≦ a ≦ 5,000,000,a.

第 9 章群集分析：額外的議題與演算法 © 2008 台灣培生教育出版 (Pearson Education Taiwan)

Fugacity Coefficient and Fugacity

: Multisets and Sequences ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 11023: Multisets and Sequences 解題者：葉貫中解題日期： 2007 年 4 月 24 日題意：在這個題目中，我們要定義.

:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 10944:Nuts for nuts.. 解題者：楊家豪解題日期： 2006 年 2 月題意：給定兩個正整數 x,y.

資料結構實習-一參數傳遞.

公用品.  該物品的數量不會因一人的消費而受到影響，它可以同時地被多人享用。角色分配  兩位同學當我的助手，負責：  其餘各人是投資者，每人擁有 $100 ，可以投資在兩種資產上。  記錄  計算  協助同學討論.

: Lucky Number ★★★★☆ 題組： Proble Set Archive with Online Judge 題號： 10909: Lucky Number 解題者：李育賢解題日期： 2008 年 4 月 25 日題意：給一個奇數數列 1,3,5,7,9,11,13,15…

Section 4.2 Probability Models 機率模式. 由實驗看機率實驗前先列出所有可能的實驗結果。 – 擲銅板：正面或反面。 – 擲骰子： 1~6 點。 – 擲骰子兩顆： (1,1),(1,2),(1,3),… 等 36 種。決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。

JAVA 程式設計與資料結構第二十章 Searching. Sequential Searching Sequential Searching 是最簡單的一種搜尋法，此演算法可應用在 Array 或是 Linked List 此等資料結構。 Sequential Searching 的 worst-case.

演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.

逆向選擇和市場失調. 定義  資料不對稱在交易其中，其中一方較對方有多些資料。  逆向選擇出現在這個情況下，就是當買賣雙方隨意在市場上交易，與比較主動交易者作交易為佳。

845: Gas Station Numbers ★★★ 題組： Problem Set Archive with Online Judge 題號： 845: Gas Station Numbers. 解題者：張維珊解題日期： 2006 年 2 月題意：將輸入的數字，經過重新排列組合或旋轉數字，得到比原先的數字大，

Linguistics phonetic symbols. 先下載 IPA 字型檔案，執行安裝。由於這個程式的字型目錄設定錯誤，所以等重新開機時就會發現字型消失。所以必須根據以下步驟來讓 Windows 加入 IPA 字型。

Chapter 10 m-way 搜尋樹與B-Tree

演算法課程 (Algorithms) 國立聯合大學資訊管理學系陳士杰老師 Course 7 貪婪法則 Greedy Approach.

JAVA 程式設計與資料結構第十六章 Hash Tables. Introduction Hash Tables 結構為一個 Array ，稱之為 Bucket array 。如果想要新增一個物件，要根據這個物件的特性將其加入 Hash Table 內。 Bucket Array 用 A 來代替，其.

Probability Distribution 機率分配汪群超 12/12. 目的：產生具均等分配的數值 (Data) ，並以『直方圖』的功能計算出數值在不同範圍內出現的頻率，及繪製數值的分配圖，以反應出該機率分配的特性。

1/17 A Study on Separation between Acoustic Models and Its Application Author : Yu Tsao, Jinyu Li, Chin-Hui Lee Professor : 陳嘉平 Reporter : 許峰閤.

Cluster Analysis 目的 – 將資料分成幾個相異性最大的群組基本問題 – 如何衡量事務之間的相似性 – 如何將相似的資料歸入同一群組 – 如何解釋群組的特性.

: Problem E Antimatter Ray Clearcutting ★★★★☆ 題組： Problem Set Archive with Online Judge 題號： 11008: Problem E Antimatter Ray Clearcutting 解題者：林王智瑞.

連續隨機變數連續變數：時間、分數、重量、……

Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.

:Commandos ★★★☆☆ 題組： Contest Archive with Online Judge 題號： 11463: Commandos 解題者：李重儀解題日期： 2008 年 8 月 11 日題意：題目會給你一個敵營區內總共的建築物數，以及建築物之間可以互通的路有哪些，並給你起點的建築物和終點.

: Place the Guards ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 11080: Place the Guards 解題者：陳盈村解題日期： 2008 年 3 月 26 日題意：有一個國王希望在他的城市裡佈置守衛，

: Finding Paths in Grid ★★★★☆ 題組： Contest Archive with Online Judge 題號： 11486: Finding Paths in Grid 解題者：李重儀解題日期： 2008 年 10 月 14 日題意：給一個 7 個 column.

:Problem E.Stone Game ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 10165: Problem E.Stone Game 解題者：李濟宇解題日期： 2006 年 3 月 26 日題意： Jack 與 Jim.

:Rings and Glue ★★☆☆☆ 題組： Problem Set Archive with Online Judge 題號： 10301: Rings and Glue 解題者：施博修解題日期： 2011 年 5 月 18 日題意：小約翰有了個大麻煩，他不小心將 rings.

幼兒行為觀察與記錄第八章事件取樣法.

第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群記憶體： Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構學習組合語言的基本工具.

: How many 0's? ★★★☆☆ 題組： Problem Set Archive with Online Judge 題號： 11038: How many 0’s? 解題者：楊鵬宇解題日期： 2007 年 5 月 15 日題意：寫下題目給的 m 與 n(m

McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆資料分析與表達.

1 柱體與錐體 1. 找出柱體與錐體的規則 2. 柱體的命名與特性 3. 柱體的展開圖 4. 錐體的命名與特性 5. 錐體的展開圖

Presentation transcript:

Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤

大綱介紹半自動單元選取機制全域音素決策樹

Outline Introduction Semi-automatic Unit Selection Global Phonetic Decision Tree

介紹將 learning method 開發在多語言的辨識上是為了 1. 提高多語言的訓練資料的效益 2. 降低在語言不同時無法對應的情況

Introduction Why do we develope learning method for multilingual speech recognition ? Maximizing the benefit of boosting the acoustic training data from multiple source language Minimizing the negative effects of data impurity arising from language mismatch

Semi-automatic Unit Selection 當兩種不同語言的音素分享同一個以萬國音標為基礎的通用音素符號時, 他們的相似度並不一定夠高下圖為西班牙文及義大利文的比較,X 軸為 KL distance

半自動單元選取機制

將多語言的音素都表示成為了方便表示再將分開的語言的音素表示成再將這些資料來訓練 HMM

半自動單元選取機制接著使用 K-mean cluster 將 phone 分別聚集起來, 而其中兩個 phone 之間的距離使用 KL distance 來計算, 接著會產生一個新的符號用來表示在同一個 cluster 中的 phone, 最後得到的這群新的符號便可以拿來當成全部語言所共用的 phone

半自動單元選取機制

Global Phonetic Decision Tree 在上下文相依的模型中常用的基本單元為 triphone, 但是這樣會需要相當多的模型, 例如當一個語言需要 30 個音素來描述時, 此時模型的數量為 30 的三次方, 這是非常龐大的欲解決此問題, 需建立決策樹, 對每一個 base phone 的每一個 Markov state ，皆建立一 Decision Tree

12/13 全域音素決策樹而在全域決策樹的運用中, 我們將所有的狀態都集中於根節點中, 來建造這棵決策樹, 而要將樹往下分類所問的問題必須包含, 現在的狀態, 現在的音素及當下前後兩音素, 在其他方面則跟建普通的決策樹一樣步驟全域決策樹可以讓不同的音素及狀態作結合

全域音素決策樹