ASR System & LIBDNN Yen-Chen Wu

Slides:



Advertisements
Similar presentations
FCU, Department of ECE, IC Design Research Lab. TEL: # 4945 Pre-SIm , Post-Sim.
Advertisements

本章結構 前言 符號介紹與立透法則 指數機率分配 基本無限來源模式 基本有限來源模式 等候系統的經濟分析-最佳化 進階等候模式 16-1.
建立使用案例敘述 --Use Case Narrative
Mathcad 基本認識 再mathcad中等於(=)的符號有區分為三種: 第一種:冒號等於(:=)是代表我們要定義ㄧ個參數
: A-Sequence 星級 : ★★☆☆☆ 題組: Online-judge.uva.es PROBLEM SET Volume CIX 題號: Problem D : A-Sequence 解題者:薛祖淵 解題日期: 2006 年 2 月 21 日 題意:一開始先輸入一個.
3Com Switch 4500 切VLAN教學.
國立臺北科技大學進修部推廣教 育中心 生活美語會話 課程 英語課程說明 陳韻如 Melody.  課程目的:學生能夠使用簡單的英文以及在 一般英文會話中能夠自然應對並啟發學習英文 興趣  培養學生的聽、說、讀、寫基本能力,且琢 磨於文法、句型、字彙上的練習及應用使學生 透過老師的帶領,進行文化的體驗、發音的矯.
BY OX. 檢視表與資料表的差異性 查詢 (query) 檢視表 (View) 的紀錄,是經由查詢 (query) 而來,而檢 視表的資料來源可以是單一資料表或是多資料表,甚 至其他檢視表 但檢視表中的紀錄只存在資料表中.
1 Advanced Chemical Engineering Thermodynamics Appendix H Brief introduction to perturbation theory of dense fluid.
Graph V(G 1 )={0, 1, 2, 3, 4, 5, 6, 7, 8, 9} E(G 1 )={(0, 2), (0, 3), (1, 4), (2, 3), (2, 5), (2, 6), (3, 6), (3, 7), (4, 7), (5, 6), (5,
1 實驗二 : SIP User Mobility 實驗目的 藉由 Registra 和 Redirect Server 的設計,深入瞭解 SIP 的運 作及訊息格式。 實作部分 ( 1 )實作一個 Registrar 來接收 SIP REGISTER ,而且 要將 REGISTER 中 Contact.
:New Land ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11871: New Land 解題者:施博修 解題日期: 2011 年 6 月 8 日 題意:國王有一個懶兒子,為了勞動兒子,他想了一個 辦法,令他在某天早上開始走路,直到太陽下山前,靠.
: OPENING DOORS ? 題組: Problem Set Archive with Online Judge 題號: 10606: OPENING DOORS 解題者:侯沛彣 解題日期: 2006 年 6 月 11 日 題意: - 某間學校有 N 個學生,每個學生都有自己的衣物櫃.
: ShellSort ★★☆☆☆ 題組: Problem D 題號: 10152: ShellSort 解題者:林一帆 解題日期: 2006 年 4 月 10 日 題意:烏龜王國的烏龜總是一隻一隻疊在一起。唯一改變烏龜位置 的方法為:一隻烏龜爬出他原來的位置,然後往上爬到最上方。給 你一堆烏龜原來排列的順序,以及我們想要的烏龜的排列順序,你.
1.1 電腦的特性 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。 電腦能夠快速處理資料:電腦可在一秒內處理數百萬個 基本運算,這是人腦所不能做到的。原本人腦一天的工 作量,交給電腦可能僅需幾分鐘的時間就處理完畢。
備份部落格資料 Zoundry 為什麼要備份部落格資料?
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
1 網路同步學習 如何使用中山大學管理學院知識管理平台 愷中 製作. 2 如何登入中山大學網路學習平台 1. 首先, 請輸入 2. 點選申請帳號, 依照螢幕所示, 輸入個人資訊.
Intelligent Systems Mu-Chun Su Department of Computer Science & Information Engineering National Central University.
具備人臉追蹤與辨識功能的一個 智慧型數位監視系統 系統架構 在巡邏模式中 ,攝影機會左右來回巡視,並 利用動態膚色偵測得知是否有移動膚色物體, 若有移動的膚色物體則進入到追蹤模式,反之 則繼續巡視。
數位內容學院專業學程 說明會 廖文宏 6/8/2006. 緣由 經濟部工業局為鼓勵優秀學子積極投入數位內 容產業,並縮短業界對於應屆畢業學生的 職前訓練時間,因此委託數位內容學院與大學 院校合作,為即將畢業的大四或研究所學 生,規劃開設數位內容相關課程,讓學生能在 理論與實務兼具的課程中培養數位內容專.
資料處理 汪群超 2 這一年將學習到什麼? 網際網路:你在哪裡?瞭解你的角色、駕馭網路 。 Web 、 FTP 、 、 Proxy 、 Database Servers 記錄你的學習歷程、展現學習成果: Homepage 、 PowerPoint.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
Introduction to Java Programming Lecture 17 Abstract Classes & Interfaces.
:Problem D: Bit-wise Sequence ★★★☆☆ 題組: Problem Set Archive with Online Judge 題號: 10232: Problem D: Bit-wise Sequence 解題者:李濟宇 解題日期: 2006 年 4 月 16.
FGU LDT. FGU EIS 96 ‧ 8 ‧ 25 FGU LDT 佛光大學學習與數位科技學系.
24-6 設定開始與結束場景中的 程式 最後我們要替這個遊戲收個尾, 幫它把開始 的等待畫面跟結束畫面處理一下。
最新計算機概論 第 5 章 系統程式. 5-1 系統程式的類型 作業系統 (OS) : 介於電腦硬體與 應用軟體之間的 程式,除了提供 執行應用軟體的 環境,還負責分 配系統資源。
台灣客家知識治理之研究 -- 以 行政院客委會為例 發表人: 彭安麗 南華大學公共行政與政策研究所助理教授 發表人: 彭安麗 南華大學公共行政與政策研究所助理教授
: Fast and Easy Data Compressor ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 10043: Fast and Easy Data Compressor 解題者:葉貫中 解題日期: 2007 年 3.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 資料蒐集的方法.
行政院國家科學委員會工程技術發展處自動化學門 * 試以國立成功大學製造工程研究所 鄭芳田教授 產學合作計畫 : 智慧預測保養系統之設計與實作 成果報告盤點為範例 國科會工程處專題計畫成果典藏 自動化學門成果報告盤點範例.
: Problem A : MiniMice ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11411: Problem A : MiniMice 解題者:李重儀 解題日期: 2008 年 9 月 3 日 題意:簡單的說,題目中每一隻老鼠有一個編號.
: Ahoy, Pirates! ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11402: Ahoy, Pirates! 解題者:李重儀 解題日期: 2008 年 8 月 26 日 題意:有一個海盜島有 N 個海盜,他們的編號 (id)
:Nuts for nuts..Nuts for nuts.. ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 10944:Nuts for nuts.. 解題者:楊家豪 解題日期: 2006 年 2 月 題意: 給定兩個正整數 x,y.
校外使用圖書館購置之資料庫 龍華大學圖書館. 讀者遠端認證 (RPA) 設定說明  透過圖書館架設完成的 RPA (Remote Patron Authentication) 讀者遠端認證代理主 機系統,讀者於校外或院外 可直接連線使 用本館所提供的資料庫。  若非使用本館電子資料,請勿設定此代理.
教材名稱:網際網路安全之技術及其應用 (編號: 41 ) 計畫主持人:胡毓忠 副教授 聯絡電話: 教材網址: 執行單位: 政治大學資訊科學系.
從此處輸入帳號密碼登入到管理頁面. 點選進到檔案管理 點選「上傳檔案」上傳資料 點選瀏覽選擇電腦裡的檔案 可選擇公開或不公開 為平台上的資料夾 此處為檔案分類,可顯示在展示頁面上,若要參加 MY EG 競賽,做品一律上傳到 “ 98 MY EG Contest ” 點選此處確定上傳檔案.
The application of boundary element evaluation on a silencer in the presence of a linear temperature gradient Boundary Element Method 期末報告 指導老師:陳正宗終身特聘教授.
資料結構實習-一 參數傳遞.
6-2 認識元件庫與內建元件庫 Flash 的元件庫分兩種, 一種是每個動畫專 屬的元件庫 (Library) ;另一種則是內建元 件庫 (Common Libraries), 兩者皆可透過 『視窗』功能表來開啟, 以下即為您說明。
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2008.
: Beautiful Numbers ★★★★☆ 題組: Problem Set Archive with Online Judge 題號: 11472: Beautiful Numbers 解題者:邱經達 解題日期: 2011 年 5 月 5 日 題意: 若一個 N 進位的數用到該.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
資料結構實習-二.
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
2010 MCML introduction 製作日期: 2010/9/10 製作人 : 胡名霞.
-Antidifferentiation- Chapter 6 朝陽科技大學 資訊管理系 李麗華 教授.
845: Gas Station Numbers ★★★ 題組: Problem Set Archive with Online Judge 題號: 845: Gas Station Numbers. 解題者:張維珊 解題日期: 2006 年 2 月 題意: 將輸入的數字,經過重新排列組合或旋轉數字,得到比原先的數字大,
Linguistics phonetic symbols. 先下載 IPA 字型檔案,執行安裝。 由於這個程式的字型目錄設定錯誤, 所以等重新開機時就會發現字型消失。 所以必須根據以下步驟來讓 Windows 加入 IPA 字型。
廣電新聞播報品質電腦化 評估系統之研發 國立政治大學 資訊科學系 指導教授:廖文宏 學生:蘇以暄.
Open Services Gateway Initiative (OSGi) Service Platform 1 OSGi Architecture.
1/17 A Study on Separation between Acoustic Models and Its Application Author : Yu Tsao, Jinyu Li, Chin-Hui Lee Professor : 陳嘉平 Reporter : 許峰閤.
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2009.
線上寫作之語音評閱 – 以中央大學進修英文課程中 之「寫作報告」為例 中央大學語言中心 劉詠華 January 22, 2007.
如何使用 Yahoo Messenger Yahoo Messenger 雅虎即時通 讓你在第一時間內和上線的朋 友溝通!
論文閱讀報告 論文題目:應用模糊理論於颱風降雨量之推估 作者:陳正彬. 模糊化類神經網路 ‧模糊系統的建立 1. 由人類專家建立規則 ex:if 風速大 then 降雨量高 效果受到規則庫完整的影響 2. 經由訓練法則從數值資料得到模糊規則.
-Artificial Neural Network- Matlab操作介紹 -以類神經網路BPN Model為例
Visual C++重點複習.
資料結構實習-六.
1 Introduction to Java Programming Lecture 2: Basics of Java Programming Spring 2010.
OmniFile Full Text 系列資料庫 個人化服務設定步驟. 此相關資料庫之個人化服 務只提供類似專題選粹的 服務,然無提供 mail 通知的 服務,讀者可建立個人 ID , 並儲存檢索策略,日後需 再進入該資料庫,查詢檢 索策略之新進文章。 導航目次 個人化服務說明 個人帳號密碼申請 個人化服務設定.
Microsoft Excel.
實體關係模型 (ER Model).
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
著作權所有 © 旗標出版股份有限公司 第 14 章 製作信封、標籤. 本章提要 製作單一信封 製作單一郵寄標籤.
幼兒行為觀察與記錄 第八章 事件取樣法.
第 1 章 PC 的基本構造. 本章提要 PC 系統簡介 80x86 系列 CPU 及其暫存器群 記憶體: Memory 80x86 的分節式記憶體管理 80x86 的 I/O 結構 學習組合語言的基本工具.
學校本位暨教師自我 專業進修研習規劃服務 教育訓練 指導單位:教育部 執行單位:全國教師在職進修資訊網 講 師:國立高雄師範大學進修學院教師生涯專業發展研究中心 曾子唐 專任研究助理 尤嬿琇 專任研究助理.
Presentation transcript:

ASR System & LIBDNN Yen-Chen Wu r03942044@ntu.edu.tw 台大語音實驗室 暑期專題研究 ASR System & LIBDNN Yen-Chen Wu r03942044@ntu.edu.tw

Outline DNN in Speech Recognition DNN TIMIT Introduction How to use libdnn

DNN IN SPEECH RECOGNITION

Speech Recognition In speech processing… each word consists of syllables each syllable consists of phonemes Each time frame, with an observance (vector) mapped to a phoneme. “青色” → “青(ㄑㄧㄥ)色(ㄙㄜ、)” → ”ㄑ” (syllables) 青:TSI --I –N (phonemes) 色:S--@ (phonemes)

Observation Sequences Sample Rate: 16000 Observation Sequences         10 ms 25 ms sliding window       frames of features Digital Speech Processing Lect. 2.0 Frame 1 Frame 2 Frame 3

DNN in Speech Recognition Goal: predict phoneme given feature in each time frame. Frame-wise prediction Input: acoustic features MFCC, FBANK or... Output: pronunciation units Phonemes or... To know more about Automatic Speech Recognition(ASR), please refer to http://speech.ee.ntu.edu.tw/DSP2015Spring/

Training Deep Neural Network

Main Problems Model initialize Feedforward Backpropagate Update Predict

Model Initialize DNN sometimes fails at local optimum problem, so initialization matters. Practically, there exists unsupervised pre-training technique on initialization. However, in this homework, we recommend you initialize them randomly for the simplicity and efficiency.

Feedforward

Backpropagate

Update

Evaluation Framewise phoneme prediction Frame Accuracy

WHY DNN? Basic Model in Deep Learning Network Structure Feature Extraction (Representation) Variety of Structures (CNN, RNN, LSTM, NTM…etc) Network Structure How many layers? Number of neurons in each layer Training Parameter Learning Rate Batch Size

Dataset and Format

Dataset TIMIT(Texas Instrument and Massachusetts Institute of Technology) Well-transcribed speech of American English speakers of different sexes and dialects. Designed for the development and evaluation of ASR systems.

Dataset Each instance consists of 3 parts: speaker faem0, sentence si1392, the 37th frame

Data Format WAV file: Speak-Sentence ID + .wav Check by your ear(s) ARK file: Instance ID + features TODO

HOW TO USE LIBDNN

LIBDNN libdnn 是一個輕量、好讀、人性化的深層學習函式 庫。由 C++ 和 CUDA 撰寫而成,目的是讓開發人 員、研究人員、或任何有興趣的人都可以輕鬆體驗 並駕馭深層學習所帶來的威力。 Ref: 以深層與卷積類神經網路建構聲學模型之大字彙連續 語音辨識 ( Deep and Convolutional Neural Networks for Acoutic Modeling in Large Vocabulary Continuous Speech Recognition ) 已安裝於專題生工作站

資料格式(一) 稀疏矩陣( LibSVM ) 這個向量大部分的值都是0,只有少數幾維的值為1

資料格式(二) 緊密排列的方式(dense) 本次練習給的格式

如何使用 主要有以下三個程式: 會將指令寫成shell-script 直接修改參數即可 nn-init nn-train nn-init [train_set_file] <-o> <--input-dim> <--struct> [options] EX: nn-init -o init.model --input-dim 69 --struct 1024 --output-dim 39 nn-train nn-train <training_set_file> <model_in> [valid_set_file] [model_out] <--input-dim> [options] EX: nn-train train.dat init.model --input-dim 69 nn-predict nn-predict <testing_set_file> <model_file> [output_file] <--input- dim> [options] EX: nn-predict test.dat train.model --input-dim 69 會將指令寫成shell-script 直接修改參數即可

WORK STATION 專題生開工作站帳號請找 ssh -p 2822 your_account@140.112.21.35 實驗室網管: 廖宜修 r03921048@ntu.edu.tw ssh -p 2822 your_account@140.112.21.35 進入工作站後先確認data位置 /home/wyc2010/DNN_practice 複製run.sh回到自己的家目錄 cp /home/wyc2010/DNN_practice/run.sh 開始實驗! sh run.sh