A Study on PNS and Block Length Switching in MPEG-4 Audio Coding 電通所 碩二 研究生 : 游政勳 指導教授 : 尤信程 老師.

Slides:



Advertisements
Similar presentations
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Advertisements

1 Chemical and Engineering Thermodynamics Chapter 2 Conservation of mass and energy Sandler.
布林代數的應用--- 全及項(最小項)和全或項(最大項)展開式
第七章 抽樣與抽樣分配 蒐集統計資料最常見的方式是抽查。這 牽涉到兩個問題: 抽出的樣本是否具有代表性?是否能反應出母體的特徵?
第二章 太陽能電池的基本原理 及其結構 2-1 太陽能電池的基本原理 2-2 太陽能電池的基本結構 2-3 太陽能電池的製作.
指導教授:陳淑媛 學生:李宗叡 李卿輔.  利用下列三種方法 (Edge Detection 、 Local Binary Pattern 、 Structured Local Edge Pattern) 來判斷是否為場景變換,以方便使用者來 找出所要的片段。
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 參 實驗法.
1 Advanced Chemical Engineering Thermodynamics Appendix BK The Generalized van der Waals Partition Function.
亂數產生器安全性評估 之統計測試 SEC HW7 姓名:翁玉芬 學號:
: OPENING DOORS ? 題組: Problem Set Archive with Online Judge 題號: 10606: OPENING DOORS 解題者:侯沛彣 解題日期: 2006 年 6 月 11 日 題意: - 某間學校有 N 個學生,每個學生都有自己的衣物櫃.
消費者物價指數反映生活成本。當消費者物價指數上升時,一般家庭需要花費更多的金錢才能維持相同的生活水準。經濟學家用物價膨脹(inflation)來描述一般物價持續上升的現象,而物價膨脹率(inflation rate)為物價水準的變動百分比。
STAT0_sampling Random Sampling  母體: Finite population & Infinity population  由一大小為 N 的有限母體中抽出一樣本數為 n 的樣 本,若每一樣本被抽出的機率是一樣的,這樣本稱 為隨機樣本 (random sample)
第 4 章 迴歸的同步推論與其他主題.
1. 假設以下的敘述為一未提供 “ 捷徑計算 ” 能力的程式段,試用程 式設計的技巧,使此敘述經此改 寫的動作後,具有與 “ 捷徑計算 ” 之 處理方法相同之處理模式。 if and then E1 else E2 endif.
STAT0_corr1 二變數的相關性  變數之間的關係是統計研究上的一大目標  討論二分類變數的相關性,以列聯表來表示  討論二連續隨機變數時,可以作 x-y 散佈圖觀察它 們的關係強度  以相關係數來代表二者關係的強度.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
CH22 可靠性加速測試方法 目的 基本假設 加速試驗模式 Inverse Power Model
Wavelet transform and SPIHT 林明德. Wavelet transform & SPIHT Wavelet transform  濾波器組  程式功能  額外資訊 SPIHT  將不同功能的 SPIHT 做整合  用於各種長寬的圖檔  適用於 DSC 的 SPIHT.
Department of Air-conditioning and Refrigeration Engineering/ National Taipei University of Technology 模糊控制設計使用 MATLAB 李達生.
Monte Carlo Simulation Part.2 Metropolis Algorithm Dept. Phys. Tunghai Univ. Numerical Methods C. T. Shih.
1 Part IC. Descriptive Statistics Multivariate Statistics ( 多變量統計 ) Focus: Multiple Regression ( 多元迴歸、複迴歸 ) Spring 2007.
2009fallStat_samplec.i.1 Chap10 Sampling distribution (review) 樣本必須是隨機樣本 (random sample) ,才能代表母體 Sample mean 是一隨機變數,隨著每一次抽出來的 樣本值不同,它的值也不同,但會有規律性 為了要知道估計的精確性,必需要知道樣本平均數.
具備人臉追蹤與辨識功能的一個 智慧型數位監視系統 系統架構 在巡邏模式中 ,攝影機會左右來回巡視,並 利用動態膚色偵測得知是否有移動膚色物體, 若有移動的膚色物體則進入到追蹤模式,反之 則繼續巡視。
信度.
© The McGraw-Hill Companies, Inc., 2008 第 6 章 製造流程的選擇與設計.
論文研討 2 學分 授課教師:吳俊概.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 貳 研究設計.
Chapter 13 塑模靜態觀點:物件圖 Static View : Object Diagram.
微帶線濾波器 國立聯合大學 電機工程學系 主講人 : 徐振剛 何奕叡. 目 錄  設計程序理論說明  1. 微波諧振電路  2. 傳輸線特性  3.Chebyshev filter & Butterworth filter  4. 傳輸線殘段設計濾波器和步階阻抗式低通濾波器  設計模型.
錄音筆,MP3 撥放器, 隨身碟 之原理及規格. 定義 錄音筆 – 以錄音為首要功能 MP3 撥放器 – 以播放音樂為首要功能 隨身碟 – 以行動碟為功能.
第二章 供給與需求 中興大學會計學系 授課老師:簡立賢.
7.1 背景介紹 7.2 多解析度擴展 7.3 一維小波轉換 7.4 快速小波轉換 7.5 二維小波轉換 7.6 小波封包
選舉制度、政府結構與政 黨體系 Cox (1997) Electoral institutions, cleavage strucuters, and the number of parties.
實用管理科學 陳明德、陳武林 著 前程文化 Ch14 決策分析 14-1 本章結構 隨機模式導論 決策分析步驟 決策分析模式與符號 非機率性模式分析 機率性模式分析 貝氏決策分析技術 決策樹的建立 風險分析與敏感度分析.
CH 15- 元件可靠度之驗證  驗證方法  指數模式之可靠度驗證  韋式模式之可靠度驗證  對數常態模式之可靠度驗證  失效數為零時之可靠度估算  各種失效模式之應用.
緒論 統計的範圍 敘述統計 推論統計 有母數統計 無母數統計 實驗設計 統計的本質 大量 數字 客觀.
Fugacity Coefficient and Fugacity
The application of boundary element evaluation on a silencer in the presence of a linear temperature gradient Boundary Element Method 期末報告 指導老師:陳正宗終身特聘教授.
資料結構實習-一 參數傳遞.
Feature Motion for Monocular Robot Navigation. 單視覺機器人 – 追蹤 (tracking) 最常見的機器人導航技術 特徵點特性(特別 匹配性 抗破壞性) 特徵點取得(區塊 尺度不變)
觀測量的權 權的觀念與計算.
方案設計 —評估考核 張 紉.
Section 4.2 Probability Models 機率模式. 由實驗看機率 實驗前先列出所有可能的實驗結果。 – 擲銅板:正面或反面。 – 擲骰子: 1~6 點。 – 擲骰子兩顆: (1,1),(1,2),(1,3),… 等 36 種。 決定每一個可能的實驗結果發生機率。 – 實驗後所有的實驗結果整理得到。
演算法 8-1 最大數及最小數找法 8-2 排序 8-3 二元搜尋法.
Chapter 3 Entropy : An Additional Balance Equation
1 第七章 植基於可調整式量化表及離散餘 弦轉換之浮水印技術. 2 Outlines 介紹 介紹 灰階浮水印藏入 灰階浮水印藏入 灰階浮水印取回 灰階浮水印取回 實驗結果 實驗結果.
介紹不同坐標系之間的轉換 以LS平差方式求解坐標轉換參數
Structural Equation Modeling Chapter 6 CFA 根據每個因素有多重指標,以減少 測量誤差並可建立問卷的構念效度 驗證性因素分析.
廣電新聞播報品質電腦化 評估系統之研發 國立政治大學 資訊科學系 指導教授:廖文宏 學生:蘇以暄.
Learning Method in Multilingual Speech Recognition Author : Hui Lin, Li Deng, Jasha Droppo Professor: 陳嘉平 Reporter: 許峰閤.
描述統計 描述統計(Descriptive Statistics)-將蒐集到的資料加以整理和記錄,並以數字和統計圖表的方式來分析及解釋資料所具有的特性. 基本統計值(平均數,中位數,標準差,變異量….) 相關性測量(卡方,相關係數,迴歸…)
Probability Distribution 機率分配 汪群超 12/12. 目的:產生具均等分配的數值 (Data) ,並以 『直方圖』的功能計算出數值在不同範圍內出現 的頻率,及繪製數值的分配圖,以反應出該 機率分配的特性。
1/17 A Study on Separation between Acoustic Models and Its Application Author : Yu Tsao, Jinyu Li, Chin-Hui Lee Professor : 陳嘉平 Reporter : 許峰閤.
Chapter 7 Sampling Distribution
1 © 2011 台灣培生教育出版 (Pearson Education Taiwan). 2 學習目標 1. 當面對可預測的變異性時,同步管理並改善供應鏈 中的供給。 2. 當面對可預測的變異性時,同步管理並改善供應鏈 中的需求。 3. 當面對可預測的變異性時,使用總體規劃將利潤最 大化。
資訊教育 吳桂光 東海大學物理系助理教授 Tel: 3467 Office: ST223 Office hour: Tue, Fri. (10-11am)
5 重複迴圈 5.1 增減運算符號 增量運算符號 減量運算符號
冷凍空調自動控制 - 系統性能分析 李達生. Focusing here … 概論 自動控制理論發展 自控系統設計實例 Laplace Transform 冷凍空調自動控制 控制系統範例 控制元件作動原理 控制系統除錯 自動控制理論 系統穩定度分析 系統性能分析 PID Controller 自動控制實務.
連續隨機變數 連續變數:時間、分數、重量、……
Teacher : Ing-Jer Huang TA : Chien-Hung Chen 2015/6/30 Course Embedded Systems : Principles and Implementations Weekly Preview Question CH7.1~CH /12/26.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 壹 企業研究導論.
:Commandos ★★★☆☆ 題組: Contest Archive with Online Judge 題號: 11463: Commandos 解題者:李重儀 解題日期: 2008 年 8 月 11 日 題意: 題目會給你一個敵營區內總共的建築物數,以及建築物 之間可以互通的路有哪些,並給你起點的建築物和終點.
指導教授 : 林啟芳 教授 組員 : 邱秉良 林育賢. 何謂 GPS  GPS 即全球定位系統,是一個中距離圓 型軌道衛星導航系統。它可以為地球表面 絕大部分地區( 98% )提供準確的定位、 測速和高精度的時間標準。
第五章IIR數位濾波器設計 濾波器的功能乃對於數位信號進行處理﹐ 以滿足系統的需求規格。其作法為設計一 個系統的轉移函數﹐或者差分方程式﹐使 其頻率響應落在規格的範圍內。本章探討 的是其中一種方法﹐稱為Infinite impulse register(IIR)。 IIR架構說明。 各種不同頻帶(Band)濾波器的設計方法。
: Finding Paths in Grid ★★★★☆ 題組: Contest Archive with Online Judge 題號: 11486: Finding Paths in Grid 解題者:李重儀 解題日期: 2008 年 10 月 14 日 題意:給一個 7 個 column.
幼兒行為觀察與記錄 第八章 事件取樣法.
1 Chemical and Engineering Thermodynamics Chapter 1 Introduction Sandler.
CH 14-可靠度工程之數學基礎 探討重點 失效時間之機率分配 指數模式之可靠度工程.
McGraw-Hill/Irwin © 2003 The McGraw-Hill Companies, Inc.,All Rights Reserved. 肆 資料分析與表達.
Presentation transcript:

A Study on PNS and Block Length Switching in MPEG-4 Audio Coding 電通所 碩二 研究生 : 游政勳 指導教授 : 尤信程 老師

Outline 1. MPEG-4 Audio Coding 2. Psychoacoustics ( 聽覺心理學 ) 3.The structure of MPEG-4 General Audio Coding 4. Perceptual Noise Substitution (PNS, 類雜訊取代 ) 5. The reserch of Block Length Switching 6. Conclusion

MPEG-4 Audio Coding (1) MPEG-4 Audio Coding 概分為三大類 : 1. General audio coding 2. Speech coding 3. Structured Audio

MPEG-4 Audio Coding (2) MPEG-4 Audio Coding 之特性 : 1. Low bit-rate 之壓縮技巧 2. 音訊物件之分類 3. Scalability 之應用

Psychoacoustic (1) 1. 聽覺心理學 (Psychoacoustics) 描述人耳對聲音訊號 的知覺特性 2. 聽覺心理學由聽覺實驗之結果得知 3. 音訊編碼主要利用聽覺心理學來達到壓縮的目的

Psychoacoustic (2) 人耳在靜音環境下的絕對聽覺門檻 :

Psychoacoustic (3) 臨界頻帶 (Critical band):

Psychoacoustic (4) 臨界頻帶之意義 : 1. 人耳之聽覺神經可由多個帶通濾波器 (band pass filter) 所組成之 模型來近似 2. 各頻帶之頻寬, 即為該頻帶中心頻率單頻音所能遮蔽之範圍 ( 頻域之遮蔽 ) 3. 愈高頻帶頻寬愈寬, 訊號愈容易互相遮蔽, 使得人耳對高頻訊號 較不敏感

Psychoacoustic (5) 聲音在頻域上之遮蔽效應 :

Psychoacoustic (6) 能量不同之頻域遮蔽 :

Psychoacoustic (7) 頻域遮蔽效應之分類 : (a) Noise Masking Tone (NMT), (b) Tone Masking Noise (TMN)

Psychoacoustic (8) 頻域遮蔽效應在音訊編碼上應用 : 1. 頻域遮蔽效應可分為 intra-band 與 inter-band 來討論 2. Intra-band: 用 NMT 與 TMN 之區分方式, 來近似頻帶內之遮蔽效應 3. Inter-band: 用 Spreading Function 來概略計算鄰近頻帶間之遮蔽效 應 4. 依上述步驟算出各頻帶訊號之遮蔽門檻, 量化雜訊 (Quantization Noise) 需小於遮蔽門檻

MPEG-4 General Audio Coding(1) 1. MPEG-4 GA 除了沿襲自 MPEG-2 AAC, 並多了 LTP 與 PNS 兩模 組, 以及 BSAC 與 Twin-VQ 兩編碼方式 2. 將訊號在時間上作區塊 (Block) 切分, 並以區塊為單位作時頻轉換 (MDCT) 與量化編碼 3. 有長區塊 (Long block) 與短區塊 (Short block) 兩種區塊長度可供 切換 4. 將頻譜劃分成 49 個 scale factor band, 各頻帶有不同的量化單位, 以 符合聽覺特性 Scalefactor: 各頻帶量化時之控制係數

MPEG-4 General Audio Coding(2)

MPEG-4 General Audio Coding(3) Psychoacoustic Model ( 聽覺心理模型 ): The input of psychoacoustic model: 2048 點 (long block) 或 256 點 (short block) 之時軸訊號與取樣頻率 The output of psychoacoustic model: Signal to mask ratio(SMR) 與決定長短區塊切換之 時機

MPEG-4 General Audio Coding(4) 聽覺心理模型之計算步驟 : Step1. 將該區塊訊號以 FFT 作時頻轉換 Step2. 以前兩個區塊之頻譜來預測現在區塊之頻譜

MPEG-4 General Audio Coding(5) Step3. 求各頻帶之預測誤差總和 c(b), b: band index Step4. 用預測誤差來算各頻帶之 tonality index, 其值介於 0 到 1 之 間, 1 代表 tone, 0 代表 noise Step5. 由 tonality index 求各頻帶之 SMR ( 由 tonality index 可知 訊號中 tone 與 noise 所佔之比例, 即可 利用 NMT 與 TMN 之分類, 來計算 SMR)

MPEG-4 General Audio Coding(6) Step6. 用 Spreading function 來修正各頻帶之 SMR 值 ( 考慮 inter-band) Step7. 將各頻帶之遮蔽門檻, 與靜音時絕對聽覺門檻取較大值 Step8. 由各頻帶之 SMR, 算出各頻帶之 Perceptual Entropy(PE), 並求 所有頻帶 PE 之總和, 以決定長短區塊之切換 由各頻帶之 SMR 值, 可決定各頻帶係數該用多少位元數作量化 ( 量化雜訊需小於遮蔽門檻 )

MPEG-4 General Audio Coding(7) AAC Quantization and Coding: 1. 利用雙巢狀式迴圈, 來達到量化編碼之最佳化 內迴圈 : 控制編碼所使用之位元總數 外迴圈 : 使各頻帶之量化雜訊低於遮蔽門檻 2. 使用 Huffman coding 作編碼, 有 12 種碼簿 (code-book) 可供選擇

Perceptual Noise Substitution (1) PNS 之原理 : 人耳對不同雜訊之判別性低 PNS 之運作 : 1. 對 5 KHz (band 25) 以上之訊號, 判別出類似雜訊的頻 帶 (Noise detection) 2. 類似雜訊之頻帶係數, 不編碼不傳送 3. 解碼端以隨機產生同能量之雜訊, 貼補於該頻帶

Perceptual Noise Substitution (2) PNS 之效果 : 1. 原訊號頻譜 : 2. 不啟動 PNS 解碼 後頻譜 : 3. 啟動 PNS 解碼 後頻譜 :

Perceptual Noise Substitution (3) ISO 標準中之雜訊偵測方法 : (1) 若聽覺心理模型中之 tonality index 小於某門檻值 (2) 前後區塊該頻帶能量之變化不能過大 (1) 與 (2) 同時成立時, 將該頻帶訊號判段成雜訊

Perceptual Noise Substitution (4) ISO 雜訊偵測方法之缺點 : 1. Tonality index 對些微之頻率變化太過敏感 (1)6 KHz 弦波訊號 (2)6 ~6.1KHz 弦波訊號

Perceptual Noise Substitution (5) ISO 雜訊偵測方法之缺點 : 1. Tonality index 對些微之頻率變化太過敏感 (1) 針對 6 KHz 弦波訊號 之統計圖 (2) 針對 6 ~6.1 KHz 弦波訊號 之統計圖

Perceptual Noise Substitution (6) ISO 雜訊偵測方法之缺點 : 2. 用 tonality index 判別不太準確, 且對不同類型音樂之判別性不好 Band: 1~24 Band: 25~49 ( 有作 PNS 考慮之頻帶 )

Perceptual Noise Substitution (7) 新雜訊偵測方法 (Donald Schulz 所提出之概念 ) PQF: Poly-phase Quadrature Filter P: 30 order linear predictor

Perceptual Noise Substitution (8) Noise detection 新方法與 ISO 方法之比較 1: (1) 針對 6 KHz 弦波訊號 (2) 針對 6 ~6.1KHz 弦波訊號

Perceptual Noise Substitution (9) Noise detection 新方法與 ISO 方法之比較 2: ( 針對兩首不同類型之音樂 ) 新方法 : ISO 之方法 :

Perceptual Noise Substitution (10) 相似性貼補之概念與作法 : 1. 除了以雜訊貼補外之另一貼補方式 2. 用相似度夠高之低頻頻帶係數, 貼補於有啟動 PNS 之高頻頻 帶 3. 若相似度不夠高, 仍以雜訊貼補

Perceptual Noise Substitution (11) 相似性之計算 : 1. 六個低頻頻帶為一組, 與高頻頻帶作比較求相似性 …………

Perceptual Noise Substitution (11) 相似性之計算 : 2. 將低頻與高頻頻帶, 兩者之頻寬與總能量調整到一致, 使兩者 有相同之比較基準 3. 將兩組訊號相減求誤差, 再將誤差作正規化 (Normalize), 以此 誤差來判斷相似性

Perceptual Noise Substitution (12) 相似性與雜訊貼補效果之比較 : 1. 原訊號頻譜 : 2. 相似性貼補 解碼後頻譜 : 3. 雜訊貼補 解碼後頻譜 :

Perceptual Noise Substitution (13) 聆聽實驗一 : 新雜訊偵測方法, 並僅以雜訊貼補 聆聽實驗二 : 新雜訊偵測方法, 並 動態切換貼補方式 比較對象 : ISO 標準之方法

Reserch of Block Length Switching(1) 為何使用 block length switching ? (Time resolution vs. Freq resolution) 1. 短區塊 (512 點 ) 有較好之時間解析度 ( 針對 Transient signal ) 2. 長區塊 (2048 點 ) 有較好之頻率解析度, 且編碼效益較好 ( 針對 Stationary signal) 3. 對 Transient signal, 使用長區塊所算出之 SMR 值並不正確, 僅得平 均之結果, 無法反映出訊號頻譜分布在短時間內之變化

Reserch of Block Length Switching(2) 區塊切換示意圖 :

Reserch of Block Length Switching(2) 對 Transient signal, 為何不能用長區塊編碼 ? (32 kbps) (Short)(long) (original)

Reserch of Block Length Switching(3) 對 Transient signal, 為何不能用長區塊編碼 ? (32 kbps) ( 橫軸 : 時間, 縱軸 : 頻率 ) (original) (Short)(long)

Reserch of Block Length Switching(4) 區塊切換之缺點 : 1. 短區塊之編碼效益較差 2. Bit-rate 64 kbps 以上時, 區塊切塊效果以不明顯 ( 位元數已 足夠 ) 3. 區塊切換機制會增加編解碼器與音訊串流之複雜度

Reserch of Block Length Switching(5) 取代區塊切換之方法 : 僅用長區塊編碼配合 Pre-processing and Post-processing)

Reserch of Block Length Switching(6) 取代區塊切換之方法 : (a) Pre-processing: 將該區塊訊號作倍率之調整, 使訊號變小 ( 倍率約 1/6 ~ 1/10) (b) Post-processing: 將訊號以此倍率之倒數, 還原成原大小

Reserch of Block Length Switching(7) 新方法之效能 : ( 新方法 ) (long) (original)

Reserch of Block Length Switching(8) 新方法與 ISO 區塊切換之聆聽實驗結果之比較 : ( 區塊切換門檻值 : 350)

Reserch of Block Length Switching(9) 新方法與 ISO 區塊切換之聆聽實驗結果之比較 : ( 區塊切換門檻值 : -1000, 此值之設定不佳 )

Reserch of Block Length Switching(10) 為何長區塊編碼配合此新方法, 可取代短區塊編碼 ? 對於暫態訊號, 人耳在短瞬間的知覺並不靈敏, 聽覺心理模型並 不適用, 因此僅用量化單位固定之波形編碼 (waveform coding) 即 可有相當之效果

Reserch of Block Length Switching(11) 驗證新方法類似 waveform coding: 比較原訊號與倍率調整後之訊號之量化情形 1. 原訊號量化情形 2. 倍率調整後訊號量化情形

Conclusion and Future Work 1. 新雜訊偵測方法可改進 ISO 方法之缺點, 且相似性貼補對某些類 音樂, 可進一步提升聲音品質 2. 實驗證明, 區塊切換機制可用較簡便之方式來取代 3. 未來在 PNS 的研究上, 可考慮用不同類型或不同機率分布之雜訊, 來動態切換貼補 4. 取代區塊切換之新方法, 是否可以建構在 MPEG-4 標準中原有 之 gain control module