6.符号化法(6章).

Slides:



Advertisements
Similar presentations
SPSSによるHosmer-Lemeshow検定について
Advertisements

あなたは真夜中に 山の頂上を目指す登山者です
1 ソフトウェア工学 200 5 年 5セメスタ. 2 履修にあたって 教科書:「アルゴリズムとデータ構造」 平田富夫著 森北出版 講義:5セメスター開講、専門科目、 K318 、金曜4時限 担当: 草苅 良至 GI511, 2095、 参考書:「プログラミング作法」
レポート書き方. おしいレポート よく調べてある それぞれの、1文の言っていることは正 しい しかし、全体として、何が言いた いのかわからない 内容の重要だが、全体の構成も重 要である.
1 7.時間限定チューリングマシンと クラス P. 2 7 -1.入力サイズ チューリングマシンの入力記号 の長さ を 入力サイズという。 名称:合成数の問題 インスタンス:整数n 問:nは合成数か? 通常は、入力サイズとしてはもっとも短い表現での 長さが利用される。 例えば、次のような合成数の問題における入力サイズは、
7.n次の行列式   一般的な(n次の)行列式の定義には、数学的な概念がいろいろ必要である。まずそれらを順に見ていく。
9.線形写像.
概要 2009 年 10 月 23 日に、いて座に出現した X 線新星 (XTE J ) を、出現から消滅まで 全天 X 線監視装置 MAXI (マキシ)で観測したところ、 新種のブラックホール新星であることが判明した。 従来のブラックホールを、 多量のガスを一気に飲み込む「肉食系」と.
3.多項式計算アルゴリズム べき乗の計算 多項式の計算.
時間的に変化する信号. 普通の正弦波 は豊富な情報を含んでいません これだけではラジオのような複雑な情報 を送れない 振幅 a あるいは角速度 ω を時間的に変化 させて情報を送る.
情報処理A 第10回 Excelの使い方 その3.
九州大学 岡村研究室 久保 貴哉 1. 利用中のAPの数の推移 2 横軸:時刻 縦軸:接続要求数 ・深夜では一分間で平均一台、 昼間では平均14台程度の接続 要求をAPが受けている。 ・急にAPの利用者数が増えてく るのは7~8時あたり.
麻雀ゲーム 和島研究室 ソ 小林巧人
5.連立一次方程式.
1 情報量(2章). 2 物理的概念との対比1(入れ物と中 身) 塩水 塩 データ 情報 情報の量? 塩分の量! 情報の量は見た目ではわ からない。データと情報 は異なる概念。 塩分の量は見た目 ではわからない。 しかし、本質的な もの。
―本日の講義― ・平均と分散 -代表値 -ぱらつき(分散・標準偏差等) ・Excelによる演習
論理回路 第2回 今日の内容 前回の課題の説明 数の体系 – 数の表現 – 代表的な数 – 基数の変換 – 補数.
ノイズ. 雑音とも呼ばれる。(音でなくても、雑 音という) 入力データに含まれる、本来ほしくない 成分.
この資料は、情報工学レクチャーシリーズ オペレー ティングシステム 松尾啓志 著(森北出版株式会 社)を用いて授業を行うために、名古屋工業大学松 尾啓志、津邑公暁が作成しました。 パワーポイント2007で最終版として保存しているため、変更はできませ
09bd135d 柿沼健太郎 重不況の経済学 日本の新たな 成長へ向けて.
素数判定法 2011/6/20.
地球温暖化と 天候の関係性 ~温暖化は天候のせいなのではないのか~. 目的課題 地球温暖化現象 ただの気象条件によるものではないのか? 地球温暖化現象に天候は関係しているの か?
1章 行列と行列式.
本宮市立白岩小学校. 1 はじめに 2 家庭学習プログラム開発の視点 ① 先行学習(予習)を生かした 確かな学力を形成する授業づく り ② 家庭との連携を図った家庭学習の習慣化.
プログラミングⅠ( 1 組) 第 9 回
フーリエ級数. 一般的な波はこのように表せる a,b をフーリエ級数とい う 比率:
プログラミング入門2 第4回 式文 代入式 論理演算子 ループの脱出、スキップ 情報工学科 篠埜 功.
3.エントロピーの性質と各種情報量.
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
Excelによる積分.
1 6.低次の行列式とその応用. 2 行列式とは 行列式とは、正方行列の特徴を表す一つのスカ ラーである。すなわち、行列式は正方行列からスカ ラーに写す写像の一種とみなすこともできる。 正方行列 スカラー(実数) の行列に対する行列式を、 次の行列式という。 行列 の行列式を とも表す。 行列式と行列の記号.
計算のスピードアップ コンピュータでも、sin、cosの計算は大変です 足し算、引き算、掛け算、割り算は早いです
線形符号(10章).
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
10.PとNP完全問題との境界.
複素数.
4.プッシュダウンオートマトンと 文脈自由文法の等価性
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
信号測定. 正弦波 多くの場合正弦波は 0V の上下で振動する しかし、これでは AD 変換器に入れら れないので、オフ セットを調整して データを取った.
1 9.線形写像. 2 ここでは、行列の積によって、写像を 定義できることをみていく。 また、行列の積によって定義される写 像の性質を調べていく。
通信路(7章).
1 情報理論 2008 年度 4 セメスター. 2 履修にあたって 担当 – 草苅 良至(部屋GI511、内線209 5 ) 教科書 平田廣則著「情報理論のエッセンス」 昭晃堂、 \2,700- ・参考書 今井秀樹著「情報理論」 昭晃堂、 \2,900-
3.プッシュダウンオートマトンと 文脈自由文法
ビット. 十進数と二進数 十進数  0から9までの数字を使って 0、1、2、3、4、5、6、7、8、9、 10、11、12 と数える 二進数  0と1を使って 0、1、10、11、100、101、11 0、111 と数える.
重不況の経済学 第2章第2節 山下 真弘. 不均等成長 不均等成長=市場の特定の製品または特定の国・ 地域で付加価値の縮小が生じること 要因は2つ 製品別の「生産性向上速度の差」 付加価値総額の天井(=需要制約)
アルゴリズムとデータ構造 補足資料14-1 「ハッシュ法」
3.正方行列(単位行列、逆行列、対称行列、交代行列)
様々な情報源(4章).
論理回路 第1回. 今日の内容 論理回路とは? 本講義の位置づけ,達成目標 講義スケジュールと内容 受講時の注意事項 成績の評価方法.
伝わるスライド 中野研究室 M2 石川 雅 信. どのようなスライドを作れば良 いか 伝えたいこと.
方程式を「算木」で 解いてみよう! 愛媛大学 教育学部 平田 浩一.
データベース入門 日進高等学校 情報化推進委員会. 表計算ソフトとの比較 表計算ソフト (Excel) データベース ( Access ) 編集 二人目はデータの編集が ロックされる 複数の人が同時にデータ を 編集できる 信頼性 ファイルの数だけ データが存在する データは一つ データ処理 自由.
C言語応用 構造体.
3.多項式計算アルゴリズム べき乗の計算 多項式の計算.
階層分析法. 表3. 1 ルートR1R1 R2R2 R3R3 R4R4 R5R5 F1F1 最寄駅までの所要 時間(分) 10 7 F2F2 実乗車時間(分) F3F3 片道切符(円) ヶ月定期(円) 11,21011,9309,75012,46012,720.
偏微分方程式の境界値問題を 基礎とするデジタル画像解析
HKS Analysis Log Jul 2006 Part1 D.Kawama. 第壱部 HKS Sieve Slit Analysis.
1 プログラミング言語論 第13回 プログラムの意味論と検証 (2) 表示的意味論 担当:犬塚. 2 表示的意味論 denotational semantics  表示的意味論では、プログラムの要素とそれが 意味するものを対応付ける。 変数 式 文 A B … A+2 2B+C A:=A+2 if.
8.任意のデータ構造 (グラフの表現とアルゴリズム)
プログラミング入門2 第3回 複合文、繰り返し 情報工学科 篠埜 功.
メニューに戻る メニューに戻る | 前表示スライド 前表示スライド G*power 3 の web ページ Windows はこちら Mac はこちら ダウンロード後,実行してインストール.
第14回 プログラムの意味論と検証(3) 不動点意味論 担当:犬塚
実験5 規則波 C0XXXX 石黒 ○○ C0XXXX 杉浦 ○○ C0XXXX 大杉 ○○ C0XXXX 高柳 ○○ C0XXXX 岡田 ○○ C0XXXX 藤江 ○○ C0XXXX 尾形 ○○ C0XXXX 足立 ○○
オセロの思考アルゴリズムについて 1103072 岩間 隆浩.
1 アルゴリズムの高速化. 2 アルゴリズムにおける 大幅な性能アップ 多項式時間アルゴリズム VS 対数時間アルゴリズム (最大公約数の問題) 指数時間アルゴリズム VS 多項式時間アルゴリズム (フィボナッチ数列を求める問題)
音の変化を視覚化する サウンドプレイヤーの作成
プログラミングの基礎知識 プログラミングの手順と重要概念 アルゴリズム. プログラミングの手順 コーディング エディタなどでコードを記述 コンパイル・インタープリタ 実行可能な形に翻訳 デバッグ(虫取り、不具合の調整) 完成!
本文. 考えながら読みましょ う 「いろいろなこと」( 3 行目)は何で すか 「①電話料金はコンビニで支払いをしていま す。いつでも払えますから、便利です。」 「②夕食はコンビニで買います。お弁当やお かずがいろいろありますから。」今、若者に 人気のあるコンビニは、いろいろなことをす るのに非常に便利な場所になった。
11万km上空のかぐやから見た地球. デジタル信号処理 Digital Signal Processing 2010 年度春学期 Spring Semester, 2010 担当者: 栗濱 忠司( Professor ) 第3週第3週.
地球儀と様々な地図. 1 球体としての地球 こうした現象はあることをイ メージすると理解できる。
Presentation transcript:

6.符号化法(6章)

情報源符号化定理と符号化法 情報源符号化定理(シャノンの第1定理)は、符号化の理論的限界を与えているだけであり、具体的な符号化の手法を与えてはいない。すなわち、ある情報源に対して、エントロピーは平均符号長の“目標”にすぎない。 ここでは、具体的な符号化法を与える。

代表的(情報源)符号化法 シャノン・ファノ符号化(算術符号化) ハフマン符号化(コンパクト符号化) 確率を2進数化して符号化する。 最小の平均符号長を持つ符号 (コンパクト符号)を実現する符号。 符号の木の葉から符号を割り当てていく。

P進数と基数変換 (シャノン・ファノ符号化法の準備1)

p進数 種類の記号 を基に、 数を表現することができる。小数点以上n桁、小数点以下m桁の 進数 は以下の値を持つ。ただし、   種類の記号               を基に、 数を表現することができる。小数点以上n桁、小数点以下m桁の  進数 は以下の値を持つ。ただし、 基数を明示する表記 整数部 (小数点の左の 数、1以上) 小数部 (小数点の右の 数、1未満)

10進数と2進数 各桁の数字は、その位の値が何個あるのかを示している。 小数点の位置が重要 基数を明示する表記(通常は10の省略)

練習 次の値を求めよ。 (3) (1) (2) (4)

10進数から2進数への変換1 2進数変換アルゴリズム(整数部分) [step1]: とする。 [step2]: の間以下を繰り返す; 出力 入力 2進数変換アルゴリズム(整数部分) [step1]:             とする。 初期設定 [step2]: の間以下を繰り返す; 2で割った余り (2-1)            2で割った商 (切り捨て) (2-2)            (2-3)             を1増加させる。 [step3]:  を出力して終了する。

開始 偽 真 として出力。 終了

例 2)54 2)27 ・・・0 2)13 ・・・1 2) 6 ・・・1 2) 3 ・・・0 2) 1 ・・・1 0 ・・・1 2) を2進数に変換せよ。 2)54 2)27  ・・・0 2)13  ・・・1 2) 6  ・・・1 2) 3  ・・・0 2) 1  ・・・1    0   ・・・1 2)   2)    ・・・    0  ・・・ よって、

練習 次の10進数を2進数に変換せよ。 (1) (2) (3) (4)

アルゴリズムの正当性 除算における商と余りの関係式

奇数なので1余る

性質:整数部分基数変換アルゴリズムのループ不変条件                   とおく。 ループの  回の繰り返しにおいて次式が成り立つ。 このような式を ループ不変条件という。 先頭の    桁を抜き出した2進数。(途中では、求まっていないことに注意する。) アルゴリズムの途中で現れる10進数

証明 繰り返し回数  に関する帰納法で証明する。 (     のとき。) であるので成り立つ。 アルゴリズムの初期化により 正しい。

(     のとき。)      のとき                 であると仮定する。 帰納法の仮定 のとき アルゴリズムの各繰り返しにより、         であるので、以下のように計算できる。 アルゴリズムの動作 帰納法の仮定 定義

証明 性質:整数部分基数変換アルゴリズムの出力の正当性 のとき 各 に対して、                        のとき 各              に対して、 証明 一般に、   を   で割った商が  で余りが   であるとき、以下の式が成り立つ。

この関係より、各                に対して 次ように計算できる。 ループ不変条件 アルゴリズムの動作

10進数から2進数への変換2 2進数変換アルゴリズム(小数部分) [step1]: とする。 [step2]: の間以下を繰り返す; 出力 入力 2進数変換アルゴリズム(小数部分) [step1]:               とする。 初期設定 [step2]: の間以下を繰り返す; (2-1)            (2-2)            (2-3)            [step3]:  を出力して終了する。

開始 偽 真 として出力。 終了

例 を2進数に変換せよ。 よって、 小数点に近い方から順に求まる。

練習 次の10進数を2進数に変換せよ。 (1) (2) (3) (4)

練習 小数部分の基数変換アルゴリズムにおけるループ不変条件を示し、正当性を証明せよ。

累積確率 (シャノン・ファノ符号化法の準備2)

累積確率 累積確率 確率 1 1 確率変数 確率変数 高さが1に漸近する。(一種の積分に対応。) 面積が1

シャノン・ファノ符号化法

シャノン・ファノ符号化 入力:情報源(情報源記号の集合とその発生確率) 出力:符号(情報源記号に対応する符号語の集合) ステップ1:発生確率の大きい順に並べる。       (ここでは、添え字でこの順序が見たされるとする。) ステップ2:各符号語長を次式で求める。 切り上げ ステップ3:次のような累積確率   を求める。 ステップ4:累積確率   を2進数    に変換する。 ステップ5:2進数    の上位   桁を符号語  とする。

例 次の無記憶情報源   に対して、シャノンファノ符号を構成する。 ステップ1(降順に並び替え)

ステップ2(符号語長の決定) したがって、 の符号語長を持つ符号を構成する。

ステップ3(累積確率の計算) 情報源記号 符号語長 確率 累積確率

累積確率 確率 1 1 情報源 記号 情報源 記号 確率の降順 面積が1 高さが1に漸近する。(一種の積分に対応。)

ステップ4(累積確率の2進数化)

ステップ5(符号の割り当て)

符号の木 1 1 1 1 1 平均符号長

練習 次の情報源ジャンをシャノンファノの符号化法に従って符号化せよ。 また、得られた符号に対する符号の木を示し、平均符号長、効率を求めよ。

シャノン・ファノ符号化法の性質

シャノンファノ符号化法の平均符号長 に対して、 どこかで見た式 であるが、これは次式を満たす。 したがって、平均符号長は次式で求められる。

シャノンファノ符号の非特異性 性質 シャノンファノ符号化法で構成された符号は非特異符号である。 証明 符号語長の選び方より、次式が成り立つ。

一方、 記号   の生成確率 に注意する。 累積確率の  番目 累積確率の     番目 よって、2進数表現して、次式が成り立つ。 第    桁で必ず異なることを 意味する。 Q.E.D

縮退情報源 (ハフマン符号化法の準備)

縮退情報源 情報源 対して、 の2つ以上の情報源記号 を一つにまとめた情報源を元の情報源の縮退情報源という。すなわち、 情報源   対して、    の2つ以上の情報源記号        を一つにまとめた情報源を元の情報源の縮退情報源という。すなわち、 2つの(情報源)記号を一つにまとめる。 ここで、 元の情報源の記号より一つ少なくなる。

例 次の情報源の縮退情報源をいくつか示せ。 解)

練習 次の情報源に対して、2記号を1記号に縮退して得られる情報源 をすべて示せ。

ハフマン符号化法

ハフマン符号化 入力:情報源(情報源記号の集合とその発生確率) 出力:符号(情報源記号と符号語の対応の集合) ステップ1: とし、 とする。 ステップ1:     とし、    とする。 ここで、 ステップ2: 発生確率の大きい順に並べる。        (添え字の順序をこの順序とする。)

      記号の情報源に縮退されている。 ステップ3:縮退情報源                に対して、確率の小さい2つの情報源記号        に対して、対応する符号の末尾に0と1を割り当てる。さらに、       を縮退して、新たな縮退情報源 を作成する。  ここで、

ステップ4:         である限り、          として ステップ2に戻る。

ハフマン符号化例 全ての点線で、縮退情報源の確率が降順になっていること。 次の符号のハフマン符号を与える。 符号の木を葉から構成していくと分かりやすい。

前のスライドの符号の木より、 平均符号長   は、次のように計算される。

練習 次の符号をハフマン符号化し、 符号の木、平均符号長、効率を求めよ。

ハフマン符号化法の性質

コンパクト符号 (定義)コンパクト符号 情報源に対して、符号語長が最短となる(瞬時)符号を コンパクト符号という。 コンパクト符号であっても、効率が1になるとは限らない。効率が1なら明らかにコンパクト符号である。

ハフマン符号のコンパクト性 性質 ハフマン符号は、コンパクト符号である。 ハフマン符号化で得られる符号は、1通りとは限らない。しかし、どのようなハフマン符号もコンパクトとなる。 この証明のために、次の補題を示す。

補題 情報源    の最小の生成確率を持つ2記号を縮退して得られる情報源を   とする。 情報源    のハフマン符号を   とし、情報源    のハフマン符号を    とする。このとき、     がコンパクト符号ならば、    もコンパクト符号である。 証明    の平均符号長を    とし、     の平均符号長を    とする。

まず、符号の木の経路長が最長の葉は2つある。 (もし、経路長が最長の葉が1つだけなら、さらに短くできる。) この2つの葉に発生確率最小の2記号          を割り当てる。(もし、発生確率が最小以外の記号を割り当てるとより短い 平均符号長が得られる。)

今、   に対する任意の符号の平均符号長を     と表す。 このとき、       のコンパクト性より、以下が成り立つ。

同じ値を両辺から引いているだけ。 情報源    の平均符号長と等しい。 したがって、     もコンパクト符号になる。 Q.E.D

ハフマン符号のコンパクト性の証明 基礎 のとき。 このとき、縮退情報源の記号の数は、 であり、ハフマン符号は明らかにコンパクト符号である。 このとき、縮退情報源の記号の数は、  であり、ハフマン符号は明らかにコンパクト符号である。 帰納            のすべての   に対して、ハフマン符号    が情報源    のコンパクト符号だと仮定する。(帰納法の仮定) 先の補題より、     がコンパクト符号ならば、    もコンパクト符号である。 したがって、    をハフマン符号化した    もコンパクト符号である。 Q.E.D