1 情報量(2章). 2 物理的概念との対比1(入れ物と中 身) 塩水 塩 データ 情報 情報の量? 塩分の量! 情報の量は見た目ではわ からない。データと情報 は異なる概念。 塩分の量は見た目 ではわからない。 しかし、本質的な もの。

Slides:



Advertisements
Similar presentations
SPSSによるHosmer-Lemeshow検定について
Advertisements

確率と統計 - 確率2回目 - 平成 18 年 11 月 1 日. 2 今日の内容 1. 確率の復習(再整理) 2. 加法の定理 3. 乗法の定理へのイントロ.
レポート書き方. おしいレポート よく調べてある それぞれの、1文の言っていることは正 しい しかし、全体として、何が言いた いのかわからない 内容の重要だが、全体の構成も重 要である.
7.n次の行列式   一般的な(n次の)行列式の定義には、数学的な概念がいろいろ必要である。まずそれらを順に見ていく。
9.線形写像.
概要 2009 年 10 月 23 日に、いて座に出現した X 線新星 (XTE J ) を、出現から消滅まで 全天 X 線監視装置 MAXI (マキシ)で観測したところ、 新種のブラックホール新星であることが判明した。 従来のブラックホールを、 多量のガスを一気に飲み込む「肉食系」と.
3.多項式計算アルゴリズム べき乗の計算 多項式の計算.
時間的に変化する信号. 普通の正弦波 は豊富な情報を含んでいません これだけではラジオのような複雑な情報 を送れない 振幅 a あるいは角速度 ω を時間的に変化 させて情報を送る.
5.連立一次方程式.
相関.
―本日の講義― ・平均と分散 -代表値 -ぱらつき(分散・標準偏差等) ・Excelによる演習
論理回路 第2回 今日の内容 前回の課題の説明 数の体系 – 数の表現 – 代表的な数 – 基数の変換 – 補数.
ノイズ. 雑音とも呼ばれる。(音でなくても、雑 音という) 入力データに含まれる、本来ほしくない 成分.
09bd135d 柿沼健太郎 重不況の経済学 日本の新たな 成長へ向けて.
広告付き価格サービ ス 小園一正. はじめに 世の中には様々な表現方法の広告があり ます。その中でも私たち学生にとって身 近にあるものを広告媒体として取り入れ られている。 価格サービス(無料配布のルーズリー フ)を体験したことにより興味を惹かれ るきっかけとなった。主な目的は、これ.
素数判定法 2011/6/20.
フーリエ係数の性質. どこまで足す? 理想的には無限大であるが、実際に はそれは出来ない これをフーリエ解析してみる.
地球温暖化と 天候の関係性 ~温暖化は天候のせいなのではないのか~. 目的課題 地球温暖化現象 ただの気象条件によるものではないのか? 地球温暖化現象に天候は関係しているの か?
公開鍵暗号系 2011/05/09.
1章 行列と行列式.
本宮市立白岩小学校. 1 はじめに 2 家庭学習プログラム開発の視点 ① 先行学習(予習)を生かした 確かな学力を形成する授業づく り ② 家庭との連携を図った家庭学習の習慣化.
フーリエ級数. 一般的な波はこのように表せる a,b をフーリエ級数とい う 比率:
3.エントロピーの性質と各種情報量.
9.通信路符号化手法1 (誤り検出と誤り訂正の原理)
Excelによる積分.
1 6.低次の行列式とその応用. 2 行列式とは 行列式とは、正方行列の特徴を表す一つのスカ ラーである。すなわち、行列式は正方行列からスカ ラーに写す写像の一種とみなすこともできる。 正方行列 スカラー(実数) の行列に対する行列式を、 次の行列式という。 行列 の行列式を とも表す。 行列式と行列の記号.
計算のスピードアップ コンピュータでも、sin、cosの計算は大変です 足し算、引き算、掛け算、割り算は早いです
線形符号(10章).
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
10.PとNP完全問題との境界.
複素数.
4.プッシュダウンオートマトンと 文脈自由文法の等価性
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
人工知能特論II 第7回 二宮 崇.
信号測定. 正弦波 多くの場合正弦波は 0V の上下で振動する しかし、これでは AD 変換器に入れら れないので、オフ セットを調整して データを取った.
1 9.線形写像. 2 ここでは、行列の積によって、写像を 定義できることをみていく。 また、行列の積によって定義される写 像の性質を調べていく。
通信路(7章).
アルゴリズムとデータ構造 補足資料 7-4 「単純交換ソート exsort.c 」 横浜国立大学 理工学部 数物・電子情報系学科 富井尚志.
3.プッシュダウンオートマトンと 文脈自由文法
6.符号化法(6章).
ビット. 十進数と二進数 十進数  0から9までの数字を使って 0、1、2、3、4、5、6、7、8、9、 10、11、12 と数える 二進数  0と1を使って 0、1、10、11、100、101、11 0、111 と数える.
重不況の経済学 第2章第2節 山下 真弘. 不均等成長 不均等成長=市場の特定の製品または特定の国・ 地域で付加価値の縮小が生じること 要因は2つ 製品別の「生産性向上速度の差」 付加価値総額の天井(=需要制約)
平成22年度 第4回 Let’s Enjoy English 平成22年度 第4回 Let’s Enjoy English 期日:平成22年10月30日 場所:旭川市立北光小学校 基調提言.
アルゴリズムとデータ構造 補足資料14-1 「ハッシュ法」
平成22年度予算の国立大学法人関連要望事項に係るパブリックコメント説明会
3.正方行列(単位行列、逆行列、対称行列、交代行列)
年度 情報数理学. 2 履修にあたって 2009 年度 大学院奇数セメスター(前期)開講 K336→ 大学院棟 D 416(次回から)教室: 時限: 火曜日3時限( 12:50 - 14:20 ) 担当 草苅良至 4/21( 火) 休講 → 補講 ?/? ? 時限 D416.
様々な情報源(4章).
プログラミング演習B ML編 第3回 2010/6/15 (コミ) 2010/6/16 (情報・知能) 住井 ~sumii/class/proenb2010/ml3/
論理回路 第1回. 今日の内容 論理回路とは? 本講義の位置づけ,達成目標 講義スケジュールと内容 受講時の注意事項 成績の評価方法.
C言語応用 構造体.
実装の流れと 今後のスケジュール 03k0014 岸原 大祐. システム概要 天気データをもとに、前向き推論をし ていき、親の代わりに子供に服装、持 ち物、気をつけることなどを教える。
3.多項式計算アルゴリズム べき乗の計算 多項式の計算.
JPN 312 (Fall 2007): Conversation and Composition 文句 ( もんく ) を言う.
確率と統計 確率編- 平成23年10月13日(木).
HKS Analysis Log Jul 2006 Part1 D.Kawama. 第壱部 HKS Sieve Slit Analysis.
1 プログラミング言語論 第13回 プログラムの意味論と検証 (2) 表示的意味論 担当:犬塚. 2 表示的意味論 denotational semantics  表示的意味論では、プログラムの要素とそれが 意味するものを対応付ける。 変数 式 文 A B … A+2 2B+C A:=A+2 if.
「ネット社会の歩き方」レッスンキット プレゼンテーション資料集 15. チャットで個人情報は 言わない プレゼンテーション資料 著作権は独立行政法人情報処理推進機構( IPA )及び経済産業省に帰属します。
8.任意のデータ構造 (グラフの表現とアルゴリズム)
第14回 プログラムの意味論と検証(3) 不動点意味論 担当:犬塚
実験5 規則波 C0XXXX 石黒 ○○ C0XXXX 杉浦 ○○ C0XXXX 大杉 ○○ C0XXXX 高柳 ○○ C0XXXX 岡田 ○○ C0XXXX 藤江 ○○ C0XXXX 尾形 ○○ C0XXXX 足立 ○○
ことばとコンピュータ 2007 年度 1 学期 第 1 回. 2 ことばとコンピュータ 授業科目名:言語情報処理論 授業題目名:ことばとコンピュータ 履修コード: 5067 教室: 323 一学期開講 授業の進め方 – 基本的に講義中心ですすめ,時々コンピュー タを使う.
1 アルゴリズムの高速化. 2 アルゴリズムにおける 大幅な性能アップ 多項式時間アルゴリズム VS 対数時間アルゴリズム (最大公約数の問題) 指数時間アルゴリズム VS 多項式時間アルゴリズム (フィボナッチ数列を求める問題)
LANG3910 Japanese Ⅲ Lesson 14 依頼・現在進行形. 学習項目 1. 「て -form 」 2. 依頼表現 An expression of request 3. 相手の意向を尋ねる Ask someone’s mind 4. 現在進行形 Actions in Progress.
音の変化を視覚化する サウンドプレイヤーの作成
プログラミングの基礎知識 プログラミングの手順と重要概念 アルゴリズム. プログラミングの手順 コーディング エディタなどでコードを記述 コンパイル・インタープリタ 実行可能な形に翻訳 デバッグ(虫取り、不具合の調整) 完成!
本文. 考えながら読みましょ う 「いろいろなこと」( 3 行目)は何で すか 「①電話料金はコンビニで支払いをしていま す。いつでも払えますから、便利です。」 「②夕食はコンビニで買います。お弁当やお かずがいろいろありますから。」今、若者に 人気のあるコンビニは、いろいろなことをす るのに非常に便利な場所になった。
11万km上空のかぐやから見た地球. デジタル信号処理 Digital Signal Processing 2010 年度春学期 Spring Semester, 2010 担当者: 栗濱 忠司( Professor ) 第3週第3週.
IIR 輪講復習 #18 Matrix decompositions and latent semantic indexing.
地球儀と様々な地図. 1 球体としての地球 こうした現象はあることをイ メージすると理解できる。
Presentation transcript:

1 情報量(2章)

2 物理的概念との対比1(入れ物と中 身) 塩水 塩 データ 情報 情報の量? 塩分の量! 情報の量は見た目ではわ からない。データと情報 は異なる概念。 塩分の量は見た目 ではわからない。 しかし、本質的な もの。

3 物理的概念との対比2(情報の形 態) 塩 変換 情報 料理 情報から 様々な形態 が生成(変 換)できる。 塩から様々 な料理が生 成できる。

4 物理的概念との対比3(情報量の計 測) 塩水 塩 データ 情報 蒸留・融解等 データから情報のとり出 し方 を学ぶ。(実は、確率)

5 情報の大小(情報量の性質 1) ( a) 沖縄に雪が降った。 ( b) 北海道に雪が降った。 事象(出来事) 情報量 どれが妥当か? ニュースにな る! ニュースにな る? 一種の 重要度 と考え る。 A:A: B:B: C:C:

6 練習 次のニュース(事象)の確率と情報量の大小関係を示せ。 (1) (宝 a ) 買った宝くじが外れた。 ( 宝 b) 買った宝くじが1等当たった。 (2)(2) (3)(3) (事 a )今日事故にあった。 ( 事 b) 今日事故にあわなかった (サ a) サイコロを振ったら1が出た。 (サ b) 偶数がでた。

7 情報量と確率の関係 沖縄に雪が降った。 北海道に雪が降った。 事象 情報量 確率 1.情報量は、確率の関数 2.情報量は、確率に関する減少関数 (確率が増加すれば、情報量は減少する。) 事象 の確率を と表す。 情報量の性質1

8 独立事象の確率と情報量(情報量の性質 2) 事象「宝くじが当たって、しかも事故にあった。」の情報量を 考えよう。 (宝 a ) 買った宝くじが 外れた。 ( 宝 b) 買った宝くじが 1等当たった。 (事 a )今日事故に あった。 ( 事 b) 今日事故にあわな かった (互いに無関係な事象を独立な事象と言う。) ” 独立 ” な事象の積事象の確率 ” 独立 ” な事象の積事象の情報量 3.独立な事象の積事象の情報量は、個々の情報量の和 確率統計の復習 積事象の確率が、各事象の 確率の和であるとき、独立 な事象という。

9 情報量の性質から情報量の数値化へ 事象 がおきる確率を と表し、 事象 がおきたことを知った情報量を と表す。 このとき、以下を満たす関数 で情報量を定義する。 1.情報量は、確率の関数である。 2.情報量は、確率に対する減少関数である。 3. 独立な積事象を知ったときの情報量は、個々の情報量の 和である。

10 (自己)情報量と情報量の単 位 先のスライドを満たすように、 ある事象 を知る情報量 は以下の関数で 定義される。 定義(自己情報量) 情報量の単位 [bit] (ビット) [nat] (ナット) [decit] (デシット) 1ビットは確率 0.5 の 事象が起きたことを 知る情報量。以後は、 ビットだけを扱う。 ただし、 情報量は、 確率の 逆数の 対数。

11 自己情報量の外形

12 練習 次の事象の自己情報量を求めよ。 (1) (2) (3) 52枚のトランプから絵札を1枚引く 2枚のコインを投げて両方とも裏がでる。 アルファベットの書いてある26個の玉から、 c の玉を取り出す。

13 事象系 単独の事象ではなくて、事象の集合を考える。 事象の集合とそれが生じる確率を以下のように表す。 このように、確率が定められた事象の集合を事象系 と言う。 ここで、

14 事象系例 (1) コイントスの事象系 (2) サイコロの事象系 (3)(3)トランプを引いたときの数の事象系

15 練習 次の事象系を形式的に示せ。 (1) トランプを引いたときのカードのマークの事象系 (2) 26 文字のアルファベットと空白文字が書かれ た、27個の玉が袋に入っている。その袋から1つ の玉をとりだしす事象系。

16 事象系の平均情報量 ある事象系 が以下のように与えられるとする。 事象系 のすべての事象に対して、その情報量 の平均をとったものを平均情報量またはエントロ ピーという。 定義(エントロピー) このとき、平均情報量 は自己情報量 を元に 以下のように表される。 慣用的に、エント ロピーには記号 H を用いる。

自己情報量と平均情報量 17 自己情報量は事象に対して定義され、 平均情報量は事象系(事象の集合)に対して定義される。

18 平均情報量の計算例 (1) (2)

19 練習1 次の確率事象系(情報源)の平均情報量(エント ロピーを求めよ。) (1)(2) (3)

20 練習2 次の事象系のエントロピーを求めよ。 (1) トランプを引いたときのカードのマークの事象系 (2) 26 文字のアルファベットと空白文字が書かれ た、27個の玉が袋に入っている。その袋から1つ の玉をとりだす事象系。

21 補足:平均(期待値)の話

22 期待値の式 1週間の間の平均気温を求めたい。 晴 くもり 雨 月火水 木金土日

23 単純平均 面積が等しい 平均 平均値は、゛ならした “ ときの 高さ。

24 晴れの平均気温 面積が等しい 晴れの 平均 木と日を交換

25 曇りの平均気温 面積が等しい くもりの 平均

26 雨の平均気温 面積が等しい 雨の 平均

よくある間違い 27 1週間のすべての日は、「晴れ」か「くもり」か「雨」 であった。 「晴れ」の日の平均気温は 度 、 「くもり」の日の平均気温は 度、 「雨」の日の平均気温は であった。 一週間の平均気温を求めよ。 この計算は間違い。 (平均の平均を求めるとき には、注意が必要。) このような計算ができるた めには、どのような条件が 必要か?

28 確率 7 421 晴れの確率: 雨の確率: 曇りの確率:

29 単純平均と期待値の関係 面積が等しい

30 2事象の事象系の平均情報量(重 要) ある事象系 が以下のように与えられるとする。 このとき、エントロピーは次式となる。 この形の事象系は非常によく用いられ、この右辺の 形の関数をエントロピー関数といい以下のように表 す。 引数が、事象系。 記号も注意する。 引数が、数。 記号も注意する。

31 エントロピー関数の外形

32 具体例1:文書の情報量 (1記号あたりの平均情報量の意 味) アルファベット に対して、 個々の記号の出現確率を考えよう。 記号 の出現する確率を と書く。 例えば、 : の現れる確率 このとき、一般の英文において、各記号の出現 確率は異なる。すなわち、以下である。 辞書

33 まず、アルファベット 中の文字を用いた文書の情報量を考える。 今、 の 個の文字からなる英文 の情報量を とする。 は各記号が に出現する自己情報量の 総和である。 出現確率に基づく 事象とみなせるこ とに注意する。 事象に対する 確率の逆数の対数

34 まず、アルファベットの(1記号あたりの)平均情報量(エ ントロピー)が以下の式で表される。 [bit/ 記号 ] 今度は逆に、情報量 を持つ事象を文書 で表すこと を考える。

35 よって、文書 中に含まれる文字数の期待値 は次 式で求められる。 したがって、文書の長さは情報源 の1記号あたり の平均情報量(エントロピー ) を “ 単位 ” とし た情報量で表される。 また、情報源 の長さ の文書(事象)の 平均情報量 に関して次式が成り立つ。

36 練習1 次の事象系のエントロピー(平均情報量)を求めよ。 (1) (2)

37 練習2 情報源 ( 事象系)から生成された文字列の自己情報量を求めよ。 (1) (2) から生成された、文字列 の自己情報量

38 具体例2:画像の情報量 4 × 4の画素数を持ち、個々の画素が4階調の輝度値 を持つ画像の情報量を考える。 各画素がある輝度値を持つ確率を、 とする。この とき、この画像が持つ情報量I ( 画)は次式で表され る。

40 前のスライドでは、輝度値が全ての画素で確率が均等 であると仮定してあった。 実は、風景画、人物画等では、画素における輝度値の 出現確率は一様ではない。 このような場合、より少ない情報量しか持たない。 すなわち、確率が一様でない場合には、1画素あたり の平均情報量は、一様な場合より小さくなる。

41 練習 の画素で、各画素が 階調の白黒画像の自己情報量を求めよ。 (1) の画素のカラー画像の自己情 報量を求めよ。ただし、1画素は赤、緑、青(RG B)の各色で表され、各色はそれぞれ16階調で表さ れるものとする。 (1) 下の画像の自己情報量を求めよ。ただし、各画素の諧調値は すべて均等に現れるのものとする。