人工知能特論II 第7回 二宮 崇.

Slides:



Advertisements
Similar presentations
SPSSによるHosmer-Lemeshow検定について
Advertisements

確率と統計 - 確率2回目 - 平成 18 年 11 月 1 日. 2 今日の内容 1. 確率の復習(再整理) 2. 加法の定理 3. 乗法の定理へのイントロ.
レポート書き方. おしいレポート よく調べてある それぞれの、1文の言っていることは正 しい しかし、全体として、何が言いた いのかわからない 内容の重要だが、全体の構成も重 要である.
1 7.時間限定チューリングマシンと クラス P. 2 7 -1.入力サイズ チューリングマシンの入力記号 の長さ を 入力サイズという。 名称:合成数の問題 インスタンス:整数n 問:nは合成数か? 通常は、入力サイズとしてはもっとも短い表現での 長さが利用される。 例えば、次のような合成数の問題における入力サイズは、
7.n次の行列式   一般的な(n次の)行列式の定義には、数学的な概念がいろいろ必要である。まずそれらを順に見ていく。
9.線形写像.
3.多項式計算アルゴリズム べき乗の計算 多項式の計算.
時間的に変化する信号. 普通の正弦波 は豊富な情報を含んでいません これだけではラジオのような複雑な情報 を送れない 振幅 a あるいは角速度 ω を時間的に変化 させて情報を送る.
情報処理A 第10回 Excelの使い方 その3.
九州大学 岡村研究室 久保 貴哉 1. 利用中のAPの数の推移 2 横軸:時刻 縦軸:接続要求数 ・深夜では一分間で平均一台、 昼間では平均14台程度の接続 要求をAPが受けている。 ・急にAPの利用者数が増えてく るのは7~8時あたり.
5.連立一次方程式.
相関.
1 情報量(2章). 2 物理的概念との対比1(入れ物と中 身) 塩水 塩 データ 情報 情報の量? 塩分の量! 情報の量は見た目ではわ からない。データと情報 は異なる概念。 塩分の量は見た目 ではわからない。 しかし、本質的な もの。
つくばだいがくについて 芸術専門学群のこと. 筑波大学ってこんなところ 東京教育大学を前身とする大学で、その 創立は日本で最も古い大学のひとつ。 大学の敷地面積は日本で二番目に広い大 学で、やたら坂が多い。移動時間が15分 しかないのに上り坂を三つ超えることがよ くある。
―本日の講義― ・平均と分散 -代表値 -ぱらつき(分散・標準偏差等) ・Excelによる演習
ノイズ. 雑音とも呼ばれる。(音でなくても、雑 音という) 入力データに含まれる、本来ほしくない 成分.
人工知能特論 II 第 6 回 二宮 崇 1. 今日の講義の予定 確率的文法 品詞解析 HMM 構文解析 PCFG 教科書 北研二 ( 著 ) 辻井潤一 ( 編 ) 言語と計算 4 確率的言語モデル 東大出版会 C. D. Manning & Hinrich Schütze “FOUNDATIONS.
09bd135d 柿沼健太郎 重不況の経済学 日本の新たな 成長へ向けて.
素数判定法 2011/6/20.
フーリエ係数の性質. どこまで足す? 理想的には無限大であるが、実際に はそれは出来ない これをフーリエ解析してみる.
地球温暖化と 天候の関係性 ~温暖化は天候のせいなのではないのか~. 目的課題 地球温暖化現象 ただの気象条件によるものではないのか? 地球温暖化現象に天候は関係しているの か?
1章 行列と行列式.
本宮市立白岩小学校. 1 はじめに 2 家庭学習プログラム開発の視点 ① 先行学習(予習)を生かした 確かな学力を形成する授業づく り ② 家庭との連携を図った家庭学習の習慣化.
フーリエ級数. 一般的な波はこのように表せる a,b をフーリエ級数とい う 比率:
3.エントロピーの性質と各種情報量.
人工知能特論II 第10回 二宮 崇.
Excelによる積分.
1 6.低次の行列式とその応用. 2 行列式とは 行列式とは、正方行列の特徴を表す一つのスカ ラーである。すなわち、行列式は正方行列からスカ ラーに写す写像の一種とみなすこともできる。 正方行列 スカラー(実数) の行列に対する行列式を、 次の行列式という。 行列 の行列式を とも表す。 行列式と行列の記号.
計算のスピードアップ コンピュータでも、sin、cosの計算は大変です 足し算、引き算、掛け算、割り算は早いです
線形符号(10章).
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
4.プッシュダウンオートマトンと 文脈自由文法の等価性
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
信号測定. 正弦波 多くの場合正弦波は 0V の上下で振動する しかし、これでは AD 変換器に入れら れないので、オフ セットを調整して データを取った.
1 9.線形写像. 2 ここでは、行列の積によって、写像を 定義できることをみていく。 また、行列の積によって定義される写 像の性質を調べていく。
通信路(7章).
アルゴリズムとデータ構造 補足資料 7-4 「単純交換ソート exsort.c 」 横浜国立大学 理工学部 数物・電子情報系学科 富井尚志.
3.プッシュダウンオートマトンと 文脈自由文法
人工知能特論II 第13回 二宮 崇.
6.符号化法(6章).
ビット. 十進数と二進数 十進数  0から9までの数字を使って 0、1、2、3、4、5、6、7、8、9、 10、11、12 と数える 二進数  0と1を使って 0、1、10、11、100、101、11 0、111 と数える.
人工知能特論II 第12回 二宮 崇.
人工知能特論 II 第 4 回 二宮 崇 1. CCG (COMBINATORY CATEGORIAL GRAMMAR) 組合せ範疇文法 2 今日の講義の予定.
A 「喫煙率が下がっても肺ガン死亡率が減っていないじゃな いか」 B 「喫煙を減らしてもガン減るかどうか疑問だ 」 1.
井元清哉、上 昌広 2035年の日本医療を考える ワーキンググループ
結城諒 司 吉田成 樹 完成予定図 O N! 7セグLE D ランダム表 示 OF F ? 数字が出たら 勝ち!!
3.正方行列(単位行列、逆行列、対称行列、交代行列)
年度 情報数理学. 2 履修にあたって 2009 年度 大学院奇数セメスター(前期)開講 K336→ 大学院棟 D 416(次回から)教室: 時限: 火曜日3時限( 12:50 - 14:20 ) 担当 草苅良至 4/21( 火) 休講 → 補講 ?/? ? 時限 D416.
様々な情報源(4章).
論理回路 第1回. 今日の内容 論理回路とは? 本講義の位置づけ,達成目標 講義スケジュールと内容 受講時の注意事項 成績の評価方法.
Bar-TOP における光の 群速度伝播の解析 名古屋大学 高エネルギー物理研究室 松石 武 (Matsuishi Takeru)
伝わるスライド 中野研究室 M2 石川 雅 信. どのようなスライドを作れば良 いか 伝えたいこと.
Three-Year Course Orientation International Course.
JPN 311: Conversation and Composition 許可 (permission)
方程式を「算木」で 解いてみよう! 愛媛大学 教育学部 平田 浩一.
C言語応用 構造体.
測定における誤差 KEK 猪野 隆 論文は、自ら書くもの 誤差は、自分で定義するもの ただし、この定義は、 多数の人に納得してもらえるものであること.
3.多項式計算アルゴリズム べき乗の計算 多項式の計算.
Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学.
確率と統計 確率編- 平成23年10月13日(木).
1 中野研究室 4 年ゼミのイロハ 斉藤(修士 2 年) ( 2009 年 ”4 年ゼミのイロハ ” を参考に作りました)
「ネット社会の歩き方」レッスンキット プレゼンテーション資料集 15. チャットで個人情報は 言わない プレゼンテーション資料 著作権は独立行政法人情報処理推進機構( IPA )及び経済産業省に帰属します。
8.任意のデータ構造 (グラフの表現とアルゴリズム)
平成 16 年 6 月 29 日佐賀大学知能情報システム学科 1 計算の理論 I 文脈自由文法 火曜3校時 大月 美佳.
メニューに戻る メニューに戻る | 前表示スライド 前表示スライド G*power 3 の web ページ Windows はこちら Mac はこちら ダウンロード後,実行してインストール.
第14回 プログラムの意味論と検証(3) 不動点意味論 担当:犬塚
実験5 規則波 C0XXXX 石黒 ○○ C0XXXX 杉浦 ○○ C0XXXX 大杉 ○○ C0XXXX 高柳 ○○ C0XXXX 岡田 ○○ C0XXXX 藤江 ○○ C0XXXX 尾形 ○○ C0XXXX 足立 ○○
Kitenet の解析 (110118) 九州大学 工学部 電気情報工学科 岡村研究室 久保 貴哉.
音の変化を視覚化する サウンドプレイヤーの作成
IIR 輪講復習 #18 Matrix decompositions and latent semantic indexing.
Presentation transcript:

人工知能特論II 第7回 二宮 崇

今日の講義の予定 系列ラベリングのためのHMM 教科書 解析 学習 北研二(著) 辻井潤一(編) 言語と計算4 確率的言語モデル 東大出版会 ビタビアルゴリズム 学習 最尤推定 教科書 北研二(著) 辻井潤一(編) 言語と計算4 確率的言語モデル 東大出版会 C. D. Manning & Hinrich Schütze “FOUNDATIONS OF STATISTICAL NATURAL LANGUAGE PROCESSING” MIT Press, 1999 Christopher M. Bishop “PATTERN RECOGNITION AND MACHINE LEARNING” Springer, 2006

HMM for Sequential labeling

品詞解析 品詞タガー “I have a pen.” I have a pen . I have a pen . トーカナイザー POSタガー I have a pen . 代名詞 動詞 不定冠詞 名詞 ピリオド

隠れマルコフモデル Hidden Markov Model (HMM) 0.3 名詞 he 0.25 出力 (emission) 0.3 Mary ピリオド 0.01 0.43 0.01 … 代名詞 0.1 0.5 不定 冠詞 動詞 遷移 (transition) I have a pen . 0.3 代名詞 動詞 不定冠詞 名詞 ピリオド 0.4 0.01

隠れマルコフモデル Hidden Markov Model (HMM) Q: 状態の有限集合 Σ: 出力記号の有限集合 πq: 文頭が状態qになる確率 Σr∈Q πr=1 aq,r: 状態qから状態rへの遷移確率 Σr∈Q aq,r=1 bq,o: 状態qにおける記号oの出力確率 Σo∈Σ bq,o = 1

状態記号列の確率と 生成確率 状態と記号の列が与えられた時 記号列のみが与えられた時 (生成確率)

解析(inference) 復号化(decoding)

解析 解析 (入力: o1o2…oT) しかし、計算量はO(|Q|T)!

効率的な品詞解析: ビタビアルゴリズム 動的計画法 δ(t, q): 時刻t(otが出力される時)に状態qとなる状態列の中で最大確率となる列の確率 maxq∈ Q δ(T, q)を求めれば良い 時刻 1 2 3 T 出力記号 o1 o2 o3 oT … 状態1 … 状態2 … 状態3 … 状態4 トレリス

効率的な品詞解析: ビタビアルゴリズム o1 o2 ot-1 ot oT 状態1 … … 状態2 … … … … … 状態 q … … … 最大確率で遷移したパスをバックポインタで保存 o1 o2 ot-1 ot oT 状態1 … … 状態2 … … … … … 状態 q … … …

効率的な品詞解析: ビタビアルゴリズム 動的計画法 δ(1,状態1)=π状態1b状態1,o1 δ(1,状態2)=π状態2b状態2,o1 δ(t, q): 時刻t(otが出力される時)に状態qとなる状態列の中で最大確率となる列の確率 左から右に向かって 全てのδ(t,q)を計算 時刻 1 2 3 T 出力記号 o1 o2 o3 oT δ(1,状態1)=π状態1b状態1,o1 … 状態1 δ(1,状態2)=π状態2b状態2,o1 … 状態2 δ(1,状態3)=π状態3b状態3,o1 … 状態3 δ(1,状態4)=π状態4b状態4,o1 … 状態4

効率的な品詞解析: ビタビアルゴリズム 動的計画法 δ(2,状態1)= max { δ(1,状態1)a状態1,状態1b状態1,o2, δ(t, q): 時刻t(otが出力される時)に状態qとなる状態列の中で最大確率となる列の確率 左から右に向かって 全てのδ(t,q)を計算 最大確率で遷移したパスをバックポインタで保存 時刻 1 2 3 T 出力記号 o1 o2 o3 oT δ(2,状態1)= max { δ(1,状態1)a状態1,状態1b状態1,o2, δ(1,状態2)a状態2,状態1b状態1,o2, δ(1,状態3)a状態3,状態1b状態1,o2, δ(1,状態4)a状態4,状態1b状態1,o2 } … 状態1 … 状態2 … 状態3 … 状態4

効率的な品詞解析: ビタビアルゴリズム 動的計画法 δ(2,状態2)= max { δ(1,状態1)a状態1,状態2b状態2,o2, δ(t, q): 時刻t(otが出力される時)に状態qとなる状態列の中で最大確率となる列の確率 左から右に向かって 全てのδ(t,q)を計算 時刻 1 2 3 T 出力記号 o1 o2 o3 oT δ(2,状態2)= max { δ(1,状態1)a状態1,状態2b状態2,o2, δ(1,状態2)a状態2,状態2b状態2,o2, δ(1,状態3)a状態3,状態2b状態2,o2, δ(1,状態4)a状態4,状態2b状態2,o2 } … 状態1 … 状態2 … 状態3 … 状態4

最後にバックポインタを辿ることで最大確率となる状態列が得られる 効率的な品詞解析: ビタビアルゴリズム 最後にバックポインタを辿ることで最大確率となる状態列が得られる o1 o2 oT-2 oT-1 oT 状態1 … 状態2 … 状態 3 … 状態 4 …

効率的な品詞解析: ビタビアルゴリズム δ[1,q] := π[q]b[q, o1] (for all q) for t =2 to T for q ∈ Q δ[t, q] := maxq’∈Q {δ[t-1, q’]a[q’,q]b[q, ot]} bp[t,q] := argmaxq’∈Q {δ[t-1, q’]a[q’,q]b[q, ot]}

学習 (パラメータ推定): 最尤推定

パラメータ推定: 最尤推定 最尤推定 文の集合を観測したとき、その文の集合がそこに出現したのは、その文の集合が最も確率が高かったから、と考えるやり方 コインの例:表がでる確率θが未知のコインがある。100回投げたところ、62回表がでた。すると、その確率はθ62(1-θ)38となる。この確率はθ=0.62で最大となるので、θは0.62であったのだろう、と考えるのが最尤推定の考え方である。

最尤推定 最尤推定 観測値 x1,...,xn が与えられた時、それぞれが独立に出現したと考えると、その確率はパラメータθの関数になる このl(θ)を尤度(likelihood)もしくは尤度関数(likelihood function)と呼ぶ 尤度関数を最大化するθを求める

最尤推定 最大を求めるために尤度関数の極値を求める コインの例を解析的に解いてみよう l(θ) = θ62(1-θ)38

最尤推定 対数尤度(log likelihood)を使うと計算が楽になる コインの例で解いてみよう log l(θ) = log( θ62(1-θ)38 )

最尤推定 正規分布の最尤推定 正規分布N(μ, σ2)から抽出された標本をx1,...,xnとする 尤度 対数尤度

ラグランジュの未定乗数法 ラグランジュの未定乗数法   はラグランジュ関数と呼ばれる

まとめ HMM 資料 解析 学習 http://aiweb.cs.ehime-u.ac.jp/~ninomiya/ai2/ ビタビアルゴリズム 学習 最尤推定 資料 http://aiweb.cs.ehime-u.ac.jp/~ninomiya/ai2/