人工知能特論II　第7回二宮　崇.

Slides:

Advertisements

Similar presentations

SPSSによるHosmer-Lemeshow検定について

Advertisements

確率と統計 - 確率２回目 - 平成 18 年 11 月 1 日. 2 今日の内容 1. 確率の復習（再整理） 2. 加法の定理 3. 乗法の定理へのイントロ.

レポート書き方. おしいレポートよく調べてあるそれぞれの、１文の言っていることは正しいしかし、全体として、何が言いたいのかわからない内容の重要だが、全体の構成も重要である.

1 ７．時間限定チューリングマシンとクラス P. 2 7 －１．入力サイズチューリングマシンの入力記号の長さを入力サイズという。名称：合成数の問題インスタンス：整数ｎ問：ｎは合成数か？通常は、入力サイズとしてはもっとも短い表現での長さが利用される。例えば、次のような合成数の問題における入力サイズは、

７．n次の行列式　　一般的な（n次の）行列式の定義には、数学的な概念がいろいろ必要である。まずそれらを順に見ていく。

９．線形写像.

３．多項式計算アルゴリズムべき乗の計算多項式の計算.

時間的に変化する信号. 普通の正弦波は豊富な情報を含んでいませんこれだけではラジオのような複雑な情報を送れない振幅 a あるいは角速度 ω を時間的に変化させて情報を送る.

情報処理A 第１０回 Excelの使い方　その３.

九州大学岡村研究室久保貴哉 1. 利用中のＡＰの数の推移 2 横軸：時刻縦軸：接続要求数・深夜では一分間で平均一台、昼間では平均１４台程度の接続要求をＡＰが受けている。・急にＡＰの利用者数が増えてくるのは７～８時あたり.

５．連立一次方程式.

1 情報量（２章）. 2 物理的概念との対比１（入れ物と中身）塩水塩データ情報情報の量？塩分の量！情報の量は見た目ではわからない。データと情報は異なる概念。塩分の量は見た目ではわからない。しかし、本質的なもの。

つくばだいがくについて芸術専門学群のこと. 筑波大学ってこんなところ東京教育大学を前身とする大学で、その創立は日本で最も古い大学のひとつ。大学の敷地面積は日本で二番目に広い大学で、やたら坂が多い。移動時間が１５分しかないのに上り坂を三つ超えることがよくある。

―本日の講義― ・平均と分散 -代表値 -ぱらつき(分散・標準偏差等) ・Excelによる演習

ノイズ. 雑音とも呼ばれる。（音でなくても、雑音という）入力データに含まれる、本来ほしくない成分.

人工知能特論 II 第 6 回二宮崇 1. 今日の講義の予定確率的文法品詞解析 HMM 構文解析 PCFG 教科書北研二 ( 著 ) 辻井潤一 ( 編 ) 言語と計算 4 確率的言語モデル東大出版会 C. D. Manning & Hinrich Schütze “FOUNDATIONS.

09bd135d 柿沼健太郎重不況の経済学日本の新たな成長へ向けて.

素数判定法 2011/6/20.

フーリエ係数の性質. どこまで足す？理想的には無限大であるが、実際にはそれは出来ないこれをフーリエ解析してみる.

地球温暖化と天候の関係性～温暖化は天候のせいなのではないのか～. 目的課題地球温暖化現象ただの気象条件によるものではないのか？地球温暖化現象に天候は関係しているのか？

１章　行列と行列式.

本宮市立白岩小学校. １はじめに２家庭学習プログラム開発の視点 ① 先行学習（予習）を生かした確かな学力を形成する授業づくり ② 家庭との連携を図った家庭学習の習慣化.

フーリエ級数. 一般的な波はこのように表せる a,b をフーリエ級数という比率：

3.エントロピーの性質と各種情報量.

人工知能特論II　第10回二宮　崇.

Excelによる積分.

1 ６．低次の行列式とその応用. 2 行列式とは行列式とは、正方行列の特徴を表す一つのスカラーである。すなわち、行列式は正方行列からスカラーに写す写像の一種とみなすこともできる。正方行列スカラー（実数）の行列に対する行列式を、次の行列式という。行列の行列式をとも表す。行列式と行列の記号.

計算のスピードアップコンピュータでも、sin、cosの計算は大変です足し算、引き算、掛け算、割り算は早いです

線形符号（１０章）.

1 ０章数学基礎. 2 ( 定義）集合集合については、３セメスタ開講の「離散数学」で詳しく扱う。集合大学では、高校より厳密に議論を行う。そのために、議論の対象を明確にする必要がある。ある “ もの ” （基本的な対象、概念）の集まりを、集合という。集合に含まれる “ もの ” を、集合の要素または元という。

４．プッシュダウンオートマトンと文脈自由文法の等価性

1 ０章数学基礎. 2 ( 定義）集合集合については、３セメスタ開講の「離散数学」で詳しく扱う。集合大学では、高校より厳密に議論を行う。そのために、議論の対象を明確にする必要がある。ある “ もの ” （基本的な対象、概念）の集まりを、集合という。集合に含まれる “ もの ” を、集合の要素または元という。

信号測定. 正弦波多くの場合正弦波は 0V の上下で振動するしかし、これでは AD 変換器に入れられないので、オフセットを調整してデータを取った.

1 ９．線形写像. 2 ここでは、行列の積によって、写像を定義できることをみていく。また、行列の積によって定義される写像の性質を調べていく。

通信路（７章）.

アルゴリズムとデータ構造補足資料 7-4 「単純交換ソート exsort.c 」横浜国立大学理工学部数物・電子情報系学科富井尚志.

３．プッシュダウンオートマトンと文脈自由文法

人工知能特論II　第13回二宮　崇.

6.符号化法（６章）.

ビット. 十進数と二進数十進数  ０から９までの数字を使って０、１、２、３、４、５、６、７、８、９、１０、１１、１２と数える二進数  ０と１を使って０、１、１０、１１、１００、１０１、１１０、１１１と数える.

人工知能特論II　第12回二宮　崇.

人工知能特論 II 第 4 回二宮崇 1. CCG (COMBINATORY CATEGORIAL GRAMMAR) 組合せ範疇文法 2 今日の講義の予定.

A 「喫煙率が下がっても肺ガン死亡率が減っていないじゃないか」 B 「喫煙を減らしてもガン減るかどうか疑問だ」 1.

井元清哉、上昌広 2035年の日本医療を考えるワーキンググループ

結城諒司吉田成樹完成予定図ＯＮ！７セグＬＥＤランダム表示ＯＦＦ？数字が出たら勝ち！！

3．正方行列（単位行列、逆行列、対称行列、交代行列）

年度情報数理学. 2 履修にあたって 2009 年度大学院奇数セメスター（前期）開講 K336→ 大学院棟 D ４１６（次回から）教室：時限：火曜日３時限（ 12:50 － 14:20 ）担当草苅良至 4/21( 火）休講 → 補講 ?/? ? 時限 D416.

様々な情報源（４章）.

論理回路第１回. 今日の内容論理回路とは？本講義の位置づけ，達成目標講義スケジュールと内容受講時の注意事項成績の評価方法.

Bar-TOP における光の群速度伝播の解析名古屋大学高エネルギー物理研究室松石武 (Matsuishi Takeru)

伝わるスライド中野研究室 M2 石川雅信. どのようなスライドを作れば良いか伝えたいこと.

Three-Year Course Orientation International Course.

JPN 311: Conversation and Composition 許可 (permission)

方程式を「算木」で解いてみよう! 愛媛大学教育学部平田　浩一.

Ｃ言語応用構造体.

測定における誤差 KEK 猪野隆論文は、自ら書くもの誤差は、自分で定義するものただし、この定義は、多数の人に納得してもらえるものであること.

３．多項式計算アルゴリズムべき乗の計算多項式の計算.

Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学.

確率と統計確率編- 平成23年10月13日(木).

1 中野研究室 4 年ゼミのイロハ斉藤（修士 2 年）（ 2009 年 ”4 年ゼミのイロハ ” を参考に作りました）

「ネット社会の歩き方」レッスンキットプレゼンテーション資料集 15. チャットで個人情報は言わないプレゼンテーション資料著作権は独立行政法人情報処理推進機構（ IPA ）及び経済産業省に帰属します。

８．任意のデータ構造（グラフの表現とアルゴリズム）

平成 16 年 6 月 29 日佐賀大学知能情報システム学科 1 計算の理論 I 文脈自由文法火曜３校時大月美佳.

メニューに戻るメニューに戻る | 前表示スライド前表示スライド G*power 3 の web ページ Windows はこちら Mac はこちらダウンロード後，実行してインストール.

第１４回プログラムの意味論と検証（３）不動点意味論担当：犬塚

実験５規則波 C0XXXX 石黒 ○○ C0XXXX 杉浦 ○○ C0XXXX 大杉 ○○ C0XXXX 高柳 ○○ C0XXXX 岡田 ○○ C0XXXX 藤江 ○○ C0XXXX 尾形 ○○ C0XXXX 足立 ○○

Kitenet の解析 (110118) 九州大学工学部電気情報工学科岡村研究室久保貴哉.

音の変化を視覚化するサウンドプレイヤーの作成

IIR 輪講復習 #18 Matrix decompositions and latent semantic indexing.

Presentation transcript:

人工知能特論II　第7回二宮　崇

今日の講義の予定系列ラベリングのためのHMM 教科書解析学習北研二(著) 辻井潤一(編) 言語と計算4 確率的言語モデル東大出版会ビタビアルゴリズム学習最尤推定教科書北研二(著) 辻井潤一(編) 言語と計算4 確率的言語モデル東大出版会 C. D. Manning & Hinrich Schütze “FOUNDATIONS OF STATISTICAL NATURAL LANGUAGE PROCESSING” MIT Press, 1999 Christopher M. Bishop “PATTERN RECOGNITION AND MACHINE LEARNING” Springer, 2006

HMM for Sequential labeling

品詞解析品詞タガー “I have a pen.” I have a pen . I have a pen . トーカナイザー POSタガー I have a pen . 代名詞動詞不定冠詞名詞ピリオド

隠れマルコフモデル Hidden Markov Model (HMM) 0.3 名詞 he 0.25 出力 (emission) 0.3 Mary ピリオド 0.01 0.43 0.01 … 代名詞 0.1 0.5 不定冠詞動詞遷移 (transition) I have a pen . 0.3 代名詞動詞不定冠詞名詞ピリオド 0.4 0.01

隠れマルコフモデル Hidden Markov Model (HMM) Q: 状態の有限集合 Σ: 出力記号の有限集合 πq: 文頭が状態qになる確率 Σr∈Q πr=1 aq,r: 状態qから状態rへの遷移確率 Σr∈Q aq,r=1 bq,o: 状態qにおける記号oの出力確率 Σo∈Σ bq,o = 1

状態記号列の確率と生成確率状態と記号の列が与えられた時記号列のみが与えられた時 (生成確率)

解析(inference) 復号化(decoding)

解析解析 (入力: o1o2…oT) しかし、計算量はO(|Q|T)!

効率的な品詞解析: ビタビアルゴリズム動的計画法 δ(t, q): 時刻t(otが出力される時)に状態qとなる状態列の中で最大確率となる列の確率 maxq∈ Q δ(T, q)を求めれば良い時刻 1 2 3 T 出力記号 o1 o2 o3 oT … 状態1 … 状態2 … 状態3 … 状態4 トレリス

効率的な品詞解析: ビタビアルゴリズム o1 o2 ot-1 ot oT 状態1 … … 状態2 … … … … … 状態 q … … … 最大確率で遷移したパスをバックポインタで保存 o1 o2 ot-1 ot oT 状態1 … … 状態2 … … … … … 状態 q … … …

効率的な品詞解析: ビタビアルゴリズム動的計画法 δ(1,状態1)=π状態1b状態1,o1 δ(1,状態2)=π状態2b状態2,o1 δ(t, q): 時刻t(otが出力される時)に状態qとなる状態列の中で最大確率となる列の確率左から右に向かって全てのδ(t,q)を計算時刻 1 2 3 T 出力記号 o1 o2 o3 oT δ(1,状態1)=π状態1b状態1,o1 … 状態1 δ(1,状態2)=π状態2b状態2,o1 … 状態2 δ(1,状態3)=π状態3b状態3,o1 … 状態3 δ(1,状態4)=π状態4b状態4,o1 … 状態4

効率的な品詞解析: ビタビアルゴリズム動的計画法 δ(2,状態1)= max { δ(1,状態1)a状態1,状態1b状態1,o2, δ(t, q): 時刻t(otが出力される時)に状態qとなる状態列の中で最大確率となる列の確率左から右に向かって全てのδ(t,q)を計算最大確率で遷移したパスをバックポインタで保存時刻 1 2 3 T 出力記号 o1 o2 o3 oT δ(2,状態1)= max { δ(1,状態1)a状態1,状態1b状態1,o2, δ(1,状態2)a状態2,状態1b状態1,o2, δ(1,状態3)a状態3,状態1b状態1,o2, δ(1,状態4)a状態4,状態1b状態1,o2 } … 状態1 … 状態2 … 状態3 … 状態4

効率的な品詞解析: ビタビアルゴリズム動的計画法 δ(2,状態2)= max { δ(1,状態1)a状態1,状態2b状態2,o2, δ(t, q): 時刻t(otが出力される時)に状態qとなる状態列の中で最大確率となる列の確率左から右に向かって全てのδ(t,q)を計算時刻 1 2 3 T 出力記号 o1 o2 o3 oT δ(2,状態2)= max { δ(1,状態1)a状態1,状態2b状態2,o2, δ(1,状態2)a状態2,状態2b状態2,o2, δ(1,状態3)a状態3,状態2b状態2,o2, δ(1,状態4)a状態4,状態2b状態2,o2 } … 状態1 … 状態2 … 状態3 … 状態4

最後にバックポインタを辿ることで最大確率となる状態列が得られる効率的な品詞解析: ビタビアルゴリズム最後にバックポインタを辿ることで最大確率となる状態列が得られる o1 o2 oT-2 oT-1 oT 状態1 … 状態2 … 状態 3 … 状態 4 …

効率的な品詞解析: ビタビアルゴリズム δ[1,q] := π[q]b[q, o1] (for all q) for t =2 to T for q ∈ Q δ[t, q] := maxq’∈Q {δ[t-1, q’]a[q’,q]b[q, ot]} bp[t,q] := argmaxq’∈Q {δ[t-1, q’]a[q’,q]b[q, ot]}

学習 (パラメータ推定): 最尤推定

パラメータ推定: 最尤推定最尤推定文の集合を観測したとき、その文の集合がそこに出現したのは、その文の集合が最も確率が高かったから、と考えるやり方コインの例：表がでる確率θが未知のコインがある。100回投げたところ、62回表がでた。すると、その確率はθ62(1－θ)38となる。この確率はθ=0.62で最大となるので、θは0.62であったのだろう、と考えるのが最尤推定の考え方である。

最尤推定最尤推定観測値 x1,...,xn が与えられた時、それぞれが独立に出現したと考えると、その確率はパラメータθの関数になるこのl(θ)を尤度(likelihood)もしくは尤度関数(likelihood function)と呼ぶ尤度関数を最大化するθを求める

最尤推定最大を求めるために尤度関数の極値を求めるコインの例を解析的に解いてみよう l(θ) = θ62(1－θ)38

最尤推定対数尤度(log likelihood)を使うと計算が楽になるコインの例で解いてみよう log l(θ) = log( θ62(1－θ)38 )

最尤推定正規分布の最尤推定正規分布N(μ, σ2)から抽出された標本をx1,...,xnとする尤度対数尤度

ラグランジュの未定乗数法ラグランジュの未定乗数法　　はラグランジュ関数と呼ばれる

まとめ HMM 資料解析学習 http://aiweb.cs.ehime-u.ac.jp/~ninomiya/ai2/ ビタビアルゴリズム学習最尤推定資料 http://aiweb.cs.ehime-u.ac.jp/~ninomiya/ai2/