Download presentation
Presentation is loading. Please wait.
1
Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学
2
発表内容 Lingquest システムの紹介 背景: 人間が作るモデル 従来の自動獲得 提案 インタラクティブ・アプローチの概念 設計 Use Case ( 例 ) まとめ
3
Lingquest System というのは … 自動的な自然言語獲得ツール
4
Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない
5
Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない 結果として得られるモデルは再利用、共 用できる、 例: J - POP ?
6
Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない 結果として得られるモデルは再利用、共 用できる、 例: J - POP =英語 + 日本語
7
Lingquest System というのは … 自動的な自然言語獲得ツール 特定の言語、ドメインに依存しない 結果として得られるモデルは再利用、共 用できる ある言語定理でモデルを実現するツール だけではなく、基本の言語定理、モデル 等で始まり、インタラクティブ実験で適 応なモデル, 定理とモデルを作る方法を発 見するものである
8
背景 言語学者 も必要 時間 かかる 整備も 必要 効率が悪い 人間が作ったモデル
9
目的 効率のよい自動獲得方法を開発
10
関連研究 統計的な方法 (Deligne & Bimbot) + 簡単、効率がよい - 局所極大 (EM 元 ), sparse data インタラクティブな方法 (J. Riloff) + 局所極大問題のような問題に成功できる - まだ人間に依存する 帰納的方法 (R. Mooney) + 人間に読みやすいルール( symbolic), 見ていない データに強い, 新しいルールを推論できる
11
提案 自動獲得方法を 組み合わせる 自動獲得方法を 組み合わせる 統計的な 方法 統計的な 方法 インタラクティブ な方法 インタラクティブ な方法 帰納的 方法 帰納的 方法 + 人間より 効率がよい + 人間より 効率がよい - 局所極大、 sparse data 等 - 局所極大、 sparse data 等 + 統計問題 に成功 + 統計問題 に成功 - また人間から モデルの問題 - また人間から モデルの問題 + 新しい ルールを 自動的に 作れる + 新しい ルールを 自動的に 作れる
12
提案(続き) 人間が作ったモデ ル + 深い ( 抽象パターン認 識 ), 信用性が高い - 遅い, 効率が悪い, 整 備しにくい コンピュータが作っ たモデル + 速い, 順応で整備が やすい - 浅い ( 表層認識のみ ), データの限界 人間が フィードバック を与える フィードバック を利用し、 ルールを帰納 統計的に パターン を求める
13
設計 3成分システム: Learner: 学習方法を使い、データを変化出 来るモデルを出す: Data Learner Model Model: モデルを使い、データの変化をユー ザに出力する: Data Model Data’ Meta-Learner: ユーザのフィードバックを利 用し、新しい学習方法を推論する: Data’’ + Model’’ Meta-Learner Learner
14
人間が作る方法 Data Model 入力 出力 A t-1 ? t A t-1 B t ? A t-1 B t
15
人間が作る方法 Data Model 入力 出力 A t-1 ? t A t-1 B t A t-1 B t
16
自動獲得 Data Model 入力 出力 A t-1 ? t A t-1 B t A t-1 B t Learner A t-1 B t ? t-1 ? t ?
17
Meta-Learning (メタ学習) Data Model 入力 出力 A t-1 ? t A t-1 B t A t-1 B t Learner A t-1 B t ? t-1 ? t C t-1 D t C t-1 D t ? Meta- Learner ????????
18
設計 (Behavior) Hybrid, Interactive Bootstrapping: 1. 自動獲得を利用して簡単なモデルを作る 2. ユーザのモデルとデータのフィードバッ クを受ける。 3 a. フィードバックで変形されたモデル ( 強 い ), データ ( 弱い ) を用いて1に戻る 3b. ユーザのフィードバックを利用して帰納 的に新モデル, 学習方法を作ったら1に戻 る
19
Lingquest: Use Case 1. Model Alpha = Learner Alpha (Data J ) = {…, で, は, な, い,…} 2. Model μ- gram = Learner EM (Rep J = Model Alpha (Data J )): = {…, で, は, な, い, ない, はない,…} 3. Model μ- gram (“ ではない ”) = [ で ][ はない ] 4. User corrects: 1. Strong : Model μ- gram = {…, で, は, な, い, ない, では … } 2. Weak : Rep J = [ では ][ ない ]
20
Lingquest: Use Case( 続き ) 5a. Lingquest がユーザのフィードバックで モデル、 Representation を評価し直して 2に戻る 5b. 類似行列、 feature selection 等で新しい変 形を帰納的に探す e.g.- [ で ][ もない ] [ でも ][ ない ] 2に戻る
21
まとめ コンピュータの計算能力と人間の知的能 力で協力する、 Lingquest というシステム を提案した 情報工学の Contribution : 人間がモデルを作る方法より効率がいい 自動獲得システムの問題はいくつかを解決す る( EM 局所極大や浅いモデルなど) 簡単にユーザがコンピュータの結果を直すだ けではなく、インタラクションで学ぶ方法を 開発する
Similar presentations
© 2025 SlidePlayer.com. Inc.
All rights reserved.