ピボット言語を介したフレーズベース統 計的機械翻訳を用いた対訳辞書の構築 綱川 隆司 1 岡崎 直観 1 辻井 潤一 1,2 1 東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室 2 School of Computer Science, University of Manchester.

Slides:



Advertisements
Similar presentations
AIR マスターへの 抜け道!? ~といいつつ王道話です~ 平成 20 年 2 月 6 日 図書系のための アプリケーション開発講習会.
Advertisements

3D Wand による 3 次 元形状計測. 3次元形状計測装置  3D Wand(テクノドリーム 21 社 製)  構成 3D Wand 本体: 7 つの発光ダイオー ドとラインレーザー発光装置が一体となっ た手に持って移動できる電池駆動の装置.
コンピュータとコーパスを使用 して、英語を理解し、使いこな す 北尾 謙治. コーパス テキストの集積したもの テキストファイルや、それを集めたも の 電子コーパスとも呼ばれる (音声コーパス)
7.n次の行列式   一般的な(n次の)行列式の定義には、数学的な概念がいろいろ必要である。まずそれらを順に見ていく。
9.線形写像.
神戸大学 大学院 理学研究科 地球惑星科学専攻 地球および惑星大気科学研究室 M 2 島津 通. Index ITPASSとは 目的 目標 活動内容 勉強会 計算機管理 その他の活動 環境 まとめ.
学生の携帯電話選択理由 岡田隆太.
大気重力波と一般流 の相互作用 & 自己紹介 元 東京学芸大学 教育学部 環境総合科学課程 自然環境科学専攻 気象学研究室 現 今村研 M 1 樋口武人 元 東京学芸大学 教育学部 環境総合科学課程 自然環境科学専攻 気象学研究室 現 今村研 M 1 樋口武人.
「のだ」と「のか」の使用・非使用に関する 文法および語彙知識の影響 趙萍(麗澤大学大学院生) 玉岡賀津雄(名古屋大学) 木山幸子(麗澤大学大学院生) 言語科学会第 11 回年次国際大会 (JSLS2009)
時間的に変化する信号. 普通の正弦波 は豊富な情報を含んでいません これだけではラジオのような複雑な情報 を送れない 振幅 a あるいは角速度 ω を時間的に変化 させて情報を送る.
情報処理A 第10回 Excelの使い方 その3.
九州大学 岡村研究室 久保 貴哉 1. 利用中のAPの数の推移 2 横軸:時刻 縦軸:接続要求数 ・深夜では一分間で平均一台、 昼間では平均14台程度の接続 要求をAPが受けている。 ・急にAPの利用者数が増えてく るのは7~8時あたり.
麻雀ゲーム 和島研究室 ソ 小林巧人
5.連立一次方程式.
相関.
1 情報量(2章). 2 物理的概念との対比1(入れ物と中 身) 塩水 塩 データ 情報 情報の量? 塩分の量! 情報の量は見た目ではわ からない。データと情報 は異なる概念。 塩分の量は見た目 ではわからない。 しかし、本質的な もの。
つくばだいがくについて 芸術専門学群のこと. 筑波大学ってこんなところ 東京教育大学を前身とする大学で、その 創立は日本で最も古い大学のひとつ。 大学の敷地面積は日本で二番目に広い大 学で、やたら坂が多い。移動時間が15分 しかないのに上り坂を三つ超えることがよ くある。
―本日の講義― ・平均と分散 -代表値 -ぱらつき(分散・標準偏差等) ・Excelによる演習
人工知能特論 II 第 6 回 二宮 崇 1. 今日の講義の予定 確率的文法 品詞解析 HMM 構文解析 PCFG 教科書 北研二 ( 著 ) 辻井潤一 ( 編 ) 言語と計算 4 確率的言語モデル 東大出版会 C. D. Manning & Hinrich Schütze “FOUNDATIONS.
素数判定法 2011/6/20.
地球温暖化と 天候の関係性 ~温暖化は天候のせいなのではないのか~. 目的課題 地球温暖化現象 ただの気象条件によるものではないのか? 地球温暖化現象に天候は関係しているの か?
公開鍵暗号系 2011/05/09.
1章 行列と行列式.
フーリエ級数. 一般的な波はこのように表せる a,b をフーリエ級数とい う 比率:
3.エントロピーの性質と各種情報量.
1 6.低次の行列式とその応用. 2 行列式とは 行列式とは、正方行列の特徴を表す一つのスカ ラーである。すなわち、行列式は正方行列からスカ ラーに写す写像の一種とみなすこともできる。 正方行列 スカラー(実数) の行列に対する行列式を、 次の行列式という。 行列 の行列式を とも表す。 行列式と行列の記号.
計算のスピードアップ コンピュータでも、sin、cosの計算は大変です 足し算、引き算、掛け算、割り算は早いです
線形符号(10章).
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
1 0章 数学基礎. 2 ( 定義)集合 集合については、 3セメスタ開講の「離散数学」で詳しく扱う。 集合 大学では、高校より厳密に議論を行う。そのために、議論の 対象を明確にする必要がある。 ある “ もの ” (基本的な対象、概念)の集まりを、 集合という。 集合に含まれる “ もの ” を、集合の要素または元という。
人工知能特論II 第7回 二宮 崇.
1 9.線形写像. 2 ここでは、行列の積によって、写像を 定義できることをみていく。 また、行列の積によって定義される写 像の性質を調べていく。
通信路(7章).
アルゴリズムとデータ構造 補足資料 7-4 「単純交換ソート exsort.c 」 横浜国立大学 理工学部 数物・電子情報系学科 富井尚志.
3.プッシュダウンオートマトンと 文脈自由文法
研究会 “Harmonies and Surprises on the Lattice” 地域社会と連携した大学教育と 研究プロセスの類似性 ~松本大学での帰納的教育手法の展開~ 報告者: Matsumoto University 松本大学/松本大学松商短期大学部 Hiroyuki Sumiyoshi.
平成22年度予算の国立大学法人関連要望事項に係るパブリックコメント説明会
3.正方行列(単位行列、逆行列、対称行列、交代行列)
名古屋工業大学 電気電子工学科 岩波・岡本研究室 野々村嘉人
論理回路 第1回. 今日の内容 論理回路とは? 本講義の位置づけ,達成目標 講義スケジュールと内容 受講時の注意事項 成績の評価方法.
Bar-TOP における光の 群速度伝播の解析 名古屋大学 高エネルギー物理研究室 松石 武 (Matsuishi Takeru)
伝わるスライド 中野研究室 M2 石川 雅 信. どのようなスライドを作れば良 いか 伝えたいこと.
JPN 312 (Fall 2007): Conversation and Composition Contraction (2); 意見を言う (to express your opinion)
JPN 311: Conversation and Composition 勧誘 (invitation)
JPN 311: Conversation and Composition 許可 (permission)
C言語応用 構造体.
Servlet 入門 大岩研究室 川村昌弘. そもそも WEB アプリってなんやね ん n この研究会のテーマは『 WEB アプリケー ションの開発』でした. n じゃぁ WEB アプリケーションって何です か? o WEB アプリってどんなものがありますか? 検索エンジン 乗換え案内サイト 翻訳.
実装の流れと 今後のスケジュール 03k0014 岸原 大祐. システム概要 天気データをもとに、前向き推論をし ていき、親の代わりに子供に服装、持 ち物、気をつけることなどを教える。
Automatic Language Acquisition, an Interactive Approach † Robert J. Martin † 大西昇 ‡ 山村毅 † 名古屋大学 ‡ 愛知県立大学.
1 中野研究室 4 年ゼミのイロハ 斉藤(修士 2 年) ( 2009 年 ”4 年ゼミのイロハ ” を参考に作りました)
言語とジェンダー. 目的 言語には、性的な存在である人間の自己認識や 世界認識を決定する力が潜んでいる。 – 言語構造の面(言語的カテゴリー ) – 言語運用の面 日常に潜む無意識の言語の力を、記述し、意識 化することが本講義の目的である。 同時に、さまざまな言語、さまざまな文化には、 それぞれに特徴的な問題があり、ジェンダーの.
移動エージェントプログラムの 動作表示のためのアニメーション言 語 名古屋大学情報工学コース 坂部研究室 高岸 健.
プログラミングⅠ( 2 組) 第 1 回 / pLB1.pptx.
第14回 プログラムの意味論と検証(3) 不動点意味論 担当:犬塚
Run2b シリコン検出 器 現在の SVX-II (内側3層)は 放射線損傷により Run2b 中に 著しく性能が劣化する Run2b シリコン検出器 日本の分担: 1512 outer axial sensors 648 outer stereo sensors ( 144 inner axial.
ネットワークの基礎技術と TCP/IP 曹 暁達 ( そう ぎょうたつ ) 国際産業情報学科 2 年 10 月 28 日.
ことばとコンピュータ 2007 年度 1 学期 第 1 回. 2 ことばとコンピュータ 授業科目名:言語情報処理論 授業題目名:ことばとコンピュータ 履修コード: 5067 教室: 323 一学期開講 授業の進め方 – 基本的に講義中心ですすめ,時々コンピュー タを使う.
図書館における 個人対応検索システム                03k1001 赤塚 拓巳.
携帯電話でのコミュニ ケーションについて 1班真田 出水 佐伯 堺. 仮説  女性のほうが携帯電話を使ったコミュニ ケーションを重要視する。
日本の開発援助と法情報理論 国際的な比較法研究基盤の整備 2004 年度「アジア法整備支援」全体会議 名古屋大学大学院法学研究科 松浦好治 2004/12/05.
LabVIEWを用いた計測制御システムの構築1 - 電気抵抗率算出プログラムの作成 -
Kitenet の解析 (110118) 九州大学 工学部 電気情報工学科 岡村研究室 久保 貴哉.
Exercise IV-A p.164. What did they say? 何と言ってましたか。 1.I’m busy this month. 2.I’m busy next month, too. 3.I’m going shopping tomorrow. 4.I live in Kyoto.
音の変化を視覚化する サウンドプレイヤーの作成
東北大学 情報科学研究科 システム情報科学専攻 TOKUYAMA Lab. 1 左順序付き柔軟ラベリングの実 装 Implementation of Left-part ordered Flexible Labeling 東北大学大学院 情報科学研究科 ◎小池 敦 徳山 豪.
英語勉強会 名手⇒詫間 2015/10/22. 原文 This study says acquiring motor skills support system. There is how to acquire moor skills that coach advises learner. Motor.
Bootstrapping 2014/4/13 R basic 3 Ryusuke Murakami.
教養的教育パッケージ別科目 「産業と技術」 制度と生活世界 自然の視角 LSI と産業 広島大学 ナノデバイス・システム研究センター 平成 14 年度前期 横山 新 後期 吉川公麿 HIROSHIMA UNIVERSITY 平成 14 年 5 月 28 日.
腎臓移植 腎臓移植の前に、ドナー両方の腎臓は機 能的に良好でなければならない。ドナー の両方の腎臓が機能的に健康であること を保証するために、多数の試験が行われ ている。
地球儀と様々な地図. 1 球体としての地球 こうした現象はあることをイ メージすると理解できる。
Presentation transcript:

ピボット言語を介したフレーズベース統 計的機械翻訳を用いた対訳辞書の構築 綱川 隆司 1 岡崎 直観 1 辻井 潤一 1,2 1 東京大学大学院情報理工学系研究科コンピュータ科学専攻 辻井研究室 2 School of Computer Science, University of Manchester / National Centre for Text Mining, UK

モチベーション 英語とその他の言語の2言語間の対訳辞書は, 英語以外の2言語間の対訳辞書に比べ資源が豊 富  英語を中間言語(ピボット言語)として英語以 外の2言語の単語を結びつけることで,既存の 対訳辞書に比べより多くの対訳項目の獲得が期 待できる 辞書の英語項目によって単純に結びつけるだけ でなく,統計的機械翻訳を用いて可能な限り結 びつける

対訳辞書のマージ ChineseEnglish 代谢综合症 metabolic syndrome 道恩综合症 Down’s syndrome 抗体缺乏 综合症 antibody-deficiency syndrome JapaneseEnglish 代謝異常 metabolic disorder ダウン症候群 Down’s syndrome メタボリック metabolic シンドローム syndrome 抗体欠乏 antibody deficiency ChineseJapanese 道恩综合症 ダウン 症候群 単純な辞書マッチング では1対訳しか 獲得できない

対訳辞書のマージ ChineseEnglish 代谢综合症 metabolic syndrome 道恩综合症 Down’s syndrome 抗体缺乏 综合症 antibody-deficiency syndrome JapaneseEnglish 代謝異常 metabolic disorder ダウン症候群 Down’s syndrome メタボリック metabolic シンドローム syndrome 抗体欠乏 antibody deficiency ChineseJapanese 道恩综合症 ダウン 症候群 代谢综合症 メタボリッ クシンド ローム 代谢综合症代謝症候群 抗体缺乏 综合症 抗体欠乏 症候群

フレームワーク 中英 対訳辞書 中英 対訳辞書 日英 対訳辞書 日英 対訳辞書 単語アライン メント・対訳 フレーズ対抽 出 中英対訳 フレーズ対 (確率付 き) 中英対訳 フレーズ対 (確率付 き) 日英対訳 フレーズ対 (確率付 き) 日英対訳 フレーズ対 (確率付 き) マージした 日中対訳 フレーズ対 (確率付き) マージした 日中対訳 フレーズ対 (確率付き) フレーズ ベース 統計的 機械翻訳 中英辞書の 日本語訳 中英辞書の 日本語訳 同一の英語を持つフ レーズ対の併合・確率 の再計算 その他の特徴等 代谢综合症 メタボリック シンドローム p( メタボリック | 代谢 )=0.35 p( シンドローム | 综合 症 )=0.50