Presentation is loading. Please wait.

Presentation is loading. Please wait.

「英語」を対象とした データ化 英語の文章を電子化する 山内、宿久、田口, 波多野、伊藤、 金、菅野、星、北尾.

Similar presentations


Presentation on theme: "「英語」を対象とした データ化 英語の文章を電子化する 山内、宿久、田口, 波多野、伊藤、 金、菅野、星、北尾."— Presentation transcript:

1 「英語」を対象とした データ化 英語の文章を電子化する 山内、宿久、田口, 波多野、伊藤、 金、菅野、星、北尾

2 コーパスとは? テキストの集積したもの テキストファイルや、それ を集めたもの 電子コーパスとも呼ばれる (音声コーパス)

3 作り方 コンピュータに文字を打ち込 み、保存する 印刷物はスキャナーで読み込 む WEBにある文字はコピーする 音声を書き起こして、入力す る

4 コーパスの意義 加工が容易 切り離したり、結合したり 種々の加工が容易 目的に合わせたコーパスを作 成しやすい 大きなコーパスも比較的容易 に作成できる

5 検索が容易 (辞書?) 大きなコーパスでも、特定の 語や語群の検索が容易にできる 複数のコーパスを検索するこ とも可能 複数の検索が可能 正規表現の検索が可能 検索結果をリストすることも 可能

6 解析ができる 語の頻度表 頻度順 アルファベット順 語や語群のリスト 語や語群の前後関係を調べ る 複数のコーパスで可能 複数のコーパスを比較する

7 コーパスをコンピュータを 使用して分析すれば、その ことばと表現の種々の特徴 を見つけられる。 作家の表現の特徴 イギリス英語とアメリカ 英語の比較 古い英語と最近の英語の 比較 女性と男性の英語の比較 話し言葉と書き言葉の比 較 ある語や語群の用例の検 索

8 コロケーションの強さ 特殊な辞書 天気に関する語彙と 用例 会話用例集 学習者の英語の間違いの 特徴を見出す 自動翻訳 英作の自動採点 英語学習教材 自動テスト作成

9 皆さんは、今まで英語を学習 していて、「英語ってこん な特徴があるのではない か」と感じたことはありま せんか。

10 実際に使用されている大量の 英語のコーパスを分析すれ ば、そんな疑問の答えもみ つかるはずです。

11 習った文法と異なる英語を聞 いたり見たりしたことはな いですか。 文法は本当に正しいのでしょ うか。

12 コーパス言語学 コーパス = 英語のデータ データに基づく実証的な研究 非母語者でも英語の研究がしや すい

13 コーパス言語学の歴史 1960年代から研究が進んだ Brown Corpus (百万語 1961-1964) LOB Corpus (百万語 1970-1978) Brown Corpusのタグ付け (1970-1978) 1980年代に用語が確立 BNC (1億語 1991-1 994) Bank of English (2億語 1991-1995)

14

15 ここ半世紀で急激に発達した。 とくに1990年以降 コンピュータの発達と普及 容量 速度 言語のデジタル化が進む インターネットの発達

16 コーパスの種類 Balanced Corpus British National Corpus (BNC) American National Corpus (ANC) Bank of English ESP Corpus Lerner Corpus Parallel Corpus

17 コーパスで何ができるか 語彙の研究 文法の研究 用例・表現の研究 文体や作者の比較研究 母語者と学習者の英語の比較 言語学習や教育 辞書、文法書、語法書、テキス ト、テスト

18 辞書

19 文法書、語法書

20 教材

21 単語集

22

23 参考文献 英語コーパス言語学 : 基礎と実 践 / 齊藤俊雄, 中村純作, 赤野 一郎編 改訂新版 東京 : 研究社, 2005.2 実践コーパス言語学 : 英語教師 のインネット活用 / 鷹家秀史, 須賀廣共著 東京 : 桐原ユニ 東京 : 1998.11

24 このクラスですること

25 目的 以下の 3 点を体験して学習す る 英語の文章(テキストデー タ)を電子化 コーパスを作成 コーパスの整形と解析

26 材料の英語の文章 WEB 〔インターネット〕 印刷物 〔紙の媒体〕 音声 〔録音物〕

27 取り込む手段 WEB マウスやキーボー ド 印刷物 スキャナ 音声 テープレコーダ 「おこしやす」 ソフト

28 整形・解析 ソフトを使用 エディタ Word Excel コンコーダンサ

29 期待される結果 今まで英語のクラスで学習した 語彙や文法 新たな見方 以前と異なる他の理解の仕 方がある それがどのようなものか

30 クラスの作業 よい結果を得るには 細かい作業を正確に 順序よく作業をする このマニュアルをよく読む 効率よく作業をすること

31 必修課題 授業中に必ず終え る 自由課題 終えるように努力 する 作業結果 提出 整理して保 管 最後に 4 回分を通してして、ま とめて、レポートを作成

32 4 回の授業 1 WEB の英語の文章の取り込 みと整形 コピー ごみの掃除 元の文章と同じか確認 エディタや Word を使用して整 形

33 2 印刷物の英語の文章の取 り込み スキャナを使用して取り込 む 後は WEB と同じ 注意 ごみは多い

34 3 音声英語を書き起こす テープレコーダや「おこしや す」を使用して音声英語を聞 き、書き取る 元の文章に限りなく近い英語の 文章を作成 エディタや Word を使用して整形

35 4 英語のコーパスの計量解析 語の頻度 キーワードの抽出 キーワードの頻度のグラフの作 成 キーワードの前後関係を見る

36 5 レポートの作成

37 評価 授業 4 回 50% 遅刻 30 分以内 半分 それ以上 欠席扱い レポート 50%

38 The End


Download ppt "「英語」を対象とした データ化 英語の文章を電子化する 山内、宿久、田口, 波多野、伊藤、 金、菅野、星、北尾."

Similar presentations


Ads by Google