语料库研究中的 主题词分析方法及其扩展 中国外语教育研究中心 梁茂成 An extension to the keyword approach in corpus analysis.

Slides:



Advertisements
Similar presentations
Police-Rescue Learner’s Dictionary Epp Leibur, Külli Saluste.
Advertisements

What is a corpus?* A corpus is defined in terms of  form  purpose The word corpus is used to describe a collection of examples of language collected.
核心能力意見調查 計畫主持人:劉義周教授 研究助理: 林珮婷 報告日期: 調查案的目標與性質 調查的主要目的在進行宣傳,讓全校師生可以瞭 解何謂「課程地圖」與「核心能力」。 通識中心將核心能力主要區分為「學術訓練」、 「就業準備」、「公民文化養成」、「個人特質 提升」等四大面向,本調查依據此四大面向進一.
1 信息安全学科简介 方贤进 博士 / 副教授 2009/12/23 An Introduction to Information Security.
上一页 下一页下一页 绪论绪论 任课教师 : 高庆宇 中国矿业大学化工学院 应化系中国矿业大学化工学院 应化系 序.
文獻探討 Literature Review. 文者典籍也,獻者賢也 朱熹 功能與目的 決定研究題目與問題 選取理想模式 與先前結果做比較及應 証 避免重複他人研究.
第二部分 行政法律关系主体 第一节 行政主体 一、行政主体 (一)行政主体的概念 cc (二)行政主体资格含义及构成要件 CASE1CASE1\CASE2CASE2 (三)行政主体的职权和职责 1 、行政职权的概念及内容 2 、行政职权的特点 3 、行政职责.
Data-Driven South Asian Language Learning SALRC Pedagogy Workshop June 8, 2005 J. Scott Payne Penn State University
Badi Chen, St. Paul's High School1 Learning Masters  English Learning English Learning  Free Time Activities  Tips For Being A Good Leaner.
1 第三章 管理环境 一、外部环境因素 一、外部环境因素 二、内部环境因素 二、内部环境因素 三、当代的管理环境特点 三、当代的管理环境特点.
An Introduction to English Linguistics. Course objectives: -- mastery of some linguistic concepts and theories in order to understand how language is.
聚合物在生物高分子分离中的应用 王延梅 中国科学技术大学高分子科学与工程系 Tel
数据库与智能网络研究室. © htttp://dbin.jlu.edu.cn 数据库系统原理复习大纲.
绪 论 一、药物分析性质与任务 二、国家药品标准 三、药品质量管理规范 四、课程的要求. 药 品 用于预防、治疗、诊断人的疾病, 有目的地调节人的生理机能并规定有适应 症或者功能主治、用法用量的物质, 是广大人民群众防病治病、保护健康必不 可少的特殊商品。 《中华人民共和国药品管理法》 性质与任务.
1 地 理 信 息 系 统 —— 专业必修课程 西南大学地理科学学院 田永中 ,
Corpus Linguistics What can a corpus tell us ? Levels of information range from simple word lists to catalogues of complex grammatical structures and.
Research methods in corpus linguistics Xiaofei Lu.
Unit 1 How often do you exercise?
ASYMMETRY OF NULL SUBJECTS AND NULL OBJECTS IN CHINESE SPEAKERS ’ L2 ENGLISH Boping Yuan University of Cambridge.
Online Corpora in L2 Writing Class Zawan Al Bulushi Indiana University Bloomington November 15,
From collocation to colligation
Tatsuhiko Matsushita (University of Tokyo) 2013 Victoria University of Wellington 1.
PowerConc: An R-gram Based Corpus Analysis Tool Jiajin Xu & Yunlong Jia Beijing Foreign Studies University.
Unit1 How can we become good learners?
教学设计过程实例 北京教育科学研究院 基础教育教学研究中心 张玲棣. The Easter Bunny Easter is a Christian holiday and a holiday celebrating the rebirth of nature. It occurs on a Sunday.
In Search of a Measure of Grammaticality: A Probabilistic Approach Liang Maocheng.
ENG 626 CORPUS APPROACHES TO LANGUAGE STUDIES exploring frequencies in texts Bambang Kaswanti Purwo
Unit 4. dictionary pen eraser ruler — What’s this in English? — It’s a / an … book pencil box pencil schoolbag.
语料库与英语教学 许家金 中国外语教育研究中心 北京外国语大学. Corpora and ELT Xu Jiajin Beijing Foreign Studies University.
Chapter 10 Language and Computer English Linguistics: An Introduction.
教学设计 Instructional Design (ID). 教学设计:回答 3 问题 What is instructional design? Why design? How to design a good lesson?
1 全国高等学校英语教师 教育与发展系列研修班 Statistics in action: A listening strategies project 25 July 2010 Victoria University of Wellington 中国外语教育研究中心 顾永琦
论文阅读与评价 Paper 2 文秋芳 中国外语教育研究中心 2008 年 7 月. By Carol A. Fraser Reading Rate in L1 Mandarin Chinese and L2 English Across Five Reading Tasks.
Tracking Language Development with Learner Corpora Xiaofei Lu CALPER 2010 Summer Workshop July 12, 2010.
GUIDE : PROF. PUSHPAK BHATTACHARYYA Bilingual Terminology Mining BY: MUNISH MINIA (07D05016) PRIYANK SHARMA (07D05017)
Seminar in Applied Corpus Linguistics: Introduction APLNG 597A Xiaofei Lu August 26, 2009.
學校本位暨教師自我 專業進修研習規劃服務 教育訓練 指導單位:教育部 執行單位:全國教師在職進修資訊網 講 師:國立高雄師範大學進修學院教師生涯專業發展研究中心 曾子唐 專任研究助理 尤嬿琇 專任研究助理.
牛津高中英语 ( 模块八 · 高二下学期 ). The Universal Language Project 板块:教学设计 — 课件 Unit 2.
一、教材分析: The analysis of the textbook 1 、教材的地位及作用 Position and function As we know reading is main part of teaching in senior school. Reading plays an.
Teaching Vocabulary. Without grammar, little can be conveyed; Without grammar, little can be conveyed; without vocabulary, nothing can be conveyed. ----D.Wilkins.
Yao Ming strong healthy. He is playing basketball. Playing basketball is ________. exercise / 'eksəsaiz / 打篮球是锻炼。 锻炼.
Copy all files on CD to D drive D:\workshop. Corpus: An Internet Metaphor  Web pages + search engine  Texts + Tools.
“ 图书馆资源与服务利用 ” 专题讲座 第 9 讲 JSTOR 数据库与 Kluwer Online 数据库的使用.
R esearching learner E nglish on a portfolio corpus --A research proposal for diachronic studies L i W enzhong.
学习者书面语中的程序化词汇研究 Procedural vocabulary and EFL writing quality 梁茂成
Mini-test of Unit 3 1.Basque is quite different from the other European languages. It is used in___ A. Northern Spain B. Northern Ireland C. Southern.
Unit 7. dictionary pen eraser ruler — What’s this in English? — It’s a / an … book pencil box pencil schoolbag.
Lesson 4 :Do They Work ? 冀教版五年级英语上册 Unit1 My Family.
1 教育部 2011 年高等学校青年骨干教师高级研修班项目 北京市大学英语教师专业化能力发展专题研修班 高等学校外语学科中青年骨干教师高级研修班 Doing action research in English language teaching National research center for.
Corpus search What are the most common words in English
无忧 PPT 整理发布 无忧 PPT 整理发布 网上教研活动的推进与 学习社区的构建 首都师范大学 蒋国珍 2008 年 12 月.
牛津高中英语牛津高中英语 ( 模块七 · 高二上学期 ). Project 板块:教学设计 — 课件 Unit 3 Doing research on the Internet.
M1U2 The road to Modern English 文本解读 温州八高 李培雷. 文章标题; 篇章 / 段落结构; 信息和语言; 阅读策略; 作者意图 / 态度 ; 教学目标、重难点 文本分析:
A Genre Analysis of Chinese and English Abstracts of Academic Journal Articles: A Parallel-Corpus-based Study A Genre Analysis of Chinese and English Abstracts.
外研新标准 第六册 选修 6. Module 5 Listening Objective 能识别听力中新学的词汇、短语并 正确理解其含义。能听懂对话中主 要内容并提取信息。
广州市教育局教学研究室英语科 Unit 1 Reading & listening & speaking By 广州七中 谢鸿运.
森林保护学本科系列课程 教学改革与实践 西北农林科技大学 一、基本情况 二、主要成果 三、创新点 四、成果的应用 项目研究背景 项目的总体设计 成果简介 解决的主要教学问题 解决教学问题的方法 改革前后的对比.
Corpus Linguistics MOHAMMAD ALIPOUR ISLAMIC AZAD UNIVERSITY, AHVAZ BRANCH.
课程简介 算法设计与分析 ( Design and Analysis of Algorithms) 任课教师 : 王轶彤 Tel: TA: 周泽学 授课方式 : 全英文教学, 3.
How do you read? Time for reading 2012 浙江 C (6 min)
韩文数据库使用说明 鲁锦松. 主要内容 一、为什么要用数据库 二、怎样利用中文数据库 三、怎样利用韩文数据库.
1 全国高等学校英语教师教育与发展 系列研修班 问卷设计与实施 中国外语教育研究中心 文秋芳. 2 Questionnaire Design and Administration Wen, Qiufang The National Research Center for Foreign Language.
What is a Corpus? What is not a corpus?  the Web  collection of citations  a text Definition of a corpus “A corpus is a collection of pieces of language.
SCI 数据库检索练习参考 本练习完全依照 SCI 数据库实际检索过程而 实现。 本练习完全依照 SCI 数据库实际检索过程而 实现。 练习中,选择了可以举一反三的题目,读 者可以根据题目进行另外的检索练习,如: 可将 “ 与 ” 运算检索改为 “ 或 ” 、 “ 非 ” 运算检索 等等。 练习中,选择了可以举一反三的题目,读.
Unit 9 Section B Period 2 (2a - Self Check). What is your favorite school day? What classes do you have on that day?
Exploring the BNC Corpus
《新视野大学英语 读写教程》 (第一版) Book 1 · Unit 4 安徽师范大学·外国语学院 王瑜.
清新毕业答辩模板 THESIS DEFENSE POWERPOINT TEMPLATE 指导老师:X教授 答辩人:宝藏PPT.
英语教学课件系列 Unit 2 Culture shock 九年级(下) More practice and Project
LOGO XX学校 这回我们毕业啦 我们毕业啦 其实是答辩的标题地方 答辩人 李某某 指导老师 XX教授.
Presentation transcript:

语料库研究中的 主题词分析方法及其扩展 中国外语教育研究中心 梁茂成 An extension to the keyword approach in corpus analysis

主要内容 Keywords Applications of corpus comparison Limitations to the keyword approach Keywords+ Demo

Keywords ☻ Keywords: ☺ Keywords are words whose frequency is unusually high (or low) in comparison with some norm. (Scott, 2003)

Keywords ☻ Positive keywords: ☺ Words which occur more often than would be expected by chance in comparison with the reference corpus.

Keywords ☻ Negative keywords: ☺ Words which occur less often than would be expected by chance in comparison with the reference corpus.

Keywords ☻ Positive and negative keywords ☺ In a corpus of business English, words such as business, profit and companies are likely to be positive keywords if the corpus is to be compared with a general corpus.

Keywords ☻ Positive and negative keywords ☺ In a corpus of academic English, words such as morning, afternoon and evening are likely to be negative keywords if the corpus is to be compared with a general corpus.

Keywords ☻ Calculating keyness (Rayson et al. 2004, Oakes 1998) ☺ Chi-square

Keywords Chi-square

Keywords Chi-square with Yate’s correction

Keywords Loglikelihood References:

Keywords ☻ Previous research has revealed that loglikelihood is a better measure than chi-square when comparing word frequencies in corpora.

Keywords ☻ Ways to find keywords: ☺ Top-down: corpus-based ☺ Buttom-up: corpus-driven

Applicatons of… ☺ Comparison across users ☺ Comparison across genres ☺ Comparison across times ☺ Comparison across (varieties of) languages

Applicatons of… ☺ Compiling a specialized dictionary ☺ Detecting the topic ☺ Genre analysis ☺ Contrastive Interlanguage Analysis ☺ ……

Limitations to… ☻ Keywords: ☺ Do keywords have to be single words? Phraseology seems more interesting! ☺ Do keywords have to be lexical words? POS tag sequences may also be interesting. ☺ Can we bring together the bottom-up approach and the top-down approach?

Limitations to… ☻ Top-down: the problem is I do not yet know what may be interesting.

Limitations to… ☻ Buttom-up: the problem is that I have been given a long list of keywords, only some of which are interesting, buried among many others which do not seem interesting at all.

Keywords+ ☻ Support multiword sequences ☻ Support online search ☻ Support POS tag sequences ☻ Support regex search

Demo ☻ demo

Thank you.