(CTV Viện CNTT – ĐHQG Hà Nội) HƯỚNG SỬ DỤNG KHỐI LIỆU TIẾNG VIỆT TS. Đào Hồng Thu (CTV Viện CNTT – ĐHQG Hà Nội) Hà Nội, 08/2010 Corpus Linguistics
XUẤT PHÁT ĐIỂM NGHIÊN CỨU Công nghiệp nội dung Công cụ Công nghệ ngôn ngữ Công nghệ thông tin Xử lý dữ liệu Xử lý ngôn ngữ Corpus Linguistics
NỘI DUNG Sử dụng khối liệu tiếng Việt Các đề nghị Corpus Linguistics
I. KHỐI LIỆU TIẾNG VIỆT Trong giáo dục Trong dạy và học ngôn ngữ (ngoại ngữ và bản ngữ) Mục tiêu: xây dựng hệ thống các thể loại từ điển và từ điển tự động hóa trong hệ thống dịch máy Mục tiêu: xây dựng Khối liệu tiếng Việt (ngôn ngữ quốc gia) và các khối liệu ngôn ngữ dân tộc Corpus Linguistics
1. TRONG GIÁO DỤC Chương trình dạy và học trên Internet Mạng thông tin thống nhất của công nghiệp giáo dục với các thành viên tham gia Corpus Linguistics
Sử dụng khối liệu ngôn ngữ trong giáo dục cho phép: Nâng cao chất lượng dạy và học; Thúc đẩy quá trình NCKH; Tiết kiệm thời gian; Nâng cao tính năng động và hiệu quả quản lý giáo dục; Liên kết các hệ thống đào tạo, tiếp cận dễ dàng các thông tin trong các lĩnh vực giáo dục, khoa học, văn hóa v.v. Corpus Linguistics
2. TRONG GiẢNG DẠY NGÔN NGỮ (NGOẠI NGỮ VÀ BẢN NGỮ) Ứng dụng trực tiếp trong quá trình giảng dạy và nghiên cứu ngôn ngữ Đánh giá các tài liệu giảng dạy hiện hành Corpus Linguistics
Kết quả khảo sát Khả năng sử dụng khối liệu để tham khảo, phân tích dữ liệu thực và sử dụng các ngữ liệu, giảm tối đa giao thoa ngôn ngữ văn bản Mở rộng kiến thức về đối chiếu ngôn ngữ và dịch thuật Khả năng tham gia vào quá trình hiệu đính Tốc độ mở rộng lượng từ trong lĩnh vực chuyên ngành Corpus Linguistics
3. XÂY DỰNG HỆ THỐNG CÁC THỂ LOẠI TỪ ĐiỂN Từ điển đơn ngữ Từ điển song ngữ Từ điển đa ngữ Từ điển chính tả Từ điển khoa học chuyên ngành Dictionary of Usage Thesaurus (Từ điển chuyên khảo) Từ điển tự động hóa trong hệ thống dịch máy Corpus Linguistics
4. XÂY DỰNG KHỐI LIỆU TIẾNG VIỆT (ngôn ngữ quốc gia) và CÁC KHỐI LIỆU NGÔN NGỮ DÂN TỘC Corpus Linguistics
II. CÁC ĐỀ NGHỊ Corpus Linguistics
1. Giới thiệu với NCS ngôn ngữ và giáo viên tiếng Anh Phương pháp sử dụng khối liệu ngôn ngữ, bao gồm cả concordance Phương pháp xây dựng concordance có sự tham gia của tiếng Việt Phương pháp xây dựng bài giảng trên cơ sở Hot Potatoes 6 Corpus Linguistics
Khối liệu Anh Quốc Corpus Linguistics
Concordance khối liệu tiếng Anh Corpus Linguistics
Ví dụ concordance Corpus Linguistics
Hot Potatoes 6 Corpus Linguistics
2. Giới thiệu và cộng tác Nghiên cứu và xây dựng Khối liệu tiếng Việt (ngôn ngữ quốc gia) và các khối liệu ngôn ngữ dân tộc Nghiên cứu và xây dựng Viet TreeBank Nghiên cứu và xây dựng từ điển tự động hóa dành cho hệ thống dịch máy (dịch tự động) Corpus Linguistics
3. Xây dựng bộ môn và nghiên cứu, đào tạo khoa học liên ngành là NGÔN NGỮ HỌC KHỐI LiỆU Corpus Linguistics
School of Computing Corpus Linguistics
XIN CẢM ƠN! Corpus Linguistics