Structure-based Web Access Method for Ancient Chinese Characters


Similar presentations
1 The Ideographic Composition Scheme and Its Applications in Chinese Text Processing Qin LU Department of Computing, The Hong Kong Polytechnic University.

首 页 首 页 上一页 下一页 本讲内容 投影法概述三视图形成及其投影规律平面立体三视图、尺寸标注 本讲内容 复习: P25~P31 、 P84~P85 作业: P7, P8, P14[2-32(2) A3 (1:1)]
1 FAIR USE of TRADEMARK in OSS Xue Ji Chinese Academy of Engineering
第十二章 常微分方程 返回. 一、主要内容 基本概念 一阶方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程 类 型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次 方程 5. 全微分方程 6. 线性方程.
Writing: letter of advice.
Digital Humanities, Research Computing Modeling Life Histories and this workshop Peter Bol.
第二章 质点组力学 质点组:许多(有限或无限)相 互联系的质点组成的系统 研究方法: 1. 分离体法 2. 从整体考虑 把质点的三个定理推广到质点组.
OCLC 及 OCLC ECO 电子期刊. 创建于 1967 年 非盈利性的会员机构 总部设在美国俄亥俄州, 目前有来自 86 个国家和地区的 个成员馆, 为 83 个国家和地区 43,000 个图书馆 提供信息服务 世界上最大的联合图书馆 OCLC(Online Computer Library.
分析化学与无机化学中溶液 pH 值计算的异同比较 谢永生  分析化学是大学化学系的一门基础课,课 时较少,其内容主要是无机物的化学分析。 分析化学是以无机化学作为基础的,我们 都是在已掌握一定的无机化学知识后才学 习分析化学 。所以在分析 化学的学习中会 重复许多无机化学内容,造成学习没有兴.
1 为了更好的揭示随机现象的规律性并 利用数学工具描述其规律, 有必要引入随 机变量来描述随机试验的不同结果 例 电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述 例 检测一件产品可能出现的两个结果, 也可以用一个变量来描述 第五章 随机变量及其分布函数.
: Point of View in Flatland ★★☆☆☆ 題組: Problem Set Archive with Online Judge 題號: 11037: Point of View in Flatland 解題者:黃士庭 解題日期: 2007 年 5 月 15 日 題意:在座標平面上給三個圓,找一個點使從這.
线性代数习题课 吉林大学 术洪亮 第一讲 行 列 式 前面我们已经学习了关 于行列式的概念和一些基本 理论,其主要内容可概括为:
Thomson Reuters 中国办事处 2008 年 5 月 Web of Science 培训课件 第三部分 : Web of Science 的引文检索功能.
数 学 系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章 曲线拟合的最小二乘法 给出一组离散点,确定一个函数逼近原函数,插值是这样的一种手段。 在实际中,数据不可避免的会有误差,插值函数会将这些误差也包括在内。
自顶向下分析 —— 递归下降法 递归下降法 (Recursive-Descent Parsing) 对每个非终极符按其产生式结构产生相应语 法分析子程序. 终极符产生匹配命令 非终极符则产生调用命令 文法递归相应子程序也递归,所以称这种方 法为递归子程序方法或递归下降法。
第一节 相图基本知识 1 三元相图的主要特点 (1)是立体图形,主要由曲面构成; (2)可发生四相平衡转变; (3)一、二、三相区为一空间。
第 3 章 控制流分析 内容概述 – 定义一个函数式编程语言,变量可以指称函数 – 以 dynamic dispatch problem 为例(作为参数的 函数被调用时,究竟执行的是哪个函数) – 规范该控制流分析问题,定义什么是可接受的控 制流分析 – 定义可接受分析在语义模型上的可靠性 – 讨论分析算法.
吉林大学远程教育课件 主讲人 : 杨凤杰学 时: 64 ( 第五十三讲 ) 离散数学. 定义 设 G= ( V , T , S , P ) 是一个语法结构,由 G 产生的语言 (或者说 G 的语言)是由初始状态 S 演绎出来的所有终止符的集合, 记为 L ( G ) ={w  T *
平行线的平行公理与判定 九年制义务教育七年级几何 制作者:赵宁睿. 平行线的平行公理与判定 要点回顾 课堂练习 例题解析 课业小结 平行公理 平行判定.
Statistical Software An introduction to Statistics Using R Instructed by Jinzhu Jia.
氧 族 元 素 第一课时. 氧族元素 包含元素 氧族元素包括 氧 ( 8 O) 、硫 ( 16 S) 、硒 ( Se) 、碲 ( Te) 、钋 ( Po) 等 氧 ( 8 O) 、硫 ( 16 S) 、硒 ( Se) 、碲 ( Te) 、钋 ( Po) 等 氧族元素。 它们的最外层电子、化学性质相似统称为.
Project Designing a booklet. 有个学生名字叫 “ 马騳 (dú) 骉 (biāo) ” ,开学点名了,班主 任不知怎么念,所以每当上 课点名的时候,总爱说马叉 叉到了没。 语文课上课了 ,语文老师有点文学素养, 点名道: “ 万马奔腾到了没 ? ” 接下来是体育课,体育.
Welcome 欢迎 Using the PCC 使用 PCC Dipl.-Ing. Manfred Schleicher.
Unit 22 sport. 复习表示将来时的几种方法: (P 39) Be + doing 用来谈论已经确定无疑的将来的安排 Be + going to + do ( 动词原形 ) 用来表示预先计划好的事情 Will + do ( 动词原形 ) 用来表示说话时即时决定做的事情.
演化博弈中个体的 惰性对合作行为的 影响 报告人:刘润然 中国科学技术大学 指导老师:汪秉宏教授.
Unit 1 Remember to look out for the red light!. old radio modern radio digital radio What are these?
CALIS 用户培训 2010/05/ 14 Henry Liu. Agenda Introduction of RSC RSC products RSC eplatform - Beta.
中國文字的 字形由來和演變 The Origins and Evolution of Chinese Characters.
图解老子的不言之教 · 手机版 思东创作室 编号: 009. 第1章1-2第1章1-2 第2章1-2第2章1-2.
解读卡片格式 西安交通大学图书馆 编目中心 朱超敏. 目的 回溯 部分符号的延续使用 一些概念 文献著录 图书著录 著录法 款目 标目 通用款目 目录.
How long has she been playing computer? (four hours) She has been playing computer for four hours.
名探柯南在侦查一个特大盗窃集团过程 中,获得藏有宝物的密码箱,密码究竟 是什么呢?请看信息: ABCDEF( 每个字 母表示一个数字 ) A :是所有自然数的因数 B :既有因数 5 ,又是 5 的倍数 C :既是偶数又是质数 D :既是奇数又是合数 EF :是 2 、 3 、 5 的最小公倍数.
Project Designing a booklet The development of Chinese characters.
By Lu Meijuan. The development of Chinese characters Project Designing a booklet.
2015 年江苏省美术专业统考考试说明 解读 : 贡加兵 扬州市邗江区公道中学
Unit 9 Multinational Corporation 目的要求 了解跨国公司的发展历程, 学会在工作中如何介绍自己的公司 学习重点 跨国公司的工作中心和雇员情况 公司新闻发布会公告的组成部分和格式 学习难点 了解跨国公司的运作模式, 学会在工作中如何介绍自己的公司 注意与外宾举行的业务会议的安排与内部会议安排的异同.
外研初中一年级上册 Module 1 Nice to meet you I’m from China and I’m Chinese.
力的合成 力的合成 一、力的合成 二、力的平行四边形 上一页下一页 目 录 退 出. 一、力的合成 O. O. 1. 合力与分力 我们常常用 一个力来代替几个力。如果这个 力单独作用在物体上的效果与原 来几个力共同作用在物体上的效 果完全一样,那么,这一个力就 叫做那几个力的合力,而那几个 力就是这个力的分力。
河南济源市沁园中学 前进中的沁园中学欢迎您 ! 温故知新: 1 、什么是原子? 2 、原子是怎样构成的? 3 、原子带电吗?为什么?
第四章 不定积分. 二、 第二类换元积分法 一、 第一类换元积分法 4.2 换元积分法 第二类换元法 第一类换元法 基本思路 设 可导, 则有.
演示场景. 类图 配置 HibernateApplicationContext.xml hibernate.cfg.xml 创建数据库 – ooad/ooad 关于 Library/Project 模板.
Unit 2 What time do you go to school?
Chinese Language Chapter 27:2 China developed in isolation from the rest of the world. Because they viewed their country as the center of the world,
向日葵的花盘 画一画 用圆规画圆用圆规画圆 用圆规画圆用圆规画圆 用圆规画圆的方法: ( 1 )把圆规的两脚分开,定好两脚间 的距离(定长) ( 2 )把有针尖的一只脚固定在一点上 (定点) ( 3 )把装有铅笔尖的一只脚旋转一周 ,就画出一个圆(旋转)
“ 图书馆资源与服务利用 ” 专题讲座 第 9 讲 JSTOR 数据库与 Kluwer Online 数据库的使用.
“ 百链 ” 云图书馆. 什么是百链云图书馆?1 百链云图书馆的实际效果?2 百链云图书馆的实现原理?3 百链云图书馆的价值?44 图书馆要做什么?55 提 纲.
The Construction of News Database in China Li Yankui, Beijing Daily Group, Beijing, China.
无忧 PPT 整理发布 无忧 PPT 整理发布 网上教研活动的推进与 学习社区的构建 首都师范大学 蒋国珍 2008 年 12 月.
? Which number should the question mark be? 授课人: 江西省赣州市章贡中学 阳雪峰 Unit11 Self check Could you please lend me your pen?
阅读理解 B) 七选五 Reading makes a wise man. 读书使人明智。 解题方法 : 1. 通读全文,了解大意。 2. 理清文脉,分析结构:总 - 分, 分 - 总,总 - 分 - 总。 3. 精读试答,找出文章内在联系。 4. 通读,核对答案。 ————————————
Chapter One The origin and forms of Chinese characters.
万言 Wendy Wan.  历史 History  构字方式 Formations 一共有多少种构字方式? How many formations of Chinese characters? 汉字简介 ● Introduction to Chinese Characters
重点与难点: 1.现在完成进行时 have / has been + Ving 2.引导时间的介词 for 与 since 的使用.
人教版 PEP 六年级英语上册 Unit 4 I HAVE A PEN PAL 岔口中心学校 余银飞.
Generation of Chinese Character Based on Human Vision and Prior Knowledge of Calligraphy 报告人: 史操 作者: 史操、肖建国、贾文华、许灿辉 单位: 北京大学计算机科学技术研究所 NLP & CC 2012: 基于人类视觉和书法先验知识的汉字自动生成.
Talk about the ways you learn other subjects. You can use the following phrases and sentences. How do you learn Chinese/ math /physics/chemistry?
韩文数据库使用说明 鲁锦松. 主要内容 一、为什么要用数据库 二、怎样利用中文数据库 三、怎样利用韩文数据库.
马克思主义哲学与室内设计 1 、哲学与现代室内设计 2 、马克思主义哲学实践观对艺术设 计的影响 1 ) 物质与意识的结合 2 )一切从实际出发为前提的活动.
SCI 数据库检索练习参考 本练习完全依照 SCI 数据库实际检索过程而 实现。 本练习完全依照 SCI 数据库实际检索过程而 实现。 练习中,选择了可以举一反三的题目,读 者可以根据题目进行另外的检索练习,如: 可将 “ 与 ” 运算检索改为 “ 或 ” 、 “ 非 ” 运算检索 等等。 练习中,选择了可以举一反三的题目,读.
Unit 1 My name ’ s Gina. Section B ( 2a-3b ). 学习目标: 学习目标: ※ 学习英语中姓名( full name )、姓 ( last name )和名( first name )的用 法。 ※ 学习英语中姓名( full name )、姓 ( last.
Introduction to Classical Chinese February 4, 2013.
外研版 初三 ( 上 ) Module 8. Unit 2 Read on to find out who the winners are.
思考:物质由哪些微粒构成? 思考:物质由哪些微粒构成? 仅仅是只由分子原子构成的吗?有没有其它的 微粒? 仅仅是只由分子原子构成的吗?有没有其它的 微粒? 原子 原子核 ( + ) ( + ) 质子( + ) 中子 核外电子( – ) H 、 C 、 O 、 Na 、 S 这五种元素的原子核外各有.
生化实验的数字化 D igital I nformation S ystem Laboratory —— 数字化信息系统在生物化学实验中的应用.
Fun with English 5B Changsong Primary School My English name is Apple. I’m from Nanjing. I speak English and Chinese. I like traveling around the world.
义务教育教科书 数 学(一年级上册) 简 介. 1. 加强了准备性(主要体现在第一、二单元)  把实验教材的第一、二单元合并为 “ 准备课 ” 。  将 “ 位置 ” 由一年级下册提前到一年级上册。 一、内容变动 2. 降低了难度(主要体现在第四、七单元)  平面、立体图形的认识分散编排。 
2019/5/5 A Flexible Wildcard-Pattern Matching Accelerator via Simultaneous Discrete Finite Automata Author: Hsiang-Jen Tsai, Chien-Chih Chen, Yin-Chi Peng,
B Let's learn.
Ancient Chinese Language
Presentation transcript:

Structure-based Web Access Method for Ancient Chinese Characters Xiaoqing Lu Yingmin Tang Zhi Tang Yujun Gao Jianguo Zhang Institute of Computer Science and Technology, Peking University, Beijing, 100871, China Beijing Founder Electronics CO.,Ltd., Beijing, 100085, China Center for Chinese Font Design and Research, Beijing, 100871, China State Key Laboratory of Digital Publishing Technology (Peking University Founder Group Co.,Ltd.), 100871, Beijing, China {lvxiaoqing,tangyingmin,tangzhi}, {gao_yujun,zjg} 2013.11.19, ChongQing, China

Outline Background Formalization of relationships between ACCs and modern characters Establishment of Super Large Font ACC Database Implementation and results

Background (1/3) Ancient Chinese Characters (ACCs) Important heritage of Chinese history Date back to at least 3300 year-old Development is not one-dimensional Collection, management, and access on the Internet

Background (2/3) Problems 1 Involves very large quantities of modern characters Block Range Comment CJK Unified Ideographs 4E00–9FFF common Extension A 3400–4DBF Rare Extension B 20000–2A6DF Rare, historic Extension C 2A700–2B73F Extension D 2B740–2B81F Uncommon, some in current use Compatibility F900–FAFF Duplicates, unifiable variants, corporate characters Supplement 2F800–2FA1F Unifiable variants In 2012, Unicode 6.2 had totally encoded 75,215 Han characters

Background (3/3) Problems 2 & 3 Lack of software code Traditional IMEs are not suitable for ACCs In 2012, Unicode 6.2 had totally encoded 75,215 Han characters

Related work 1993, Xusheng Ji 1994, Ning Li 1996, Fangzheng Chen 2003, Zaixing Zhang 2004, Zhiji Liu 2005, Derming Juang 2007, Yi Zhuang 2008, James S. Kirk 2008, Dan Chen ... ... 中外学者一直在探索,有的针对不同时期的古体字,例如,甲骨文、金文等,提出了一些解决方法;有的通过分析书写方法,字形结构的演变找出了一些古汉字的内在规律。

Outline Background Formalization of relationships between ACCs and modern characters Establishment of Super Large Font ACC Database Implementation and results

2 Formalization of relationships between ACCs and modern characters Contemporary encoded characters Existing encoded Chinese characters Marks for uncoded Chinese characters ACCs Corresponding relationships with contemporary encoded characters No corresponding relationships with the contemporary encoded characters

2 Formalization of relationships between ACCs and modern characters Two relations Three Types of ACCs Recognized characters Ambiguous characters Unrecognized characters

Outline Background Formalization of relationships between ACCs and modern characters Establishment of Super Large Font ACC Database Implementation and results

3 Establishment of Super Large Font Automatic generation of Chinese characters [27-30] rules regarding glyph structure decomposition redundant expressions of glyph structures are permitted multi-level radicals

Outline Background Formalization of relationships between ACCs and modern characters Establishment of Super Large Font ACC Database Implementation and results

ACC Database (1/3) Relation Schema Item Meaning Unicode Contemporary Chinese character Unicode for this ancient character. Dynasty Dynasty when this ancient character was used. Type Type of this ancient character (e.g. pictographic characters, ideograph, and phonogram) Classification Class type of this ancient character (e.g. inscriptions on bones or tortoise shells of the Shang Dynasty, inscriptions on bronze, seal character, etc.) Place Contemporary place where this ancient character was unearthed. Carrier Carrier of this ancient character (e.g. the name or the number of a certain bronze implement) Country Ancient country where this ancient character was used. SubbaseID Number of the font database storing this ancient character. SubID Code of the ancient character, used in sub-font database. Filename File name for the picture of this ancient character. ID The unique ID of this ancient character in the font database.

ACC Database (2/3) Other relation schemas Dynasty and Country (DC_RS), Ancient C_Character Classification (ACCC_RS) ACC Type (ACCT_RS) Unicode and Glyph (UG_RS) Radical and Component (RC_RS) Ancient Image (AI_RS) Contemporary Image (CI_RS)

ACC Database (3/3) Relationships of the data tables

Outline Background Formalization of relationships between ACCs and modern characters Establishment of Super Large Font ACC Database Implementation and results

Implementation and results Retrieval method

Implementation and results

谢谢! Thanks! 联系方式