从 Postscript 格式文献中提取数学公式的方法. 概述从 Postscript 格式文献中提取识别数学公式, 是数学公式识别领域的一个研究方向。主要针对以 Word 和 Latex 为生成源的 Postscript 文档, 提出基于内容的数学公式提取方法。首先重载 Postscript.

Slides:

Advertisements

Similar presentations

首页首页上一页下一页本讲内容投影法概述三视图形成及其投影规律平面立体三视图、尺寸标注本讲内容复习： P25~P31 、 P84~P85 作业： P7, P8, P14[2-32(2) A3 (1:1)]

Advertisements

纺纱学. 2 绪论基本要求：了解纺纱系统的类别重点掌握：棉纺系统的工艺流程 3 一、纺纱原理与设备纺纱：用物理或机械的方法将纺织纤维纺成纱线的过程。纺纱原理：初加工、原料的选配、开松除杂、混和、梳理、精梳、并合、牵伸、加捻、卷绕等。纺纱方法：传统纺纱方法、新型纺纱方法。纺纱设备：开清棉联合机、梳棉机、精梳机、

Nutch 二次开发介绍.  1.Nutch 二次开发中重点环节介绍 1.1 信息源选择及规范制定 1.2 信息预处理 1.3 索引构建 1.4 排序规则制定 1.5 查询系统及用户界面  2.Nutch 中的 plugin 介绍 2.1 Plugin 介绍 2.2 页面解析.

一、统计范围注册地在湖里区的具有房地产开发资质的房地产开发企业无论目前是否有开发项目无论开发的项目是在湖里区还是在其他区没有开发项目的企业需要报送年报和月报中的资金表（空表）。新成立的项目公司，要先入库，再报报表。

第十二章常微分方程返回. 一、主要内容基本概念一阶方程类型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次方程 5. 全微分方程 6. 线性方程类型 1. 直接积分法 2. 可分离变量 3. 齐次方程 4. 可化为齐次方程 5. 全微分方程 6. 线性方程.

退出退出退出退出上一页下一页仪器使用 §1-2 尺规绘图工具和仪器的使用方法图板丁字尺三角板比例尺圆规分规铅笔曲线板。要提高绘图的准确度和绘图效率，必须正确地使用各种绘图工具和仪器。常用的手工绘图工具和仪器有图板、丁字尺、三角板、比例尺、圆规、分规、铅笔、曲线板等。提示：将光标放在仪器上，

概率统计（ ZYH ）节目录 3.1 二维随机变量的概率分布 3.2 边缘分布 3.4 随机变量的独立性第三章随机向量及其分布 3.3 条件分布.

基本知识和几何要素的投影模块一：字体练习第一章制图的基本知识与基本技能题目提示返回.

第 12 章位运算 C 语言兼具高级语言及低级语言的特性，因此适合编写系统软件。 C 语言具备低级语言的特性就在于它能直接对硬件进行操作，即位运算。所谓位运算是指，按二进制位进行的运算。例如，将一个存储单元中各二进位左移或右移一位等。

数据挖掘实验 1 Apriori 算法编程实现. 数据挖掘实验一 (20’) 实验目的：了解关联规则在数据挖掘中的应用，理解和掌握关联挖掘的经典算法 Apriori 算法的基本原理和执行过程并完成程序设计。实验内容：对给定数据集用 Apriori 算法进行挖掘，找出其中的频繁集并生成关联规则。

HistCite 结果分析示例罗昭锋. By:SC 可能原因：文献年度过窄，少有相互引用.

实验：验证牛顿第二定律. 1 、实验目的：探究 a 与 F 、 m 的定量关系 2 、实验原理：控制变量法 A 、 m 一定时，探究 a 随 F 的变化关系 B 、 F 一定时，探究 a 随 m 的变化关系.

位置相关查询处理研究背景及意义移动计算、无线通信以及定位技术的快速发展，使得位置相关的查询处理及基于位置的信息服务技术已经成为一个热点研究领域。大量的应用领域 ( 如地理信息系统、智能导航、交通管制、天气预报、军事、移动电子商务等 ) 均迫切需要有效地查询这些数据对象。

一、拟合优度检验二、变量的显著性检验三、参数的置信区间

计算机在分析化学的应用 ( 简介 ) 陈辉宏. 一. 概述信息时代的来临, 各门学科的研究方法都有了新的发展. 计算机的介入, 为分析化学的进展提供了一种更方便的研究方法.

4 第四章矩阵学时：  18 学时。教学手段：  讲授和讨论相结合，学生课堂练习，演练习题与辅导答疑相结合。基本内容和教学目的：  基本内容：矩阵的运算，可逆矩阵，初等矩阵及其性质和意义，分块矩阵。  教学目的：  1 ．使学生理解和掌握矩阵等价的相关理论  2 ．能熟练地进行矩阵的各种运算.

编译程序构造原理和实现技术授课教师：吕江花. 第一章编译程序概述主要内容：几个基本概念编译器的工作过程概述编译器各个阶段的功能描述编译程序的实现途径.

主要内容  LR(0) 分析. 0 S→  E ＃ E→  E+T E→  T T→  id T→  ( E ) 1 S→E  ＃ E→E  +T 5 T→id  3 E→E+  T T→  id T→  (E) 4 E→E+T  9 E→T  6 T→(  E) E→

嵌入式操作系统陈香兰 Fall 系统调用 10/27/09 嵌入式 OS 3/12 系统调用的意义  操作系统为用户态进程与硬件设备进行交互提供了一组接口 —— 系统调用  把用户从底层的硬件编程中解放出来  极大的提高了系统的安全性  使用户程序具有可移植性.

地理信息系统概述. 数据和信息 (Data & Information) 数据原始事实如：员工姓名，数据可以有数值、图形、声音、视觉数据等信息以一定规则组织在一起的事实的集合。

第 4 章抽象解释内容概述以一种独立于编程语言的方式，介绍抽象解释的一些本质概念 – 将 “ 程序分析对语言语义是正确的 ” 这个概念公式化 – 用 “ 加宽和收缩技术 ” 来获得最小不动点的较好的近似，并使所需计算步数得到限制 – 用 “ 伽罗瓦连接和伽罗瓦插入 ” 来把代价较大的属性空间用代价较小的属性空间来代替.

5 第五章二次型学时： 10 学时。教学手段：  讲授和讨论相结合，学生课堂练习，演练习题与辅导答疑相结合。基本内容和教学目的：  基本内容：二次型的矩阵表示、标准型、唯一性、正定二次型。  教学目的：  1 、了解二次型的概念，二次型的矩阵表示。  2 、会化二次型为标准型，规范性。

吉林大学远程教育课件主讲人 : 杨凤杰学时： 64 ( 第六十二讲 ) 离散数学. 最后，我们构造能识别 A 的 Kleene 闭包 A* 的自动机 M A* =(S A* ， I ， f A* ， s A* ， F A* ) ，令 S A* 包括所有的 S A 的状态以及一个附加的状态 s.

1 为了更好的揭示随机现象的规律性并利用数学工具描述其规律, 有必要引入随机变量来描述随机试验的不同结果例电话总机某段时间内接到的电话次数, 可用一个变量 X 来描述例检测一件产品可能出现的两个结果, 也可以用一个变量来描述第五章随机变量及其分布函数.

有限自动机 (Finite Automata) 描述程序设计语言中的单词的识别过程。主要内容：确定有限自动机 DFA(Deterninistic FA) 确定有限自动机 DFA 的实现非确定有限自动机 NFA(Nondeterninistic FA) NFA 到 DFA 的转换 DFA 的化简.

吉林大学远程教育课件主讲人 : 杨凤杰学时： 64 ( 第三十八讲 ) 离散数学. 第八章格与布尔代数 §8.1 引言在第一章中我们介绍了关于集合的理论。如果将 ρ （ S ）看做是集合 S 的所有子集组成的集合，于是， ρ （ S ）中两个集合的并集 A ∪ B ，两个集合的交集.

吉林大学远程教育课件主讲人 : 杨凤杰学时： 64 ( 第四十八讲 ) 离散数学. 例设 S 是一个非空集合， ρ （ s ）是 S 的幂集合。不难证明 :(ρ(S),∩, ∪,ˉ, ,S) 是一个布尔代数。其中： A∩B 表示 A ， B 的交集； A ∪ B 表示 A ，

第十一章曲线回归第一节曲线的类型与特点第二节曲线方程的配置第三节多项式回归.

线性代数习题课吉林大学术洪亮第一讲行列式前面我们已经学习了关于行列式的概念和一些基本理论，其主要内容可概括为：

6 第一章线性空间学时： 16 学时。教学手段：  讲授和讨论相结合，学生课堂练习，演练习题与辅导答疑相结合。基本内容和教学目的：  基本内容：集合、映射的概念；线性空间的定义与简单性质、维数、基与坐标、过渡矩阵的概念；基变换与坐标变换；线性子空间、子空间的交与和、子空间的直和；线性空间的同构等概念。

第 4 章过程与变量的作用范围. 4.1 Visual Basic 的代码模块 Visual Basic 的应用程序是由过程组成的，过程代码存放在模块中。 Visual Basic 提供了三类模块，它们是窗体模块、标准模块和类模块。窗体模块窗体模块是大多数 Visual Basic.

数学系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 3 章曲线拟合的最小二乘法给出一组离散点，确定一个函数逼近原函数，插值是这样的一种手段。在实际中，数据不可避免的会有误差，插值函数会将这些误差也包括在内。

自顶向下分析 —— 递归下降法递归下降法 (Recursive-Descent Parsing) 对每个非终极符按其产生式结构产生相应语法分析子程序. 终极符产生匹配命令非终极符则产生调用命令文法递归相应子程序也递归，所以称这种方法为递归子程序方法或递归下降法。

聚合物在生物高分子分离中的应用王延梅中国科学技术大学高分子科学与工程系 Tel

吉林大学远程教育课件主讲人 : 杨凤杰学时： 64 ( 第三十九讲 ) 离散数学. 例设 S 是一个集合， ρ （ S ）是 S 的幂集合，集合的交（ ∩ ），并（∪）是 ρ （ S ）上的两个代数运算，于是，（ ρ （ S ）， ∩ ，∪）是一个格。而由例知.

OS 进程调度模拟演示制作人：钱晶高上上. OS 进程调度模拟－实验原理静态优先级原理在这种方式下，系统一旦把处理机分配给就绪队列中的优先权最高的进程后，该进程便一直执行下去，直至完成。或因为发生某事件使该进程放弃处理机，系统方可再将处理机分配给另一优先级最高的进程。这些事件包括有优先级更高的进程进入，或是因为某些原因.

1 第 7 章专家控制系统概述专家系统的起源与发展专家系统的一般结构专家系统的知识表示和获取专家系统的特点及分类.

信息利用与学术论文写作 Library of Jiangsu University, Zhenjiang Sha Zhenjiang

量子化学第四章角动量与自旋（Angular momentum and spin） 4.1 动量算符 4.2 角动量阶梯算符方法

数学系 University of Science and Technology of China DEPARTMENT OF MATHEMATICS 第 5 章解线性方程组的直接法实际中，存在大量的解线性方程组的问题。很多数值方法到最后也会涉及到线性方程组的求解问题：如样条插值的 M 和.

主讲教师：陈殿友总课时： 124 第十一讲极限的运算法则. 第一章二、极限的四则运算法则三、复合函数的极限运算法则一、无穷小运算法则机动目录上页下页返回结束 §5 极限运算法则.

在发明中学习线性代数概念的引入李尚志中国科学技术大学. 随风潜入夜 : 知识的引入之一、线性方程组的解法加减消去法  方程的线性组合  原方程组的解是新方程的解是否有 “ 增根 ” ？  互为线性组合 : 等价变形  初等变换  高斯消去法.

第一节相图基本知识 1 三元相图的主要特点（1）是立体图形，主要由曲面构成；（2）可发生四相平衡转变；（3）一、二、三相区为一空间。

第5章键盘与鼠标接口 5.1 键盘概述 5.2 键盘的工作原理 5.3 PC扩展键盘接口 5.4 键盘中断与键盘I/O 5.5 鼠标接口.

第 3 章控制流分析内容概述 – 定义一个函数式编程语言，变量可以指称函数 – 以 dynamic dispatch problem 为例（作为参数的函数被调用时，究竟执行的是哪个函数） – 规范该控制流分析问题，定义什么是可接受的控制流分析 – 定义可接受分析在语义模型上的可靠性 – 讨论分析算法.

吉林大学远程教育课件主讲人 : 杨凤杰学时： 64 ( 第五十三讲 ) 离散数学. 定义设 G= （ V ， T ， S ， P ）是一个语法结构，由 G 产生的语言（或者说 G 的语言）是由初始状态 S 演绎出来的所有终止符的集合，记为 L （ G ） ={w  T *

编译原理总结. 基本概念  编译器、解释器  编译过程、各过程的功能  编译器在程序执行过程中的作用  编译器的实现途径.

 符号表  标识符的作用：声明部分：定义了各种对象及对应的属性和使用规则。程序体：对所定义的对象进行各种操作。 $ididname IdnameAttributeIR  必要性 Token ：新表－符号表（种类、类型等信息）：

Department of Mathematics 第二章解析函数第一节解析函数的概念与 C-R 条件第二节初等解析函数第三节初等多值函数.

网上预约集港操作指南一、登录系统登陆下面图片显示网址：输入堆场用户名、密码和校验码登陆系统.

首页首页上一页下一页本讲内容本讲内容视图，剖视图（Ⅰ）复习： P107 ~ P115 作业： P48(6-2,6-4), P49( 去 6-6) P50, P51(6-13), P52 P50, P51(6-13), P52 P53 (6-18,6-20) P53 (6-18,6-20)

1-4 节习题课山东省淄博第一中学物理组阚方海. 2 、位移公式： 1 、速度公式： v ＝ v 0 +at 匀变速直线运动规律： 4 、平均速度：匀变速直线运动矢量式要规定正方向统一单位五个量知道了三个量，就能求出其余两个量 3 、位移与速度关系：

《 UML 分析与设计》交互概述图授课人：唐一韬. 知识图谱知识图谱知识图谱知识图谱.

1 、如果 x ＋ 5 ＞ 4 ，那么两边都可得 x ＞－ 1 2 、在－ 3y ＞－ 4 的两边都乘以 7 可得 3 、在不等式 — x≤5 的两边都乘以－ 1 可得 4 、将－ 7x — 6 ＜ 8 移项可得。 5 、将 5 + a ＞－ 2 a 移项可得。 6 、将－ 8x ＜ 0.

名探柯南在侦查一个特大盗窃集团过程中，获得藏有宝物的密码箱，密码究竟是什么呢？请看信息： ABCDEF( 每个字母表示一个数字 ) A ：是所有自然数的因数 B ：既有因数 5 ，又是 5 的倍数 C ：既是偶数又是质数 D ：既是奇数又是合数 EF ：是 2 、 3 、 5 的最小公倍数.

项目七： PLC 功能指令应用带进位循环左移指令 XXXXX. 项目七： PLC 功能指令应用 FX2 系列可编程控制器移位控制指令有移位、循环移位、字移位及先进先出 FIFO 指令等 10 条指令。带进位循环右移指令 RCR 带进位循环左移指令 RCL 字右移位指令 WSFR 先入先出读出指令.

§10.2 对偶空间一、对偶空间与对偶基二、对偶空间的有关结果三、例题讲析.

请同学们仔细观察下列两幅图有什么共同特点？如果两个图形不仅形状相同，而且每组对应点所在的直线都经过同一点, 那么这样的两个图形叫做位似图形, 这个点叫做位似中心.

企业产品标准信息公共服务平台操作介绍目录一、系统架构介绍二、企业产品标准自我声明填报系统三、企业产品标准公示系统.

表单自定义 “ 表单自定义 ” 功能是用于制作表单的工具，用数飞 OA 提供的表单自定义功能能够快速制作出内容丰富、格式规范、美观的表单。

项目 1 典型低压电器的拆装、检修及调试任务 2 交流接触器的拆装与检修接触器是一种自动的电磁式自动开关，是一种依靠电磁力作用使触点闭合或分离的自动电器，用于接通和断开电动机或其它用电设备电路。适用于远距离频繁地接通或断开交直流主电路及大容量控制电路。交流接触器具有控制容量大、操作方便、便于远距离.

力的合成力的合成一、力的合成二、力的平行四边形上一页下一页目录退出. 一、力的合成 O. O. 1. 合力与分力我们常常用一个力来代替几个力。如果这个力单独作用在物体上的效果与原来几个力共同作用在物体上的效果完全一样，那么，这一个力就叫做那几个力的合力，而那几个力就是这个力的分力。

逻辑设计基础 1 第 7 章多级与（或）非门电路逻辑设计基础多级门电路.

八. 真核生物的转录㈠特点 ① 转录单元为单顺反子（ single cistron ），每个蛋白质基因都有自身的启动子，从而造成在功能上相关而又独立的基因之间具有更复杂的调控系统。 ② RNA 聚合酶的高度分工，由 3 种不同的酶催化转录不同的 RNA 。 ③ 需要基本转录因子与转录调控因子的参与，这.

张勤人大报刊复印资料专题全文数据库简介简介《人大报刊资料全文数据库》是中国人民大学书报资料中心与北京博利群电子信息有限公司联合开发研制的大型数据库光盘。它涵盖面广、信息量大、分类科学、筛选严谨、结构合理，是国内最具权威的社会科学、人.

欢迎使用《工程流体力学》多媒体授课系统燕山大学《工程流体力学》课程组. 第九章缝隙流动概述 9.1 两固定平板间的层流流动 9.2 具有相对运动的两平行平板间的缝隙流动 9.3 环形缝隙中的层流流动.

1 第三章数列数列的概念考点搜索 ●数列的概念 ●数列通项公式的求解方法 ●用函数的观点理解数列高考猜想以递推数列、新情境下的数列为载体, 重点考查数列的通项及性质, 是近年来高考的热点, 也是考题难点之所在.

§9. 恒定电流场第一章静电场恒定电流场. 电流强度  电流：电荷的定向移动  正负电荷反方向运动产生的电磁效应相同 ( 霍尔效应特例 ) 规定正电荷流动的方向为正方向  电流方向：正方向、反方向  电流强度 ( 电流 ) A 安培标量单位时间通过某一截面的电荷.

目录上页下页返回结束二、无界函数反常积分的审敛法 * 第五节反常积分无穷限的反常积分无界函数的反常积分一、无穷限反常积分的审敛法反常积分的审敛法  函数第五章第五章.

SCI 数据库检索练习参考本练习完全依照 SCI 数据库实际检索过程而实现。本练习完全依照 SCI 数据库实际检索过程而实现。练习中，选择了可以举一反三的题目，读者可以根据题目进行另外的检索练习，如：可将 “ 与 ” 运算检索改为 “ 或 ” 、 “ 非 ” 运算检索等等。练习中，选择了可以举一反三的题目，读.

Presentation transcript:

从 Postscript 格式文献中提取数学公式的方法

概述从 Postscript 格式文献中提取识别数学公式, 是数学公式识别领域的一个研究方向。主要针对以 Word 和 Latex 为生成源的 Postscript 文档, 提出基于内容的数学公式提取方法。首先重载 Postscript 语言中的一些相关命令, 先后提取出文档中的字符及由线段连接得到的图形。然后根据字符名称、字体信息、位置信息对字符进行判断分析, 提取出其中的数学符号 ; 对提取出的图形, 进行编码以识别出其对应的数学符号。最后, 根据得到的数学符号之间的空间位置关系, 借助启发式规则, 将数学符号合并, 提取出完整的数学公式。

PS 语言 PS （ Postscript ）是 Adobe 公司在 1985 年发明的一种解释性页面描述语言, 它拥有强大的图形功能以支持文字、图形与图像的显示和打印, 并可在图文编辑环境和打印设备之间传递信息, 具有设备无关性的优点。 PDF （ Portable document format ）是一种基于 PS 语言的电子文档格式。

PS 和 PDF 文档的生成和转化 (1) 编写 PS 语言代码。 (2) 由 PS/PDF 虚拟打印机生成。 (3) 由应用程序转化而成。 (e.g:Acrobat Distiller ； Divps) (4)PS 和 PDF 文档可以通过 ps2pdf/pdf2ps 等程序进行相互转化。

PS 语言特点 (1) 基于栈的存储和执行，所有命令和操作数都存储在栈中。 (2) 操作数在前，操作命令在后。 (3) 支持多种数据类型。 (4) 可自由定义操作命令以扩展功能。 (5) 程序代码完全由 ASCII 字符编写，可在任意文本编辑工具中编辑。 (6) 支持头文件 (prolog) 和脚本 (script) 的文件

的文件组织结构。头文件中主要包含脚本中命令和过程的定义。 PS 语言由解释器进行解释执行，控制打印机或显示设备进行输出。

PS 中文本的显示机制 (1) 字符串 (e.g:(This is a cat)(\098)) (2) 字体 (3) 显示位置 (4) 显示命令 (show,ashow,widthshow,awidthshow,ksh ow,xshow,yshow,xyshow 等 )

PS 显示文本的过程

数学符号提取从 PS 文档中正确提取出数学公式的前提是提取并识别出文档中的数学符号。由于数学符号同其他字符混杂在一起, 这需要首先提取出文档中的字符然后经过判别, 筛选出其中的数学符号。

此外, 一些数学符号不是由字符而是由图形所表示的。例如在以 Word 文档为生成源的 PS 文档中, 根号表示为 4 条顺次连接的线段。在由 Latex 文档转换得到的文档中, 根号表示为由 4 条线段封闭连接形成的狭长矩形。因此, 除了提取字符, 还需要提取出这些表示特殊数学符号的图形。

字符提取从 PS 文档中提取字符可以视为一个解码过程。字符提取的目标是提取出 PS 文档中的所有字符的相关信息。这些信息用来判断字符是否为数学符号, 包括字符名称、字体信息字体类型和字体名称以及位置信息。

具体步骤： (1) 重载 show ashow w idthshow awidthshow kshow xshow yshow xyshow 等显示命令, 提取出字符串； (2) 加载当前字体词典, 访问其字体类型和字体名称 ; (3) 根据每个字符的字符编码, 在字体词典的编码表中索引对应的字符名称 ; (4) 对每一个字符, 根据显示命令的位置参量, 设置正确的当前位置, 并用 charpath 命令得到其应字形的图形构造路径, 之后用 pathbbox 命令得到字形的最小外接矩形 ; (5) 对外接矩形坐标进行坐标变换, 由 PS 用户坐标变换至最终显示的页面坐标, 从而得到字符的位置信息。

图形提取绝大多数表示数学符号的图形都是由线段连接组成的封闭或开放的图形。方法是先提取出所有线段，然后找出相连接的线段以组成图形。

数学符号识别在提取出文档中的字符之后, 接下来是判断其是否为数学符号。判断的依据是字符的息, 包括字符名称、字体信息以及位置信息。字符名称能够反映一个字符的本质含义，是判别数学符号的基本依据。字体信息 ( 包括字体类型和字体名称 ) 也是判断数学符号的重要依据。数学公式和普通文本的区别很大程度上在于数学符号的二维空间排列性质，因此子图位置信息也很重要。

对于提取出的图形，先对其进行编码，然后根据编码识别其对应的数学符号。首先给出一个绘制方向的定义：对开放的图形，即折线段，规定起点为折线段两端点中 x 坐标较小者 (x 坐标相等时，取 y 坐标较大者 ) ，另一端点则为重点，沿各点段由起点到终点的行进方向为绘制方向；对封闭的图形，起点选择为各端点中 x 坐标最小者，规定绘制方向为由起点以顺时针沿各线段行进，最后回到起点的方向。规定了绘制方向后，以下图所示的八方向编码依次对图形中各线段进行标记，这样可以得到整个图形的编码。

构造图形编码与数学符号的映射表，根据图形编码可以识别出它对应的数学符号。

数学公式提取经过前面的处理, 已经提取出了各种数学符号。下一步是将这些孤立的数学符号合并为完整的数学公式。这一过程还可以解决数学符号提取中存在的两个问题 : (1) 一些符号的含义并不能确定。例如, 由一条水平直线段构成的字符可能是减号, 也可能是分号, 还有可能是上划线。 (2) PS 中有些数学符号用标点符号所代替。例如, 减号有时被英文破折号替代, 这种情况造成有个别数学符号被遗漏。

给出一个简单的文法 G={N,∑,P,S}, 并根据这个文法合并所有识别出的数学符号。其中，非终结符 N={S} ，并根据这个文法合并所有识别出的数学符号。其中，非终结符 N={S} ，终结符 ∑ 为数学符号结合， S 为起始符，也是唯一的非终结符，表示数学公式，产生式 P 定义为以下的启发式规则：规则 1 数学重音符号数学符号与其上面的数学重音符号合并。规则 2 上下标数学符号与其上下标位置的数学符号合并。

规则 3 单元运算符单元运算符与其相邻的数学符号合并。规则 4 二元运算符 “+” 等二元运算符与其前后子公式合并。规则 5 关系运算符 “=” 等关系运算符与其前后子公式合并。规则 6 分式当 “/” 前后为子公式时，将 “/” 作为斜分号，并将其作为前后子公式合并为分式。当 “-” 上下为子公式时，将 “-” 作为水平分毫，将其与上下子公式合并为分式。

规则 7 根式根号范围内的子公式与根号合并为根式。规则 8 积分与求和积分符号与其上下限及积分项合并；求和符号与其上下限及求和项合并。规则 9 函数数学函数名与其作用域子公式合并。规则 10 定界符由 “(”“)” 等定界符包围的子公式与定界符合并。规则 11 矩阵矩阵等在空间阵列排列的子公式按空间位置关系进行合并。规则 12 公式扩展水平相邻的子公式相合并。 e.g:100,xyz 。