CN102156890B - 手写公式的笔画切分方法及装置 - Google Patents

手写公式的笔画切分方法及装置 Download PDF

Info

Publication number
CN102156890B
CN102156890B CN 201110104339 CN201110104339A CN102156890B CN 102156890 B CN102156890 B CN 102156890B CN 201110104339 CN201110104339 CN 201110104339 CN 201110104339 A CN201110104339 A CN 201110104339A CN 102156890 B CN102156890 B CN 102156890B
Authority
CN
China
Prior art keywords
stroke
combination
stroke combination
handwriting
score
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN 201110104339
Other languages
English (en)
Other versions
CN102156890A (zh
Inventor
王徽蓉
郭育生
邹明福
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Hanwang Technology Co Ltd
Original Assignee
Hanwang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwang Technology Co Ltd filed Critical Hanwang Technology Co Ltd
Priority to CN 201110104339 priority Critical patent/CN102156890B/zh
Publication of CN102156890A publication Critical patent/CN102156890A/zh
Application granted granted Critical
Publication of CN102156890B publication Critical patent/CN102156890B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Collating Specific Patterns (AREA)
  • Character Discrimination (AREA)

Abstract

本发明公开了一种笔画切分方法及其装置,属于手写公式识别技术领域。该方法包括:根据手写公式的笔迹,获得构成该公式的笔画组成的所有笔画组合;计算每个笔画组合的评价得分;根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,并根据标注切分所述手写公式的笔画,并显示切分结果。对错误切分的笔画组合,通过获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分,可以手动修正错误的切分结果。本发明提供的笔画切分方法及装置不仅使手写输入公式书写流畅,而且输入速度快、可快速完成错误矫正。

Description

手写公式的笔画切分方法及装置
技术领域
本发明涉及手写公式识别技术领域,特别涉及一种手写公式的笔画切分方法及装置。
背景技术
随着电子技术的飞速发展,计算机输入技术也有了很大的提高,越来越人性化,越来越便捷。然而,到目前为止,数学公式的输入仍然是以数学公式编辑器为工具,以手动选择或者键盘输入的方式为主,这种输入方式只能输入英文字母及数字等键盘可键入的符号,输入速度慢,效率低下,不能满足人们的需要。以手写进行数学公式输入的方式是进行数学公式快速输入的一个发展方向。
目前,以手写方式进行数学公式输入的产品不多,并且笔画的切分是以时间间隔来作为主要的切分特征,即写完一个符号后要经过一定的时间停顿,从而确认切分点。这样就导致书写不流畅,书写速度无法提高。
发明内容
本发明解决的技术问题是提供一种手写公式的笔画切分方法及装置,使书写公式的过程更流畅,提高书写速度。
根据本发明的一个方面,提供一种手写公式的笔画切分方法包括:
根据手写公式的笔迹,获得构成该公式的笔画组成的所有笔画组合;
计算每个笔画组合的评价得分;
根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,并根据标注切分所述手写公式的笔画,显示切分结果。进一步地说,所述计算每个笔画组合的评价得分,包括:
计算笔画组合的几何特征评价得分;
计算所述笔画组合的语言模型评价得分;
对所述几何特征评价得分和语言模型评价得分求和获得笔画组合的评价得分。
进一步地说,根据公式
Figure BDA0000057353760000021
计算笔画组合的语言模型评价得分,其中,x为采用语言模型识别当前笔画组合的第一候选识别得分,a为训练语言模型时该第一候选字符的统计最高得分,b为训练语言模型时该第一候选字符的统计最低得分。
进一步地说,根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,并根据标注切分所述手写公式的笔画并显示切分结果,包括:
将笔画组合按照笔画组合的评价得分由大到小的顺序排序,得到降序排列的笔画组合;
从前向后遍历所述降序排列的笔画组合,根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注;
根据标注切分所述手写公式的笔画,显示切分结果。
进一步地说,从前向后遍历所述降序排列的笔画组合,根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,包括:
如果当前笔画组合的评价得分高于设定阈值,且当前笔画组合中不包括已经标注的笔画组合中的笔画,则将当前笔画组合作为一个公式符号进行标注;
如果当前笔画组合的评价得分高于设定阈值,且当前笔画组合中包括已经标注的笔画组合中的笔画,在当前笔画组合与已经标注的笔画组合的并集中的笔画数少于设定数目时,将所述笔画组合的并集作为一个公式符号进行标注;其中,若所述并集与当前笔画组合或已经标注的笔画组合其中的一个相同,则所述并集的评价得分等于所述相同的笔画组合的评价得分;若所述并集与当前笔画组合和已经标注的笔画组合均不相同,则所述并集的评价得分等于当前笔画组合的评价得分。
进一步地说,所述方法还包括:
获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分。
进一步地说,获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分,包括:
获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,根据所述输入笔迹确定切分指示信息,包括:“点”笔迹给出的切分指示信息和“划”笔迹给出的合并指示信息,所述“点”笔迹包括的笔迹点数小于设定值,所述“划”笔迹包括的笔迹点数大于或等于设定值;
确定与所述输入笔迹的中心位置距离最近的公式笔画,查找公式笔画中与所述距离最近的公式笔画向前相邻少于设定数目的笔画和向后相邻少于设定数目的笔画的所有笔画组合,所述相邻依据输入笔画的顺序排列确定;
根据获得的笔画组合及其评价得分,得到可疑的错误切分的笔画组合,具体为“点”笔迹得到的是评价得分第一个高于设定阈值的笔画组合,“划”笔迹得到的是评价得分第一个低于设定阈值的笔画组合;
根据“点”笔迹给出的切分指示信息将错误切分的笔画组合进行切分或根据“划”笔迹给出的合并指示信息将错误切分的笔画组合进行进一步合并。
根据本发明的另一个方面提供一种手写公式的笔画切分装置,包括:
笔画组合确定模块,用于根据手写公式的笔迹,获得构成该公式的笔画组成的所有笔画组合;
评价得分模块,用于计算每个笔画组合的评价得分;
切分模块,用于根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,并根据标注切分所述手写公式的笔画并显示切分结果。
进一步地说,所述评价得分模块包括:
第一计算模块,用于计算所述笔画组合的几何特征评价得分;
第二计算模块,用于计算所述笔画组合的语言模型评价得分;
第三计算模块,用于对所述几何特征评价得分和语言模型评价得分求和获得笔画组合的评价得分。
进一步地说,所述第二计算模块是根据公式
Figure BDA0000057353760000041
计算笔画组合的语言模型评价得分,其中,x为采用语言模型识别当前笔画组合的第一候选识别得分,a为训练语言模型时该第一候选字符的统计最高得分,b为训练语言模型时该第一候选字符的统计最低得分。
进一步地说,所述切分模块包括:
排序单元,用于将所述笔画组合按照评价得分由大到小排序,得到降序排列的笔画组合;
标注单元,用于从前向后遍历所述降序排列的笔画组合,根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注;
显示单元,用于根据标注切分所述手写公式的笔画并显示切分结果。
进一步地说,所述标注单元包括:
判断子单元,用于判断当前笔画组合是否包括已经标注的笔画组合中的笔画;
控制子单元,用于在当前笔画组合的评价得分高于设定阈值,且当前笔画组合中不包括已经标注的笔画组合中的笔画时,将当前笔画组合作为一个公式符号进行标注;
在当前笔画组合的评价得分高于设定阈值,且当前笔画组合中包括已经标注的笔画组合中的笔画,且当前笔画组合与已经标注的笔画组合的并集中的笔画数少于设定数目时,将所述笔画组合的并集作为一个公式符号进行标注;其中,若所述并集与当前笔画组合或已经标注的笔画组合其中的一个相同,则所述并集的评价得分等于所述相同的笔画组合的评价得分;若所述并集与当前笔画组合和已经标注的笔画组合均不相同,则所述并集的评价得分等于当前笔画组合的评价得分。
进一步地说,所述装置还包括:
错误切分处理模块,用于获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分。
进一步地说,所述错误切分处理模块包括:
指示获取单元,用于获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,根据所述输入笔迹确定切分指示信息,包括:“点”笔迹给出的切分指示信息和“划”笔迹给出的合并指示信息,所述“点”笔迹包括的笔迹点数小于设定值,所述“划”笔迹包括的笔迹点数大于或等于设定值;
确定单元,用于确定与所述输入笔迹的中心位置距离最近的公式笔画,查找公式笔画中与所述距离最近的公式笔画向前相邻少于设定数目的笔画和向后相邻少于设定数目的笔画的所有笔画组合,所述相邻依据输入笔画的顺序排列确定;
处理单元,根据“点”笔迹给出的切分指示信息将错误切分的笔画组合进行切分或根据“划”笔迹给出的合并指示信息将错误切分的笔画组合进行进一步合并。
本发明提供的笔画切分方法及装置在书写公式过程中不需要停顿,使书写公式的过程更流畅,提高了书写速度,而且通过手动对切分错误进行标注,提高了公式切分的准确性。
附图说明
图1是本发明实施例提供的一种手写公式的笔画切分方法的流程图;
图2是本发明实施例提供的方法中计算笔画组合的评价得分的流程示意图;
图3是本发明实施例提供的根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分的流程示意图;
图4是本发明实施例提供的手写公式切分结果示意图;
图5是本发明实施例提供的经过错误切分处理的手写公式切分结果示意图;
图6是本发明实施例提供的一种手写公式的笔画切分装置的结构框图;
图7是图6所示装置中切分模块的结构框图;
图8是图7所示模块中标注单元的结构框图。
具体实施方式
如图1所示,本发明实施例提供一种笔画切分方法包括以下四个步骤。
步骤10、根据手写公式的笔迹,获得构成该公式的笔画组成的所有笔画组合。
通过手写板或者触摸屏采集输入公式的笔迹。在手写板或者触摸屏上输入公式的过程中,书写公式符号时,不可有倒插笔(即数学符号必须写完一个之后才能接着写另一个),输入公式符号的过程中写完一个符号之后可以不经过停顿,直接书写下一个符号。输入的公式的笔迹是由多个公式符号的笔迹构成,每个公式符号的笔迹包括一系列连续点坐标和笔画结束标志。通常一个公式符号至少包括一个笔画,如左括号“(”,一个公式的笔迹中包含至少一个笔画。
根据输入的公式笔迹,获得输入的公式的所有笔画,对输入的公式的笔画进行分组,进一步获得所有可能的构成输入公式的笔画组合,所述笔画组合指在时间顺序上相邻并包含少于设定数目的笔画的笔画组合。其中,所述设定数目为5,每个笔画组合包含至少一个笔画,包含至多四个相邻的笔画。所述确定所有可能的笔画组合包括:将每一个笔画作为一个一笔画组合;将相邻的任意两个笔画作为一个二笔画组合、将相邻的任意三个笔画作为一个三笔画组合、将相邻的任意四个笔画作为一个四笔画组合。若一个输入的公式的笔迹中包含N个笔画,则可以得到N个一笔画组合、N-1个二笔画组合、N-2个三笔画组合和N-3个四笔画组合。如图4所示的输入公式,共有37个笔画,可以获得142个笔画组合,分别包括:
37个一笔画组合:{0}、{1}、{2}、...{36};
36个二笔画组合,分别为{0、1}、{1、2}、{2、3}、...{35、36};
35个三笔画组合,分别为{0、1、2}、{1、2、3}、{2、3、4}、...{34、35、36};
34个四笔画组合,分别为{0、1、2、3}、{1、2、3、4}、{2、3、4、5}、...{33、34、35、36}。
步骤20、计算每个笔画组合的评价得分。
笔画组合的评价得分代表所述笔画组合作为一个符号的可能性,得分越高,该笔画组合作为一个符号的可能性越大。计算笔画组合的评价得分可以仅根据笔画组合的几何特征评价得分或者笔画组合的语言模型评价得分,也可以结合几何特征评价得分和语言模型评价得分。特殊的,若笔画组合中笔画数目为1,则取固定值0.9作为该笔画组合的评价得分。该固定值0.9由试验统计得出,该固定值0.9也作为预设的笔画组合合并得分阈值。本发明,为了达到更好的笔画组合切分效果,结合笔画组合的几何特征评价得分和语言模型评价得分计算笔画组合的评价得分,具体过程如下:
步骤201、计算笔画组合的几何特征评价得分。
若笔画数多于2,则先求两两笔画的组合的得分,将得分最高的两个笔画相合并(作为一个笔画处理),然后求最终评价得分。下面以笔画组合包括两个笔画为例来说明计算笔画组合的几何特征评价得分的过程。
所述笔画组合的几何特征评价得分包括:笔画间的最短距离评价得分,笔画交叉程度评价得分及笔画之间的相互交叠程度评价得分等。笔画组合的几何特征评价得分可以是所述多个几何特征评价得分之和,也可以是至少一个几何特征的评价得分。下面分别介绍笔画组合的各几何特征的评价得分计算方法。
1、笔画间的最短距离评价得分。
笔画间的最短距离是位于两个不同笔画的点中距离最近的两个点之间的距离,可以通过分别计算构成两个不同笔画的任意两点之间的距离得到。
设min、max表示求最小值与最大值的函数,h1、w1、h2、w2分别表示两笔画的高度、宽度,设中间变量scale=min(max(h1,w1),max(h2,w2)),令x=d_min/scale,其中d_min表示笔画间的最小距离,则根据笔画间的最短距离获得笔画组合的第一评价得分score1的公式如下:
scorel = f ( x ) = - x 0 &le; x < 0.4 - 0.4 x &GreaterEqual; 0.4 - - - ( 1 ) .
上述笔画的高度是该笔画沿竖直方向投影的长度H,上述笔画的宽度是该笔画在水平方向投影的长度W。
2、根据笔画间的相互交叠程度获得笔画组合的第二评价得分。
笔画间的相互交叠是指两个笔画在水平方向的投影有部分重叠。本步骤以笔画1、笔画2举例,其笔画的外接边框分别为rect1、rect2,该两笔画的合并之后的外接边框为rect3、rect1、rect2、rect3的面积分别是area1、area2、area3,则根据笔画间的相互交叠程度对笔画组合进行评价得分,得分score2如下:
score2=(area1+area2)/area3    (2)。
上述公式(2)中的area1、area2和area3的值由外接边框rect1、rect2和rect3确定,其中rect1是笔画1的外接边框,rect2是笔画2的外接边框,rect3是笔画1和笔画2合并后形成的笔画组合的外接边框。所述外接边框是一个矩形框,外接边框的宽是该笔画组合沿水平方向的投影长度W;外接边框的高是该笔画组合沿竖直方向的投影长度H。外接边框的面积area=H×W。
3、根据笔画间的交叉程度获得笔画组合的第三评价得分。
当有笔画1、笔画2相交,分别被分成两段,形成四段曲线,其中略长的两段曲线长度记为long1、long2,略短的两段曲线长度记为short1、short2,则根据笔画间的交叉程度对笔画组合进行评价得分,得分score3计算公式如下:
score 3 = k 3 &times; 2 &times; short 1 &times; short 2 short 1 &times; long 2 + short 2 &times; long 1
(3)
其中,k3为加权系数,若笔画间不交叉则k3为0,若笔画之间交叉,说明交叉的笔画是一个笔画组合,所以加权系数k3取一个极大值,如255。
由此获得笔画组合的几何特征评价得分,可以是一种几何特征的得分,也可以是多种几何特征的评价得分之和(例如,上述第一评价得分、第二评价得分及第三评价得分之和)。
步骤202、计算笔画组合的语言模型评价得分。
采用公式符号识别核心对所述笔画组合进行识别,得到至少一个候选字符及候选字符得分,该候选字符按照得分由高到底的顺序排列。公式符号识别是本领域技术人员所熟知的技术,因此,本发明对公式符号识别核心的实现不再赘述。该笔画组合的第一候选的识别得分经过线性映射后的得分即为笔画组合的语言模型得分score0,具体映射过程如下:
Figure BDA0000057353760000091
其中x为采用语言模型识别当前笔画组合的第一候选识别得分,a为训练语言模型时该第一候选字符的统计最高得分,b为训练语言模型时该第一候选字符的统计最低得分。
步骤203、根据所述几何特征评价得分和语言模型评价得分之和获得笔画组合的评价得分。
笔画组合的评价得分是所述几何特征评价得分和语言模型评价得分之和。以图4所示的输入公式的为例,可以得到如表1所示的笔画组合及评价得分对照表,表中未示出一笔画组合。
表1
Figure BDA0000057353760000092
步骤30、根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,并根据标注切分所述手写公式的笔画,显示切分结果。
通过上述步骤,可以获得所有笔画组合的评价得分,将所有组合按照评价得分从大到小的顺序排列,以图4所示的输入公式的为例,将其笔画组合按照评价得分由大到小排序,得到降序排列的笔画组合列表,如:如表2所示的笔画组合及评价得分对照表,表中只列举出部分笔画组合及其评价得分。
表2
Figure BDA0000057353760000101
从前向后遍历所述降序排列的笔画组合,根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注。具体包括以下情况:
如果当前笔画组合的评价得分高于设定阈值,且当前笔画组合中不包括已经标注的笔画组合中的笔画,则将当前笔画组合作为一个公式符号进行标注。如当前笔画组合{3、4、5}的评价得分是3.8,高于设定阈值0.9,并且当前笔画组合中不包括已经标记的笔画组合中的笔画,则标注该笔画组合{3、4、5}为有效公式符号。
如果当前笔画组合的评价得分高于设定阈值,且当前笔画组合中包括已经标注的笔画组合中的笔画,在当前笔画组合中的笔画与已经标注的笔画组合中的笔画的并集的笔画数少于设定数目时,将所述笔画组合中的笔画的并集作为一个公式符号进行标注;其中,若所述并集中的笔画与当前笔画组合或已经标注的笔画组合其中的一个相同,则所述并集的评价得分等于与其相同的笔画组合的评价得分;若所述并集中的笔画与当前笔画组合和已经标注的笔画组合均不相同,则所述并集的评价得分等于当前笔画组合的评价得分。所述设定数目根据公式中符号的笔画数确定,优选设定数目为5。
具体实施时,如本例中{3、4、5}得分为3.8,高于{3、4}得分2.0,且高于阈值0.9,则当遍历到笔画组合{3、4}时,笔画组合{3、4、5}已经被标注为一个公式符号,这种情况{3、4}不再被标注为一有效的公式符号;反之如果{3、4}的得分高于{3、4、5},且得分高于阈值,则当遍历到笔画组合{3、4、5}时,笔画组合{3、4}已经被标注为一个公式符号,此时它们有共同的笔画3和4,且笔画组合{3、4}和笔画组合{3、4、5}的笔画的并集中的笔画的数目为3,小于设定数目5,所以此时继续合并,将{3、4、5}标注为一个有效公式符号,取代{3,4}笔画组合。
根据标注切分所述手写公式的笔画并显示切分结果。遍历笔画组合及评价得分对照表完成之后,所有评价得分超过设定阈值的笔画组合都被标注为有效公式符号,按照标注信息切分手写公式的笔画为公式符号,并采用虚线的外接边框指示笔画组合的切分结果,得到的切分结果,如图4所示。具体使用何种方式指示笔画组合的切分结果,在此不做限定,只要能够达到清晰地显示切分结果就可以,例如可以使用虚线的外接边框或实线的外接边框或者不同字体颜色等方式。
经过步骤10-30可以使得手写输入公式书写流畅、输入速度快,但可能仍存在着对输入公式的切分错误,这些错误可通过执行步骤40进一步消除。
步骤40、获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分。
所述对错误切分的笔画组合进行合并或切分指示的输入笔迹包括:“点”笔迹和“划”笔迹。使用“点”笔迹来指示“点”的周围有笔画切分错误并且有笔画组合需要被再次切分;使用“划”笔迹来指示“划”的周围有笔画切分错误并且有笔画组合需要被进一步合并。其中“点”笔迹是指在修改模式下,笔迹中包含的笔迹点数目小于设定值的笔迹,“划”笔迹是指在修改模式下的笔迹中包含的笔迹点数目大于或等于设定值的笔迹。所述设定值根据输入区域大小确定,可以是1、2或更大值。
获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分,参见图3,具体包括:
步骤401、获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,根据所述输入笔迹确定切分指示信息,包括:“点”笔迹给出的切分指示信息和“划”笔迹给出的合并指示信息,所述“点”笔迹包括的笔迹点数小于设定值,所述“划”笔迹包括的笔迹点数大于或等于设定值。
步骤402、确定与所述输入笔迹的中心位置距离最近的公式笔画,查找公式笔画中与所述距离最近的公式笔画向前相邻小于设定数目的笔画和向后相邻小于设定数目的笔画的所有笔画组合,所述相邻依据输入笔画的顺序排列确定。
根据所述输入笔迹的中心位置确定距离所述中心位置最近的公式笔画,所述距离指的是“点”笔迹或“划”笔迹的外接矩形框的中心与公式中的笔画的外接矩形框的中心之间的欧氏距离。
步骤403、根据获得的笔画组合及其评价得分,得到可疑的错误切分的笔画组合,具体为“点”笔迹得到的是评价得分第一个高于设定阈值的笔画组合,“划”笔迹得到的是评价得分第一个低于设定阈值的笔画组合。
步骤404、根据“点”笔迹给出的切分指示信息将错误切分的笔画组合进行切分或根据“划”笔迹给出的合并指示信息将错误切分的笔画组合进行进一步合并。
如图4所示,笔画0、1被分割,而这两个笔画应该合并为一个符号“P”,因而在笔画0、1的周围画一条较长笔迹“划”,所画的笔迹“划”的周边笔画的所有组合的得分(如表1所示),其中笔画组合{0、1}得分0.84低于设定阈值且与设定阈值点0.9最接近,由“划”所表达的合并指示,将笔画0、笔画1进行合并,就可以得到图5中的正确切分结果。表1中,笔画组合表示相邻的多个笔画,用数字表示,如{0、1}表示笔画0与笔画1的组合。
如果仍存在着对输入公式的切分错误,这些错误可通过执行手动标注而消除。
本发明提供的手写公式的笔画切分方法在书写公式过程中不需要停顿,使书写公式的过程更流畅,提高了书写速度,而且通过手动对切分错误进行标注,提高了公式切分的准确性。另外,所提出的“点”、“划”错误切分指示修改方式,可快速完成错误矫正。
参见图6,本发明实施例提供的一种手写公式的笔画切分装置包括:笔画组合确定模块1、评价得分模块2、切分模块3。其中,笔画组合确定模块1用于根据手写公式的笔迹,获得构成该公式的笔画组成的所有笔画组合;评价得分模块2用于计算每个笔画组合的评价得分;切分模块3用于根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,并根据标注切分所述手写公式的笔画,显示切分结果。
评价得分模块2进一步包括:第一计算模块、第二计算模块及第三计算模块。
第一计算模块用于计算笔画组合的几何特征评价得分。笔画组合的几何特征评价得分包括:笔画间的最短距离评价得分、笔画交叉程度评价得分及笔画之间的相互交叠程度评价得分等。笔画组合的几何特征评价得分是所述多个几何特征评价得分之和,也可以是至少一个几何特征的评价得分。
第二计算模块用于根据公式
Figure BDA0000057353760000131
计算笔画组合的语言模型评价得分,其中,x为采用语言模型识别当前笔画组合的第一候选识别得分,a为训练语言模型时该第一候选字符的统计最高得分,b为训练语言模型时该第一候选字符的统计最低得分。
第三计算模块对几何特征评价得分和语言模型评价得分求和获得笔画组合的评价得分。
如图7所示,切分模块3进一步包括:排序单元31、标注单元32及显示单元33。其中,排序单元31用于将所述笔画组合按照评价得分由大到小排序,得到降序排列的笔画组合;标注单元32用于从前向后遍历所述降序排列的笔画组合,根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注;显示单元33用于根据标注切分所述手写公式的笔画,显示切分结果。
参见图8,标注单元32进一步包括:判断子单元321和控制子单元322。判断子单元321用于判断当前笔画组合是否包括已经标注的笔画组合中的笔画;控制子单元322用于在当前笔画组合的评价得分高于设定阈值,且当前笔画组合中不包括已经标注的笔画组合中的笔画时,将当前笔画组合作为一个公式符号进行标注;
在当前笔画组合的评价得分高于设定阈值,且当前笔画组合中包括已经标注的笔画组合中的笔画,且当前笔画组合中的笔画与已经标注的笔画组合中的笔画的并集的笔画数少于设定数目(如5)时,将所述笔画组合的并集作为一个公式符号进行标注;其中,若所述并集中的笔画与当前笔画组合或已经标注的笔画组合其中的一个相同,则所述并集的评价得分等于所述相同的笔画组合的评价得分;若所述并集与当前笔画组合和已经标注的笔画组合均不相同,则所述并集的评价得分等于当前笔画组合的评价得分。
根据图6所示的笔画切分装置可以使得书写流畅、输入速度快,但可能仍存在着对输入公式的切分错误,但可能仍存在着对输入公式的切分错误。为了进一步消除错误,可通过错误切分处理模块进行进一步的处理。错误切分处理模块,用于获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分。错误切分处理模块包括指示获取单元、确定单元及处理单元。其中,指示获取单元,用于获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,根据所述输入笔迹确定切分指示信息,包括:“点”笔迹给出的切分指示信息和“划”笔迹给出的合并指示信息,所述“点”笔迹包括的笔迹点数小于设定值,所述“划”笔迹包括的笔迹点数大于或等于设定值;
确定单元,用于确定与所述输入笔迹的中心位置最近的公式笔画S,查找公式笔画中与笔画S向前相邻小于设定数目的笔画和向后相邻小于设定数目的笔画的所有笔画组合,所述相邻依据输入笔画的顺序排列确定,并根据获得的笔画组合及其评价得分,得到可疑的错误切分的笔画组合,具体为“点”笔迹得到的是评价得分第一个高于设定阈值的笔画组合,“划”笔迹得到的是评价得分第一个低于设定阈值的笔画组合。
处理单元,根据“点”笔迹给出的切分指示信息将错误切分的笔画组合进行再次切分或根据“划”笔迹给出的合并指示信息将错误切分的笔画组合进行进一步合并。
本发明提供的一种手写公式的笔画切分装置不依赖于输入时笔画间的停顿时间信息,只依赖于几何模型以及语言模型,因而书写公式时更加流畅,输入速度更快。另外,所提出的“点”、“划”错误切分指示修改方式,可快速完成错误矫正。
上述实施例为本发明较佳的实施方式,但本发明的实施方式并不受上述实施例的限制,其他的任何未背离本发明的精神实质与原理下所作的改变、修饰、替代、组合、简化,均应为等效的置换方式,都包含在本发明的保护范围之内。

Claims (11)

1.一种手写公式的笔画切分方法,其特征在于,包括:
根据手写公式的笔迹,获得构成该公式的笔画组成的所有笔画组合;
计算每个笔画组合的评价得分;根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,并根据标注切分所述手写公式的笔画,显示切分结果;
其中,所述计算每个笔画组合的评价得分,包括:
计算笔画组合的几何特征评价得分;其中,所述笔画组合的几何特征评价得分至少包括:笔画间的最短距离评价得分,笔画交叉程度评价得分,以及笔画之间的相互交叠程度评价得分;所述计算笔画组合的几何特征评价得分包括计算笔画间的最短距离评价得分、笔画交叉程度评价得分以及笔画之间的相互交叠程度评价得分的几何特征评价得分之和,或者至少是其中一个几何特征的评价得分;
根据公式计算所述笔画组合的语言模型评价得分;其中,x为采用语言模型识别当前笔画组合的第一候选识别得分,a为训练语言模型时该第一候选字符的统计最高得分,b为训练语言模型时该第一候选字符的统计最低得分;
对所述几何特征评价得分和语言模型评价得分求和获得笔画组合的评价得分。
2.根据权利要求1所述的笔画切分方法,其特征在于,根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,并根据标注切分所述手写公式的笔画,显示切分结果,包括:
将笔画组合按照笔画组合的评价得分由大到小的顺序排序,得到降序排列的笔画组合;
从前向后遍历所述降序排列的笔画组合,根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注;
根据标注切分所述手写公式的笔画,显示切分结果。
3.根据权利要求2所述的笔画切分方法,其特征在于,所述从前向后遍历所述降序排列的笔画组合,根据所述笔画组合的评价得分,对该笔画组合是否为一个公式符号进行标注,包括:
如果当前笔画组合的评价得分高于设定阈值,且当前笔画组合中不包括已经标注的笔画组合中的笔画,则将当前笔画组合作为一个公式符号进行标注;
如果当前笔画组合的评价得分高于设定阈值,且当前笔画组合中包括已经标注的笔画组合中的笔画,在当前笔画组合与已经标注的笔画组合的并集中的笔画数少于设定数目时,将所述笔画组合的并集作为一个公式符号进行标注;其中,若所述并集与当前笔画组合或已经标注的笔画组合其中的一个相同,则所述并集的评价得分等于所述相同的笔画组合的评价得分;若所述并集与当前笔画组合和已经标注的笔画组合均不相同,则所述并集的评价得分等于当前笔画组合的评价得分。
4.根据权利要求1-3任一项所述的笔画切分方法,其特征在于,所述方法还包括:
获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分;其中,所述对错误切分的笔画组合进行合并或切分包括:“点”笔迹给出的切分指示信息和“划”笔迹给出的合并指示信息。
5.根据权利要求4所述的笔画切分方法,其特征在于,所述获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分,包括:
获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,根据所述输入笔迹确定切分指示信息,包括:所述“点”笔迹包括的笔迹点数小于设定值,所述“划”笔迹包括的笔迹点数大于或等于设定值;
确定与所述输入笔迹的中心位置距离最近的公式笔画,查找公式笔画中与所述距离最近的公式笔画向前相邻少于设定数目笔画和向后相邻少于设定数目笔画的所有笔画组合,所述相邻依据输入笔画的顺序排列确定;
根据获得的笔画组合及其评价得分,得到可疑的错误切分的笔画组合,具体为“点”笔迹得到的是评价得分第一个高于设定阈值的笔画组合,“划”笔迹得到的是评价得分第一个低于设定阈值的笔画组合;
根据“点”笔迹给出的切分指示信息将错误切分的笔画组合进行切分或根据“划”笔迹给出的切分指示信息将错误切分的笔画组合进行进一步合并。
6.根据权利要求5所述的笔画切分方法,其特征在于,所述笔画组合包括少于设定数目的笔画,所述笔画按照书写顺序相邻。
7.一种手写公式的笔画切分装置,其特征在于,包括:
笔画组合确定模块,用于根据手写公式的笔迹,获得构成该公式的笔画组成的所有笔画组合;
评价得分模块,用于计算每个笔画组合的评价得分;
切分模块,用于根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注,并根据标注切分所述手写公式的笔画并显示切分结果;其中,所述评价得分模块包括:
第一计算模块,用于计算所述笔画组合的几何特征评价得分;其中,所述笔画组合的几何特征评价得分至少包括:笔画间的最短距离评价得分,笔画交叉程度评价得分,以及笔画之间的相互交叠程度评价得分;所述第一计算模块,用于计算笔画间的最短距离评价得分、笔画交叉程度评价得分以及笔画之间的相互交叠程度评价得分的几何特征评价得分之和,或者至少是其中一个几何特征的评价得分;
第二计算模块,用于根据公式计算所述笔画组合的语言模型评价得分;其中,x为采用语言模型识别当前笔画组合的第一候选识别得分,a为训练语言模型时该第一候选字符的统计最高得分,b为训练语言模型时该第一候选字符的统计最低得分;
第三计算模块,用于对所述几何特征评价得分和语言模型评价得分求和获得笔画组合的评价得分。
8.根据权利要求7所述的笔画切分装置,其特征在于,所述切分模块包括:
排序单元,用于将所述笔画组合按照评价得分由大到小排序,得到降序排列的笔画组合;
标注单元,用于从前向后遍历所述降序排列的笔画组合,根据所述每个笔画组合的评价得分对该笔画组合是否为一个公式符号进行标注;
显示单元,用于根据标注切分所述手写公式的笔画并显示切分结果。
9.根据权利要求8所述的笔画切分装置,其特征在于,所述标注单元包括:
判断子单元,用于判断当前笔画组合是否包括已经标注的笔画组合中的笔画;
控制子单元,用于在当前笔画组合的评价得分高于设定阈值,且当前笔画组合中不包括已经标注的笔画组合中的笔画时,将当前笔画组合作为一个公式符号进行标注;
在当前笔画组合的评价得分高于设定阈值,且当前笔画组合中包括已经标注的笔画组合中的笔画,且当前笔画组合与已经标注的笔画组合的并集的笔画数少于设定数目时,将所述笔画组合的并集作为一个公式符号进行标注;其中,若所述并集与当前笔画组合或已经标注的笔画组合其中的一个相同,则所述并集的评价得分等于所述相同的笔画组合的评价得分;若所述并集与当前笔画组合和已经标注的笔画组合均不相同,则所述并集的评价得分等于当前笔画组合的评价得分。
10.根据权利要求7-9任一项所述的笔画切分装置,其特征在于,还包括:
错误切分处理模块,用于获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,并根据所述输入笔迹和笔画组合的评价得分对错误切分的笔画组合进行合并或切分;其中,所述对错误切分的笔画组合进行合并或切分包括:“点”笔迹给出的切分指示信息和“划”笔迹给出的合并指示信息。
11.根据权利要求10所述的笔画切分装置,其特征在于,所述错误切分处理模块包括:
指示获取单元,用于获取对错误切分的笔画组合进行合并或切分指示的输入笔迹,根据所述输入笔迹确定切分指示信息,包括:所述“点”笔迹包括的笔迹点数小于设定值,所述“划”笔迹包括的笔迹点数大于或等于设定值;
确定单元,用于确定与所述输入笔迹的中心位置距离最近的公式笔画,查找公式笔画中与所述距离最近的公式笔画向前相邻少于设定数目笔画和向后相邻少于设定数目笔画的所有笔画组合,所述相邻依据输入笔画的顺序排列确定;
笔画组合获取单元,用于根据获得的笔画组合及其评价得分,得到可疑的错误切分的笔画组合,具体为“点”笔迹得到的是评价得分第一个高于设定阈值的笔画组合,“划”笔迹得到的是评价得分第一个低于设定阈值的笔画组合;
处理单元,根据“点”笔迹给出的切分指示信息将错误切分的笔画组合进行切分或根据“划”笔迹给出的合并指示信息将错误切分的笔画组合进行进一步合并。
CN 201110104339 2011-04-25 2011-04-25 手写公式的笔画切分方法及装置 Active CN102156890B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN 201110104339 CN102156890B (zh) 2011-04-25 2011-04-25 手写公式的笔画切分方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN 201110104339 CN102156890B (zh) 2011-04-25 2011-04-25 手写公式的笔画切分方法及装置

Publications (2)

Publication Number Publication Date
CN102156890A CN102156890A (zh) 2011-08-17
CN102156890B true CN102156890B (zh) 2013-05-29

Family

ID=44438380

Family Applications (1)

Application Number Title Priority Date Filing Date
CN 201110104339 Active CN102156890B (zh) 2011-04-25 2011-04-25 手写公式的笔画切分方法及装置

Country Status (1)

Country Link
CN (1) CN102156890B (zh)

Families Citing this family (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP6038700B2 (ja) * 2013-03-25 2016-12-07 株式会社東芝 整形装置
CN104820833B (zh) * 2015-05-18 2018-06-26 成都准星云学科技有限公司 一种识别手写表达式的方法和装置
CN104898855B (zh) * 2015-06-05 2017-12-19 上海交通大学 基于带摇杆设备的文本输入系统及方法
CN105138271A (zh) * 2015-09-07 2015-12-09 深圳市金立通信设备有限公司 一种输入法的识别方法及终端
CN106325596B (zh) * 2016-08-17 2019-04-30 广州视睿电子科技有限公司 一种书写笔迹自动纠错方法及系统

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6795838B1 (en) * 1999-02-05 2004-09-21 Nec Corporation Apparatus and method for transforming mathematical expression, and storage medium
JP2009080615A (ja) * 2007-09-26 2009-04-16 Univ Of Tokyo オンライン手書き数式認識方法及び装置
CN101329731A (zh) * 2008-06-06 2008-12-24 南开大学 图像中数学公式的自动识别方法

Also Published As

Publication number Publication date
CN102156890A (zh) 2011-08-17

Similar Documents

Publication Publication Date Title
CN102156890B (zh) 手写公式的笔画切分方法及装置
CN101464946B (zh) 基于头部识别和跟踪特征的检测方法
CN111881310B (zh) 一种汉字硬笔书写智能指导和评分方法及指导评分系统
CN104063059B (zh) 一种基于手指分割的实时手势识别方法
CN106156387B (zh) 轨道交通线路图纸数据的自动导出方法
CN107633250A (zh) 一种文字识别纠错方法、纠错系统及计算机装置
CN107103326A (zh) 基于超像素聚类的协同显著性检测方法
CN110298250A (zh) 一种书写评分及纠错方法和交互式系统
CN109635687B (zh) 基于时序点集计算的汉字文本行书写质量自动评价方法和系统
CN105046200B (zh) 基于直线检测的电子阅卷方法
CN103971102A (zh) 基于手指轮廓和决策树的静态手势识别方法
CN105787522A (zh) 基于手写笔迹的书写态度评价方法及系统
CN110414477A (zh) 图像比例尺检测方法及装置
CN101266654A (zh) 基于连通分量和支持向量机的图像文本定位方法和装置
CN101901350A (zh) 一种基于特征向量的静态手势识别方法
CN107622271A (zh) 手写文本行提取方法及系统
CN107292936B (zh) 一种汉字字体矢量化方法
JPH06348896A (ja) 文字の切り出し方法及びその装置
CN108388895A (zh) 一种基于机器学习的试卷答题卡自动处理方法
CN113095267B (zh) 统计图的数据提取方法、电子设备和存储介质
CN107944451B (zh) 一种藏文古籍文档的行切分方法及系统
CN106485710A (zh) 一种元件错件检测方法和装置
CN107909068A (zh) 一种大数据图像曲线反向解析方法及系统
CN106203284A (zh) 基于卷积神经网络和条件随机场的人脸检测方法
CN103679213B (zh) 一种3d手势识别方法

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant