CN101388068A - 数学公式识别编码方法 - Google Patents

数学公式识别编码方法 Download PDF

Info

Publication number
CN101388068A
CN101388068A CNA200710121679XA CN200710121679A CN101388068A CN 101388068 A CN101388068 A CN 101388068A CN A200710121679X A CNA200710121679X A CN A200710121679XA CN 200710121679 A CN200710121679 A CN 200710121679A CN 101388068 A CN101388068 A CN 101388068A
Authority
CN
China
Prior art keywords
formula
mathematical formula
symbol
coding method
identifying
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CNA200710121679XA
Other languages
English (en)
Other versions
CN101388068B (zh
Inventor
刘迎建
黄磊
刘昌平
郭育生
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Hanwang Yingyan Technology Co.,Ltd.
Original Assignee
Hanwang Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Hanwang Technology Co Ltd filed Critical Hanwang Technology Co Ltd
Priority to CN200710121679XA priority Critical patent/CN101388068B/zh
Publication of CN101388068A publication Critical patent/CN101388068A/zh
Application granted granted Critical
Publication of CN101388068B publication Critical patent/CN101388068B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Landscapes

  • Character Discrimination (AREA)

Abstract

数学公式识别编码方法属于公式识别领域。本发明包括:采集并输入印刷体数学公式图像或者联机手写笔画序列;对输入的印刷体数学公式图像或者联机手写笔画序列进行符号分割;进行符号识别处理;合并常见函数名,设置与识别出的常见函数名相对应的自定义代码;对符号分割、识别、函数名合并后的结果进行结构分析处理,获得整个公式的结构关系树;按照可编辑的计算机公式表达语言的格式,编码表示所得到的整个公式的结构关系树。

Description

数学公式识别编码方法
技术领域
本发明属于公式识别领域,涉及一种应用于集成开发环境的数学公式识别编码方法。更具体地,在面向对象的可视化编程环境中引入数学公式可视化识别和编码,识别手写/扫描数学公式,并将其编码为可编辑的计算机公式表达语言,更进一步,可将其转化为可实现该数学公式计算的计算机语言命令行,以简化程序设计过程和难度。
背景技术
目前可视化的集成开发环境(如Visual studio)越来越普及,这些开发环境以控件的形式,可以方便地实现表格、列表、按钮、浏览器等复杂工具的设计,但是目前还没有开发环境支持数学计算相关程序的快速设计方案。
当开发人员要实现数学计算的程序设计时,需要详细地设计变量、操作优先级、功能函数等细节。复杂的数学计算任务非常复杂。
现有的数学公式结构分析方法主要有:基于语义导向的方法(参见参考文献[3,4]);轮廓投影切分的方法(参见参考文献[5,6]);基于图改写的方法(参见参考文献[7,8]);基于过程导向的文法方法(参见参考文献[9]);和基于基准线分析的方法(参见参考文献[10])。
语义导向的方法(参见参考文献[10])的语义识别能力较强,但因为数学公式的形式是无穷无尽的,而且有的数学符号具有二义性,所以单纯依靠语义分析的公式类型有限。
轮廓投影分割方法(参见参考文献[5,6])在一定程度上节省了计算开销,但轮廓投影方法在上/下标和矩阵处理上还不完善,而且不能处理类似这样一个符号在多个符号上方的修饰符表达式。
图改写方法(参见参考文献[7,8])受字符识别错误和局部结构分析错误的影响较小,但该方法认为设定不同关系的代价值的计算方法降低了该方法的适应性且计算量较大。
基于过程导向的方法(参见参考文献[9])分析过程过于简单,难以分析复杂的数学公式。基于基准线分析的方法(参见参考文献[10])具有分析速度快的优点,但鲁棒性较差。
发明内容
本发明的目的在于提供一种数学公式识别编码方法,可以对手写的数学公式笔画和扫描的数学公式图像直接进行识别,并自动编码为可编辑的计算机公式表达语言,更进一步地,可用于可视化的数学计算程序设计方案,这种方案利用上述数学公式自动识别编码技术识别,将识别出的可编辑计算机公式表达语言转化为可实现该数学公式计算的计算机语言命令行,减少开发人员的程序设计工作量。
为了实现上述目的,根据本发明,提出了一种数学公式识别编码方法,包括:采集并输入印刷体数学公式图像或者联机手写笔画序列;对输入的印刷体数学公式图像或者联机手写笔画序列进行符号分割;进行符号识别处理;合并常见函数名,设置与识别出的常见函数名相对应的自定义代码;对符号分割、识别、函数名合并后的结果进行结构分析处理,获得整个公式的结构关系树;按照可编辑的计算机公式表达语言的格式,编码表示所得到的整个公式的结构关系树。
更进一步地,根据本发明,在集成开发环境中,增加公式输入按钮;在需要进行较复杂的计算程序设计时,打开数学公式输入界面,采集手写数学公式笔迹或者数学公式图像,对手写数学公式笔迹或者数学公式图像进行分析识别,然后将数学公式识别结果自动转化为函数代码,并插入集成开发环境。
本发明的有益效果
利用数学公式识别技术,对数学公式进行可视化程序设计。本发明的关键点在于利用数学公式识别技术进行可视化的数学公式程序设计。本发明提出了一种基于公式的整体结构重建的公式结构分解方法,在该方法中,通过重建公式的整体结构,将公式分解成多个相对简单的表达式。
附图说明
通过下面结合附图说明本发明的优选实施例,将使本发明的上述及其它目的、特征和优点更加清楚,其中:
图1示出了根据本发明的数学公式识别编码方法的流程图;
图2示出了根据本发明的符号识别步骤的详细流程图;
图3示出了根据本发明的符号分割步骤S101的示例;
图4a和4b示出了与图3相对应的、根据本发明的矩阵分析步骤S104的示例,其中图4a所示为矩阵行分析处理,图4b所示为矩阵列分析处理;
图5示出了与图4a和4b相对应的、矩阵分析步骤S104的结果的示例;
图6示出了与图5相对应的、子表达式分析步骤S105的结果的示例;
图7示出了用于说明根据本发明的角标关系分析步骤S106的示例;
图8示出了根据本发明的角标关系分析步骤S106中的语义分析的示例;
图9示出了与图6相对应的、角标关系分析步骤S106的结果的示例;
图10示出了与图3相对应的、以Latex语言描述的公式表达形式;以及
图11示出了与图3、图10相对应的、以C语言描述的计算机程序命令行。
具体实施方式
下面参照附图对本发明的优选实施例进行详细说明,在描述过程中省略了对于本发明来说不必要的细节和功能,以防止对本发明的理解造成混淆。
图1示出了根据本发明的数学公式识别编码方法的流程图。
首先,在步骤S100,采集并输入印刷体数学公式图像或者联机手写笔画序列。
然后,在步骤S101,对输入的印刷体数学公式图像或者联机手写笔画序列进行符号分割,将单个符号分离出来。在本发明中,符号分割采用通用的连通域分割方法,如图3所示。例如,在图3中,通过符号分割,将左侧所示矩阵示例分割为以下多个符号:(,p,2,j,+,t,—[分数线],n,1,0,);应当注意,在此步骤S101中,仅进行了符号分割,而并未进行符号的识别,因此,所得到的结果仍为各个符号所占用连通区域的图像表示形式。
接下来,在步骤S102中,进行符号识别处理。数学公式识别系统中的符号识别要求识别正体英文字母、斜体英文字母、数字、希腊字母、数学运算符号、数学关系符号、箭头符号、定界符号等各种符号。分割好的符号图像采用统计模式识别的方法进行识别,给出每个符号的UNICODE编码。如图2所示,具体方法如下:步骤S1201,将切分好的符号进行非线性放缩,即曲线拟合归一化(参见参考文献[1]:C.L.Liu,Kazuki Nakashima.Handwritten digit recognition:investigation of normalization and feature extractiontechniques.Pattern Recognition,2004:265-279),归一化到大小64*64;步骤S1202,提取感知方向特征(参见参考文献[2]:H.W.Hao,X.H.Xiao,R.W.Dai.Handwritten Chinese characterrecognition by metasynthetic approach.Pattern recognition,vol.30,no.8,1997:1321-1328)(步骤S1202);步骤S1203,计算所提取的特征与已经采集的模板之间的相似度,例如,欧式距离的倒数,或者计算所提取的特征与已经采集的模版的特征之间的相关;步骤S1204,相似度最大的字符作为正确的符号识别结果。
结合图3所示示例,在步骤S102中,识别出所分割的各个图像区域对应于何种符号。即,在此步骤中,已经获得了上述符号:(,p,2,j,+,t,—[分数线],n,1,0,)。
接下来,在步骤S103中,对常见函数名进行合并,如sin,cos,sec,scs,tan,cotan,ctg,tg,lg,ln,cov,inf,sup,lim,liminf,exp,min,max,arc,log,cov,mod,rad,arg,det,将符号识别结果中有函数名组合的符号串合并为函数名,并设置一个自定义的UNICODE码,例如,sin用0 x e1b1表示,如表1所示。
表1:函数名与UNICODE码间的对应关系
 
函数名 UNICODE码
min 0 x e1a8
max 0 x e1a9
sup 0 x e1aa
inf 0 x e1ab
cosh 0 x e1ac
cot 0 x e1ad
cotan 0 x e1ae
det 0 x e1af
tan 0 x e1b0
sin 0 x e1b1
cos 0 x e1b2
tg 0 x e1b3
ctg 0 x e1b4
sec 0 x e1b5
csc 0 x e1b6
arc 0 x e1b7
log 0 x e1b8
ln 0 x e1b9
lim 0 x e1bd
exp 0 x e1be
cov 0 x e1bf
应当注意的是,上述关于函数名的UNICODE码定义并非唯一的,此处仅给出以上表1作为示例,本领域普通技术人员可以根据需要对函数名的UNICODE码进行适当的定义。因此,这部分内容绝不倾向于限制本发明的范围,而只是用作对本发明的示例。
至此,已经识别出构造数学公式的基本符号集合。在完成步骤S103之后,输出符号分割的结果。
接下来,对符号分割、识别、函数名合并后的结果进行结构分析处理。结构分析处理包括矩阵及多行表达式分析步骤S104、子表达式分析步骤S105和角标关系分析步骤S106。
在步骤S104,进行矩阵及多行表达式分析。首先,合并符号串中的左定界符和右定界符形成定界符组,然后,根据定界符之间的空间位置关系建立定界符组之间的结构关系树,再根据定界符组结构关系树重建矩阵层公式的整体结构,这样矩阵层公式分析就转化成多个基本矩阵的结构分析。在基本矩阵结构分析中,首先分析基本矩阵的行,如图4a中矩阵为两行矩阵,然后再分析基本矩阵的列,如图4b中矩阵为两列矩阵,得到矩阵的行和列候选后,从中选择可信度较高的行候选和列候选形成矩阵的元素候选,并得到基本矩阵的分析结果。依次对所有的基本矩阵进行分析,最后合成这些基本矩阵的分析结果,即得矩阵层公式分析的结果(图3所示公式的结构关系树),如图5所示。
在步骤S105,进行子表达式分析,主要包括对分式、求和表达式、连乘表达式、根式、修饰符等的分析。相应的具有结构关系的符号被称为控制符号,包括∑、∏、∧、∨、∩、∫、lim等。在子表达式层公式分析中,首先建立子表达式控制符间的结构关系树,并通过该关系树重建子表达式的整体结构,然后分析每一个子表达式,即得子表达式的结构分析结果,如图6中子表达式Sub2的分析结果为一分式,分子为符号‘l’,分母为待分析的符号串“l,n”。在完成所有的子表达式分析后,即得子表达式层公式分析结果,如图6所示。
在步骤S106,进行角标关系分析。首先,利用符号之间的位置关系,确定两两符号之间的角标关系图,例如,在图7中,左边的符号图像(真实身份为‘p’)的识别结果为字符“p”的概率是0.4、识别结果为字符“P”的概率是0.3、识别结果为字符“ρ”的概率是0.2;右边的符号图像(真实身份为‘2’)的识别结果为字符“2”的概率是0.5、识别结果为字符“z”的概率是0.4、识别结果为字符“Z”的概率是0.1;这样左边符号和右边符号的角标分析结果为字符‘p’上标字符‘2’的概率为0.8,为字符‘P’上标字符‘2’的概率为0.2。然后,使用语义分析剪枝,如图8所示,可参见参考文献[11][12][13],最后得到角标表达式的角标关系分析结果。如图6中的角标表达式Sub3的分析结果为
Figure A200710121679D0010160508QIETU
。在完成所有的角标表达式分析后,即得公式的分析结果,如图9所示。
在步骤S107,在得到公式的结构关系树图9后,按照一定的格式例如Latex语言、MathML、MathType等,将公式识别的结果表示出来,本实施例采用Latex格式。
首先,按照自底向上的方法依次将结构关系树中的每一个结构关系按照Latex格式表示。例如,图9中:
Sub3对应的Latex字符串为:p_j^{2}+t;
Sub6对应的Latex字符串为:n+1;
Sub5对应的Latex字符串为:\frac{1}{n+1};
Sub4对应的Latex字符串为:\frac{1}{n+1}+t;
Sub1对应的Latex字符串为:
\frac{p_j^{2}+t}{\frac{1}{n+1}+t};
Sub2对应的Latex字符串为:\frac{1}{n}。
由此,整个公式的结构关系树对应的Latex字符串为:
\left(\begin{array}{1,r}
\frac{p_j^{2}+t}{\frac{1}{n+1}+t}&\frac{1}{n}\\
0 & 1
\end{array}\right)
至此,公式的结构关系树就转化为Latex格式的字符串,如图10所示。
通过上述步骤,实现了根据本发明的数学公式识别编码方法。
更进一步地,根据本发明,可以将已被编码为可编辑的计算机公式表达语言的数学公式如Latex格式、MathML格式、Mathtype格式等转化为可实现该数学公式计算的计算机语言命令行(C语言、C++语言、汇编语言等),以简化程序设计过程和难度。例如,图11示出了与图3、图10相对应的、以C语言描述的计算机程序指令行。
至此已经结合优选实施例对本发明进行了描述。应该理解,本领域技术人员在不脱离本发明的精神和范围的情况下,可以进行各种其它的改变、替换和添加。因此,本发明的范围不局限于上述特定实施例,而应由所附权利要求所限定。
参考文献列表
[1] C.L.Liu,Kazuki Nakashima.“Handwritten digit recognition:investigation of normalization and feature extraction techniques”.PatternRecognition,2004:265-279
C.LLiu、Kazuki Nakashima,“手写数字识别:规一化技术和特征提取技术研究”;Pattern Recognition,2004:265-279
[2] H.W.Hao,X.H.Xiao,R.W.Dai.“Handwritten Chinesecharacter recognition by metasynthetic approach”.Pattern recognition,vol.30,no.8,1997:1321-1328
H.W.Hao、X.H.Xiao、R.W.Dai,“基于综合集成的手写汉字识别方法”;Pattern recognition,vol.30,no.8,1997:1321-1328
[3] Abdelwaheb Belaid and Jean-Paul Haton.“A SyntacticApproach for Handwritten Mathematical Formula Recognition”.IEEETransactions on Pattern Analysis and Machine Intelligence,1984,PAMI-6(1):105-111.
Abdelwaheb Belaid和Jean-Paul Haton,“一种手写数学公式识别的句法分析方法”;IEEE Transactions on Pattern Analysis and MachineIntelligence,1984,PAMI-6(1):105-111.
[4] Andreas Kosmala,Gerhard Rigoll,Stéphane Lavirotte and
Figure A200710121679D0012160645QIETU
 Pottier.“On-Line Handwritten Formula Recognition using HiddenMarkov Models and Context Dependant Graph Grammars”.Proceedingsof 5th International Conference on Document Analysis and Recognition,ICDAR′99,1999,107-110.
Andreas Kosmala、Gerhard Rigoll、Stéphane Lavirotte和
Figure A200710121679D0012160707QIETU
Pottier,“使用马尔可夫模型和上下文图文法的联机手写数学公式识别”;Proceedings of 5th International Conference on Document Analysisand Recognition,ICDAR′99,1999,107-110.
[5] Masayuki Okamoto and B. Miao.“Recognition ofMathematical Expressions by using the Layout Structure of Symbols”.Proceedings of 1st International Conference on Document Analysis andRecognition,ICDAR′91,Saint Malo,France,1991,242-250.
Masayuki Okamoto和B.Miao,“使用符号层次结构的数学公式识别方法”;Proceedings of 1st International Conference on DocumentAnalysis and Recognition,ICDAR′91,Saint Malo,France,1991,242-250.
[6] Masayuki Okamoto and A.Miyazawa.“An ExperimentalImplementation of Document Recognition System for Papers ContainingMathematical Expressions”.In Structured Document Image Analysis,H.S.Baird,H.Bunke,K.Yamamoto(Eds.),Berlin,Springer Verlag,1992,36-53.
Masayuki Okamoto和A.Miyazawa,“针对数学公式文档的文档识别系统一种实验实施”;In Structured Document Image Analysis,H.S.Baird,H.Bunke,K.Yamamoto(Eds.),Berlin,Springer Verlag,1992,36-53.
[7] Ann Grbavec and Dorothea Blostein.“MathematicsRecognition using Graph Rewriting”.Proceedings of 3rd InternationalConference on Document Analysis and Recognition(ICDAR′95),1995,417-421.
Ann Grbavec和Dorothea Blostein,“使用图改写方法的数学公式识别”;Proceedings of 3rd International Conference on DocumentAnalysis and Recognition(ICDAR′95),1995,417-421.
[8]Benjamin P. Berman and Richard J. Fateman.“OpticalCharacter Recognition for Typeset Mathematics”.Proceedings of the1994 International Symposium on Symbolic and Algebraic Computation,Oxford,UK,1994,348-353.
Benjamin P.Berman和Richard J.Fateman,“用于印刷体数学的光学字符识别”;Proceedings of the 1994 International Symposium onSymbolic and Algebraic Computation,Oxford,UK,1994,348-353.
[9]Hsi-Jian Lee and Min-Chou Lee.“UnderstandingMathematical Expressions Using Procedure-oriented Transformation”.Pattern Recognition,1994,27(3):447-457.
Hsi-Jian Lee和Min-Chou Lee,“使用过程导向变换的数学公式理解”;Pattern Recognition,1994,27(3):447-457.
[10]Richard Zanibbi,Dorothea Blostein,and James R.Cordy.“Recognizing Mathematical Expressions Using Tree Transformation”.IEEE Transactions on Pattern Analysis and Machine Intelligence,2002,24(11):1455-1467.
Richard Zanibbi、Dorothea Blostein和James R.Cordy,“使用树变换方法识别数学公式”;IEEE Transactions on Pattern Analysis andMachine Intelligence,2002,24(11):1455-1467.

Claims (10)

1.一种数学公式识别编码方法,包括:
采集并输入印刷体数学公式图像或者联机手写笔画序列;
对输入的印刷体数学公式图像或者联机手写笔画序列进行符号分割;
进行符号识别处理;
合并常见函数名,设置与识别出的常见函数名相对应的自定义代码;
对符号分割、识别、函数名合并后的结果进行结构分析处理,获得整个公式的结构关系树;
按照可编辑的计算机公式表达语言的格式,编码表示所得到的整个公式的结构关系树。
2.根据权利要求1所述的数学公式识别编码方法,其特征在于所述符号识别处理包括以下子步骤:
对分割后的符号进行非线性放缩;
提取感知方向特征;以及
计算所提取的特征与预定义模板之间的相似度;以及
选择相似度最大的字符作为正确的符号识别结果。
3.根据权利要求2所述的数学公式识别编码方法,其特征在于所提取的特征与预定义模板之间的相似度是欧式距离的倒数,或者是所提取的特征与预定义模版的特征之间的相关。
4.根据权利要求1所述的数学公式识别编码方法,其特征在于所述结构分析处理包括以下子步骤:
矩阵及多行表达式分析,合并符号串中的左定界符和右定界符形成定界符组;建立定界符组之间的结构关系树;以及根据定界符组结构关系树,重建公式的整体结构;
子表达式分析,建立子表达式控制符间的结构关系树,并通过该关系树重建子表达式的整体结构,然后分析每一个子表达式;以及
角标关系分析,利用符号之间的位置关系,确定两两符号之间的角标关系图,然后使用语义分析剪枝,得到角标表达式的角标关系分析结果。
5.根据权利要求4所述的数学公式识别编码方法,其特征在于所述子表达式分析步骤对分式、求和表达式、连乘表达式、根式、修饰符进行分析。
6.根据权利要求4所述的数学公式识别编码方法,其特征在于所述子表达式控制符包括∑、∏、∧、∨、∩、∫、lim。
7.根据权利要求1~6之一所述的数学公式识别编码方法,其特征在于所述自定义代码是自定义UNICODE码。
8.根据权利要求1~6之一所述的数学公式识别编码方法,其特征在于所述可编辑的计算机公式表达语言是Latex、MathML或MathType。
9.根据权利要求1~8之一所述的数学公式识别编码方法,其特征在于还包括:
将已被编码为可编辑的计算机公式表达语言的数学公式转化为可实现该数学公式计算的计算机语言命令行。
10.根据权利要求9所述的数学公式识别编码方法,其特征在于所述计算机语言命令行是C语言命令行、C++语言命令行、汇编语言行。
CN200710121679XA 2007-09-12 2007-09-12 数学公式识别编码方法 Active CN101388068B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN200710121679XA CN101388068B (zh) 2007-09-12 2007-09-12 数学公式识别编码方法

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN200710121679XA CN101388068B (zh) 2007-09-12 2007-09-12 数学公式识别编码方法

Publications (2)

Publication Number Publication Date
CN101388068A true CN101388068A (zh) 2009-03-18
CN101388068B CN101388068B (zh) 2011-06-22

Family

ID=40477483

Family Applications (1)

Application Number Title Priority Date Filing Date
CN200710121679XA Active CN101388068B (zh) 2007-09-12 2007-09-12 数学公式识别编码方法

Country Status (1)

Country Link
CN (1) CN101388068B (zh)

Cited By (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446267A (zh) * 2010-09-30 2012-05-09 汉王科技股份有限公司 公式符号识别方法及其装置
CN103235945A (zh) * 2013-03-27 2013-08-07 重庆市科学技术研究院 一种基于Android系统的手写数学公式识别及生成MathML的方法
CN103810493A (zh) * 2012-11-06 2014-05-21 夏普株式会社 识别数学公式的方法和设备
CN106611148A (zh) * 2015-10-21 2017-05-03 北京百度网讯科技有限公司 基于图像的离线公式识别方法和装置
CN106980856A (zh) * 2016-01-15 2017-07-25 上海谦问万答吧云计算科技有限公司 公式识别方法及系统和符号推理计算方法及系统
CN107209862A (zh) * 2015-01-21 2017-09-26 国立大学法人东京农工大学 程序、信息存储介质以及识别装置
CN107301164A (zh) * 2016-04-14 2017-10-27 科大讯飞股份有限公司 数学公式的语义解析方法及装置
CN108241847A (zh) * 2016-12-27 2018-07-03 北京新唐思创教育科技有限公司 一种文本识别中的拉泰赫格式公式处理方法及其装置
CN108898142A (zh) * 2018-06-15 2018-11-27 宁波云江互联网科技有限公司 一种手写公式的识别方法及计算设备
CN109063561A (zh) * 2018-06-28 2018-12-21 广州视源电子科技股份有限公司 公式的识别计算方法和装置
CN112507806A (zh) * 2020-11-19 2021-03-16 深圳市鹰硕教育服务有限公司 智慧课堂信息交互方法、装置及电子设备
CN113657413A (zh) * 2021-10-19 2021-11-16 北京世纪好未来教育科技有限公司 手写公式的识别方法、装置、设备及介质
FR3137987A1 (fr) * 2022-07-14 2024-01-19 Sunia Pte. Ltd Système de reconnaissance d'expressions mathématiques dirigé par la syntaxe.

Cited By (22)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102446267B (zh) * 2010-09-30 2014-12-10 汉王科技股份有限公司 公式符号识别方法及其装置
CN102446267A (zh) * 2010-09-30 2012-05-09 汉王科技股份有限公司 公式符号识别方法及其装置
CN103810493A (zh) * 2012-11-06 2014-05-21 夏普株式会社 识别数学公式的方法和设备
CN103235945A (zh) * 2013-03-27 2013-08-07 重庆市科学技术研究院 一种基于Android系统的手写数学公式识别及生成MathML的方法
CN103235945B (zh) * 2013-03-27 2016-03-23 重庆市科学技术研究院 一种基于Android系统的手写数学公式识别及生成MathML的方法
CN107209862A (zh) * 2015-01-21 2017-09-26 国立大学法人东京农工大学 程序、信息存储介质以及识别装置
CN106611148B (zh) * 2015-10-21 2020-04-24 北京百度网讯科技有限公司 基于图像的离线公式识别方法和装置
CN106611148A (zh) * 2015-10-21 2017-05-03 北京百度网讯科技有限公司 基于图像的离线公式识别方法和装置
CN106980856A (zh) * 2016-01-15 2017-07-25 上海谦问万答吧云计算科技有限公司 公式识别方法及系统和符号推理计算方法及系统
CN106980856B (zh) * 2016-01-15 2020-11-27 北京字节跳动网络技术有限公司 公式识别方法及系统和符号推理计算方法及系统
CN107301164A (zh) * 2016-04-14 2017-10-27 科大讯飞股份有限公司 数学公式的语义解析方法及装置
CN108241847A (zh) * 2016-12-27 2018-07-03 北京新唐思创教育科技有限公司 一种文本识别中的拉泰赫格式公式处理方法及其装置
CN108898142A (zh) * 2018-06-15 2018-11-27 宁波云江互联网科技有限公司 一种手写公式的识别方法及计算设备
CN108898142B (zh) * 2018-06-15 2022-03-18 宁波云江互联网科技有限公司 一种手写公式的识别方法及计算设备
CN109063561A (zh) * 2018-06-28 2018-12-21 广州视源电子科技股份有限公司 公式的识别计算方法和装置
CN109063561B (zh) * 2018-06-28 2022-03-08 广州视源电子科技股份有限公司 公式的识别计算方法和装置
CN112507806A (zh) * 2020-11-19 2021-03-16 深圳市鹰硕教育服务有限公司 智慧课堂信息交互方法、装置及电子设备
CN112507806B (zh) * 2020-11-19 2022-05-27 深圳市鹰硕教育服务有限公司 智慧课堂信息交互方法、装置及电子设备
WO2022105005A1 (zh) * 2020-11-19 2022-05-27 深圳市鹰硕教育服务有限公司 智慧课堂信息交互方法、装置及电子设备
CN113657413A (zh) * 2021-10-19 2021-11-16 北京世纪好未来教育科技有限公司 手写公式的识别方法、装置、设备及介质
CN113657413B (zh) * 2021-10-19 2022-02-15 北京世纪好未来教育科技有限公司 手写公式的识别方法、装置、设备及介质
FR3137987A1 (fr) * 2022-07-14 2024-01-19 Sunia Pte. Ltd Système de reconnaissance d'expressions mathématiques dirigé par la syntaxe.

Also Published As

Publication number Publication date
CN101388068B (zh) 2011-06-22

Similar Documents

Publication Publication Date Title
CN101388068B (zh) 数学公式识别编码方法
Mahdavi et al. ICDAR 2019 CROHME+ TFD: Competition on recognition of handwritten mathematical expressions and typeset formula detection
KR101376863B1 (ko) 문서 시각 구조의 문법 분석
Khorsheed Offline recognition of omnifont Arabic text using the HMM ToolKit (HTK)
US8908961B2 (en) System and methods for arabic text recognition based on effective arabic text feature extraction
US8768062B2 (en) Online script independent recognition of handwritten sub-word units and words
US7885456B2 (en) Symbol graph generation in handwritten mathematical expression recognition
Biadsy et al. Segmentation-free online arabic handwriting recognition
Benouareth et al. Semi-continuous HMMs with explicit state duration for unconstrained Arabic word modeling and recognition
CN108804423B (zh) 医疗文本特征提取与自动匹配方法和系统
US20100163316A1 (en) Handwriting Recognition System Using Multiple Path Recognition Framework
US20060280370A1 (en) Application of grammatical parsing to visual recognition tasks
US9286527B2 (en) Segmentation of an input by cut point classification
Assabie et al. Offline handwritten Amharic word recognition
Nguyen et al. ICFHR 2018–competition on Vietnamese online handwritten text recognition using HANDS-VNOnDB (VOHTR2018)
Saba et al. Online versus offline Arabic script classification
Serrano et al. Interactive handwriting recognition with limited user effort
Le et al. Stroke order normalization for improving recognition of online handwritten mathematical expressions
Zhang et al. A symbol dominance based formulae recognition approach for pdf documents
Kunwar et al. Online handwritten Kannada word recognizer with unrestricted vocabulary
CN110442876B (zh) 文本挖掘方法、装置、终端及存储介质
Kanoun et al. Affixal approach for Arabic decomposable vocabulary recognition a validation on printed word in only one font
Simistira et al. A system for recognition of on-line handwritten mathematical expressions
Shah et al. Line-of-Sight with Graph Attention Parser (LGAP) for Math Formulas
Alvaro et al. Unbiased evaluation of handwritten mathematical expression recognition

Legal Events

Date Code Title Description
C06 Publication
PB01 Publication
C10 Entry into substantive examination
SE01 Entry into force of request for substantive examination
C14 Grant of patent or utility model
GR01 Patent grant
TR01 Transfer of patent right
TR01 Transfer of patent right

Effective date of registration: 20210901

Address after: 100124 first floor, building 8, No. 1129, Huihe South Street, Banbidian village, Gaobeidian Township, Chaoyang District, Beijing

Patentee after: Beijing Hanwang Yingyan Technology Co.,Ltd.

Address before: 100094, No. 5, building 8, No. three northeast Wang Xi Road, Beijing, Haidian District

Patentee before: HANWANG TECHNOLOGY Co.,Ltd.