CN108364009A - 二维结构公式的识别方法、计算设备及计算机存储介质 - Google Patents

二维结构公式的识别方法、计算设备及计算机存储介质 Download PDF

Info

Publication number
CN108364009A
CN108364009A CN201810145895.6A CN201810145895A CN108364009A CN 108364009 A CN108364009 A CN 108364009A CN 201810145895 A CN201810145895 A CN 201810145895A CN 108364009 A CN108364009 A CN 108364009A
Authority
CN
China
Prior art keywords
line
text
determined
structural formula
dimensional structural
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201810145895.6A
Other languages
English (en)
Inventor
张恒
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Zhangyue Technology Co Ltd
Original Assignee
Zhangyue Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Zhangyue Technology Co Ltd filed Critical Zhangyue Technology Co Ltd
Priority to CN201810145895.6A priority Critical patent/CN108364009A/zh
Publication of CN108364009A publication Critical patent/CN108364009A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/158Segmentation of character regions using character size, text spacings or pitch estimation
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/32Digital ink
    • G06V30/36Matching; Classification
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明公开了一种二维结构公式的识别方法、计算设备及计算机存储介质,其中,方法包括:获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;根据待定文本行中的文本元素确定待定文本行是否为二维结构公式行。由此可见,利用本发明提供的方案,可以完整且准确识别出二维结构公式行,克服了现有技术中直接根据识别结果,将同一个二维结构公式行识别成多行,而导致的识别错误以及转换结果混乱的问题。

Description

二维结构公式的识别方法、计算设备及计算机存储介质
技术领域
本发明涉及文本识别技术领域,具体涉及一种二维结构公式的识别方法、计算设备及计算机存储介质。
背景技术
目前,随着手机等移动终端的普及以及电子书阅读器的发展,电子书越来越受阅读用户的青睐。与此同时,在电子阅读器中,为使文档内容能够根据阅读设备的特性,以最适于阅读的方式显示,需将版式文档的文档内容的格式进行转换,例如,将PDF文档转成电子出版文档(Electronic Publication,简称ePUB),或者转成HTML文档。
在现有技术中,对PDF中的二维结构公式(即:以独立“行”显示的公式)进行转换识别时,会依据文本元素的显示位置,将二维结构公式识别成多行,使得在转换后的文档中,原来的二维结构公式显示混乱,进而给用户的阅读带来较差的体验。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的二维结构公式的识别方法、计算设备及计算机存储介质。
根据本发明的一个方面,提供了一种二维结构公式的识别方法,包括:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
根据本发明的另一方面,提供了一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
根据本发明的又一方面,提供了一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行以下操作:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
根据本发明提供的二维结构公式的识别方法、计算设备及计算机存储介质,当识别出文本行之后,首先获取各行文本行的文本行信息,根据文本行信息判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件,即判断任意相邻文本行是否应该作为一行待定文本行来进行转换处理,将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;然后,进一步根据待定文本行中的文本元素确定待定文本是否为二维结构公式行,以便准确针对二维结构公式行进行转换处理,同时避免错误的对不是二维结构公式行的待定公式行进行转换处理而导致转换后的文档显示的效果差的问题。由此可见,利用本实施例提供的方案,可以完整且准确识别出二维结构公式行,克服了现有技术中直接根据识别结果,将同一个二维结构公式行识别成多行,而导致的识别错误以及转换结果混乱的问题。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明一个实施例的二维结构公式的识别方法的流程图;
图2示出了本发明另一个实施例的二维结构公式的识别方法的流程图;
图3示出了根据本发明实施例的一种计算设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
考虑到现有技术中的识别方法,容易造成二维结构公式识别以及显示混乱,给用户带来较差的体验的问题。基于此,本发明提供了一种通过预设的规则进行判断识别,并将识别出的二维结构公式对应的区域进行截图处理,以得到二维结构公式图片的方案,进而可以针对得到的二维结构公式图片整体进行转换处理,使二维结构公式可以完整且准确的显示在转换后的文档中。
图1示出了本发明一个实施例的二维结构公式的识别方法的流程图。如图1所示,该方法包括以下步骤:
步骤S110:获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件。
在对待识别文档进行识别的过程中,为避免将二维结构公式识别成多行。在本实施例中,首先获取利用现有技术识别出的各行文本行的文本行信息,并据此文本行信息判断相邻文本行是否满足第一合并条件和/或第二合并条件,以防止在转换后的文档中,将本应作为一行待定文本行进行转换处理的文本行,错误的作为多行文本行进行处理,进而造成转换处理后的文本显示混乱的问题。
其中,文本行信息包括文本行的文本元素和/或文本行参数。举例来说,在PDF文档中,文本元素包括字符、路径线以及图片;文本行参数包括识别出的各行文本行的行高以及文本行之间的行间距,另外文本行信息还包括各个文本元素的标记值,例如,PDF文档中文本元素的索引值,需要在次说明的是,本发明并不受上述举例的限定,在具体实施时,本领域技术人员可灵活选择文本行信息。另外,第一合并条件和/或第二合并条件为任意可以确定相邻文本行本应作为一行待定文本行进行转换处理的条件,具体地,第一合并条件为限定相邻行的文本元素的标记值的数值范围的条件;第二合并条件为限定文本行参数的参数值范围的条件。例如,第二合并条件为相邻文本行的行间距小于预设平均行间距。
步骤S120:将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行。
若相邻文本行满足第一合并条件和/或第二合并条件,则将相邻文本行合并成待定文本行,以便针对该待定文本行整体进行转换处理。具体地,根据相邻文本行的文本行信息将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行,以使合并后的待定文本行中的各个文本元素的位置与待转换文档中的排版更接近。例如,根据各个文本元素的标记值、文本行的行高以及文本行之间的行间距进行合并。
步骤S130:根据待定文本行中的文本元素确定待定文本行是否为二维结构公式行。
在确定了待定文本行之后,进一步确定待定文本行是否为二维结构公式行,以便准确针对二维结构公式行进行转换处理。
具体地,根据待定文本行中的文本元素的类型和/或文本元素的具体内容来确定待定文本行是否为二维结构公式行。举例来说,若待定文本行的文本元素中包括特殊符号,例如,包括求和符号∑,则确定待定文本行为二维结构公式行。
根据本实施例提供的二维结构公式的识别方法,当识别出文本行之后,首先获取各行文本行的文本行信息,根据文本行信息判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件,即判断任意相邻文本行是否应该作为一行待定文本行来进行转换处理,将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;然后,进一步根据待定文本行中的文本元素确定待定文本是否为二维结构公式行,以便准确针对二维结构公式行进行转换处理,同时避免错误的对不是二维结构公式行的待定公式行进行转换处理而导致转换后的文档显示的效果差的问题。由此可见,利用本实施例提供的方案,可以完整且准确识别出二维结构公式行,克服了现有技术中直接根据识别结果,将同一个二维结构公式行识别成多行,而导致的识别错误以及转换结果混乱的问题。
图2示出了本发明另一个实施例的二维结构公式的识别方法的流程图。如图2所示,该方法包括以下步骤:
步骤S210:获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件。
本步骤中,通过获取利用现有技术识别出的各行文本行的文本行信息,并据此文本行信息判断相邻文本行是否满足第一合并条件和/或第二合并条件,以确定相邻文本行是否应该被作为一个整体进行转换处理。
其中,文本行信息包括文本行的文本元素和/或文本行参数。则根据文本行信息判断任意相邻文本行是否满足预设条件具体指:根据文本元素、行间距、行高和/或索引值判断任意相邻文本行是否满足预设条件。
在具体实施时,可通过如下判断准则去判定相邻文本行是否满足预设条件:
准则一,判断相邻文本行中是否存在任一特定文本行,且相邻文本行中除该特定文本行以外的其它文本行中的文本元素的标记值全部在该特定文本行中的文本元素的标记值的最小值与最大值之间,若是,则判定相邻文本行满足第一合并条件。该判断准则是根据待转换文档中文本元素的标记规则而确定的。具体地,若在相邻文本行中,除特定文本行以外的其他文本行的所有标记值在特定文本行的标记值的最小值与最大值之间,则确定该相邻文本行为一个整体,则判定相邻文本行满足第一合并条件。
以待转换文档为PDF文档为例,则标记规则具体为索引规则,PDF中文本元素的索引规则是指:在PDF文档中的同一文本行中,文本元素的索引值是连续的。
举例来说,若将PDF文档中的如下公式识别成两行:
其中,i=1为第一文本行,其余部分为第二文本行,PDF中第一文本行和第二文本行原本属于同一文本行,因识别错误导致识别为两个文本行。假设第一文本行的文本元素的索引值分别为3,4,5,第二文本行的文本元素的索引值分别为1,2,6,7,8,9,10,11,第一文本行中的文本元素的索引值全部在第二文本行中的文本元素的索引值的最小值与最大值之间,则认为该相邻文本行中的文本元素为一个整体,则确定相邻文本行满足第一合并条件。
准则二,判断相邻文本行之间是否包括路径线,在相邻文本行之间具有路径线的情况下,则进一步根据行间距和/或行高判断相邻文本行是否满足第二合并条件。其中,在PDF文档中,路径线为一种文本元素,其可以用来表示生僻字、表格或者分数线等文本内容。具体地,首先判断相邻文本行之间是否包括路径线,若包含,则进一步根据相邻文本行的行间距是否小于预设平均行间距,和/或,根据相邻文本行的行高的比值是否大于第一预设行高比值,来判断相邻文本行是否满足第二合并条件。仍以上述举例中识别成两行的公式为例,其中,第一文本行的行高为0.2,第二文本行的行高为0.8,行高大的第二文本行的行高与行高小的第一文本行的行高的比值为4,该比值大于第一预设行高比值2,则判定相邻文本行满足第二合并条件。
另外,在本发明的一些其他具体实施例中,也可以通过将上述两种判断准则进行结合来判定相邻文本行是否满足预设条件。
步骤S220:将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行。
在判定出相邻文本行满足第一合并条件和/或第二合并条件之后,将该相邻文本行合并成待定文本行,以便针对该待定文本行整体进行文档转换处理。
步骤S230:根据待定文本行中的文本元素和/或文本元素信息确定待定文本行是否为二维结构公式行。
在确定了待定文本行之后,进一步确定待定文本行是否为二维结构公式行,以便准确针对二维结构公式行进行转换处理。其中,文本元素进一步包括文本元素的类型和/或文本元素的具体内容;文本元素信息包括文本元素的位置信息和/或高度信息。
在具体实施时,确定待定文本行是否为二维结构公式行的标准可以灵活多样,下面分别以第一特殊符号、包含路径线和不包含路径线三种较典型的标准进行具体说明:
标准一,以待定文本行中的字符是否包含第一特殊符号为标准。其中,第一特殊符号指在数学公式中,在与符号垂直投影相交的区域内同时存在运算符、数学符号和/或数字的特殊符号。常见的第一特殊符号包括但不限于以下特殊符号中的至少一种:求和符号、求极限符号以及积分符号。本发明并不受上述提及的第一特殊符号的限定,本领域技术人员也可以根据需要将其他具有上述类似特征的数学符号作为第一特殊符号。
具体地,将待定文本行中的字符与第一特殊符号库中的第一特殊符号进行匹配;若至少一个字符匹配成功,以及,至少一个字符的字符高度与待定文本行的行高的比值超过预设比值,则确定待定文本行为二维结构公式行。其中,在匹配成功后,进一步根据该至少一个字符的高度信息确定待定文本行是否为二维结构公式行,以提高确定的二维结构公式行的准确性。
除上述标准一之外,还可以通过包含路径线或不包含路径线两种标准来确定二维结构公式行。在本实施例中,若需要以包含路径线或不包含路径线的标准来进行确定,则首先需要执行查询待定文本行中的文本元素中是否包含路径线;然后,根据查询结果确定待定文本行是否为二维结构公式行。由于在二维结构公式中,路径线通常表示的是分数线,因此,在下文中,主要以路径线为分数线为例进行说明,但需要在此强调的是,并不能以此作为对本发明的限定。
标准二,以待定文本行中包含路径线为标准。在该种标准下,需要进一步根据路径线周围的文本元素的具体内容确定待定文本行是否为二维结构公式行。在具体实施时,分为以下几种情况:
情况一,若查询结果为包含路径线,以及,在路径线左侧或右侧且与路径线相邻的位置存在运算符,则确定待定文本行为二维结构公式行。以分数线为例,若分数线左侧或右侧相邻的位置存在运算符,则确定待定文本行为二维结构公式行。
情况二,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内存在运算符,则确定待定文本行为二维结构公式行;和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内的所有字符全是数字,则确定待定文本行为二维结构公式行;和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内包含数学符号库中的数学符号,则确定待定文本行为二维结构公式行,其中,数学符号包括但不限于希腊字母及拉丁字母。以待定文本行中的文本内容如下为例说明文本元素相对于路径线的位置关系:
其中,中的dx和ax+b与两者之间的分数线为垂直投影相交,中的1和a与两者之间的分数线为垂直投影相交,而该公式中的其他运算符及数学符号均不与分数线垂直投影相交。
情况三,若查询结果为包含路径线,以及,在不与路径线的垂直投影相交的至少两个位置存在垂直投影相交的字符,则确定待定文本行不是二维结构公式行。通过该种情况,可以排除待定文本行为公式行的可能,避免将非二维结构公式行错误的确定为二维结构公式行。
标准三,以待定文本行中不包含路径线为标准。在该种标准下,需要进一步根据待定文本行中的文本元素的具体内容和/或文本元素信息确定待定文本行是否为二维结构公式行。在具体实施时,分为以下几种情况:
情况一,若查询结果为不包含路径线,则检测待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;当检测到包含至少一个第二特殊符号时,则根据至少一个第二特殊符号的高度与待定文本行的行高的比值,确定待定文本行是否为二维结构公式行。其中,第二特殊符号指在数学公式中,在与符号水平投影相交的区域内包括至少两组垂直投影相交的文本元素的特殊符号。常见的第二特殊符号包括但不限于以下特殊符号中的至少一种:大括号、中括号以及矩阵符号。具体地,当第二特殊符号的高度与待定文本行的行高的比值大于第二预设行高比值,则确定待定文本行为二维结构公式行。以待定文本行中的文本内容如下为例:
上述待定文本行中,大括号的高度与待定文本行的行高的比值大于第二预设行高比值70%,则确定该待定文本行为二维结构公式行。
或者,当检测到包含至少一个第二特殊符号时,根据至少一个第二特殊符号周围的预设位置处的文本元素确定待定文本行是否为二维结构公式行。具体地,若第二特殊符号前后有运算符,则确定待定文本行为公式行;若第二特殊符号前后无运算符,则检测待定文本行中是否存在垂直位置关系的运算符,其中,该垂直位置关系可以为垂直投影相交的关系。
或者,当检测到包含至少一个第二特殊符号时,可以结合上述根据至少一个第二特殊符号的高度与待定文本行的行高的比值,以及根据至少一个第二特殊符号周围的预设位置处的文本元素的方式来确定待定文本行是否为二维结构公式行,以提高确定结果的准确性。
情况二,若查询结果为不包含路径线,则检测待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;当检测到不包含至少一个第二特殊符号时,则判断待定文本行的文本元素中是否同时包括运算符和上下标;若是,则确定待定文本行为二维结构公式行。以待定文本行中的文本内容为为例,其中既包含运算符又包含上下标,则确定待定文本行为二维结构公式行。
另外,在本发明的一些其他实施例中,也可以从上述三种标准或多种情况中任意选择一种或多种方式来确定待定文本行是否为二维结构公式行。一般情况下,利用多种方式可以提高确定结果的准确性。
步骤S240:当确定待定文本行为二维结构公式行时,对二维结构公式行进行截图处理,得到二维结构公式图片。
在本步骤中,在确定待定文本行为二维结构公式行之后,对二维结构公式行进行截图处理,以将得到的二维结构公式图片作为一个整体显示在转换后的文档的相应位置中。
其中,在对二维结构公式行进行截图处理时,截图处理的区域可以灵活确定,本发明对此不做具体限定。例如,截图处理的区域为二维结构公式的外接矩形,或者为二维结构公式行的外接矩形,或者为二维结构公式行中所有的文本元素的外接矩形等等。
在本发明的一个具体实施例中,通过如下方式确定截图区域以及进行截图处理:当确定待定文本行为二维结构公式行时,根据二维结构公式行中二维结构公式的位置和/或提示符的位置确定截图区域;对截图区域进行截图处理。具体地,在确定待定文本行为二维结构公式行之后,在二维结构公式行中进一步锁定二维结构公式所在的位置,根据该位置确定截图区域;或者,当二维结构公式行中有公式提示符时,则结合该公式提示符的位置确定截图区域;对截图区域进行截图处理。
根据本实施例提供的一种二维结构公式的识别方法,当利用现有技术识别出文本行之后,首先获取各行文本行的文本行信息,根据文本行信息判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件,即判断任意相邻文本行是否应该作为一行待定文本行来进行转换处理,将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;然后,进一步根据待定文本行中的文本元素和/或文本元素信息确定待定文本行是否为二维结构公式行,以便准确针对二维结构公式行进行转换处理,同时避免错误的对不是二维结构公式行的待定公式行进行转换处理而导致转换后的文档显示的效果差的问题;在确定待定文本行为二维结构公式行之后,根据二维结构公式行中二维结构公式的位置和/或提示符的位置确定截图区域;对截图区域进行截图处理,以将得到的二维结构公式图片作为一个整体进行转换处理。由此可见,利用本实施例提供的方案,可以将二维结构公式完整且准确的以二维结构公式图片显示在转换后的文档中,克服了现有技术中直接根据识别结果,将同一个二维结构公式识别成多行,而导致的识别错误以及转换结果的问题。
本申请实施例提供了一种非易失性计算机存储介质,所述计算机存储介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实施例中的二维结构公式的识别方法。
可执行指令具体可以用于使得处理器执行以下操作:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:当确定所述待定文本行为二维结构公式行时,对所述二维结构公式行进行截图处理,得到二维结构公式图片。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
判断相邻文本行中是否存在任一特定文本行,且相邻文本行中除该特定文本行以外的其它文本行中的文本元素的标记值全部在该特定文本行中的文本元素的标记值的最小值与最大值之间,若是,则判定相邻文本行满足第一合并条件。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行;其中,所述文本元素信息包括文本元素的位置信息和/或高度信息。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
将所述待定文本行中的字符与第一特殊符号库中的第一特殊符号进行匹配;其中,第一特殊符号指在数学公式中,在与符号垂直投影相交的区域内同时存在运算符、数学符号和/或数字的特殊符号;
若至少一个字符匹配成功,以及,所述至少一个字符的字符高度与所述待定文本行的行高的比值超过预设比值,则确定所述待定文本行为二维结构公式行。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
查询所述待定文本行中的文本元素中是否包含路径线;
根据查询结果确定所述待定文本行是否为二维结构公式行。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为包含路径线,以及,在路径线左侧或右侧且与路径线相邻的位置存在运算符,则确定所述待定文本行为二维结构公式行。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内存在运算符,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内的所有字符全是数字,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内包含数学符号库中的数学符号,则确定所述待定文本行为二维结构公式行。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为包含路径线,以及,在不与路径线的垂直投影相交的至少两个位置存在垂直投影相交的字符,则确定所述待定文本行不是二维结构公式行。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到包含至少一个第二特殊符号时,则根据至少一个第二特殊符号的高度与所述待定文本行的行高的比值,确定所述待定文本行是否为二维结构公式行;
和/或,根据至少一个第二特殊符号周围的预设位置处的文本元素确定所述待定文本行是否为二维结构公式行。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到不包含至少一个第二特殊符号时,则判断所述待定文本行的文本元素中是否同时包括运算符和上下标;若是,则确定所述待定文本行为二维结构公式行。
在一种可选的实施方式中,所述可执行指令进一步使所述处理器执行以下操作:
根据所述二维结构公式行中二维结构公式的位置和/或提示符的位置确定截图区域;对所述截图区域进行截图处理。
图3示出了根据本发明实施例的一种计算设备的结构示意图,本发明具体实施例并不对计算设备的具体实现做限定。
如图3所示,该计算设备可以包括:处理器(processor)302、通信接口(Communications Interface)304、存储器(memory)306、以及通信总线308。
其中:
处理器302、通信接口304、以及存储器306通过通信总线308完成相互间的通信。
通信接口304,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器302,用于执行程序310,具体可以执行上述二维结构公式的识别方法实施例中的相关步骤。
具体地,程序310可以包括程序代码,该程序代码包括计算机操作指令。
处理器302可能是中央处理器CPU,或者是特定集成电路ASIC(ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例的一个或多个集成电路。计算设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器306,用于存放程序310。存储器306可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序310具体可以用于使得处理器302执行以下操作:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
当确定所述待定文本行为二维结构公式行时,对所述二维结构公式行进行截图处理,得到二维结构公式图片。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
判断相邻文本行中是否存在任一特定文本行,且相邻文本行中除该特定文本行以外的其它文本行中的文本元素的标记值全部在该特定文本行中的文本元素的标记值的最小值与最大值之间,若是,则判定相邻文本行满足第一合并条件。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行;其中,所述文本元素信息包括文本元素的位置信息和/或高度信息。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
将所述待定文本行中的字符与第一特殊符号库中的第一特殊符号进行匹配;其中,第一特殊符号指在数学公式中,在与符号垂直投影相交的区域内同时存在运算符、数学符号和/或数字的特殊符号;
若至少一个字符匹配成功,以及,所述至少一个字符的字符高度与所述待定文本行的行高的比值超过预设比值,则确定所述待定文本行为二维结构公式行。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
查询所述待定文本行中的文本元素中是否包含路径线;
根据查询结果确定所述待定文本行是否为二维结构公式行。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
若查询结果为包含路径线,以及,在路径线左侧或右侧且与路径线相邻的位置存在运算符,则确定所述待定文本行为二维结构公式行。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内存在运算符,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内的所有字符全是数字,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内包含数学符号库中的数学符号,则确定所述待定文本行为二维结构公式行。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
若查询结果为包含路径线,以及,在不与路径线的垂直投影相交的至少两个位置存在垂直投影相交的字符,则确定所述待定文本行不是二维结构公式行。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到包含至少一个第二特殊符号时,则根据至少一个第二特殊符号的高度与所述待定文本行的行高的比值,确定所述待定文本行是否为二维结构公式行;
和/或,根据至少一个第二特殊符号周围的预设位置处的文本元素确定所述待定文本行是否为二维结构公式行。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到不包含至少一个第二特殊符号时,则判断所述待定文本行的文本元素中是否同时包括运算符和上下标;若是,则确定所述待定文本行为二维结构公式行。
在一种可选的实施方式中,程序310具体可以进一步用于使得处理器302执行以下操作:
根据所述二维结构公式行中二维结构公式的位置和/或提示符的位置确定截图区域;对所述截图区域进行截图处理。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述,构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容,并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有若干不同元件的硬件以及借助于适当编程的计算机来实现。单词第一、第二、以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
本发明公开了:
A1.一种二维结构公式的识别方法,包括:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
A2.根据A1所述的方法,其中,所述方法还包括:
当确定所述待定文本行为二维结构公式行时,对所述二维结构公式行进行截图处理,得到二维结构公式图片。
A3.根据A1或A2所述的方法,其中,所述判断任意相邻文本行的文本元素的标记值是否满足第一合并条件进一步包括:
判断相邻文本行中是否存在任一特定文本行,且相邻文本行中除该特定文本行以外的其它文本行中的文本元素的标记值全部在该特定文本行中的文本元素的标记值的最小值与最大值之间,若是,则判定相邻文本行满足第一合并条件。
A4.根据A1-A3任一项所述的方法,其中,所述根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行进一步包括:
根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行;其中,所述文本元素信息包括文本元素的位置信息和/或高度信息。
A5.根据A4所述的方法,其中,所述根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行进一步包括:
将所述待定文本行中的字符与第一特殊符号库中的第一特殊符号进行匹配;其中,第一特殊符号指在数学公式中,在与符号垂直投影相交的区域内同时存在运算符、数学符号和/或数字的特殊符号;
若至少一个字符匹配成功,以及,所述至少一个字符的字符高度与所述待定文本行的行高的比值超过预设比值,则确定所述待定文本行为二维结构公式行。
A6.根据A4或A5所述的方法,其中,所述根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行进一步包括:
查询所述待定文本行中的文本元素中是否包含路径线;
根据查询结果确定所述待定文本行是否为二维结构公式行。
A7.根据A6所述的方法,其中,所述根据查询结果确定所述待定文本行是否为二维结构公式行具体为:
若查询结果为包含路径线,以及,在路径线左侧或右侧且与路径线相邻的位置存在运算符,则确定所述待定文本行为二维结构公式行。
A8.根据A6所述的方法,其中,所述根据查询结果确定所述待定文本行是否为二维结构公式行具体为:
若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内存在运算符,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内的所有字符全是数字,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内包含数学符号库中的数学符号,则确定所述待定文本行为二维结构公式行。
A9.根据A6-A8任一项所述的方法,其中,所述根据查询结果确定所述待定文本行是否为二维结构公式行具体为:
若查询结果为包含路径线,以及,在不与路径线的垂直投影相交的至少两个位置存在垂直投影相交的字符,则确定所述待定文本行不是二维结构公式行。
A10.根据A6所述的方法,其中,所述根据查询结果确定所述待定文本行是否为二维结构公式行具体为:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到包含至少一个第二特殊符号时,则根据至少一个第二特殊符号的高度与所述待定文本行的行高的比值,确定所述待定文本行是否为二维结构公式行;
和/或,根据至少一个第二特殊符号周围的预设位置处的文本元素确定所述待定文本行是否为二维结构公式行。
A11.根据A6所述的方法,其中,所述根据查询结果确定所述待定文本行是否为二维结构公式行具体为:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到不包含至少一个第二特殊符号时,则判断所述待定文本行的文本元素中是否同时包括运算符和上下标;若是,则确定所述待定文本行为二维结构公式行。
A12.根据A2-A11任一项所述的方法,其中,所述对所述二维结构公式行进行截图处理进一步包括:
根据所述二维结构公式行中二维结构公式的位置和/或提示符的位置确定截图区域;对所述截图区域进行截图处理。
B13.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
B14.根据B13所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:当确定所述待定文本行为二维结构公式行时,对所述二维结构公式行进行截图处理,得到二维结构公式图片。
B15.根据B13或B14所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
判断相邻文本行中是否存在任一特定文本行,且相邻文本行中除该特定文本行以外的其它文本行中的文本元素的标记值全部在该特定文本行中的文本元素的标记值的最小值与最大值之间,若是,则判定相邻文本行满足第一合并条件。
B16.根据B13-B15任一项所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行;其中,所述文本元素信息包括文本元素的位置信息和/或高度信息。
B17.根据B16所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
将所述待定文本行中的字符与第一特殊符号库中的第一特殊符号进行匹配;其中,第一特殊符号指在数学公式中,在与符号垂直投影相交的区域内同时存在运算符、数学符号和/或数字的特殊符号;
若至少一个字符匹配成功,以及,所述至少一个字符的字符高度与所述待定文本行的行高的比值超过预设比值,则确定所述待定文本行为二维结构公式行。
B18.根据B16或B17所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
查询所述待定文本行中的文本元素中是否包含路径线;
根据查询结果确定所述待定文本行是否为二维结构公式行。
B19.根据B18所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为包含路径线,以及,在路径线左侧或右侧且与路径线相邻的位置存在运算符,则确定所述待定文本行为二维结构公式行。
B20.根据B18所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内存在运算符,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内的所有字符全是数字,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内包含数学符号库中的数学符号,则确定所述待定文本行为二维结构公式行。
B21.根据B18-B20任一项所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为包含路径线,以及,在不与路径线的垂直投影相交的至少两个位置存在垂直投影相交的字符,则确定所述待定文本行不是二维结构公式行。
B22.根据B18所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到包含至少一个第二特殊符号时,则根据至少一个第二特殊符号的高度与所述待定文本行的行高的比值,确定所述待定文本行是否为二维结构公式行;
和/或,根据至少一个第二特殊符号周围的预设位置处的文本元素确定所述待定文本行是否为二维结构公式行。
B23.根据B18所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到不包含至少一个第二特殊符号时,则判断所述待定文本行的文本元素中是否同时包括运算符和上下标;若是,则确定所述待定文本行为二维结构公式行。
B24.根据B14-B23任一项所述的计算设备,其中,所述可执行指令进一步使所述处理器执行以下操作:
根据所述二维结构公式行中二维结构公式的位置和/或提示符的位置确定截图区域;对所述截图区域进行截图处理。
C25.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行以下操作:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
C26.根据C25所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:当确定所述待定文本行为二维结构公式行时,对所述二维结构公式行进行截图处理,得到二维结构公式图片。
C27.根据C25或C26所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
判断相邻文本行中是否存在任一特定文本行,且相邻文本行中除该特定文本行以外的其它文本行中的文本元素的标记值全部在该特定文本行中的文本元素的标记值的最小值与最大值之间,若是,则判定相邻文本行满足第一合并条件。
C28.根据C25-C27任一项所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行;其中,所述文本元素信息包括文本元素的位置信息和/或高度信息。
C29.根据C28所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
将所述待定文本行中的字符与第一特殊符号库中的第一特殊符号进行匹配;其中,第一特殊符号指在数学公式中,在与符号垂直投影相交的区域内同时存在运算符、数学符号和/或数字的特殊符号;
若至少一个字符匹配成功,以及,所述至少一个字符的字符高度与所述待定文本行的行高的比值超过预设比值,则确定所述待定文本行为二维结构公式行。
C30.根据C28或C29所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
查询所述待定文本行中的文本元素中是否包含路径线;
根据查询结果确定所述待定文本行是否为二维结构公式行。
C31.根据C30所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为包含路径线,以及,在路径线左侧或右侧且与路径线相邻的位置存在运算符,则确定所述待定文本行为二维结构公式行。
C32.根据C30所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内存在运算符,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内的所有字符全是数字,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内包含数学符号库中的数学符号,则确定所述待定文本行为二维结构公式行。
C33.根据C30-C32任一项所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为包含路径线,以及,在不与路径线的垂直投影相交的至少两个位置存在垂直投影相交的字符,则确定所述待定文本行不是二维结构公式行。
C34.根据C30所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到包含至少一个第二特殊符号时,则根据至少一个第二特殊符号的高度与所述待定文本行的行高的比值,确定所述待定文本行是否为二维结构公式行;
和/或,根据至少一个第二特殊符号周围的预设位置处的文本元素确定所述待定文本行是否为二维结构公式行。
C35.根据C30所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
若查询结果为不包含路径线,则检测所述待定文本行中的文本元素中是否包含第二特殊字符库中的至少一个第二特殊符号;
当检测到不包含至少一个第二特殊符号时,则判断所述待定文本行的文本元素中是否同时包括运算符和上下标;若是,则确定所述待定文本行为二维结构公式行。
C36.根据C26-C35任一项所述的计算机存储介质,其中,所述可执行指令进一步使所述处理器执行以下操作:
根据所述二维结构公式行中二维结构公式的位置和/或提示符的位置确定截图区域;对所述截图区域进行截图处理。

Claims (10)

1.一种二维结构公式的识别方法,包括:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
2.根据权利要求1所述的方法,其中,所述方法还包括:
当确定所述待定文本行为二维结构公式行时,对所述二维结构公式行进行截图处理,得到二维结构公式图片。
3.根据权利要求1或2所述的方法,其中,所述判断任意相邻文本行的文本元素的标记值是否满足第一合并条件进一步包括:
判断相邻文本行中是否存在任一特定文本行,且相邻文本行中除该特定文本行以外的其它文本行中的文本元素的标记值全部在该特定文本行中的文本元素的标记值的最小值与最大值之间,若是,则判定相邻文本行满足第一合并条件。
4.根据权利要求1-3任一项所述的方法,其中,所述根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行进一步包括:
根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行;其中,所述文本元素信息包括文本元素的位置信息和/或高度信息。
5.根据权利要求4所述的方法,其中,所述根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行进一步包括:
将所述待定文本行中的字符与第一特殊符号库中的第一特殊符号进行匹配;其中,第一特殊符号指在数学公式中,在与符号垂直投影相交的区域内同时存在运算符、数学符号和/或数字的特殊符号;
若至少一个字符匹配成功,以及,所述至少一个字符的字符高度与所述待定文本行的行高的比值超过预设比值,则确定所述待定文本行为二维结构公式行。
6.根据权利要求4或5所述的方法,其中,所述根据所述待定文本行中的文本元素和/或文本元素信息确定所述待定文本行是否为二维结构公式行进一步包括:
查询所述待定文本行中的文本元素中是否包含路径线;
根据查询结果确定所述待定文本行是否为二维结构公式行。
7.根据权利要求6所述的方法,其中,所述根据查询结果确定所述待定文本行是否为二维结构公式行具体为:
若查询结果为包含路径线,以及,在路径线左侧或右侧且与路径线相邻的位置存在运算符,则确定所述待定文本行为二维结构公式行。
8.根据权利要求6所述的方法,其中,所述根据查询结果确定所述待定文本行是否为二维结构公式行具体为:
若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内存在运算符,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内的所有字符全是数字,则确定所述待定文本行为二维结构公式行;
和/或,若查询结果为包含路径线,以及,在与路径线的垂直投影相交的区域内包含数学符号库中的数学符号,则确定所述待定文本行为二维结构公式行。
9.一种计算设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
10.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使处理器执行以下操作:
获取各行文本行的文本行信息,判断任意相邻文本行的文本元素的标记值是否满足第一合并条件,和/或,在相邻文本行之间具有路径线的情况下,判断相邻文本行的行间距和/或行高是否满足第二合并条件;
将满足第一合并条件和/或第二合并条件的相邻文本行合并成待定文本行;
根据所述待定文本行中的文本元素确定所述待定文本行是否为二维结构公式行。
CN201810145895.6A 2018-02-12 2018-02-12 二维结构公式的识别方法、计算设备及计算机存储介质 Pending CN108364009A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201810145895.6A CN108364009A (zh) 2018-02-12 2018-02-12 二维结构公式的识别方法、计算设备及计算机存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201810145895.6A CN108364009A (zh) 2018-02-12 2018-02-12 二维结构公式的识别方法、计算设备及计算机存储介质

Publications (1)

Publication Number Publication Date
CN108364009A true CN108364009A (zh) 2018-08-03

Family

ID=63006060

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201810145895.6A Pending CN108364009A (zh) 2018-02-12 2018-02-12 二维结构公式的识别方法、计算设备及计算机存储介质

Country Status (1)

Country Link
CN (1) CN108364009A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112241738A (zh) * 2020-12-18 2021-01-19 北京一起教育科技有限责任公司 一种数学公式字符识别方法、装置和电子设备
CN112308057A (zh) * 2020-10-13 2021-02-02 山东国赢大数据产业有限公司 一种基于文字位置信息的ocr优化方法及系统
CN112712075A (zh) * 2020-12-30 2021-04-27 科大讯飞股份有限公司 算式检测方法、电子设备和存储装置

Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329731A (zh) * 2008-06-06 2008-12-24 南开大学 图像中数学公式的自动识别方法
CN104636741A (zh) * 2015-02-06 2015-05-20 百度在线网络技术(北京)有限公司 公式识别方法和装置
CN104751148A (zh) * 2015-04-16 2015-07-01 同方知网数字出版技术股份有限公司 一种版式文件中识别科学公式的方法
CN105913057A (zh) * 2016-04-12 2016-08-31 中国传媒大学 一种结合投影和结构特征进行图像中数学公式检测方法
CN107180239A (zh) * 2017-06-09 2017-09-19 科大讯飞股份有限公司 文本行识别方法及系统

Patent Citations (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101329731A (zh) * 2008-06-06 2008-12-24 南开大学 图像中数学公式的自动识别方法
CN104636741A (zh) * 2015-02-06 2015-05-20 百度在线网络技术(北京)有限公司 公式识别方法和装置
CN104751148A (zh) * 2015-04-16 2015-07-01 同方知网数字出版技术股份有限公司 一种版式文件中识别科学公式的方法
CN105913057A (zh) * 2016-04-12 2016-08-31 中国传媒大学 一种结合投影和结构特征进行图像中数学公式检测方法
CN107180239A (zh) * 2017-06-09 2017-09-19 科大讯飞股份有限公司 文本行识别方法及系统

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
林晓燕 等: "中文电子文档的数学公式定位研究", 《北京大学学报(自然科学版)》 *

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112308057A (zh) * 2020-10-13 2021-02-02 山东国赢大数据产业有限公司 一种基于文字位置信息的ocr优化方法及系统
CN112241738A (zh) * 2020-12-18 2021-01-19 北京一起教育科技有限责任公司 一种数学公式字符识别方法、装置和电子设备
CN112241738B (zh) * 2020-12-18 2021-03-23 北京一起教育科技有限责任公司 一种数学公式字符识别方法、装置和电子设备
CN112712075A (zh) * 2020-12-30 2021-04-27 科大讯飞股份有限公司 算式检测方法、电子设备和存储装置
CN112712075B (zh) * 2020-12-30 2023-12-01 科大讯飞股份有限公司 算式检测方法、电子设备和存储装置

Similar Documents

Publication Publication Date Title
CN110069767B (zh) 基于电子书的排版方法、电子设备及计算机存储介质
US9235758B1 (en) Robust method to find layout similarity between two documents
CN108364009A (zh) 二维结构公式的识别方法、计算设备及计算机存储介质
JP5445787B2 (ja) 属性抽出方法、システム及びプログラム
CN113190781A (zh) 页面布局方法、装置、设备及存储介质
CN110705602A (zh) 大规模数据聚类方法、装置及计算机可读存储介质
CN108846176A (zh) 一种印刷电路板布线的检查方法、装置及电子设备
CN110853488A (zh) 一种poi标签显示方法、装置和设备
JP2021043775A (ja) 情報処理装置及びプログラム
CN115357155A (zh) 窗口识别方法、装置、设备及计算机可读存储介质
CN117574851B (zh) 一种在eda工具中重构电路原理图的方法、设备及存储介质
CN114330240A (zh) Pdf文档解析方法、装置、计算机设备及存储介质
JP7035474B2 (ja) 文書処理装置およびプログラム
CN112329409B (zh) 一种单元格颜色转换方法、装置及电子设备
US20110264631A1 (en) Method and system for de-identification of data
CN112036158A (zh) 词云数据分布处理方法及装置
CN112507938A (zh) 一种文本图元的几何特征计算方法及识别方法、装置
US10698943B2 (en) Method and apparatus for recognizing slide
CN112699634B (zh) 电子书的排版处理方法、电子设备及存储介质
CN113011131B (zh) 基于图片类电子书的排版方法、电子设备及存储介质
CN115116084A (zh) 引注识别方法、装置、设备及存储介质
CN109451018B (zh) 信息对象的推送方法、计算设备及计算机存储介质
CN103472991A (zh) 一种添加联系人的方法、设备及系统
CN111832270B (zh) 一种非表格文档中的表格的行号和列标的显示方法、装置及电子设备
CN111881050A (zh) 一种文本图层的剪裁方法、装置及电子设备

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication
RJ01 Rejection of invention patent application after publication

Application publication date: 20180803