CN107169486B - 文本版心识别方法、电子设备及计算机存储介质 - Google Patents
文本版心识别方法、电子设备及计算机存储介质 Download PDFInfo
- Publication number
- CN107169486B CN107169486B CN201710334158.6A CN201710334158A CN107169486B CN 107169486 B CN107169486 B CN 107169486B CN 201710334158 A CN201710334158 A CN 201710334158A CN 107169486 B CN107169486 B CN 107169486B
- Authority
- CN
- China
- Prior art keywords
- page
- projection
- text object
- value
- axis
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
- 238000000034 method Methods 0.000 title claims abstract description 74
- 238000012545 processing Methods 0.000 claims abstract description 47
- 238000001914 filtration Methods 0.000 claims description 94
- 230000003252 repetitive effect Effects 0.000 claims description 28
- 230000001174 ascending effect Effects 0.000 claims description 26
- 230000006399 behavior Effects 0.000 claims description 21
- 238000004891 communication Methods 0.000 claims description 16
- 241000406668 Loxodonta cyclotis Species 0.000 claims description 9
- 230000008901 benefit Effects 0.000 description 3
- 238000010586 diagram Methods 0.000 description 3
- 238000005516 engineering process Methods 0.000 description 3
- 238000012163 sequencing technique Methods 0.000 description 3
- 241000208340 Araliaceae Species 0.000 description 1
- 235000005035 Panax pseudoginseng ssp. pseudoginseng Nutrition 0.000 description 1
- 235000003140 Panax quinquefolius Nutrition 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 230000004888 barrier function Effects 0.000 description 1
- 238000000151 deposition Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 235000008434 ginseng Nutrition 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/22—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition
- G06V10/225—Image preprocessing by selection of a specific region containing or referencing a pattern; Locating or processing of specific regions to guide the detection or recognition based on a marking or identifier characterising the area
Landscapes
- Engineering & Computer Science (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Theoretical Computer Science (AREA)
- Controls And Circuits For Display Device (AREA)
- Document Processing Apparatus (AREA)
Abstract
本发明公开了一种文本版心识别方法、电子设备及计算机存储介质,其方法包括:从文本中择取预设页数的页面,分为奇数页面组和偶数页面组;分别对每个页面的文字以行为单位进行识别,得到对应的矩形文本对象;针对奇数页面组和偶数页面组中的每一页面组,进行处理:对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象进行合并处理;根据矩形文本对象的矩形位置数据、矩形尺寸数据和/或矩形文本对象的文字信息,对矩形文本对象进行过滤处理,得到该页面组的投影页面的有效矩形文本对象,确定该页面组的版心。本发明提供的方法,识别效率高。
Description
技术领域
本发明涉及软件领域,具体涉及一种文本版心识别方法、电子设备及计 算机存储介质。
背景技术
随着网络和移动终端设备的发展,电子书与传统的纸质书相比,从阅读 方式、携带等各方面而言,都更加便利。因此,越来越多的用户选择阅读电 子书。电子书的文本有时会比较错乱,需要对其文本进行再排版等操作。在 执行这些操作时,首先需要获取文本的版心。版心即文本每个页面中主要内 容所在的区域,位于每个页面版面正中的位置,包括了页面中正文的部分。
现有技术在获取文本的版心时,一般采用如下方法:通过Photoshop等 图像处理工具对版心位置进行定位,但这种方法需要人工操作,其处理速度 慢且获取的版心准确度较低;还可以通过预设的模块对整个版心进行识别, 这种方法虽然较前一种方法速度稍快,但对整个版心识别的准确度较低,有 时还需要人工再进行调整。
因此,需要一种效率高且准确度高的文本版心识别方法。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分 地解决上述问题的文本版心识别方法、电子设备及计算机存储介质。
根据本发明的一个方面,提供了一种文本版心识别方法,其包括:
从文本中择取预设页数的页面,将预设页数的页面按照页码分为奇数页 面组和偶数页面组;
分别对奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别, 得到每个页面中每行文字对应的矩形文本对象;
针对奇数页面组和偶数页面组中的每一页面组,进行如下处理:
对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向 对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象进 行合并处理,得到包含合并处理后的矩形文本对象的该页面组的投影页面;
根据该页面组的投影页面中矩形文本对象的矩形位置数据、矩形尺寸数 据和/或矩形文本对象的文字信息,对矩形文本对象进行过滤处理,得到该页 面组的投影页面的有效矩形文本对象;
根据该页面组的投影页面的有效矩形文本对象,确定该页面组的版心。
根据本发明的另一方面,提供了一种电子设备,包括:处理器、存储器、 通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通 信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器 执行以下操作:
从文本中择取预设页数的页面,将预设页数的页面按照页码分为奇数页 面组和偶数页面组;
分别对奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别, 得到每个页面中每行文字对应的矩形文本对象;
针对奇数页面组和偶数页面组中的每一页面组,进行如下处理:
对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向 对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象进 行合并处理,得到包含合并处理后的矩形文本对象的该页面组的投影页面;
根据该页面组的投影页面中矩形文本对象的矩形位置数据、矩形尺寸数 据和/或矩形文本对象的文字信息,对矩形文本对象进行过滤处理,得到该页 面组的投影页面的有效矩形文本对象;
根据该页面组的投影页面的有效矩形文本对象,确定该页面组的版心。
根据本发明的又一方面,提供了一种计算机存储介质,所述存储介质中 存储有至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
从文本中择取预设页数的页面,将预设页数的页面按照页码分为奇数页 面组和偶数页面组;
分别对奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别, 得到每个页面中每行文字对应的矩形文本对象;
针对奇数页面组和偶数页面组中的每一页面组,进行如下处理:
对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向 对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象进 行合并处理,得到包含合并处理后的矩形文本对象的该页面组的投影页面;
根据该页面组的投影页面中矩形文本对象的矩形位置数据、矩形尺寸数 据和/或矩形文本对象的文字信息,对矩形文本对象进行过滤处理,得到该页 面组的投影页面的有效矩形文本对象;
根据该页面组的投影页面的有效矩形文本对象,确定该页面组的版心。
根据本发明提供的文本版心识别方法、电子设备及计算机存储介质,从 文本中择取预设页数的页面,按照页码分为奇数页面组和偶数页面组。分别 对奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别,得到其 中每行文字对应的矩形文本对象;在针对奇数页面组和偶数页面组中的每一 页面组,进行处理:对该页面组的页面进行完全重叠设置,以垂直于页面的 方向为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的 矩形文本对象进行合并处理,得到包含合并处理后的矩形文本对象的该页面组的投影页面。根据该页面组的投影页面中矩形文本对象的矩形位置数据、 矩形尺寸数据和/或矩形文本对象的文字信息,对矩形文本对象进行过滤处理, 得到该页面组的投影页面的有效矩形文本对象。根据该页面组的投影页面的 有效矩形文本对象,确定该页面组的版心。通过对择取的每个页面以行为单 位识别出的矩形文本对象,并将页面组的页面完全重叠设置后进行投影、合 并等处理,得到包含合并处理后的矩形文本对象的该页面组的投影页面。对 投影页面中的矩形文本对象进一步过滤,得到有效矩形文本对象,从而可以 准确的确定页面组的版心。与现有技术相比,本发明以行为单位依次进行处 理,得到的版心的准确度更精确,且整个完全不需要人工的参与,更快速高 效。
上述说明仅是本发明技术方案的概述,为了能够更清楚了解本发明的技 术手段,而可依照说明书的内容予以实施,并且为了让本发明的上述和其它 目的、特征和优点能够更明显易懂,以下特举本发明的具体实施方式。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本 领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的, 而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示 相同的部件。在附图中:
图1示出了根据本发明实施例一的文本版心识别方法的流程图;
图2示出了根据本发明实施例二的文本版心识别方法的流程图;
图3示出了本发明实施例二中过滤处理的流程图;
图4示出了本发明实施例二中在页面建立x轴和y轴的示意图;
图5示出了根据本发明实施例四的一种电子设备的结构示意图。
具体实施方式
下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示 了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不 应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地 理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
实施例一
图1示出了根据本发明实施例一的文本版心识别方法的流程图,如图1 所示,文本版心识别方法具体包括如下步骤:
步骤S101,从文本中择取预设页数的页面,将预设页数的页面按照页码 分为奇数页面组和偶数页面组。
在从文本中择取预设页数的页面时,预设页面的数量可以根据文本自身 的页数多少来设置。再将择取的页面按照各个页面上的页码分为奇数页面组 和偶数页面组两组页面。如择取了页码为11-20共10页页面,按照页码分为 11、13、15、17、19奇数页面组和12、14、16、18、20偶数页面组。
为使版心识别的准确度和识别效率更高,优选的可设置预设页数为20页, 以便择取多个不同页面进行版心识别,同时也控制页面数量也不会过多以造 成版心识别时间较长等问题。在从文本中择取页面时,择取的位置不作限定, 可以从文本的开头部分、中间部分或结尾部分等进行择取。
步骤S102,分别对奇数页面组和偶数页面组中每个页面的文字以行为单 位进行识别,得到每个页面中每行文字对应的矩形文本对象。
分别将奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别, 将每行文字识别为一个对象,得到奇数页面组和偶数页面组中每个页面中该 每行文字对应的一个矩形文本对象。该矩形文本对象包括了其中每行的文字 信息、矩形所在的位置数据如四个角的坐标数据、矩形尺寸数据如矩形的高 度和宽度数据等。
在得到每个页面中每行文字对应的矩形文本对象后,针对奇数页面组和 偶数页面组中的每一页面组,均依次执行步骤S103-S105,对奇数页面组和偶 数页面组所做的处理相同。执行时可以先选择其中任一页面组进行处理,对 奇数页面组和偶数页面组的处理先后顺序不做限定。
步骤S103,对该页面组的页面进行完全重叠设置,以垂直于页面的方向 为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形 文本对象进行合并处理,得到包含合并处理后的矩形文本对象的该页面组的 投影页面。
将该页面组中的多个页面进行完全重叠设置,即页面的四边完全对齐重 叠设置,以垂直于页面的方向为投影方向对完全重叠设置的该页面组进行投 影处理,即对多个完全重叠设置的页面进行投影,使多个页面的矩形文本对 象都投影到一个页面中。在投影处理后,将在投影方向上具有相交区域的矩 形文本对象进行合并处理。合并处理时,将多个页面在投影方向上具有相交 区域的多个矩形文本对象按照能够包括该多个矩形文本对象的最小范围进行 合并,得到一个合并后的矩形文本对象,从而得到该页面组的投影页面。其 中,投影页面包含了该页面组多个页面进行投影处理及合并处理后的矩形文 本对象。
步骤S104,根据该页面组的投影页面中矩形文本对象的矩形位置数据、 矩形尺寸数据和/或矩形文本对象的文字信息,对矩形文本对象进行过滤处理, 得到该页面组的投影页面的有效矩形文本对象。
对投影页面中的矩形文本对象进行过滤处理时,根据该页面组的投影页 面中矩形文本对象的矩形位置数据、矩形尺寸数据、矩形文本对象的文字信 息等数据或信息进行过滤,过滤掉不属于版心所包含的矩形文本对象,如过 滤掉页眉、页脚、页码等对应的矩形文本对象,从而得到该页面组的投影页 面的上下左右各边的有效矩形文本对象。
步骤S105,根据该页面组的投影页面的有效矩形文本对象,确定该页面 组的版心。
根据该页面组的投影页面的有效矩形文本对象的矩形位置数据,得到该 页面的版心的各个位置数据,从而确定该页面组的版心。
由于奇数页面组和偶数页面组均进行了步骤S103-S105的处理,因此, 分别得到奇数页面组的版心和偶数页面组的版心。
根据本发明提供的文本版心识别方法,通过对择取的每个页面以行为单 位识别出的矩形文本对象,并将页面组的页面完全重叠设置后进行投影、合 并等处理,得到包含合并处理后的矩形文本对象的该页面组的投影页面。对 投影页面中的矩形文本对象进一步过滤,得到有效矩形文本对象,从而可以 准确的确定页面组的版心。与现有技术相比,本发明以行为单位依次进行处 理,得到的版心的准确度更精确,且整个完全不需要人工的参与,更快速高 效。
实施例二
图2示出了根据本发明实施例二的文本版心识别方法的流程图,如图2 所示,文本版心识别方法包括如下步骤:
步骤S201,从文本中择取预设页数的页面,根据各页面中文字的字体和/ 或字号判断页面是否为包含正文的页面。
从文本中择取到预设页数的页面后,先对各个页面中的文字的字体、字 号进行识别。根据各页面中文字的字体、字号进行判断,该页面是否为包含 正文的页面,若该页面为不包含正文的页面,如该页面为文本封面、文本目 录页等,即该页面不是正文页面,不适合对该页面进行版心识别,则执行步 骤S202。若该页面为包含正文的页面,执行步骤S203。
步骤S202,去除该页面。
将该页面从择取的页面中去除,不再对该页面进行后续的处理。
步骤S203,将预设页数的页面按照页码分为奇数页面组和偶数页面组。
将页面按照每个页面的页码分为奇数页面组和偶数页面组,两个页面组 中的页面数量可能相同,也可能不同。如在择取了页码为11-20共10页页面 后,由于判断第13页为不包含正文的页面,去除了该页面。分组后,奇数页 面组包括页码为11、15、17、19页面,偶数页面组包括页码为12、14、16、 18、20页面。
步骤S204,分别对奇数页面组和偶数页面组中每个页面的文字以行为单 位进行识别,得到每个页面中每行文字对应的矩形文本对象。
分别将奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别, 将每行文字识别为一个对象,得到奇数页面组和偶数页面组中每个页面中该 每行文字对应的一个矩形文本对象。该矩形文本对象包括了其中每行的文字 信息、矩形所在的位置数据如四个角的坐标数据、矩形尺寸数据如矩形的高 度和宽度数据等。
在得到每个页面中每行文字对应的矩形文本对象后,针对奇数页面组和 偶数页面组中的每一页面组,均依次执行步骤S205-S207,对奇数页面组和偶 数页面组所做的处理相同。执行时可以先选择其中任一页面组进行处理,对 奇数页面组和偶数页面组的处理先后顺序不做限定。
步骤S205,对该页面组的页面进行完全重叠设置,以垂直于页面的方向 为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形 文本对象按照包括这些矩形文本对象的最小范围进行合并处理,得到包含合 并处理后合的矩形文本对象的该页面组的投影页面。
将该页面组中的多个页面进行完全重叠设置,即页面的四边完全对齐重 叠设置,以垂直于页面的方向为投影方向对完全重叠设置的该页面组进行投 影处理,即对多个完全重叠设置的页面进行投影,使多个页面的矩形文本对 象都投影到一个页面中。在投影处理后,将在投影方向上具有相交区域的矩 形文本对象进行合并处理。合并处理时,将多个页面在投影方向上具有相交 区域的多个矩形文本对象按照能够包括该多个矩形文本对象的最小范围进行 合并,得到一个合并后的矩形文本对象,从而得到该页面组的投影页面。其 中,投影页面包含了该页面组多个页面进行投影处理及合并处理后的矩形文 本对象。
步骤S206,根据该页面组的投影页面中矩形文本对象的矩形位置数据、 矩形尺寸数据和/或矩形文本对象的文字信息,对矩形文本对象进行过滤处理, 得到该页面组的投影页面的有效矩形文本对象。
在对矩形文本对象进行过滤处理时,具体如图3所示,执行如下步骤:
步骤S2061,以该页面组的投影页面的左下角为原点,设置页面横向为x 轴,页面纵向为y轴。
建立的x轴和y轴如图4所示,以投影页面的左下角为原点(0,0),x 轴从页面的左下角(0,0)开始横向向右,y轴从页面的左下角(0,0)开始 纵向向上。
步骤S2062,按照矩形文本对象的矩形位置数据在y轴方向上投影值由大 到小排序,依照排序依次对矩形文本对象进行y轴过滤处理,选取最先未被 过滤的矩形文本对象作为该页面组的投影页面在y轴方向的第一有效矩形文 本对象。
按照各个矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排 序,将多个排序后的多个矩形文本对象按照排序依次进行y轴过滤处理。在 排序时,仅根据各个矩形文本对象上边距在y轴方向上的投影值进行排序。 具体的,y轴过滤处理包括以下几种过滤处理:
判断矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预 设重复率。矩形文本对象的文字信息是一个集合,集合中的每一条文字信息 为该页面组的一个页面中与该矩形文本对象对应的所在行的一行文字内容。 在判断文字信息中包含重复文字内容的重复率时,是以集合中一条文字信息 为单位即一行文字内容为单位,计算一行文字内容整体的重复率。当矩形文 本对象的文字信息中包含重复文字内容的重复率较高时,说明矩形文本对象 的文字信息可能是一行同样的文字内容,其极大可能为页眉或页脚,不属于 版心所包含的内容。因此,当矩形文本对象的文字信息中包含重复文字内容 的重复率达到预设重复率时,过滤掉矩形文本对象。预设重复率可根据实际 文本进行设置,在此不做限定。
或者,判断矩形文本对象的文字信息中包含的文字内容是否均为数字。 矩形文本对象的文字信息中包含的文字内容均为数字的情况下,其极大可能 为页码,不属于版心所包含的内容。因此,矩形文本对象的文字信息中包含 的文字内容均为数字时,过滤掉矩形文本对象。
或者,判断矩形文本对象的矩形高度是否小于预设高度。预设高度可以 根据文本中正文字体的高度进行设置,如设置为正文字体高度的一半。当矩 形文本对象的矩形高度小于预设高度时,矩形文本对象中的文字不是正文字 体,不属于版心所包含的内容,过滤掉矩形文本对象。
或者,判断矩形文本对象的矩形宽度是否小于预设宽度。预设宽度可以 根据多个矩形文本对象的矩形宽度的平均值进行设置,如设置为平均值的一 半。当矩形文本对象的矩形宽度小于预设宽度时,过滤掉矩形文本对象。
以上几种过滤方式仅为举例说明,在进行y轴过滤处理时,可根据实际 情况选择合适的过滤方式,选择时可以选择一项或多项过滤方式进行过滤。
被过滤的矩形文本对象均为无效矩形文本对象,选取最先未被过滤的矩 形文本对象作为该页面组的投影页面在y轴方向的第一有效矩形文本对象。 在选取第一有效矩形文本对象后,不再对其他矩形文本对象进行y轴过滤处 理。
步骤S2063,按照矩形文本对象的矩形位置数据在y轴方向上投影值由小 到大排序,依照排序依次对矩形文本对象进行y轴过滤处理,选取最先未被 过滤的矩形文本对象作为该页面组的投影页面在y轴方向的第二有效矩形文 本对象。
按照各个矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排 序,将多个排序后的多个矩形文本对象按照排序依次进行y轴过滤处理。在 排序时,仅根据各个矩形文本对象下边距在y轴方向上的投影值进行排序。 具体的,y轴过滤处理参照步骤S2502的描述,在此不再赘述。
被过滤的矩形文本对象均为无效矩形文本对象,选取最先未被过滤的矩 形文本对象作为该页面组的投影页面在y轴方向的第二有效矩形文本对象。 在选取第二有效矩形文本对象后,不再对其他矩形文本对象进行y轴过滤处 理。
步骤S2064,按照矩形文本对象的矩形位置数据在x轴方向上投影值由小 到大排序,依照排序依次对矩形文本对象进行x轴过滤处理,选取最先未被 过滤的矩形文本对象作为该页面组的投影页面在x轴方向的第三有效矩形文 本对象。
按照各个矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排 序,将多个排序后的多个矩形文本对象按照排序依次进行x轴过滤处理。在 排序时,仅根据各个矩形文本对象左边距在x轴方向上的投影值进行排序。 具体的,x轴过滤处理包括以下几种过滤处理:
判断矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预 设重复率。矩形文本对象的文字信息是一个集合,集合中的每一条文字信息 为该页面组的一个页面中与该矩形文本对象对应的所在行的一行文字内容。 在判断文字信息中包含重复文字内容的重复率时,是以集合中一条文字信息 为单位即一行文字内容为单位,计算一行文字内容整体的重复率。当矩形文 本对象的文字信息中包含重复文字内容的重复率较高时,说明矩形文本对象 的文字信息可能是一行同样的文字内容,其极大可能为页眉或页脚,不属于 版心所包含的内容。因此,当矩形文本对象的文字信息中包含重复文字内容 的重复率达到预设重复率时,过滤掉矩形文本对象。预设重复率可根据实际 文本进行设置,在此不做限定。
或者,判断矩形文本对象的文字信息中包含的文字内容是否均为数字。 矩形文本对象的文字信息中包含的文字内容均为数字的情况下,其极大可能 为页码,不属于版心所包含的内容。因此,矩形文本对象的文字信息中包含 的文字内容均为数字时,过滤掉矩形文本对象。
或者,判断矩形文本对象的矩形宽度是否小于预设宽度。预设宽度可以 根据多个矩形文本对象的矩形宽度的平均值进行设置,如设置为平均值的一 半。当矩形文本对象的矩形宽度小于预设宽度时,过滤掉矩形文本对象。
以上几种过滤方式仅为举例说明,在进行x轴过滤处理时,可根据实际 情况选择合适的过滤方式,选择时可以选择一项或多项过滤方式进行过滤。
被过滤的矩形文本对象均为无效矩形文本对象,选取最先未被过滤的矩 形文本对象作为该页面组的投影页面在x轴方向的第三有效矩形文本对象。 在选取第三有效矩形文本对象后,不再对其他矩形文本对象进行x轴过滤处 理。
步骤S2065,按照矩形文本对象的矩形位置数据在x轴方向上投影值由大 到小排序,依照排序依次对矩形文本对象进行x轴过滤处理,选取最先未被 过滤的矩形文本对象作为该页面组的投影页面在x轴方向的第四有效矩形文 本对象。
按照各个矩形文本对象的矩形位置数据在x轴方向上投影值由大到小排 序,将多个排序后的多个矩形文本对象按照排序依次进行x轴过滤处理。在 排序时,仅根据各个矩形文本对象右边距在x轴方向上的投影值进行排序。 具体的,x轴过滤处理参照步骤S2064的描述,在此不再赘述。
被过滤的矩形文本对象均为无效矩形文本对象,选取最先未被过滤的矩 形文本对象作为该页面组的投影页面在x轴方向的第四有效矩形文本对象。 在选取第四有效矩形文本对象后,不再对其他矩形文本对象进行x轴过滤处 理。
步骤S2062-步骤S2065中任一步骤均可先执行,此处不限定步骤S2062- 步骤S2065的执行先后顺序。
进一步,在选取到第一有效矩形文本对象、第二有效矩形文本对象、第 三有效矩形文本对象和第四有效矩形文本对象后,可以分别获取奇数页面组 和偶数页面组的投影页面的有效边距值y11、y12、x11、x12、y21、y22、x21和x22。 其中,y11为奇数页面组的投影页面的第一有效矩形文本对象的上边距在y轴 方向上的投影值;y12为奇数页面组的投影页面的第二有效矩形文本对象的下 边距在y轴方向上的投影值;x11为奇数页面组的投影页面的第三有效矩形文 本对象的左边距在x轴方向上的投影值;x12为奇数页面组的投影页面的第四有效矩形文本对象的右边距在x轴方向上的投影值;y21为偶数页面组的投影 页面的第一有效矩形文本对象的上边距在y轴方向上的投影值;y22为偶数页 面组的投影页面的第二有效矩形文本对象的下边距在y轴方向上的投影值; x21为偶数页面组的投影页面的第三有效矩形文本对象的左边距在x轴方向上 的投影值;x22为偶数页面组的投影页面的第四有效矩形文本对象的右边距在 x轴方向上的投影值。
步骤S207,根据该页面组的投影页面的有效矩形文本对象,确定该页面 组的版心。
根据选取到的有效矩形文本对象,可以确定页面组对应的版心。其中, y11、y12、x11和x12确定奇数页面组的有效版心。y11为奇数页面组的有效版心 的上边距在y轴方向上的投影值,y12为奇数页面组的有效版心的下边距在y 轴方向上的投影值,x11为奇数页面组的有效版心的左边距在x轴方向上的投 影值,x12为奇数页面组的有效版心的右边距在x轴方向上的投影值。y21、y22、 x21和x22确定偶数页面组的有效版心。y21为偶数页面组的有效版心的上边距 在y轴方向上的投影值,y22为偶数页面组的有效版心的下边距在y轴方向上 的投影值,x21为偶数页面组的有效版心的左边距在x轴方向上的投影值,x22为偶数页面组的有效版心的右边距在x轴方向上的投影值。
步骤S208,将奇数页面组的有效版心的上边距和下边距在y轴方向上的 投影值、左边距和右边距在x轴方向上的投影值与偶数页面组的有效版心的 上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投 影值分别进行比较,分别得到最大的上边距和下边距在y轴方向上的投影值、 左边距和右边距在x轴方向上的投影值。
步骤S209,根据最大的上边距和下边距在y轴方向上的投影值、左边距 和右边距在x轴方向上的投影值调整奇数页面组的有效版心与偶数页面组的 有效版心的四边边距对应的投影值。
在将奇数页面组的有效版心与偶数页面组的有效版心的上下左右四边边 距对应的投影值分别进行比较之前,还需要确定奇数页面组的无效版心和偶 数页面组的无效版心。
对奇数页面组和偶数页面组中的每一页面组进行以下处理,以便确定该 页面组的无效版心:
在按照矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排序, 依照排序依次对矩形文本对象进行y轴过滤处理时,选取最后被过滤的矩形 文本对象作为该页面组的投影页面在y轴方向的第一无效矩形文本对象。
在按照矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排序, 依照排序依次对矩形文本对象进行y轴过滤处理时,选取最后被过滤的矩形 文本对象作为该页面组的投影页面在y轴方向的第二无效矩形文本对象。
在按照矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排序, 依照排序依次对矩形文本对象进行x轴过滤处理时,选取最后被过滤的矩形 文本对象作为该页面组的投影页面在x轴方向的第三无效矩形文本对象。
在按照矩形文本对象的矩形位置数据在x轴方向上投影值由大到小排序, 依照排序依次对矩形文本对象进行x轴过滤处理时,选取最后被过滤的矩形 文本对象作为该页面组的投影页面在x轴方向的第四无效矩形文本对象。
在选取到第一无效矩形文本对象、第二无效矩形文本对象、第三无效矩 形文本对象和第四无效矩形文本对象后,分别获取奇数页面组和偶数页面组 的投影页面的无效边距值y13、y14、x13、x14、y23、y24、x23和x24。其中,y13为奇数页面组的投影页面的第一无效矩形文本对象的下边距在y轴方向上的 投影值;y14为奇数页面组的投影页面的第二无效矩形文本对象的上边距在y 轴方向上的投影值;x13为奇数页面组的投影页面的第三无效矩形文本对象的 右边距在x轴方向上的投影值;x14为奇数页面组的投影页面的第四无效矩形 文本对象的左边距在x轴方向上的投影值;y23为偶数页面组的投影页面的第 一无效矩形文本对象的下边距在y轴方向上的投影值;y24为偶数页面组的投 影页面的第二无效矩形文本对象的上边距在y轴方向上的投影值;x23为偶数 页面组的投影页面的第三无效矩形文本对象的右边距在x轴方向上的投影值; x24为偶数页面组的投影页面的第四无效矩形文本对象的左边距在x轴方向上 的投影值。
其中,y13、y14、x13和x14确定奇数页面组的无效版心。y13为奇数页面组 的无效版心的上边距在y轴方向上的投影值,y14为奇数页面组的无效版心的 下边距在y轴方向上的投影值,x13为奇数页面组的无效版心的左边距在x轴 方向上的投影值,x14为奇数页面组的无效版心的右边距在x轴方向上的投影 值。y23、y24、x23和x24确定偶数页面组的无效版心,y23为偶数页面组的无效 版心的上边距在y轴方向上的投影值,y24为偶数页面组的无效版心的下边距 在y轴方向上的投影值,x23为偶数页面组的无效版心的左边距在x轴方向上 的投影值;x24为偶数页面组的无效版心的右边距在x轴方向上的投影值。
在将奇数页面组的有效版心与偶数页面组的有效版心的上下左右四边边 距对应的投影值分别进行比较时,具体如下:
将y11和y21中的数值较大者与数值较小者对应的无效版心上边距在y轴 方向上的投影值相比,若y11和y21中的数值较大者小于数值较小者对应的无 效版心上边距在y轴方向上的投影值相比,将y11和y21中的数值较大者设定 为最大上边距数值较小者(将y11和y21中的数值较小者的数值调整为数值较 大者的数值)。以一具体实施例进行说明如获取到的奇数页面组的y11的数值 为95,y13的数值为98,偶数页面组的y21的数值为97,y23的数值为100。y11和y21进行比较,其中的数值较大者为y21,数值为97。将y21再和y11对应的 奇数页面组无效版心上边距在y轴方向上的投影值y13进行比较。由于y21小 于y13,将y11调整为97。
将y12和y22中的数值较小者与数值较大者对应的无效版心下边距在y轴 方向上的投影值相比,若y12和y22中的数值较小者大于数值较大者对应的无 效版心下边距在y轴方向上的投影值,将y12和y22中的数值较小者设定为最 大下边距的投影值(将y12和y22中的数值较大者的数值调整为数值较小值的 数值)。以一具体实施例进行说明如获取到的奇数页面组的y12的数值为5, y14的数值为2,偶数页面组的y22的数值为6,y24的数值为3。y12和y22进行 比较,其中的数值较小者为y12,数值为5。将y12再和y22对应的偶数页面组 无效版心下边距在y轴方向上的投影值y24进行比较。由于y12大于y24,将y22调整为5。
获取奇数页面组的投影页面的中轴在x轴方向上的投影值x15,分别计算 x11和x12到x15的距离值,获取其中最大的距离值。根据最大的距离值重新设 定奇数页面组的有效版心的左边距对应的投影值和右边距对应的投影值,得 到经修正的奇数页面组的有效版心;经修正的奇数页面组的有效版心的左边 距和右边距在x轴方向上的投影值分别为x11'和x12',x11'和x12'到x15的距离值 均为x11和x12到x15中的最大的距离值。以一具体实施例进行说明如奇数页面 组的投影页面宽度为40,奇数页面组的投影页面的中轴在x轴方向上的投影 值x15为20,奇数页面组的x11的数值为4,x12的数值为35,分别计算x11和 x12到x15的距离值为16和15,获取其中最大的距离值16。根据最大的距离值 16重新设定奇数页面组的有效版心的左边距对应的投影值和右边距对应的投 影值,分别为4和36。将4和36分别与x13和x14比较,以保障重新设定的有 效版心在无效版心范围内。x13的投影值为2,x14的投影值为38,由于4大于 x13,36小于x14,因此,x11'设为4,和x12'设为36,x11'和x12'到x15的距离值 均为16。x11'大于x13,x12'小于x14。即经修正的奇数页面组的有效版心在奇数 页面组的无效版心的范围内。
获取偶数页面组的投影页面的中轴在x轴方向上的投影值x25,分别计算 x21和x22到x25的距离值,获取其中最大的距离值。根据最大的距离值重新设 定偶数页面组的有效版心的左边距对应的投影值和右边距对应的投影值,得 到经修正的偶数页面组的有效版心;经修正的偶数页面组的有效版心的左边 距和右边距在x轴方向上的投影值分别为x21'和x22',x21'和x22'到x25的距离值 均为x21和x22到x25中的最大的距离值。偶数页面组的处理与奇数页面组上述 的处理相同。如偶数页面组的投影页面宽度为40,x25为20,偶数页面组的x21的数值为6,x22的数值为37,分别计算x21和x22到x25的距离值为14和17, 获取其中最大的距离值17。根据最大的距离值17重新设定奇数页面组的有效 版心的左边距对应的投影值和右边距对应的投影值,分别为3和37。将3和 37分别与x23和x24比较,x23的投影值为2,x24的投影值为39,由于3大于 x23,37小于x24,因此,x21'设为3,和x22'设为37,x21'和x22'到x25的距离值 均为17。X21'大于x23,x22'小于x24。即经修正的偶数页面组的有效版心在偶数 页面组的无效版心的范围内。
将x11'和x21'中的数值较小者与数值较大者对应的无效版心左边距在x轴 方向上的投影值相比,若x11'和x21'中的数值较小者大于数值较大者对应的无 效版心左边距在x轴方向上的投影值,将x11'和x21'中的数值较小者设定为最 大左边距的投影值(将x11'和x21'中的数值较大者的数值调整为数值较小值的 数值)。以一具体实施例进行说明如奇数页面组的x11'的数值为4,x13的数值 为2,偶数页面组的x21'的数值为3,x23的数值为2.5。x11'和x21'进行比较,其 中的数值较小者为x21'。将x21'再和x11'对应的奇数页面组无效版心左边距在x 轴方向上的投影值x13进行比较。由于x21'大于x13,将x11'调整为3。
将x12'和x22'中的数值较大者与数值较小者对应的无效版心右边距在x轴 方向上的投影值相比,若x12'和x22'中的数值较大者小于数值较小者对应的无 效版心右边距在x轴方向上的投影值,将x12'和x22'中的数值较大者设定为最 大右边距的投影值(将x12'和x22'中的数值较小者的数值调整为数值较大者的 数值)。以一具体实施例进行说明如奇数页面组的x12'的数值为36,x14的数 值为38,偶数页面组的x22'的数值为37,x24的数值为39。x12'和x22'进行比较, 其中的数值较大者为x22'。将x22'再和x12'对应的奇数页面组无效版心右边距在 x轴方向上的投影值x14进行比较。由于x22'小于x14,将x12'调整为37。
根据上述得到的最大上边距的投影值、最大下边距的投影值、最大左边 距的投影值和最大右边距的投影值,来调整步骤S207得到的奇数页面组的有 效版心与偶数页面组的有效版心的四边边距。使用最大上边距的投影值、最 大下边距的投影值、最大左边距的投影值和最大右边距的投影值重新确定奇 数页面组的有效版心与偶数页面组的有效版心。
需要注意的是,在分别比较上下左右四边边距的投影值时,若某一边距 不符合对应的判断条件时,则奇数页面组和偶数页面组均保持原有的该边距 不变,对得到最大边距的其他边进行调整。
根据本发明提供的文本版心识别方法,通过对择取的每个页面以行为单 位识别出的矩形文本对象,并将页面组的页面完全重叠设置后进行投影、合 并等处理,得到包含合并处理后的矩形文本对象的该页面组的投影页面。对 投影页面中的矩形文本对象进一步过滤,得到有效矩形文本对象,从而可以 准确的确定页面组的版心。进一步,还可以将奇数页面组和偶数页面组获取 的有效版心进行比较,以获取其中最大的各边边距的投影值,并根据最大边 距的投影值去重新调整奇数页面组和偶数页面组的有效版心。使得当出现某 一页面组的有效版心较小时,可以通过将两个有效版心比较将版心合理的扩 展,以保障使用调整后的版心时可以准确的获取到文本的正文。与现有技术 相比,本发明以行为单位依次进行处理,得到的版心的准确度更精确,且整 个完全不需要人工的参与,更快速高效。
实施例三
本申请实施例三提供了一种非易失性计算机存储介质,所述计算机存储 介质存储有至少一可执行指令,该计算机可执行指令可执行上述任意方法实 施例中的文本版心识别方法。
可执行指令具体可以用于使得处理器执行以下操作:从文本中择取预设 页数的页面,将预设页数的页面按照页码分为奇数页面组和偶数页面组;分 别对奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别,得到 每个页面中每行文字对应的矩形文本对象;针对奇数页面组和偶数页面组中 的每一页面组,进行如下处理:对该页面组的页面进行完全重叠设置,以垂 直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具有 相交区域的矩形文本对象进行合并处理,得到包含合并处理后的矩形文本对 象的该页面组的投影页面;根据该页面组的投影页面中矩形文本对象的矩形 位置数据、矩形尺寸数据和/或矩形文本对象的文字信息,对矩形文本对象进 行过滤处理,得到该页面组的投影页面的有效矩形文本对象;根据该页面组 的投影页面的有效矩形文本对象,确定该页面组的版心。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 根据各页面中文字的字体和/或字号判断页面是否为包含正文的页面,若否, 则去除该页面。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向对该 页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象按照包 括这些矩形文本对象的最小范围进行合并处理,得到包含合并处理后合的矩 形文本对象的该页面组的投影页面。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 以该页面组的投影页面的左下角为原点,设置页面横向为x轴,页面纵向为y 轴;按照矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排序, 依照排序依次对矩形文本对象进行y轴过滤处理,选取最先未被过滤的矩形 文本对象作为该页面组的投影页面在y轴方向的第一有效矩形文本对象;按 照矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排序,依照排 序依次对矩形文本对象进行y轴过滤处理,选取最先未被过滤的矩形文本对 象作为该页面组的投影页面在y轴方向的第二有效矩形文本对象;按照矩形 文本对象的矩形位置数据在x轴方向上投影值由小到大排序,依照排序依次 对矩形文本对象进行x轴过滤处理,选取最先未被过滤的矩形文本对象作为 该页面组的投影页面在x轴方向的第三有效矩形文本对象;按照矩形文本对 象的矩形位置数据在x轴方向上投影值由大到小排序,依照排序依次对矩形 文本对象进行x轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面 组的投影页面在x轴方向的第四有效矩形文本对象。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 判断矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预设重 复率,若是,则过滤矩形文本对象;和/或,判断矩形文本对象的文字信息中 包含的文字内容是否均为数字,若是,则过滤矩形文本对象;和/或,判断矩 形文本对象的矩形高度是否小于预设高度,若是,则过滤矩形文本对象;和/ 或,判断矩形文本对象的矩形宽度是否小于预设宽度,若是,则过滤矩形文 本对象。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 判断矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预设重 复率,若是,则过滤矩形文本对象;和/或,判断矩形文本对象的文字信息中 包含的文字内容是否均为数字,若是,则过滤矩形文本对象;和/或,判断矩 形文本对象的矩形宽度是否小于预设宽度,若是,则过滤矩形文本对象。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 分别获取奇数页面组和偶数页面组的投影页面的有效边距值y11、y12、x11、x12、 y21、y22、x21和x22;其中,y11为奇数页面组的投影页面的第一有效矩形文本 对象的上边距在y轴方向上的投影值;y12为奇数页面组的投影页面的第二有 效矩形文本对象的下边距在y轴方向上的投影值;x11为奇数页面组的投影页 面的第三有效矩形文本对象的左边距在x轴方向上的投影值;x12为奇数页面 组的投影页面的第四有效矩形文本对象的右边距在x轴方向上的投影值;y21为偶数页面组的投影页面的第一有效矩形文本对象的上边距在y轴方向上的 投影值;y22为偶数页面组的投影页面的第二有效矩形文本对象的下边距在y 轴方向上的投影值;x21为偶数页面组的投影页面的第三有效矩形文本对象的 左边距在x轴方向上的投影值;x22为偶数页面组的投影页面的第四有效矩形 文本对象的右边距在x轴方向上的投影值;y11、y12、x11和x12确定奇数页面 组的有效版心;y11为奇数页面组的有效版心的上边距在y轴方向上的投影值; y12为奇数页面组的有效版心的下边距在y轴方向上的投影值;x11为奇数页面 组的有效版心的左边距在x轴方向上的投影值;x12为奇数页面组的有效版心 的右边距在x轴方向上的投影值;y21、y22、x21和x22确定偶数页面组的有效 版心;y21为偶数页面组的有效版心的上边距在y轴方向上的投影值;y22为偶 数页面组的有效版心的下边距在y轴方向上的投影值;x21为偶数页面组的有 效版心的左边距在x轴方向上的投影值;x22为偶数页面组的有效版心的右边 距在x轴方向上的投影值。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 在按照矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排序,依 照排序依次对矩形文本对象进行y轴过滤处理时,选取最后被过滤的矩形文 本对象作为该页面组的投影页面在y轴方向的第一无效矩形文本对象;在按 照矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排序,依照排 序依次对矩形文本对象进行y轴过滤处理时,选取最后被过滤的矩形文本对 象作为该页面组的投影页面在y轴方向的第二无效矩形文本对象;在按照矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排序,依照排序依 次对矩形文本对象进行x轴过滤处理时,选取最后被过滤的矩形文本对象作 为该页面组的投影页面在x轴方向的第三无效矩形文本对象;在按照矩形文 本对象的矩形位置数据在x轴方向上投影值由大到小排序,依照排序依次对 矩形文本对象进行x轴过滤处理时,选取最后被过滤的矩形文本对象作为该 页面组的投影页面在x轴方向的第四无效矩形文本对象。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 分别获取奇数页面组和偶数页面组的投影页面的无效边距值y13、y14、x13、x14、 y23、y24、x23和x24;其中,y13为奇数页面组的投影页面的第一无效矩形文本 对象的下边距在y轴方向上的投影值;y14为奇数页面组的投影页面的第二无 效矩形文本对象的上边距在y轴方向上的投影值;x13为奇数页面组的投影页 面的第三无效矩形文本对象的右边距在x轴方向上的投影值;x14为奇数页面 组的投影页面的第四无效矩形文本对象的左边距在x轴方向上的投影值;y23为偶数页面组的投影页面的第一无效矩形文本对象的下边距在y轴方向上的 投影值;y24为偶数页面组的投影页面的第二无效矩形文本对象的上边距在y 轴方向上的投影值;x23为偶数页面组的投影页面的第三无效矩形文本对象的 右边距在x轴方向上的投影值;x24为偶数页面组的投影页面的第四无效矩形 文本对象的左边距在x轴方向上的投影值;y13、y14、x13和x14确定奇数页面 组的无效版心;y13为奇数页面组的无效版心的上边距在y轴方向上的投影值; y14为奇数页面组的无效版心的下边距在y轴方向上的投影值;x13为奇数页面 组的无效版心的左边距在x轴方向上的投影值;x14为奇数页面组的无效版心 的右边距在x轴方向上的投影值;y23、y24、x23和x24确定偶数页面组的无效 版心;y23为偶数页面组的无效版心的上边距在y轴方向上的投影值;y24为偶 数页面组的无效版心的下边距在y轴方向上的投影值;x23为偶数页面组的无 效版心的左边距在x轴方向上的投影值;x24为偶数页面组的无效版心的右边 距在x轴方向上的投影值。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 将奇数页面组的有效版心的上边距和下边距在y轴方向上的投影值、左边距 和右边距在x轴方向上的投影值与偶数页面组的有效版心的上边距和下边距 在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值分别进行比 较,分别得到最大的上边距和下边距在y轴方向上的投影值、左边距和右边 距在x轴方向上的投影值;根据最大的上边距和下边距在y轴方向上的投影 值、左边距和右边距在x轴方向上的投影值调整奇数页面组的有效版心与偶 数页面组的有效版心的四边边距对应的投影值。
在一种可选的实施方式中,可执行指令进一步使处理器执行以下操作: 将y11和y21中的数值较大者与数值较小者对应的无效版心上边距在y轴方向 上的投影值相比,若y11和y21中的数值较大者小于数值较小者对应的无效版 心上边距在y轴方向上的投影值相比,将y11和y21中的数值较大者设定为最 大上边距的投影值;将y12和y22中的数值较小者与数值较大者对应的无效版 心下边距在y轴方向上的投影值相比,若y12和y22中的数值较小者大于数值 较大者对应的无效版心下边距在y轴方向上的投影值,将y12和y22中的数值 较小者设定为最大下边距的投影值;获取奇数页面组的投影页面的中轴在x 轴方向上的投影值x15,分别计算x11和x12到x15的距离值,获取其中最大的 距离值;根据最大的距离值重新设定奇数页面组的有效版心的左边距对应的 投影值和右边距对应的投影值,得到经修正的奇数页面组的有效版心;经修 正的奇数页面组的有效版心的左边距和右边距在x轴方向上的投影值分别为 x11'和x12',x11'和x12'到x15的距离值均为x11和x12到x15中的最大的距离值; 获取偶数页面组的投影页面的中轴在x轴方向上的投影值x25,分别计算x21和x22到x25的距离值,获取其中最大的距离值;根据最大的距离值重新设定 偶数页面组的有效版心的左边距对应的投影值和右边距对应的投影值,得到 经修正的偶数页面组的有效版心;经修正的偶数页面组的有效版心的左边距 和右边距在x轴方向上的投影值分别为x21'和x22',x21'和x22'到x25的距离值均 为x21和x22到x25中的最大的距离值;将x11'和x21'中的数值较小者与数值较大 者对应的无效版心左边距在x轴方向上的投影值相比,若x11'和x21'中的数值 较小者大于数值较大者对应的无效版心左边距在x轴方向上的投影值,将x11' 和x21'中的数值较小者设定为最大左边距的投影值;将x12'和x22'中的数值较大 者与数值较小者对应的无效版心右边距在x轴方向上的投影值相比,若x12' 和x22'中的数值较小者对应的无效版心右边距在x轴方向上的投影值在x轴方 向上的投影值,将x12'和x22'中的数值较大者设定为最大右边距的投影值。
实施例四
图5示出了根据本发明实施例四的一种电子设备的结构示意图,本发明 具体实施例并不对电子设备的具体实现做限定。
如图5所示,该电子设备可以包括:处理器(processor)502、通信接口(Communications Interface)504、存储器(memory)506、以及通信总线508。
其中:
处理器502、通信接口504、以及存储器506通过通信总线508完成相互 间的通信。
通信接口504,用于与其它设备比如客户端或其它服务器等的网元通信。
处理器502,用于执行程序510,具体可以执行上述文本版心识别方法实 施例中的相关步骤。
具体地,程序510可以包括程序代码,该程序代码包括计算机操作指令。
处理器502可能是中央处理器CPU,或者是特定集成电路ASIC (ApplicationSpecific Integrated Circuit),或者是被配置成实施本发明实施例 的一个或多个集成电路。电子设备包括的一个或多个处理器,可以是同一类 型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多 个CPU以及一个或多个ASIC。
存储器506,用于存放程序510。存储器506可能包含高速RAM存储器, 也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存 储器。
程序510具体可以用于使得处理器502执行以下操作:
在一种可选的实施方式中,程序510用于使得处理器502从文本中择取 预设页数的页面,将预设页数的页面按照页码分为奇数页面组和偶数页面组; 分别对奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别,得 到每个页面中每行文字对应的矩形文本对象;针对奇数页面组和偶数页面组 中的每一页面组,进行如下处理:对该页面组的页面进行完全重叠设置,以 垂直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具 有相交区域的矩形文本对象进行合并处理,得到包含合并处理后的矩形文本 对象的该页面组的投影页面;根据该页面组的投影页面中矩形文本对象的矩 形位置数据、矩形尺寸数据和/或矩形文本对象的文字信息,对矩形文本对象 进行过滤处理,得到该页面组的投影页面的有效矩形文本对象;根据该页面 组的投影页面的有效矩形文本对象,确定该页面组的版心。
在一种可选的实施方式中,程序510用于使得处理器502根据各页面中 文字的字体和/或字号判断页面是否为包含正文的页面,若否,则去除该页面。
在一种可选的实施方式中,程序510用于使得处理器502对该页面组的 页面进行完全重叠设置,以垂直于页面的方向为投影方向对该页面组进行投 影处理,将在投影方向上具有相交区域的矩形文本对象按照包括这些矩形文 本对象的最小范围进行合并处理,得到包含合并处理后合的矩形文本对象的 该页面组的投影页面。
在一种可选的实施方式中,程序510用于使得处理器502以该页面组的 投影页面的左下角为原点,设置页面横向为x轴,页面纵向为y轴;按照矩 形文本对象的矩形位置数据在y轴方向上投影值由大到小排序,依照排序依 次对矩形文本对象进行y轴过滤处理,选取最先未被过滤的矩形文本对象作 为该页面组的投影页面在y轴方向的第一有效矩形文本对象;按照矩形文本 对象的矩形位置数据在y轴方向上投影值由小到大排序,依照排序依次对矩 形文本对象进行y轴过滤处理,选取最先未被过滤的矩形文本对象作为该页 面组的投影页面在y轴方向的第二有效矩形文本对象;按照矩形文本对象的 矩形位置数据在x轴方向上投影值由小到大排序,依照排序依次对矩形文本 对象进行x轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的 投影页面在x轴方向的第三有效矩形文本对象;按照矩形文本对象的矩形位 置数据在x轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进 行x轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的投影页 面在x轴方向的第四有效矩形文本对象。
在一种可选的实施方式中,程序510用于使得处理器502判断矩形文本 对象的文字信息中包含重复文字内容的重复率是否达到预设重复率,若是, 则过滤矩形文本对象;和/或,判断矩形文本对象的文字信息中包含的文字内 容是否均为数字,若是,则过滤矩形文本对象;和/或,判断矩形文本对象的 矩形高度是否小于预设高度,若是,则过滤矩形文本对象;和/或,判断矩形 文本对象的矩形宽度是否小于预设宽度,若是,则过滤矩形文本对象。
在一种可选的实施方式中,程序510用于使得处理器502判断矩形文本 对象的文字信息中包含重复文字内容的重复率是否达到预设重复率,若是, 则过滤矩形文本对象;和/或,判断矩形文本对象的文字信息中包含的文字内 容是否均为数字,若是,则过滤矩形文本对象;和/或,判断矩形文本对象的 矩形宽度是否小于预设宽度,若是,则过滤矩形文本对象。
在一种可选的实施方式中,程序510用于使得处理器502分别获取奇数 页面组和偶数页面组的投影页面的有效边距值y11、y12、x11、x12、y21、y22、 x21和x22;其中,y11为奇数页面组的投影页面的第一有效矩形文本对象的上 边距在y轴方向上的投影值;y12为奇数页面组的投影页面的第二有效矩形文 本对象的下边距在y轴方向上的投影值;x11为奇数页面组的投影页面的第三 有效矩形文本对象的左边距在x轴方向上的投影值;x12为奇数页面组的投影 页面的第四有效矩形文本对象的右边距在x轴方向上的投影值;y21为偶数页 面组的投影页面的第一有效矩形文本对象的上边距在y轴方向上的投影值; y22为偶数页面组的投影页面的第二有效矩形文本对象的下边距在y轴方向上 的投影值;x21为偶数页面组的投影页面的第三有效矩形文本对象的左边距在 x轴方向上的投影值;x22为偶数页面组的投影页面的第四有效矩形文本对象 的右边距在x轴方向上的投影值;y11、y12、x11和x12确定奇数页面组的有效 版心;y11为奇数页面组的有效版心的上边距在y轴方向上的投影值;y12为奇数页面组的有效版心的下边距在y轴方向上的投影值;x11为奇数页面组的有 效版心的左边距在x轴方向上的投影值;x12为奇数页面组的有效版心的右边 距在x轴方向上的投影值;y21、y22、x21和x22确定偶数页面组的有效版心; y21为偶数页面组的有效版心的上边距在y轴方向上的投影值;y22为偶数页面 组的有效版心的下边距在y轴方向上的投影值;x21为偶数页面组的有效版心 的左边距在x轴方向上的投影值;x22为偶数页面组的有效版心的右边距在x 轴方向上的投影值。
在一种可选的实施方式中,程序510用于使得处理器502在按照矩形文 本对象的矩形位置数据在y轴方向上投影值由大到小排序,依照排序依次对 矩形文本对象进行y轴过滤处理时,选取最后被过滤的矩形文本对象作为该 页面组的投影页面在y轴方向的第一无效矩形文本对象;在按照矩形文本对 象的矩形位置数据在y轴方向上投影值由小到大排序,依照排序依次对矩形 文本对象进行y轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面 组的投影页面在y轴方向的第二无效矩形文本对象;在按照矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排序,依照排序依次对矩形文本 对象进行x轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的 投影页面在x轴方向的第三无效矩形文本对象;在按照矩形文本对象的矩形 位置数据在x轴方向上投影值由大到小排序,依照排序依次对矩形文本对象 进行x轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的投影 页面在x轴方向的第四无效矩形文本对象。
在一种可选的实施方式中,程序510用于使得处理器502分别获取奇数 页面组和偶数页面组的投影页面的无效边距值y13、y14、x13、x14、y23、y24、 x23和x24;其中,y13为奇数页面组的投影页面的第一无效矩形文本对象的下 边距在y轴方向上的投影值;y14为奇数页面组的投影页面的第二无效矩形文 本对象的上边距在y轴方向上的投影值;x13为奇数页面组的投影页面的第三 无效矩形文本对象的右边距在x轴方向上的投影值;x14为奇数页面组的投影 页面的第四无效矩形文本对象的左边距在x轴方向上的投影值;y23为偶数页 面组的投影页面的第一无效矩形文本对象的下边距在y轴方向上的投影值; y24为偶数页面组的投影页面的第二无效矩形文本对象的上边距在y轴方向上 的投影值;x23为偶数页面组的投影页面的第三无效矩形文本对象的右边距在 x轴方向上的投影值;x24为偶数页面组的投影页面的第四无效矩形文本对象 的左边距在x轴方向上的投影值;y13、y14、x13和x14确定奇数页面组的无效 版心;y13为奇数页面组的无效版心的上边距在y轴方向上的投影值;y14为奇数页面组的无效版心的下边距在y轴方向上的投影值;x13为奇数页面组的无 效版心的左边距在x轴方向上的投影值;x14为奇数页面组的无效版心的右边 距在x轴方向上的投影值;y23、y24、x23和x24确定偶数页面组的无效版心; y23为偶数页面组的无效版心的上边距在y轴方向上的投影值;y24为偶数页面 组的无效版心的下边距在y轴方向上的投影值;x23为偶数页面组的无效版心 的左边距在x轴方向上的投影值;x24为偶数页面组的无效版心的右边距在x 轴方向上的投影值。
在一种可选的实施方式中,程序510用于使得处理器502将奇数页面组 的有效版心的上边距和下边距在y轴方向上的投影值、左边距和右边距在x 轴方向上的投影值与偶数页面组的有效版心的上边距和下边距在y轴方向上 的投影值、左边距和右边距在x轴方向上的投影值分别进行比较,分别得到 最大的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向 上的投影值;根据最大的上边距和下边距在y轴方向上的投影值、左边距和 右边距在x轴方向上的投影值调整奇数页面组的有效版心与偶数页面组的有 效版心的四边边距对应的投影值。
在一种可选的实施方式中,程序510用于使得处理器502将y11和y21中 的数值较大者与数值较小者对应的无效版心上边距在y轴方向上的投影值相 比,若y11和y21中的数值较大者小于数值较小者对应的无效版心上边距在y 轴方向上的投影值相比,将y11和y21中的数值较大者设定为最大上边距的投 影值;将y12和y22中的数值较小者与数值较大者对应的无效版心下边距在y 轴方向上的投影值相比,若y12和y22中的数值较小者大于数值较大者对应的 无效版心下边距在y轴方向上的投影值,将y12和y22中的数值较小者设定为 最大下边距的投影值;获取奇数页面组的投影页面的中轴在x轴方向上的投 影值x15,分别计算x11和x12到x15的距离值,获取其中最大的距离值;根据 最大的距离值重新设定奇数页面组的有效版心的左边距对应的投影值和右边 距对应的投影值,得到经修正的奇数页面组的有效版心;经修正的奇数页面 组的有效版心的左边距和右边距在x轴方向上的投影值分别为x11'和x12',x11' 和x12'到x15的距离值均为x11和x12到x15中的最大的距离值;获取偶数页面组 的投影页面的中轴在x轴方向上的投影值x25,分别计算x21和x22到x25的距 离值,获取其中最大的距离值;根据最大的距离值重新设定偶数页面组的有 效版心的左边距对应的投影值和右边距对应的投影值,得到经修正的偶数页 面组的有效版心;经修正的偶数页面组的有效版心的左边距和右边距在x轴 方向上的投影值分别为x21'和x22',x21'和x22'到x25的距离值均为x21和x22到 x25中的最大的距离值;将x11'和x21'中的数值较小者与数值较大者对应的无效 版心左边距在x轴方向上的投影值相比,若x11'和x21'中的数值较小者大于数 值较大者对应的无效版心左边距在x轴方向上的投影值,将x11'和x21'中的数 值较小者设定为最大左边距的投影值;将x12'和x22'中的数值较大者与数值较 小者对应的无效版心右边距在x轴方向上的投影值相比,若x12'和x22'中的数 值较小者对应的无效版心右边距在x轴方向上的投影值在x轴方向上的投影 值,将x12'和x22'中的数值较大者设定为最大右边距的投影值。
程序510中各步骤的具体实现可以参见上述文本版心识别实施例中的相 应步骤中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到, 为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前 述方法实施例中的对应过程描述,在此不再赘述。
通过本实施例提供的方案,通过对择取的每个页面以行为单位识别出的 矩形文本对象,并将页面组的页面完全重叠设置后进行投影、合并等处理, 得到包含合并处理后的矩形文本对象的该页面组的投影页面。对投影页面中 的矩形文本对象进一步过滤,得到有效矩形文本对象,从而可以准确的确定 页面组的版心。与现有技术相比,本发明以行为单位依次进行处理,得到的 版心的准确度更精确,且整个完全不需要人工的参与,更快速高效。
在此提供的算法和显示不与任何特定计算机、虚拟系统或者其它设备固 有相关。各种通用系统也可以与基于在此的示教一起使用。根据上面的描述, 构造这类系统所要求的结构是显而易见的。此外,本发明也不针对任何特定 编程语言。应当明白,可以利用各种编程语言实现在此描述的本发明的内容, 并且上面对特定语言所做的描述是为了披露本发明的最佳实施方式。
在此处所提供的说明书中,说明了大量具体细节。然而,能够理解,本 发明的实施例可以在没有这些具体细节的情况下实践。在一些实例中,并未 详细示出公知的方法、结构和技术,以便不模糊对本说明书的理解。
类似地,应当理解,为了精简本公开并帮助理解各个发明方面中的一个 或多个,在上面对本发明的示例性实施例的描述中,本发明的各个特征有时 被一起分组到单个实施例、图、或者对其的描述中。然而,并不应将该公开 的方法解释成反映如下意图:即所要求保护的本发明要求比在每个权利要求 中所明确记载的特征更多的特征。更确切地说,如下面的权利要求书所反映 的那样,发明方面在于少于前面公开的单个实施例的所有特征。因此,遵循 具体实施方式的权利要求书由此明确地并入该具体实施方式,其中每个权利要求本身都作为本发明的单独实施例。
本领域那些技术人员可以理解,可以对实施例中的设备中的模块进行自 适应性地改变并且把它们设置在与该实施例不同的一个或多个设备中。可以 把实施例中的模块或单元或组件组合成一个模块或单元或组件,以及此外可 以把它们分成多个子模块或子单元或子组件。除了这样的特征和/或过程或者 单元中的至少一些是相互排斥之外,可以采用任何组合对本说明书(包括伴 随的权利要求、摘要和附图)中公开的所有特征以及如此公开的任何方法或 者设备的所有过程或单元进行组合。除非另外明确陈述,本说明书(包括伴 随的权利要求、摘要和附图)中公开的每个特征可以由提供相同、等同或相 似目的的替代特征来代替。
此外,本领域的技术人员能够理解,尽管在此所述的一些实施例包括其 它实施例中所包括的某些特征而不是其它特征,但是不同实施例的特征的组 合意味着处于本发明的范围之内并且形成不同的实施例。例如,在下面的权 利要求书中,所要求保护的实施例的任意之一都可以以任意的组合方式来使 用。
应该注意的是上述实施例对本发明进行说明而不是对本发明进行限制,并 且本领域技术人员在不脱离所附权利要求的范围的情况下可设计出替换实施 例。在权利要求中,不应将位于括号之间的任何参考符号构造成对权利要求 的限制。单词“包含”不排除存在未列在权利要求中的元件或步骤。位于元件之 前的单词“一”或“一个”不排除存在多个这样的元件。本发明可以借助于包括有 若干不同元件的硬件以及借助于适当编程的计算机来实现。单词第一、第二、 以及第三等的使用不表示任何顺序。可将这些单词解释为名称。
Claims (33)
1.一种文本版心识别方法,其包括:
从文本中择取预设页数的页面,将所述预设页数的页面按照页码分为奇数页面组和偶数页面组;
分别对奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别,得到每个页面中每行文字对应的矩形文本对象;
针对奇数页面组和偶数页面组中的每一页面组,进行如下处理:
对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象进行合并处理,得到包含所述合并处理后的矩形文本对象的该页面组的投影页面;
根据该页面组的所述投影页面中矩形文本对象的矩形位置数据、矩形尺寸数据和/或矩形文本对象的文字信息,对所述矩形文本对象进行过滤处理,得到该页面组的所述投影页面的有效矩形文本对象;
根据该页面组的所述投影页面的有效矩形文本对象,确定该页面组的版心。
2.根据权利要求1所述的方法,其中,在所述从文本中择取预设页数的页面之后,将所述预设页数的页面按照页码分为奇数页面组和偶数页面组之前,所述方法进一步包括:
根据各页面中文字的字体和/或字号判断页面是否为包含正文的页面,若否,则去除该页面。
3.根据权利要求1所述的方法,其中,所述对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象进行合并处理,得到包含所述合并处理后的矩形文本对象的该页面组的投影页面进一步包括:
对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象按照包括这些矩形文本对象的最小范围进行合并处理,得到包含所述合并处理后的矩形文本对象的该页面组的投影页面。
4.根据权利要求1所述的方法,其中,所述根据该页面组的所述投影页面中矩形文本对象的矩形位置数据、矩形尺寸数据和/或矩形文本对象的文字信息,对所述矩形文本对象进行过滤处理,得到该页面组的所述投影页面的有效矩形文本对象进一步包括:
以该页面组的所述投影页面的左下角为原点,设置页面横向为x轴,页面纵向为y轴;
按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行y轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第一有效矩形文本对象;
按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行y轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第二有效矩形文本对象;
按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行x轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第三有效矩形文本对象;
按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行x轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第四有效矩形文本对象。
5.根据权利要求4所述的方法,其中,所述依照排序依次对矩形文本对象进行y轴过滤处理进一步包括:
判断所述矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预设重复率,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的文字信息中包含的文字内容是否均为数字,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的矩形高度是否小于预设高度,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的矩形宽度是否小于预设宽度,若是,则过滤所述矩形文本对象。
6.根据权利要求4所述的方法,其中,所述依照排序依次对矩形文本对象进行x轴过滤处理进一步包括:
判断所述矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预设重复率,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的文字信息中包含的文字内容是否均为数字,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的矩形宽度是否小于预设宽度,若是,则过滤所述矩形文本对象。
7.根据权利要求4所述的方法,其中,在所述得到该页面组的所述投影页面的有效矩形文本对象之后,所述方法还包括:
分别获取奇数页面组的投影页面的有效边距值y11、y12、x11、x12和偶数页面组的投影页面的有效边距值y21、y22、x21和x22;其中,y11为奇数页面组的投影页面的第一有效矩形文本对象的上边距在y轴方向上的投影值;y12为奇数页面组的投影页面的第二有效矩形文本对象的下边距在y轴方向上的投影值;x11为奇数页面组的投影页面的第三有效矩形文本对象的左边距在x轴方向上的投影值;x12为奇数页面组的投影页面的第四有效矩形文本对象的右边距在x轴方向上的投影值;y21为偶数页面组的投影页面的第一有效矩形文本对象的上边距在y轴方向上的投影值;y22为偶数页面组的投影页面的第二有效矩形文本对象的下边距在y轴方向上的投影值;x21为偶数页面组的投影页面的第三有效矩形文本对象的左边距在x轴方向上的投影值;x22为偶数页面组的投影页面的第四有效矩形文本对象的右边距在x轴方向上的投影值;
y11、y12、x11和x12确定奇数页面组的有效版心;y11为奇数页面组的有效版心的上边距在y轴方向上的投影值;y12为奇数页面组的有效版心的下边距在y轴方向上的投影值;x11为奇数页面组的有效版心的左边距在x轴方向上的投影值;x12为奇数页面组的有效版心的右边距在x轴方向上的投影值;
y21、y22、x21和x22确定偶数页面组的有效版心;y21为偶数页面组的有效版心的上边距在y轴方向上的投影值;y22为偶数页面组的有效版心的下边距在y轴方向上的投影值;x21为偶数页面组的有效版心的左边距在x轴方向上的投影值;x22为偶数页面组的有效版心的右边距在x轴方向上的投影值。
8.根据权利要求7所述的方法,其中:
在按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行y轴过滤处理时,所述方法还包括:选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第一无效矩形文本对象;
在按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行y轴过滤处理时,所述方法还包括:选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第二无效矩形文本对象;
在按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行x轴过滤处理时,所述方法还包括:选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第三无效矩形文本对象;
在按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行x轴过滤处理时,所述方法还包括:选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第四无效矩形文本对象。
9.根据权利要求8所述的方法,其中,所述方法还包括:
分别获取奇数页面组的投影页面的无效边距值y13、y14、x13、x14和偶数页面组的投影页面的无效边距值y23、y24、x23和x24;其中,y13为奇数页面组的投影页面的第一无效矩形文本对象的下边距在y轴方向上的投影值;y14为奇数页面组的投影页面的第二无效矩形文本对象的上边距在y轴方向上的投影值;x13为奇数页面组的投影页面的第三无效矩形文本对象的右边距在x轴方向上的投影值;x14为奇数页面组的投影页面的第四无效矩形文本对象的左边距在x轴方向上的投影值;y23为偶数页面组的投影页面的第一无效矩形文本对象的下边距在y轴方向上的投影值;y24为偶数页面组的投影页面的第二无效矩形文本对象的上边距在y轴方向上的投影值;x23为偶数页面组的投影页面的第三无效矩形文本对象的右边距在x轴方向上的投影值;x24为偶数页面组的投影页面的第四无效矩形文本对象的左边距在x轴方向上的投影值;
y13、y14、x13和x14确定奇数页面组的无效版心;y13为奇数页面组的无效版心的上边距在y轴方向上的投影值;y14为奇数页面组的无效版心的下边距在y轴方向上的投影值;x13为奇数页面组的无效版心的左边距在x轴方向上的投影值;x14为奇数页面组的无效版心的右边距在x轴方向上的投影值;
y23、y24、x23和x24确定偶数页面组的无效版心;y23为偶数页面组的无效版心的上边距在y轴方向上的投影值;y24为偶数页面组的无效版心的下边距在y轴方向上的投影值;x23为偶数页面组的无效版心的左边距在x轴方向上的投影值;x24为偶数页面组的无效版心的右边距在x轴方向上的投影值。
10.根据权利要求9所述的方法,其中,所述方法还包括:
将所述奇数页面组的有效版心的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值与所述偶数页面组的有效版心的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值分别进行比较,分别得到最大的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值;
根据所述最大的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值调整所述奇数页面组的有效版心与所述偶数页面组的有效版心的四边边距对应的投影值。
11.根据权利要求10所述的方法,其中,所述将所述奇数页面组的有效版心的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值与所述偶数页面组的有效版心的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值分别进行比较,分别得到最大的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值进一步包括:
将y11和y21中的数值较大者与数值较小者对应的无效版心上边距在y轴方向上的投影值相比,若y11和y21中的数值较大者小于数值较小者对应的无效版心上边距在y轴方向上的投影值,将所述y11和y21中的数值较大者设定为最大上边距的投影值;
将y12和y22中的数值较小者与数值较大者对应的无效版心下边距在y轴方向上的投影值相比,若y12和y22中的数值较小者大于数值较大者对应的无效版心下边距在y轴方向上的投影值,将所述y12和y22中的数值较小者设定为最大下边距的投影值;
获取所述奇数页面组的投影页面的中轴在x轴方向上的投影值x15,分别计算x11和x12到x15的距离值,获取其中最大的距离值;根据所述最大的距离值重新设定所述奇数页面组的有效版心的左边距对应的投影值和右边距对应的投影值,得到经修正的所述奇数页面组的有效版心;所述经修正的所述奇数页面组的有效版心的左边距和右边距在x轴方向上的投影值分别为x11'和x12',所述x11'和x12'到x15的距离值均为所述x11和x12到x15中的最大的距离值;
获取所述偶数页面组的投影页面的中轴在x轴方向上的投影值x25,分别计算x21和x22到x25的距离值,获取其中最大的距离值;根据所述最大的距离值重新设定所述偶数页面组的有效版心的左边距对应的投影值和右边距对应的投影值,得到经修正的所述偶数页面组的有效版心;所述经修正的所述偶数页面组的有效版心的左边距和右边距在x轴方向上的投影值分别为x21'和x22',所述x21'和x22'到x25的距离值均为所述x21和x22到x25中的最大的距离值;
将x11'和x21'中的数值较小者与数值较大者对应的无效版心左边距在x轴方向上的投影值相比,若x11'和x21'中的数值较小者大于数值较大者对应的无效版心左边距在x轴方向上的投影值,将所述x11'和x21'中的数值较小者设定为最大左边距的投影值;
将x12'和x22'中的数值较大者与数值较小者对应的无效版心右边距在x轴方向上的投影值相比,若x12'和x22'中的数值较大者小于数值较小者对应的无效版心右边距在x轴方向上的投影值,将所述x12'和x22'中的数值较大者设定为最大右边距的投影值。
12.一种电子设备,包括:处理器、存储器、通信接口和通信总线,所述处理器、所述存储器和所述通信接口通过所述通信总线完成相互间的通信;
所述存储器用于存放至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
从文本中择取预设页数的页面,将所述预设页数的页面按照页码分为奇数页面组和偶数页面组;
分别对奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别,得到每个页面中每行文字对应的矩形文本对象;
针对奇数页面组和偶数页面组中的每一页面组,进行如下处理:
对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象进行合并处理,得到包含所述合并处理后的矩形文本对象的该页面组的投影页面;
根据该页面组的所述投影页面中矩形文本对象的矩形位置数据、矩形尺寸数据和/或矩形文本对象的文字信息,对所述矩形文本对象进行过滤处理,得到该页面组的所述投影页面的有效矩形文本对象;
根据该页面组的所述投影页面的有效矩形文本对象,确定该页面组的版心。
13.根据权利要求12所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
根据各页面中文字的字体和/或字号判断页面是否为包含正文的页面,若否,则去除该页面。
14.根据权利要求12所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象按照包括这些矩形文本对象的最小范围进行合并处理,得到包含所述合并处理后的矩形文本对象的该页面组的投影页面。
15.根据权利要求12所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
以该页面组的所述投影页面的左下角为原点,设置页面横向为x轴,页面纵向为y轴;
按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行y轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第一有效矩形文本对象;
按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行y轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第二有效矩形文本对象;
按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行x轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第三有效矩形文本对象;
按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行x轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第四有效矩形文本对象。
16.根据权利要求15所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
判断所述矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预设重复率,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的文字信息中包含的文字内容是否均为数字,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的矩形高度是否小于预设高度,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的矩形宽度是否小于预设宽度,若是,则过滤所述矩形文本对象。
17.根据权利要求15所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
判断所述矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预设重复率,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的文字信息中包含的文字内容是否均为数字,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的矩形宽度是否小于预设宽度,若是,则过滤所述矩形文本对象。
18.根据权利要求15所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
分别获取奇数页面组的投影页面的有效边距值y11、y12、x11、x12和偶数页面组的投影页面的有效边距值y21、y22、x21和x22;其中,y11为奇数页面组的投影页面的第一有效矩形文本对象的上边距在y轴方向上的投影值;y12为奇数页面组的投影页面的第二有效矩形文本对象的下边距在y轴方向上的投影值;x11为奇数页面组的投影页面的第三有效矩形文本对象的左边距在x轴方向上的投影值;x12为奇数页面组的投影页面的第四有效矩形文本对象的右边距在x轴方向上的投影值;y21为偶数页面组的投影页面的第一有效矩形文本对象的上边距在y轴方向上的投影值;y22为偶数页面组的投影页面的第二有效矩形文本对象的下边距在y轴方向上的投影值;x21为偶数页面组的投影页面的第三有效矩形文本对象的左边距在x轴方向上的投影值;x22为偶数页面组的投影页面的第四有效矩形文本对象的右边距在x轴方向上的投影值;
y11、y12、x11和x12确定奇数页面组的有效版心;y11为奇数页面组的有效版心的上边距在y轴方向上的投影值;y12为奇数页面组的有效版心的下边距在y轴方向上的投影值;x11为奇数页面组的有效版心的左边距在x轴方向上的投影值;x12为奇数页面组的有效版心的右边距在x轴方向上的投影值;
y21、y22、x21和x22确定偶数页面组的有效版心;y21为偶数页面组的有效版心的上边距在y轴方向上的投影值;y22为偶数页面组的有效版心的下边距在y轴方向上的投影值;x21为偶数页面组的有效版心的左边距在x轴方向上的投影值;x22为偶数页面组的有效版心的右边距在x轴方向上的投影值。
19.根据权利要求18所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
在按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行y轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第一无效矩形文本对象;
在按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行y轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第二无效矩形文本对象;
在按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行x轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第三无效矩形文本对象;
在按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行x轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第四无效矩形文本对象。
20.根据权利要求19所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
分别获取奇数页面组的投影页面的无效边距值y13、y14、x13、x14和偶数页面组的投影页面的无效边距值y23、y24、x23和x24;其中,y13为奇数页面组的投影页面的第一无效矩形文本对象的下边距在y轴方向上的投影值;y14为奇数页面组的投影页面的第二无效矩形文本对象的上边距在y轴方向上的投影值;x13为奇数页面组的投影页面的第三无效矩形文本对象的右边距在x轴方向上的投影值;x14为奇数页面组的投影页面的第四无效矩形文本对象的左边距在x轴方向上的投影值;y23为偶数页面组的投影页面的第一无效矩形文本对象的下边距在y轴方向上的投影值;y24为偶数页面组的投影页面的第二无效矩形文本对象的上边距在y轴方向上的投影值;x23为偶数页面组的投影页面的第三无效矩形文本对象的右边距在x轴方向上的投影值;x24为偶数页面组的投影页面的第四无效矩形文本对象的左边距在x轴方向上的投影值;
y13、y14、x13和x14确定奇数页面组的无效版心;y13为奇数页面组的无效版心的上边距在y轴方向上的投影值;y14为奇数页面组的无效版心的下边距在y轴方向上的投影值;x13为奇数页面组的无效版心的左边距在x轴方向上的投影值;x14为奇数页面组的无效版心的右边距在x轴方向上的投影值;
y23、y24、x23和x24确定偶数页面组的无效版心;y23为偶数页面组的无效版心的上边距在y轴方向上的投影值;y24为偶数页面组的无效版心的下边距在y轴方向上的投影值;x23为偶数页面组的无效版心的左边距在x轴方向上的投影值;x24为偶数页面组的无效版心的右边距在x轴方向上的投影值。
21.根据权利要求20所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
将所述奇数页面组的有效版心的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值与所述偶数页面组的有效版心的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值分别进行比较,分别得到最大的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值;
根据所述最大的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值调整所述奇数页面组的有效版心与所述偶数页面组的有效版心的四边边距对应的投影值。
22.根据权利要求21所述的电子设备,所述可执行指令进一步使所述处理器执行以下操作:
将y11和y21中的数值较大者与数值较小者对应的无效版心上边距在y轴方向上的投影值相比,若y11和y21中的数值较大者小于数值较小者对应的无效版心上边距在y轴方向上的投影值,将所述y11和y21中的数值较大者设定为最大上边距的投影值;
将y12和y22中的数值较小者与数值较大者对应的无效版心下边距在y轴方向上的投影值相比,若y12和y22中的数值较小者大于数值较大者对应的无效版心下边距在y轴方向上的投影值,将所述y12和y22中的数值较小者设定为最大下边距的投影值;
获取所述奇数页面组的投影页面的中轴在x轴方向上的投影值x15,分别计算x11和x12到x15的距离值,获取其中最大的距离值;根据所述最大的距离值重新设定所述奇数页面组的有效版心的左边距对应的投影值和右边距对应的投影值,得到经修正的所述奇数页面组的有效版心;所述经修正的所述奇数页面组的有效版心的左边距和右边距在x轴方向上的投影值分别为x11'和x12',所述x11'和x12'到x15的距离值均为所述x11和x12到x15中的最大的距离值;
获取所述偶数页面组的投影页面的中轴在x轴方向上的投影值x25,分别计算x21和x22到x25的距离值,获取其中最大的距离值;根据所述最大的距离值重新设定所述偶数页面组的有效版心的左边距对应的投影值和右边距对应的投影值,得到经修正的所述偶数页面组的有效版心;所述经修正的所述偶数页面组的有效版心的左边距和右边距在x轴方向上的投影值分别为x21'和x22',所述x21'和x22'到x25的距离值均为所述x21和x22到x25中的最大的距离值;
将x11'和x21'中的数值较小者与数值较大者对应的无效版心左边距在x轴方向上的投影值相比,若x11'和x21'中的数值较小者大于数值较大者对应的无效版心左边距在x轴方向上的投影值,将所述x11'和x21'中的数值较小者设定为最大左边距的投影值;
将x12'和x22'中的数值较大者与数值较小者对应的无效版心右边距在x轴方向上的投影值相比,若x12'和x22'中的数值较大者小于数值较小者对应的无效版心右边距在x轴方向上的投影值,将所述x12'和x22'中的数值较大者设定为最大右边距的投影值。
23.一种计算机存储介质,所述存储介质中存储有至少一可执行指令,所述可执行指令使所述处理器执行以下操作:
从文本中择取预设页数的页面,将所述预设页数的页面按照页码分为奇数页面组和偶数页面组;
分别对奇数页面组和偶数页面组中每个页面的文字以行为单位进行识别,得到每个页面中每行文字对应的矩形文本对象;
针对奇数页面组和偶数页面组中的每一页面组,进行如下处理:
对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象进行合并处理,得到包含所述合并处理后的矩形文本对象的该页面组的投影页面;
根据该页面组的所述投影页面中矩形文本对象的矩形位置数据、矩形尺寸数据和/或矩形文本对象的文字信息,对所述矩形文本对象进行过滤处理,得到该页面组的所述投影页面的有效矩形文本对象;
根据该页面组的所述投影页面的有效矩形文本对象,确定该页面组的版心。
24.根据权利要求23所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
根据各页面中文字的字体和/或字号判断页面是否为包含正文的页面,若否,则去除该页面。
25.根据权利要求23所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
对该页面组的页面进行完全重叠设置,以垂直于页面的方向为投影方向对该页面组进行投影处理,将在投影方向上具有相交区域的矩形文本对象按照包括这些矩形文本对象的最小范围进行合并处理,得到包含所述合并处理后的矩形文本对象的该页面组的投影页面。
26.根据权利要求23所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
以该页面组的所述投影页面的左下角为原点,设置页面横向为x轴,页面纵向为y轴;
按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行y轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第一有效矩形文本对象;
按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行y轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第二有效矩形文本对象;
按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行x轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第三有效矩形文本对象;
按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行x轴过滤处理,选取最先未被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第四有效矩形文本对象。
27.根据权利要求26所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
判断所述矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预设重复率,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的文字信息中包含的文字内容是否均为数字,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的矩形高度是否小于预设高度,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的矩形宽度是否小于预设宽度,若是,则过滤所述矩形文本对象。
28.根据权利要求26所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
判断所述矩形文本对象的文字信息中包含重复文字内容的重复率是否达到预设重复率,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的文字信息中包含的文字内容是否均为数字,若是,则过滤所述矩形文本对象;
和/或,判断所述矩形文本对象的矩形宽度是否小于预设宽度,若是,则过滤所述矩形文本对象。
29.根据权利要求26所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
分别获取奇数页面组的投影页面的有效边距值y11、y12、x11、x12和偶数页面组的投影页面的有效边距值y21、y22、x21和x22;其中,y11为奇数页面组的投影页面的第一有效矩形文本对象的上边距在y轴方向上的投影值;y12为奇数页面组的投影页面的第二有效矩形文本对象的下边距在y轴方向上的投影值;x11为奇数页面组的投影页面的第三有效矩形文本对象的左边距在x轴方向上的投影值;x12为奇数页面组的投影页面的第四有效矩形文本对象的右边距在x轴方向上的投影值;y21为偶数页面组的投影页面的第一有效矩形文本对象的上边距在y轴方向上的投影值;y22为偶数页面组的投影页面的第二有效矩形文本对象的下边距在y轴方向上的投影值;x21为偶数页面组的投影页面的第三有效矩形文本对象的左边距在x轴方向上的投影值;x22为偶数页面组的投影页面的第四有效矩形文本对象的右边距在x轴方向上的投影值;
y11、y12、x11和x12确定奇数页面组的有效版心;y11为奇数页面组的有效版心的上边距在y轴方向上的投影值;y12为奇数页面组的有效版心的下边距在y轴方向上的投影值;x11为奇数页面组的有效版心的左边距在x轴方向上的投影值;x12为奇数页面组的有效版心的右边距在x轴方向上的投影值;
y21、y22、x21和x22确定偶数页面组的有效版心;y21为偶数页面组的有效版心的上边距在y轴方向上的投影值;y22为偶数页面组的有效版心的下边距在y轴方向上的投影值;x21为偶数页面组的有效版心的左边距在x轴方向上的投影值;x22为偶数页面组的有效版心的右边距在x轴方向上的投影值。
30.根据权利要求29所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
在按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行y轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第一无效矩形文本对象;
在按照所述矩形文本对象的矩形位置数据在y轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行y轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在y轴方向的第二无效矩形文本对象;
在按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由小到大排序,依照排序依次对矩形文本对象进行x轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第三无效矩形文本对象;
在按照所述矩形文本对象的矩形位置数据在x轴方向上投影值由大到小排序,依照排序依次对矩形文本对象进行x轴过滤处理时,选取最后被过滤的矩形文本对象作为该页面组的所述投影页面在x轴方向的第四无效矩形文本对象。
31.根据权利要求30所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
分别获取奇数页面组的投影页面的无效边距值y13、y14、x13、x14和偶数页面组的投影页面的无效边距值y23、y24、x23和x24;其中,y13为奇数页面组的投影页面的第一无效矩形文本对象的下边距在y轴方向上的投影值;y14为奇数页面组的投影页面的第二无效矩形文本对象的上边距在y轴方向上的投影值;x13为奇数页面组的投影页面的第三无效矩形文本对象的右边距在x轴方向上的投影值;x14为奇数页面组的投影页面的第四无效矩形文本对象的左边距在x轴方向上的投影值;y23为偶数页面组的投影页面的第一无效矩形文本对象的下边距在y轴方向上的投影值;y24为偶数页面组的投影页面的第二无效矩形文本对象的上边距在y轴方向上的投影值;x23为偶数页面组的投影页面的第三无效矩形文本对象的右边距在x轴方向上的投影值;x24为偶数页面组的投影页面的第四无效矩形文本对象的左边距在x轴方向上的投影值;
y13、y14、x13和x14确定奇数页面组的无效版心;y13为奇数页面组的无效版心的上边距在y轴方向上的投影值;y14为奇数页面组的无效版心的下边距在y轴方向上的投影值;x13为奇数页面组的无效版心的左边距在x轴方向上的投影值;x14为奇数页面组的无效版心的右边距在x轴方向上的投影值;
y23、y24、x23和x24确定偶数页面组的无效版心;y23为偶数页面组的无效版心的上边距在y轴方向上的投影值;y24为偶数页面组的无效版心的下边距在y轴方向上的投影值;x23为偶数页面组的无效版心的左边距在x轴方向上的投影值;x24为偶数页面组的无效版心的右边距在x轴方向上的投影值。
32.根据权利要求31所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
将所述奇数页面组的有效版心的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值与所述偶数页面组的有效版心的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值分别进行比较,分别得到最大的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值;
根据所述最大的上边距和下边距在y轴方向上的投影值、左边距和右边距在x轴方向上的投影值调整所述奇数页面组的有效版心与所述偶数页面组的有效版心的四边边距对应的投影值。
33.根据权利要求32所述的计算机存储介质,所述可执行指令进一步使所述处理器执行以下操作:
将y11和y21中的数值较大者与数值较小者对应的无效版心上边距在y轴方向上的投影值相比,若y11和y21中的数值较大者小于数值较小者对应的无效版心上边距在y轴方向上的投影值,将所述y11和y21中的数值较大者设定为最大上边距的投影值;
将y12和y22中的数值较小者与数值较大者对应的无效版心下边距在y轴方向上的投影值相比,若y12和y22中的数值较小者大于数值较大者对应的无效版心下边距在y轴方向上的投影值,将所述y12和y22中的数值较小者设定为最大下边距的投影值;
获取所述奇数页面组的投影页面的中轴在x轴方向上的投影值x15,分别计算x11和x12到x15的距离值,获取其中最大的距离值;根据所述最大的距离值重新设定所述奇数页面组的有效版心的左边距对应的投影值和右边距对应的投影值,得到经修正的所述奇数页面组的有效版心;所述经修正的所述奇数页面组的有效版心的左边距和右边距在x轴方向上的投影值分别为x11'和x12',所述x11'和x12'到x15的距离值均为所述x11和x12到x15中的最大的距离值;
获取所述偶数页面组的投影页面的中轴在x轴方向上的投影值x25,分别计算x21和x22到x25的距离值,获取其中最大的距离值;根据所述最大的距离值重新设定所述偶数页面组的有效版心的左边距对应的投影值和右边距对应的投影值,得到经修正的所述偶数页面组的有效版心;所述经修正的所述偶数页面组的有效版心的左边距和右边距在x轴方向上的投影值分别为x21'和x22',所述x21'和x22'到x25的距离值均为所述x21和x22到x25中的最大的距离值;
将x11'和x21'中的数值较小者与数值较大者对应的无效版心左边距在x轴方向上的投影值相比,若x11'和x21'中的数值较小者大于数值较大者对应的无效版心左边距在x轴方向上的投影值,将所述x11'和x21'中的数值较小者设定为最大左边距的投影值;
将x12'和x22'中的数值较大者与数值较小者对应的无效版心右边距在x轴方向上的投影值相比,若x12'和x22'中的数值较大者小于数值较小者对应的无效版心右边距在x轴方向上的投影值,将所述x12'和x22'中的数值较大者设定为最大右边距的投影值。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710334158.6A CN107169486B (zh) | 2017-05-12 | 2017-05-12 | 文本版心识别方法、电子设备及计算机存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201710334158.6A CN107169486B (zh) | 2017-05-12 | 2017-05-12 | 文本版心识别方法、电子设备及计算机存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN107169486A CN107169486A (zh) | 2017-09-15 |
CN107169486B true CN107169486B (zh) | 2018-06-15 |
Family
ID=59814899
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201710334158.6A Active CN107169486B (zh) | 2017-05-12 | 2017-05-12 | 文本版心识别方法、电子设备及计算机存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN107169486B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN107656915B (zh) * | 2017-10-25 | 2021-08-31 | 宋彦震 | 根据书籍页数自动调整内侧页边距的排版方法 |
CN107909064B (zh) * | 2017-12-27 | 2018-11-16 | 掌阅科技股份有限公司 | 三线表识别方法、电子设备及存储介质 |
CN113253888A (zh) * | 2021-05-06 | 2021-08-13 | 广州文石信息科技有限公司 | 版式文档奇偶页显示调整方法、装置、设备及存储介质 |
Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101017479A (zh) * | 2007-02-09 | 2007-08-15 | 北京大学 | 一种自动识别数字文档版心的方法 |
CN102819739A (zh) * | 2011-06-09 | 2012-12-12 | 汉王科技股份有限公司 | 一种版心定位方法和装置 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US8594422B2 (en) * | 2010-03-11 | 2013-11-26 | Microsoft Corporation | Page layout determination of an image undergoing optical character recognition |
-
2017
- 2017-05-12 CN CN201710334158.6A patent/CN107169486B/zh active Active
Patent Citations (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101017479A (zh) * | 2007-02-09 | 2007-08-15 | 北京大学 | 一种自动识别数字文档版心的方法 |
CN102819739A (zh) * | 2011-06-09 | 2012-12-12 | 汉王科技股份有限公司 | 一种版心定位方法和装置 |
Also Published As
Publication number | Publication date |
---|---|
CN107169486A (zh) | 2017-09-15 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN107169486B (zh) | 文本版心识别方法、电子设备及计算机存储介质 | |
CN109472262A (zh) | 车牌识别方法、装置、计算机设备及存储介质 | |
CN104484855B (zh) | 图片裁剪的方法和装置 | |
DE112016007220T5 (de) | Kontaktplanprogrammbearbeitungsunterstützungsvorrichtung und Kontaktplanprogrammbearbeitungsverfahren | |
CN105225218B (zh) | 用于文档图像的畸变校正方法和设备 | |
CN106688017A (zh) | 生成点云地图的方法、计算机系统和装置 | |
CN105988930A (zh) | 测试用例生成方法和装置 | |
CN109543139B (zh) | 卷积运算方法、装置、计算机设备及计算机可读存储介质 | |
KR101853237B1 (ko) | 딥 러닝을 이용한 3차원 기하 디노이징 방법 및 그 장치 | |
CN105989377A (zh) | 一种字符识别方法及装置 | |
CN109063720A (zh) | 手写字训练样本获取方法、装置、计算机设备及存储介质 | |
CN108446702A (zh) | 一种图像字符分割方法、装置、设备及存储介质 | |
CN108268868A (zh) | 身份证图像的倾斜值获取方法及装置、终端、存储介质 | |
CN106933794B (zh) | 图片排版方法及装置、电子设备、计算机存储介质 | |
KR920000978B1 (ko) | 문서처리장치에 있어서의 불럭처리 방식 | |
CN107045732B (zh) | 数字地面模型化简方法及装置 | |
CN105117330B (zh) | Cnn代码测试方法及装置 | |
CN110430140A (zh) | 路径处理方法、装置、设备及存储介质 | |
CN111524072B (zh) | 超分辨重构网络训练方法和装置、电子设备及存储介质 | |
CN106126670A (zh) | 运营数据排序处理方法及装置 | |
CN107085727A (zh) | 一种图像边界函数的确定方法及其装置 | |
CN113496468B (zh) | 深度图像的修复方法、装置和存储介质 | |
CN114333973A (zh) | 一种阈值电压分布的获取方法、系统及相关组件 | |
CN107909064B (zh) | 三线表识别方法、电子设备及存储介质 | |
CN106055332A (zh) | 一种基于视图旋转与镜像的快速蒙语化显示方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
EE01 | Entry into force of recordation of patent licensing contract |
Application publication date: 20170915 Assignee: Shaanxi Digital Information Technology Co.,Ltd. Assignor: ZHANGYUE TECHNOLOGY Co.,Ltd. Contract record no.: X2023990000904 Denomination of invention: Text layout recognition methods, electronic devices, and computer storage media Granted publication date: 20180615 License type: Common License Record date: 20231107 |
|
EE01 | Entry into force of recordation of patent licensing contract |