CN105512659B

CN105512659B - 一种文字行弯曲的修正方法及系统

Info

Publication number: CN105512659B
Application number: CN201510915323.8A
Authority: CN
Inventors: 张春雷; 龙安忠
Original assignee: Guangdong Genius Technology Co Ltd
Current assignee: Guangdong Genius Technology Co Ltd
Priority date: 2015-12-10
Filing date: 2015-12-10
Publication date: 2019-05-21
Anticipated expiration: 2035-12-10
Also published as: CN105512659A

Abstract

本发明公开了一种文字行弯曲的修正方法及系统。该方法，包括：获取扫描图片的文字行的曲线；获取曲线的最高点A和最大切线斜率对应的点B；计算最高点A与点B之间的直线AB与水平线之间的夹角α；确定所述夹角α大于等于预置角度，对所述文字行进行拉直。本发明通过计算扫描图片的文字行的曲线的最高点与最大切线斜率对应的点之间的直线与水平线之间的夹角α，确定所述夹角α大于等于预置角度，则对所述文字行进行拉直，本发明可有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题，有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。

Description

一种文字行弯曲的修正方法及系统

技术领域

本发明涉及图像处理技术领域，尤其涉及一种文字行弯曲的修正方法及系统。

背景技术

用户在使用扫描笔的时候，书本未摆放规范、书页拱起而导致的形变，使扫描图片中的文字行弯曲，导致在后续的OCR(Optical Character Recognition，光学字符识别)识别和搜索过程的准确程度受到影响。因此，需要提供一种扫描图片中文字行弯曲的修正方法，以修正弯曲的文字行，保证图片的视觉效果和后续OCR识别和搜索的准确性。

发明内容

本发明提供了一种文字行弯曲的修正方法及系统，有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题，有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。

为实现上述设计，本发明采用以下技术方案：

一方面，提供了一种文字行弯曲的修正方法，该方法，包括：

获取扫描图片的文字行的曲线；

获取曲线的最高点A和最大切线斜率对应的点B；

计算最高点A与点B之间的直线AB与水平线之间的夹角α；

确定所述夹角α大于等于预置角度，对所述文字行进行拉直。

优选地，所述获取扫描图片的文字行的曲线，包括：根据扫描图片的文字行的黑色像素点确定文字行高度，获取文字行高度的中点，由所述中点组成文字行的曲线。

优选地，所述对所述文字行进行拉直，包括：

把所述扫描图片按横向方向分割成n等份，对应的文字行的曲线也分成了n份，取每一份曲线的中点C_n1，取文字行的曲线的起点O；

分别计算文字行的曲线的起点O与每一份曲线的中点C_n1之间的直线OC_n1与水平线之间的夹角β_n1，根据起点O与中点C_n1之间的距离S_n1和夹角β_n1得到每一份曲线的弯曲高度h_n1，所述弯曲高度h_n1＝S_n1·sinβ_n1；

分别根据曲线的弯曲高度h_n1分别将每一份曲线对应的分割的扫描图片向下移动，将移动后的分割的扫描图片进行拼接；或

把所述扫描图片按横向方向分割成n等份，对应的文字行的曲线也分成了n分，取每份图片的纵向方向的中线，取每份图片中所述中线与曲线的交点C_n2，取文字行的曲线的起点O；

分别计算文字行的曲线的起点O与交点C_n2之间的直线OC_n1与水平线之间的夹角β_n2，根据起点O与中点C_n2之间的距离S_n2和夹角β_n2得到每一份曲线的弯曲高度h_n2，所述弯曲高度h_n2＝S_n2·sinβ_n2；

分别根据曲线的弯曲高度h_n2分别将每一份曲线对应的分割的扫描图片向下移动，将移动后的分割的扫描图片进行拼接。

优选地，所述预置角度为5°。

优选地，所述对所述文字行进行拉直之后，还包括：识别文字行中的文字，使用所述文字进行搜索。

另一方面，提供了一种文字行弯曲的修正系统，该系统，包括：

曲线获取模块，用于获取扫描图片的文字行的曲线；

点获取模块，用于获取曲线的最高点A和最大切线斜率对应的点B；

夹角计算模块，用于计算最高点A与点B之间的直线AB与水平线之间的夹角α；

拉直模块，用于确定所述夹角α大于等于预置角度，对所述文字行进行拉直。

优选地，所述曲线获取模块具体用于，根据扫描图片的文字行的黑色像素点确定文字行高度，获取文字行高度的中点，由所述中点组成文字行的曲线。

优选地，所述拉直模块，具体用于：

优选地，所述预置角度为5°。

优选地，还包括：

识别搜索模块，用于识别文字行中的文字，使用所述文字进行搜索。

与现有技术相比，本发明的有益效果为：获取扫描图片的文字行的曲线；获取曲线的最高点A和最大切线斜率对应的点B；计算最高点A与点B之间的直线AB与水平线之间的夹角α；确定所述夹角α大于等于预置角度，对所述文字行进行拉直。本发明通过计算扫描图片的文字行的曲线的最高点与最大切线斜率对应的点之间的直线与水平线之间的夹角α，确定所述夹角α大于等于预置角度，则对所述文字行进行拉直，本发明可有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题，有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。

附图说明

为了更清楚地说明本发明实施例中的技术方案，下面将对本发明实施例描述中所需要使用的附图作简单的介绍，显而易见地，下面描述中的附图仅仅是本发明的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据本发明实施例的内容和这些附图获得其他的附图。

图1是本发明具体实施方式中提供的一种文字行弯曲的修正方法的第一实施例的方法流程图。

图2是本发明具体实施方式中提供的一种文字行弯曲的修正方法的第二实施例的方法流程图。

图3是本发明具体实施方式中提供的一种文字行弯曲的修正系统的第一实施例的结构方框图。

图4是本发明具体实施方式中提供的一种文字行弯曲的修正系统的第二实施例的结构方框图。

具体实施方式

为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚，下面将结合附图对本发明实施例的技术方案作进一步的详细描述，显然，所描述的实施例仅仅是本发明一部分实施例，而不是全部的实施例。基于本发明中的实施例，本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本发明保护的范围。

请参考图1，其是本发明具体实施方式中提供的一种文字行弯曲的修正方法的第一实施例的方法流程图。如图所示，该方法，包括：

步骤S101：获取扫描图片的文字行的曲线。

由于书本中缝的存在使得书页拱起有两种情况：一种是“从正常到中缝”，另一种是“从中缝到正常”。如果得到的扫描图片的文字行的曲线由平直到弯曲，则属于“从正常到中缝”的情况；若果得到的扫描图片的文字行的曲线由弯曲到平直，则属于“从中缝到正常”的情况。

步骤S102：获取曲线的最高点A和最大切线斜率对应的点B。

获取曲线的最高点A，计算扫描图片的文字行的曲线的切线的斜率，得到最大切线斜率对应的点B。

步骤S103：计算最高点A与点B之间的直线AB与水平线之间的夹角α。

步骤S104：确定所述夹角α大于等于预置角度，对所述文字行进行拉直。

优选地，当所述夹角α大于等于预置角度时，说明扫描图片的文字行的曲线弯曲的程度比较严重，会影响后续的OCR识别和搜索构成的准确程度，因此需要对所述文字行进行拉直。优选地，所述预置角度为5°，用户也可以根据修正效果来对预置角度进行设置。

优选地，所述对所述文字行进行拉直，包括：

因为书页拱起的情况包括“从正常到中缝”和“从中缝到正常”两种，对应的扫描图片的文字行的曲线为由平直到弯曲和由弯曲到平直两种，而弯曲部分相对平直部分都是偏高的，因此，对文字行进行拉直时，需要根据曲线的弯曲高度h_n1或h_n2分别将每一份曲线对应的分割的扫描图片向下移动，之后将将移动后的分割的扫描图片进行拼接，得到修正后平直的文字行图片，有效地保证了图片的视觉效果。

综上所述，本实施例通过计算扫描图片的文字行的曲线的最高点与最大切线斜率对应的点之间的直线与水平线之间的夹角α，确定所述夹角α大于等于预置角度，则对所述文字行进行拉直，本实施例可有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题，有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。

请参考图2，其是本发明具体实施方式中提供的一种文字行弯曲的修正方法的第二实施例的方法流程图。如图所示，该方法，包括：

步骤S201：获取扫描图片的文字行的曲线。

步骤S202：获取曲线的最高点A和最大切线斜率对应的点B。

步骤S203：计算最高点A与点B之间的直线AB与水平线之间的夹角α。

步骤S204：确定所述夹角α大于等于预置角度，对所述文字行进行拉直。

优选地，当所述夹角α大于等于预置角度时，说明扫描图片的文字行的曲线弯曲的程度比较严重，影响后续的OCR识别和搜索构成的准确程度，因此需要对所述文字行进行拉直。优选地，所述预置角度为5°，用户也可以根据修正效果来对预置角度进行设置。

优选地，所述对所述文字行进行拉直，包括：

因为书页拱起的情况包括“从正常到中缝”和“从中缝到正常”两种，对应的扫描图片的文字行的曲线为由平直到弯曲和由弯曲到平直两种，而弯曲部分相对平直部分都是偏高的，因此，对文字行进行拉直时，需要根据曲线的弯曲高度h_n1或h_n2分别将每一份曲线对应的分割的扫描图片向下移动，之后将将移动后的分割的扫描图片进行拼接，得到拉直后平直的文字行图片，有效地保证了图片的视觉效果。

步骤S205：识别文字行中的文字，使用所述文字进行搜索。

识别拉直后平直的文字行中的文字，使用所述文字进行搜索，根据拉直后平直的文字行来进行识别文字和对识别的文字进行搜索，有效地保证了OCR识别和搜索的准确性。

以下是本发明具体实施方式中提供的一种文字行弯曲的修正系统的实施例，系统的实施例基于上述的方法的实施例实现，在系统中未尽的描述，请参考前述方法的实施例。

请参考图3，其是本发明具体实施方式中提供的一种文字行弯曲的修正系统的第一实施例的结构方框图。如图所示，该系统，包括：

曲线获取模块31，用于获取扫描图片的文字行的曲线。

优选地，所述曲线获取模块31具体用于，根据扫描图片的文字行的黑色像素点确定文字行高度，获取文字行高度的中点，由所述中点组成文字行的曲线。

点获取模块32，用于获取曲线的最高点A和最大切线斜率对应的点B。

夹角计算模块33，用于计算最高点A与点B之间的直线AB与水平线之间的夹角α。

拉直模块34，用于确定所述夹角α大于等于预置角度，对所述文字行进行拉直。

优选地，所述拉直模块34，具体用于：

因为书页拱起的情况包括“从正常到中缝”和“从中缝到正常”两种，对应的扫描图片的文字行的曲线为由平直到弯曲和由弯曲到平直两种，而弯曲部分相对平直部分都是偏高的，因此，拉直模块34对文字行进行拉直时，需要根据曲线的弯曲高度h_n1或h_n2分别将每一份曲线对应的分割的扫描图片向下移动，之后将将移动后的分割的扫描图片进行拼接，得到修正后平直的文字行图片，有效地保证了图片的视觉效果。

请参考图4，其是本发明具体实施方式中提供的一种文字行弯曲的修正系统的第二实施例的结构方框图。如图所示，该系统，包括：

曲线获取模块41，用于获取扫描图片的文字行的曲线。

优选地，所述曲线获取模块41具体用于，根据扫描图片的文字行的黑色像素点确定文字行高度，获取文字行高度的中点，由所述中点组成文字行的曲线。

点获取模块42，用于获取曲线的最高点A和最大切线斜率对应的点B。

夹角计算模块43，用于计算最高点A与点B之间的直线AB与水平线之间的夹角α。

拉直模块44，用于确定所述夹角α大于等于预置角度，对所述文字行进行拉直。

优选地，所述拉直模块44，具体用于：

因为书页拱起的情况包括“从正常到中缝”和“从中缝到正常”两种，对应的扫描图片的文字行的曲线为由平直到弯曲和由弯曲到平直两种，而弯曲部分相对平直部分都是偏高的，因此，拉直模块44对文字行进行拉直时，需要根据曲线的弯曲高度h_n1或h_n2分别将每一份曲线对应的分割的扫描图片向下移动，之后将将移动后的分割的扫描图片进行拼接，得到修正后平直的文字行图片，有效地保证了图片的视觉效果。

识别搜索模块45，用于识别文字行中的文字，使用所述文字进行搜索。

识别搜索模块45识别拉直后平直的文字行中的文字，使用所述文字进行搜索，根据拉直后平直的文字行来进行识别文字和对识别的文字进行搜索，有效地保证了OCR识别和搜索的准确性。

以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理，而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释，本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式，这些方式都将落入本发明的保护范围之内。

Claims

1.一种文字行弯曲的修正方法，其特征在于，包括：

获取扫描图片的文字行的曲线；

获取曲线的最高点A和最大切线斜率对应的点B；

计算最高点A与点B之间的直线AB与水平线之间的夹角α；

确定所述夹角α大于等于预置角度，对所述文字行进行拉直；

所述对所述文字行进行拉直，包括：

分别计算文字行的曲线的起点O与交点C_n2之间的直线OC_n2与水平线之间的夹角β_n2，根据起点O与中点C_n2之间的距离S_n2和夹角β_n2得到每一份曲线的弯曲高度h_n2，所述弯曲高度h_n2＝S_n2·sinβ_n2；

2.根据权利要求1所述的修正方法，其特征在于，所述获取扫描图片的文字行的曲线，包括：根据扫描图片的文字行的黑色像素点确定文字行高度，获取文字行高度的中点，由所述中点组成文字行的曲线。

3.根据权利要求1所述的修正方法，其特征在于，所述预置角度为5°。

4.根据权利要求1所述的修正方法，其特征在于，所述对所述文字行进行拉直之后，还包括：识别文字行中的文字，使用所述文字进行搜索。

5.一种文字行弯曲的修正系统，其特征在于，包括：

曲线获取模块，用于获取扫描图片的文字行的曲线；

拉直模块，用于确定所述夹角α大于等于预置角度，对所述文字行进行拉直；

所述拉直模块，具体用于：

6.根据权利要求5所述的修正系统，其特征在于，所述曲线获取模块具体用于，根据扫描图片的文字行的黑色像素点确定文字行高度，获取文字行高度的中点，由所述中点组成文字行的曲线。

7.根据权利要求5所述的修正系统，其特征在于，所述预置角度为5°。

8.根据权利要求5所述的修正系统，其特征在于，还包括：