CN105512659B - 一种文字行弯曲的修正方法及系统 - Google Patents
一种文字行弯曲的修正方法及系统 Download PDFInfo
- Publication number
- CN105512659B CN105512659B CN201510915323.8A CN201510915323A CN105512659B CN 105512659 B CN105512659 B CN 105512659B CN 201510915323 A CN201510915323 A CN 201510915323A CN 105512659 B CN105512659 B CN 105512659B
- Authority
- CN
- China
- Prior art keywords
- curve
- line
- literal line
- angle
- literal
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Active
Links
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/142—Image acquisition using hand-held instruments; Constructional details of the instruments
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/20—Image preprocessing
- G06V10/26—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
- G06V10/273—Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion removing elements interfering with the pattern to be recognised
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
- G06V30/14—Image acquisition
- G06V30/148—Segmentation of character regions
- G06V30/153—Segmentation of character regions using recognition of characters or words
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/10—Character recognition
Abstract
本发明公开了一种文字行弯曲的修正方法及系统。该方法,包括:获取扫描图片的文字行的曲线;获取曲线的最高点A和最大切线斜率对应的点B;计算最高点A与点B之间的直线AB与水平线之间的夹角α;确定所述夹角α大于等于预置角度,对所述文字行进行拉直。本发明通过计算扫描图片的文字行的曲线的最高点与最大切线斜率对应的点之间的直线与水平线之间的夹角α,确定所述夹角α大于等于预置角度,则对所述文字行进行拉直,本发明可有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题,有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。
Description
技术领域
本发明涉及图像处理技术领域,尤其涉及一种文字行弯曲的修正方法及系统。
背景技术
用户在使用扫描笔的时候,书本未摆放规范、书页拱起而导致的形变,使扫描图片中的文字行弯曲,导致在后续的OCR(Optical Character Recognition,光学字符识别)识别和搜索过程的准确程度受到影响。因此,需要提供一种扫描图片中文字行弯曲的修正方法,以修正弯曲的文字行,保证图片的视觉效果和后续OCR识别和搜索的准确性。
发明内容
本发明提供了一种文字行弯曲的修正方法及系统,有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题,有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。
为实现上述设计,本发明采用以下技术方案:
一方面,提供了一种文字行弯曲的修正方法,该方法,包括:
获取扫描图片的文字行的曲线;
获取曲线的最高点A和最大切线斜率对应的点B;
计算最高点A与点B之间的直线AB与水平线之间的夹角α;
确定所述夹角α大于等于预置角度,对所述文字行进行拉直。
优选地,所述获取扫描图片的文字行的曲线,包括:根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。
优选地,所述对所述文字行进行拉直,包括:
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;
分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn1与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;
分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。
优选地,所述预置角度为5°。
优选地,所述对所述文字行进行拉直之后,还包括:识别文字行中的文字,使用所述文字进行搜索。
另一方面,提供了一种文字行弯曲的修正系统,该系统,包括:
曲线获取模块,用于获取扫描图片的文字行的曲线;
点获取模块,用于获取曲线的最高点A和最大切线斜率对应的点B;
夹角计算模块,用于计算最高点A与点B之间的直线AB与水平线之间的夹角α;
拉直模块,用于确定所述夹角α大于等于预置角度,对所述文字行进行拉直。
优选地,所述曲线获取模块具体用于,根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。
优选地,所述拉直模块,具体用于:
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;
分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn1与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;
分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。
优选地,所述预置角度为5°。
优选地,还包括:
识别搜索模块,用于识别文字行中的文字,使用所述文字进行搜索。
与现有技术相比,本发明的有益效果为:获取扫描图片的文字行的曲线;获取曲线的最高点A和最大切线斜率对应的点B;计算最高点A与点B之间的直线AB与水平线之间的夹角α;确定所述夹角α大于等于预置角度,对所述文字行进行拉直。本发明通过计算扫描图片的文字行的曲线的最高点与最大切线斜率对应的点之间的直线与水平线之间的夹角α,确定所述夹角α大于等于预置角度,则对所述文字行进行拉直,本发明可有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题,有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对本发明实施例描述中所需要使用的附图作简单的介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据本发明实施例的内容和这些附图获得其他的附图。
图1是本发明具体实施方式中提供的一种文字行弯曲的修正方法的第一实施例的方法流程图。
图2是本发明具体实施方式中提供的一种文字行弯曲的修正方法的第二实施例的方法流程图。
图3是本发明具体实施方式中提供的一种文字行弯曲的修正系统的第一实施例的结构方框图。
图4是本发明具体实施方式中提供的一种文字行弯曲的修正系统的第二实施例的结构方框图。
具体实施方式
为使本发明解决的技术问题、采用的技术方案和达到的技术效果更加清楚,下面将结合附图对本发明实施例的技术方案作进一步的详细描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
请参考图1,其是本发明具体实施方式中提供的一种文字行弯曲的修正方法的第一实施例的方法流程图。如图所示,该方法,包括:
步骤S101:获取扫描图片的文字行的曲线。
优选地,所述获取扫描图片的文字行的曲线,包括:根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。
由于书本中缝的存在使得书页拱起有两种情况:一种是“从正常到中缝”,另一种是“从中缝到正常”。如果得到的扫描图片的文字行的曲线由平直到弯曲,则属于“从正常到中缝”的情况;若果得到的扫描图片的文字行的曲线由弯曲到平直,则属于“从中缝到正常”的情况。
步骤S102:获取曲线的最高点A和最大切线斜率对应的点B。
获取曲线的最高点A,计算扫描图片的文字行的曲线的切线的斜率,得到最大切线斜率对应的点B。
步骤S103:计算最高点A与点B之间的直线AB与水平线之间的夹角α。
步骤S104:确定所述夹角α大于等于预置角度,对所述文字行进行拉直。
优选地,当所述夹角α大于等于预置角度时,说明扫描图片的文字行的曲线弯曲的程度比较严重,会影响后续的OCR识别和搜索构成的准确程度,因此需要对所述文字行进行拉直。优选地,所述预置角度为5°,用户也可以根据修正效果来对预置角度进行设置。
优选地,所述对所述文字行进行拉直,包括:
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;
分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn1与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;
分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。
因为书页拱起的情况包括“从正常到中缝”和“从中缝到正常”两种,对应的扫描图片的文字行的曲线为由平直到弯曲和由弯曲到平直两种,而弯曲部分相对平直部分都是偏高的,因此,对文字行进行拉直时,需要根据曲线的弯曲高度hn1或hn2分别将每一份曲线对应的分割的扫描图片向下移动,之后将将移动后的分割的扫描图片进行拼接,得到修正后平直的文字行图片,有效地保证了图片的视觉效果。
综上所述,本实施例通过计算扫描图片的文字行的曲线的最高点与最大切线斜率对应的点之间的直线与水平线之间的夹角α,确定所述夹角α大于等于预置角度,则对所述文字行进行拉直,本实施例可有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题,有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。
请参考图2,其是本发明具体实施方式中提供的一种文字行弯曲的修正方法的第二实施例的方法流程图。如图所示,该方法,包括:
步骤S201:获取扫描图片的文字行的曲线。
优选地,所述获取扫描图片的文字行的曲线,包括:根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。
步骤S202:获取曲线的最高点A和最大切线斜率对应的点B。
步骤S203:计算最高点A与点B之间的直线AB与水平线之间的夹角α。
步骤S204:确定所述夹角α大于等于预置角度,对所述文字行进行拉直。
优选地,当所述夹角α大于等于预置角度时,说明扫描图片的文字行的曲线弯曲的程度比较严重,影响后续的OCR识别和搜索构成的准确程度,因此需要对所述文字行进行拉直。优选地,所述预置角度为5°,用户也可以根据修正效果来对预置角度进行设置。
优选地,所述对所述文字行进行拉直,包括:
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;
分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn1与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;
分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。
因为书页拱起的情况包括“从正常到中缝”和“从中缝到正常”两种,对应的扫描图片的文字行的曲线为由平直到弯曲和由弯曲到平直两种,而弯曲部分相对平直部分都是偏高的,因此,对文字行进行拉直时,需要根据曲线的弯曲高度hn1或hn2分别将每一份曲线对应的分割的扫描图片向下移动,之后将将移动后的分割的扫描图片进行拼接,得到拉直后平直的文字行图片,有效地保证了图片的视觉效果。
步骤S205:识别文字行中的文字,使用所述文字进行搜索。
识别拉直后平直的文字行中的文字,使用所述文字进行搜索,根据拉直后平直的文字行来进行识别文字和对识别的文字进行搜索,有效地保证了OCR识别和搜索的准确性。
以下是本发明具体实施方式中提供的一种文字行弯曲的修正系统的实施例,系统的实施例基于上述的方法的实施例实现,在系统中未尽的描述,请参考前述方法的实施例。
请参考图3,其是本发明具体实施方式中提供的一种文字行弯曲的修正系统的第一实施例的结构方框图。如图所示,该系统,包括:
曲线获取模块31,用于获取扫描图片的文字行的曲线。
优选地,所述曲线获取模块31具体用于,根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。
点获取模块32,用于获取曲线的最高点A和最大切线斜率对应的点B。
夹角计算模块33,用于计算最高点A与点B之间的直线AB与水平线之间的夹角α。
拉直模块34,用于确定所述夹角α大于等于预置角度,对所述文字行进行拉直。
优选地,当所述夹角α大于等于预置角度时,说明扫描图片的文字行的曲线弯曲的程度比较严重,会影响后续的OCR识别和搜索构成的准确程度,因此需要对所述文字行进行拉直。优选地,所述预置角度为5°,用户也可以根据修正效果来对预置角度进行设置。
优选地,所述拉直模块34,具体用于:
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;
分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn1与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;
分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。
因为书页拱起的情况包括“从正常到中缝”和“从中缝到正常”两种,对应的扫描图片的文字行的曲线为由平直到弯曲和由弯曲到平直两种,而弯曲部分相对平直部分都是偏高的,因此,拉直模块34对文字行进行拉直时,需要根据曲线的弯曲高度hn1或hn2分别将每一份曲线对应的分割的扫描图片向下移动,之后将将移动后的分割的扫描图片进行拼接,得到修正后平直的文字行图片,有效地保证了图片的视觉效果。
综上所述,本实施例通过计算扫描图片的文字行的曲线的最高点与最大切线斜率对应的点之间的直线与水平线之间的夹角α,确定所述夹角α大于等于预置角度,则对所述文字行进行拉直,本实施例可有效地修正因为书页拱起而导致的扫描图片的文字行弯曲的问题,有效地保证图片的视觉效果和后续OCR识别和搜索的准确性。
请参考图4,其是本发明具体实施方式中提供的一种文字行弯曲的修正系统的第二实施例的结构方框图。如图所示,该系统,包括:
曲线获取模块41,用于获取扫描图片的文字行的曲线。
优选地,所述曲线获取模块41具体用于,根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。
点获取模块42,用于获取曲线的最高点A和最大切线斜率对应的点B。
夹角计算模块43,用于计算最高点A与点B之间的直线AB与水平线之间的夹角α。
拉直模块44,用于确定所述夹角α大于等于预置角度,对所述文字行进行拉直。
优选地,当所述夹角α大于等于预置角度时,说明扫描图片的文字行的曲线弯曲的程度比较严重,会影响后续的OCR识别和搜索构成的准确程度,因此需要对所述文字行进行拉直。优选地,所述预置角度为5°,用户也可以根据修正效果来对预置角度进行设置。
优选地,所述拉直模块44,具体用于:
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;
分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn1与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;
分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。
因为书页拱起的情况包括“从正常到中缝”和“从中缝到正常”两种,对应的扫描图片的文字行的曲线为由平直到弯曲和由弯曲到平直两种,而弯曲部分相对平直部分都是偏高的,因此,拉直模块44对文字行进行拉直时,需要根据曲线的弯曲高度hn1或hn2分别将每一份曲线对应的分割的扫描图片向下移动,之后将将移动后的分割的扫描图片进行拼接,得到修正后平直的文字行图片,有效地保证了图片的视觉效果。
识别搜索模块45,用于识别文字行中的文字,使用所述文字进行搜索。
识别搜索模块45识别拉直后平直的文字行中的文字,使用所述文字进行搜索,根据拉直后平直的文字行来进行识别文字和对识别的文字进行搜索,有效地保证了OCR识别和搜索的准确性。
以上结合具体实施例描述了本发明的技术原理。这些描述只是为了解释本发明的原理,而不能以任何方式解释为对本发明保护范围的限制。基于此处的解释,本领域的技术人员不需要付出创造性的劳动即可联想到本发明的其它具体实施方式,这些方式都将落入本发明的保护范围之内。
Claims (8)
1.一种文字行弯曲的修正方法,其特征在于,包括:
获取扫描图片的文字行的曲线;
获取曲线的最高点A和最大切线斜率对应的点B;
计算最高点A与点B之间的直线AB与水平线之间的夹角α;
确定所述夹角α大于等于预置角度,对所述文字行进行拉直;
所述对所述文字行进行拉直,包括:
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;
分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn2与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;
分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。
2.根据权利要求1所述的修正方法,其特征在于,所述获取扫描图片的文字行的曲线,包括:根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。
3.根据权利要求1所述的修正方法,其特征在于,所述预置角度为5°。
4.根据权利要求1所述的修正方法,其特征在于,所述对所述文字行进行拉直之后,还包括:识别文字行中的文字,使用所述文字进行搜索。
5.一种文字行弯曲的修正系统,其特征在于,包括:
曲线获取模块,用于获取扫描图片的文字行的曲线;
点获取模块,用于获取曲线的最高点A和最大切线斜率对应的点B;
夹角计算模块,用于计算最高点A与点B之间的直线AB与水平线之间的夹角α;
拉直模块,用于确定所述夹角α大于等于预置角度,对所述文字行进行拉直;
所述拉直模块,具体用于:
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n份,取每一份曲线的中点Cn1,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与每一份曲线的中点Cn1之间的直线OCn1与水平线之间的夹角βn1,根据起点O与中点Cn1之间的距离Sn1和夹角βn1得到每一份曲线的弯曲高度hn1,所述弯曲高度hn1=Sn1·sinβn1;
分别根据曲线的弯曲高度hn1分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接;或
把所述扫描图片按横向方向分割成n等份,对应的文字行的曲线也分成了n分,取每份图片的纵向方向的中线,取每份图片中所述中线与曲线的交点Cn2,取文字行的曲线的起点O;
分别计算文字行的曲线的起点O与交点Cn2之间的直线OCn2与水平线之间的夹角βn2,根据起点O与中点Cn2之间的距离Sn2和夹角βn2得到每一份曲线的弯曲高度hn2,所述弯曲高度hn2=Sn2·sinβn2;
分别根据曲线的弯曲高度hn2分别将每一份曲线对应的分割的扫描图片向下移动,将移动后的分割的扫描图片进行拼接。
6.根据权利要求5所述的修正系统,其特征在于,所述曲线获取模块具体用于,根据扫描图片的文字行的黑色像素点确定文字行高度,获取文字行高度的中点,由所述中点组成文字行的曲线。
7.根据权利要求5所述的修正系统,其特征在于,所述预置角度为5°。
8.根据权利要求5所述的修正系统,其特征在于,还包括:
识别搜索模块,用于识别文字行中的文字,使用所述文字进行搜索。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510915323.8A CN105512659B (zh) | 2015-12-10 | 2015-12-10 | 一种文字行弯曲的修正方法及系统 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN201510915323.8A CN105512659B (zh) | 2015-12-10 | 2015-12-10 | 一种文字行弯曲的修正方法及系统 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN105512659A CN105512659A (zh) | 2016-04-20 |
CN105512659B true CN105512659B (zh) | 2019-05-21 |
Family
ID=55720626
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN201510915323.8A Active CN105512659B (zh) | 2015-12-10 | 2015-12-10 | 一种文字行弯曲的修正方法及系统 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN105512659B (zh) |
Families Citing this family (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106650719B (zh) * | 2016-12-21 | 2020-04-10 | 浙江宇视科技有限公司 | 识别图片文字的方法及装置 |
CN109753971B (zh) * | 2017-11-06 | 2023-04-28 | 阿里巴巴集团控股有限公司 | 扭曲文字行的矫正方法及装置、字符识别方法及装置 |
CN110057316A (zh) * | 2019-04-25 | 2019-07-26 | 华南理工大学 | 一种基于无人机图像识别的建筑塔机杆件屈曲监测的方法 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101930594A (zh) * | 2010-04-14 | 2010-12-29 | 山东山大鸥玛软件有限公司 | 一种扫描文档图像的快速纠偏方法 |
CN102184396A (zh) * | 2011-06-13 | 2011-09-14 | 北方工业大学 | 基于ocr识别反馈的文档图像倾斜校正方法 |
CN104598638A (zh) * | 2015-02-09 | 2015-05-06 | 深圳市菁优网络科技有限公司 | 一种基于互联网题库和二维码的试题解答方法 |
Family Cites Families (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP4803274B2 (ja) * | 2009-03-19 | 2011-10-26 | コニカミノルタビジネステクノロジーズ株式会社 | 画像処理方法およびコンピュータプログラム |
-
2015
- 2015-12-10 CN CN201510915323.8A patent/CN105512659B/zh active Active
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN101930594A (zh) * | 2010-04-14 | 2010-12-29 | 山东山大鸥玛软件有限公司 | 一种扫描文档图像的快速纠偏方法 |
CN102184396A (zh) * | 2011-06-13 | 2011-09-14 | 北方工业大学 | 基于ocr识别反馈的文档图像倾斜校正方法 |
CN104598638A (zh) * | 2015-02-09 | 2015-05-06 | 深圳市菁优网络科技有限公司 | 一种基于互联网题库和二维码的试题解答方法 |
Also Published As
Publication number | Publication date |
---|---|
CN105512659A (zh) | 2016-04-20 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN100464346C (zh) | 一种表格图像几何畸变的数字校正方法 | |
US8194983B2 (en) | Method and system for preprocessing an image for optical character recognition | |
CN105512659B (zh) | 一种文字行弯曲的修正方法及系统 | |
US8218875B2 (en) | Method and system for preprocessing an image for optical character recognition | |
JP3822468B2 (ja) | 画像処理装置及びその方法 | |
CN111127339B (zh) | 一种文档图像的梯形畸变矫正方法及装置 | |
CN101697228A (zh) | 一种文本图像处理方法 | |
US8675969B2 (en) | Method and apparatus for detecting page boundaries | |
CN102622593A (zh) | 一种文本识别方法及系统 | |
JP4784500B2 (ja) | 画像傾き補正装置及び画像傾き補正方法 | |
JP2014072626A (ja) | 画像処理装置、画像処理システム、画像処理方法、及び画像処理プログラム | |
CN101887521A (zh) | 一种实现文件纠偏的方法及终端 | |
US9124746B2 (en) | Image-reading device and computer-readable storage medium | |
US9317766B2 (en) | Method and device for extracting distorted straight line from image | |
JP6383441B2 (ja) | 画像読取装置および画像読取方法ならびに画像読取プログラム | |
US9769347B2 (en) | Image capturing method | |
CN111145124A (zh) | 一种图像倾斜的校正方法及装置 | |
CN100363940C (zh) | 一种文稿图像几何畸变的校正方法 | |
CN110717874A (zh) | 一种图像轮廓线平滑处理方法 | |
CN106650719B (zh) | 识别图片文字的方法及装置 | |
CN110097065A (zh) | 一种基于FreeMan链码的直线检测方法及终端 | |
JP6171165B2 (ja) | 運転免許証読取装置及び運転免許証読取方法 | |
CN107451505A (zh) | 快递单条形码的角度校正方法 | |
JP7059514B2 (ja) | 文字認識装置、文字認識方法、および、文字認識プログラム | |
CN107680046A (zh) | 影像矫正方法、装置、存储介质和计算机设备 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
C06 | Publication | ||
PB01 | Publication | ||
C10 | Entry into substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |