CN107239776B - 倾斜图像校正的方法和装置 - Google Patents

倾斜图像校正的方法和装置 Download PDF

Info

Publication number
CN107239776B
CN107239776B CN201710316489.7A CN201710316489A CN107239776B CN 107239776 B CN107239776 B CN 107239776B CN 201710316489 A CN201710316489 A CN 201710316489A CN 107239776 B CN107239776 B CN 107239776B
Authority
CN
China
Prior art keywords
character
image
correction
line
characters
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN201710316489.7A
Other languages
English (en)
Other versions
CN107239776A (zh
Inventor
庞龙
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
JD Digital Technology Holdings Co Ltd
Jingdong Technology Holding Co Ltd
Original Assignee
JD Digital Technology Holdings Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by JD Digital Technology Holdings Co Ltd filed Critical JD Digital Technology Holdings Co Ltd
Priority to CN201710316489.7A priority Critical patent/CN107239776B/zh
Publication of CN107239776A publication Critical patent/CN107239776A/zh
Application granted granted Critical
Publication of CN107239776B publication Critical patent/CN107239776B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/146Aligning or centring of the image pick-up or image-field
    • G06V30/1475Inclination or skew detection or correction of characters or of image to be recognised
    • G06V30/1478Inclination or skew detection or correction of characters or of image to be recognised of characters or characters lines
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Character Input (AREA)

Abstract

本发明实施例提供一种倾斜图像校正的方法和装置,能够以较小的运算量准确地对倾斜图像进行校正,并能够判断校正后的图像是否倒置,进而对倒置的图像进行调整。本发明实施例的倾斜图像校正的方法包括:切分图像中的字符;构建穿过切分的字符的至少一条测试线;确定所述至少一条测试线中其穿过切分的字符的数量大于预设字符数阈值的测试线作为校正线来校正图像。

Description

倾斜图像校正的方法和装置
技术领域
本发明涉及计算机领域,尤其涉及一种倾斜图像校正的方法和装置。
背景技术
如今,证件信息提取已经广泛应用于各种场景中。证件信息提取通常的流程是:先通过扫描证件或拍照得到证件图像,再利用技术手段识别图像中的关键信息。但是,在拍照或扫描过程中,由于各种原因,证件图像可能会产生一定的倾斜,这对后期证件信息的提取会产生较大影响,容易导致证件信息提取不全、错误,甚至无法提取到证件信息,因此有必要对倾斜的图像进行校正。
现有技术中倾斜图像校正的流程一般如下:
S01.利用图像采集设备获取证件图像。
S02.对证件图像进行灰度处理。
S03.对灰度图像进行边缘检测。
S04.利用Hough变换进行图像边框直线检测,计算图像倾斜角度。
S05.利用所述倾斜角度旋转图像以实现校正。上述具体流程如图1所示。
在实现本发明的过程中,发明人发现现有技术至少存在以下问题:
1.现有技术中采用Hough变换来计算倾斜角度,由于Hough变换需要对所有像素点进行重复计算,需要较大的计算量和较长的运算时间,这使得图像校正效率较低。
2.现有技术是通过检测图像的轮廓而进行旋转的,对于产生180度偏转的图像,不能判断其正反。
3.在受到噪点影响,背景与图像信息不分明的时候,现有技术很难将轮廓提取出来,导致无法实现校正。
4.现有技术采用Hough变换检测直线时,由于图片背景各异,通常会检测出较多的干扰线,从而无法确定图像边框直线。
发明内容
有鉴于此,本发明实施例提供一种倾斜图像校正的方法和装置,能够以较小的运算量准确地对倾斜图像进行校正,并能够判断校正后的图像是否倒置,进而对倒置的图像进行调整。
为实现上述目的,根据本发明的一个方面,提供了一种倾斜图像校正的方法。
本发明实施例的倾斜图像校正的方法包括:切分图像中的字符;构建穿过切分的字符的至少一条测试线;确定所述至少一条测试线中其穿过切分的字符的数量大于预设字符数阈值的测试线作为校正线来校正图像。
可选地,所述切分图像中的字符包括:检测图像中的字符,根据检测的字符的端点建立容纳所述字符的字符框;以及所述穿过切分的字符包括:穿过容纳该字符的字符框。
可选地,所述方法进一步包括:确定容纳每一字符框的判断范围、以及所述判断范围内的多个端点字符框;连接不同的端点字符框的中心点,形成至少一条测试线;统计每条测试线在所述判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较;如果存在该数量大于预设字符数阈值的测试线,则将该测试线作为校正线。
可选地,所述方法进一步包括:建立容纳每一字符框的判断范围、以及所述判断范围内的多个端点字符框;针对每一端点字符框:在所述判断范围内确定该端点字符框的相邻字符框;以该端点字符框的中心点为起点,构建穿过所述相邻字符框中心点的射线;统计每条射线在所述判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较;如果存在该数量大于预设字符数阈值的射线,则将该射线作为校正线。
可选地,确定该端点字符框的相邻字符框包括:获取与该端点字符框的距离小于预设距离阈值、且字符框面积小于预设面积阈值的至少一个字符框,将所述至少一个字符框中与该端点字符框距离最小的字符框确定为该端点字符框的相邻字符框。
可选的,所述方法进一步包括:计算所述校正线与目标方向的夹角,根据所述夹角旋转图像以实现校正。
可选地,所述方法进一步包括:校正图像后,根据所述校正线在校正后的图像中的位置判断所述校正后的图像是否倒置:若是,将该图像旋转180°。
为实现上述目的,根据本发明的另一方面,提供了一种倾斜图像校正的装置。
本发明实施例的倾斜图像校正的装置可包括:切分模块,可用于切分图像中的字符;测试线构建模块,可用于构建穿过切分的字符的至少一条测试线;校正线提取模块,可用于确定所述至少一条测试线中其穿过切分的字符的数量大于预设字符数阈值的测试线作为校正线来校正图像。
可选地,切分模块可包括:检测模块,可用于检测图像中的字符;字符框建立模块,可用于根据检测的字符的端点建立容纳所述字符的字符框;以及穿过切分的字符包括:穿过容纳切分的字符的字符框。
可选地,测试线构建模块可包括:第一确定模块,可用于确定容纳每一字符框的判断范围、以及所述判断范围内的多个端点字符框;第一测试线生成模块,可用于连接不同的端点字符框的中心点,形成至少一条测试线;第二测试线生成模块,可用于针对每一端点字符框:在所述判断范围内确定该端点字符框的相邻字符框;以该端点字符框的中心点为起点,构建穿过所述相邻字符框中心点的射线作为测试线。
可选地,校正线提取模块可包括:校正线确定模块,可用于统计第一测试线生成模块、或第二测试线生成模块生成的每条测试线在所述判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较;如果存在该数量大于预设字符数阈值的测试线,则将该测试线作为校正线。
可选地,所述装置进一步包括:校正模块,可用于计算所述校正线与目标方向的夹角,根据所述夹角旋转图像以实现校正。
可选地,所述装置进一步包括:倒置调整模块,可用于根据所述校正线在校正后的图像中的位置判断所述校正后的图像是否倒置:若是,将该图像旋转180°。
为实现上述目的,根据本发明的再一方面,提供了一种电子设备。
本发明的一种电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明所提供的倾斜图像校正的方法。
为实现上述目的,根据本发明的再一方面,提供了一种计算机可读存储介质。
本发明的一种计算机可读存储介质,其上存储有计算机程序,所述程序被处理器执行时实现本发明所提供的倾斜图像校正的方法。
根据本发明的技术方案,上述发明中的一个实施例具有如下优点或有益效果:通过为切分的字符设置字符框,利用字符框构建若干测试线,根据穿过字符框的数量特征从测试线里确定校正线,从而以较小的运算量实现了倾斜图像的准确校正,大幅提高了倾斜图像校正的效率,并为字符的后续识别提供了基础,解决了现有技术中运算量大、耗时较长、校正效率低的问题;由于从数量较少的测试线中选取校正线,且不需提取图像轮廓,避免了现有技术中干扰线较多、高噪声背景下轮廓难以提取的问题,提升了图像校正质量;通过判断校正线在校正后的图像中的位置来检测图像是否倒置,进而实现倒置图像的自动翻转,克服了现有技术中无法处理倒置图像的缺陷。
上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
附图用于更好地理解本发明,不构成对本发明的不当限定。其中:
图1是现有技术中倾斜图像校正的流程示意图;
图2是根据本发明实施例的倾斜图像校正的方法的主要步骤示意图;
图3是根据本发明实施例的倾斜图像校正的方法的字符框建立示意图;
图4是根据本发明实施例的倾斜图像校正的方法的校正线提取示意图;
图5是根据本发明实施例的倾斜图像校正的方法的第二次判断范围确定示意图;
图6是根据本发明实施例的倾斜图像校正的装置的主要部分的示意图;
图7是用来实现本发明实施例的倾斜图像校正的方法的电子设备的结构示意图。
具体实施方式
以下结合附图对本发明的示范性实施例做出说明,其中包括本发明实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本发明的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本发明实施例的技术方案通过为切分的字符设置字符框,利用字符框构建若干测试线,根据穿过字符框的数量特征从测试线里确定校正线,从而以较小的运算量实现了倾斜图像的准确校正,大幅提高了倾斜图像校正的效率,并为字符的后续识别提供了基础,解决了现有技术中运算量大、耗时较长、校正效率低的问题;由于从数量较少的测试线中选取校正线,且不需提取图像轮廓,避免了现有技术中干扰线较多、高噪声背景下轮廓难以提取的问题,提升了图像校正质量;通过判断校正线在校正后的图像中的位置来检测图像是否倒置,进而实现倒置图像的自动翻转,克服了现有技术中无法处理倒置图像的缺陷。
图2是根据本发明实施例的倾斜图像校正的方法的主要步骤的示意图。
如图2所示,本发明实施例的倾斜图像校正的方法主要包括如下步骤:
步骤S1:切分图像中的字符。本步骤的目的在于:提取图像中的字符,并利用字符框对字符进行切分。
在本发明实施例中,在步骤S1之前,以图像的中心为原点,以目标方向为X轴方向,建立平面直角坐标系。上述目标方向可以是期望的校正后的图像中的特征线所指的方向,特征线具体为图像中具有定向作用的直线,例如:对于身份证图像来说,其矩形轮廓下边所在的直线或穿过“公民身份号码xxxxxxxxxx”中字符中心的直线都可以作为特征线。在本发明实施例中,当旋转图像使图像中的特征线处于目标方向时,说明图像处于已校正状态。
较佳地,在本发明实施例中,步骤S1可以包括:检测图像中的字符,根据检测的字符的端点建立容纳字符的字符框。所述字符的端点指的是字符的横坐标最大、最小的两个像素点、以及字符的纵坐标最大、最小的两个像素点,基于四个端点在X、Y方向构建矩形字符框即可包括该字符的全部像素点,即容纳该字符。
具体应用中,可以利用MSER(Maximally Stable Extremal Regions,最大稳定极值区域)算法来实现字符的切分,MSER算法可通过OpenCv(Open Source Computer VisionLibrary,开源计算机视觉算法库)的CvExtractMSER函数实现。在MSER算法处理图像之前,首先需要对图像进行灰度处理。MSER算法的具体步骤如下:
1.利用不同灰度阈值对图像进行二值化处理。
2.对于每个阈值得到的二值化图像,获取相应的黑色区域与白色区域。
3.在预设的灰度阈值内提取保持形状稳定的区域,即为最大稳定极值区域。
4.提取同一区域内所有像素点横纵坐标的最小和最大值x1、x2、y1、y2,组合得到四个坐标点(x1,y1)、(x1,y2)、(x2,y1)、(x2,y2)。
5.以步骤4中的四个坐标点作为矩形的四个角,同一区域内的所有像素点均在这四个点围成的矩形字符框内。
图3是根据本发明实施例的倾斜图像校正的方法的字符框建立示意图,上述步骤4、5的具体执行可参见图3。
步骤S2:构建穿过切分的字符的至少一条测试线。
实际应用中,穿过切分的字符可以是穿过该字符对应的字符框。在本发明实施例中,测试线穿过字符框可以是:在字符框自身及内部的像素点中,至少有一个像素点在测试线上。所述测试线一般为直线、射线或线段。在本步骤中,利用切分字符形成的字符框生成若干测试线,从中可提取校正线。
步骤S3:确定至少一条测试线中其穿过切分的字符的数量大于预设字符数阈值的测试线作为校正线来校正图像。
在本步骤中,预设字符数阈值可根据待校正图像的字符排列特征灵活选取,而穿过字符框的数量大于预设字符数阈值的测试线通常对应于图像中呈直线排列、且包含较多字符的字符串,该字符串在图像中往往具有较为明显的区别特征,将所述测试线作为校正线可准确地实现图像的校正。特别地,在本发明的实施例中,字符串指的是由多个字符组成的具有一定形状特征的集合。
实际应用中,使用频率较高的图像如身份证、驾驶证、车牌号等通常含有呈直线排列、包括最多字符、且处于图像外侧的字符串。呈直线排列具体为:字符串中各字符框中心点的排列符合预设的直线排列规则,直线排列规则可以根据实际需要灵活设置。包括最多字符具体为:在图像中呈直线排列的字符串中该字符串包含的字符数量最大。处于图像外侧指的是该呈直线排列的字符串的两端处于图像外侧,这样当图像倾斜时,处于该字符串两端的字符框可以成为判断范围内的端点字符框。
例如:在身份证图像中,“公民身份号码xxxxxxxxxx”包括24个字符,其即为图像中呈直线排列、包括最多字符、且处于图像外侧的字符串。
本发明实施例的倾斜图像校正的方法可以提取对应于上述呈直线排列、包括最多字符、且处于图像外侧的字符串的测试线作为校正线对图像进行校正。需要说明的是,本发明实施例的倾斜图像校正的方法也可对不具有上述特征的其它图像进行校正。
特别地,在本发明实施例中,预设字符数阈值可以根据包括最多字符的上述字符串选取,而该字符串包括的字符数与其它字符串相比往往较为悬殊,因此在步骤S2生成的若干测试线中,穿过字符框的数量大于预设字符数阈值的测试线只能是穿过上述字符串的测试线。
例如:在身份证图像中,可以根据字符串“公民身份号码xxxxxxx”设置字符数阈值,如将字符数阈值设置为15。在确定校正线时,穿过字符框大于15的测试线一般只能是穿过“公民身份号码xxxxx”的测试线。
在本发明实施例中,如果穿过字符框的数量大于预设字符数阈值的测试线只有一条,将其作为校正线;如果穿过字符框的数量大于预设字符数阈值的测试线大于一条,则将大于一条的测试线都作为校正线。
在本发明的实施例中,构建测试线并从中确定校正线可按照以下步骤执行:
步骤S21:确定容纳每一字符框的判断范围以及判断范围内的多个端点字符框。在本发明实施例中,容纳字符框具体为:包括字符框的全部像素点,而字符框的全部像素点具体为:字符框自身以及内部的全部像素点。
较佳地,判断范围一般为可包含图像中所有字符框的最小矩形。判断范围可以根据以下步骤确定:
1.以所有字符框中横坐标最小的一个点做一条垂直于x轴的直线,作为判断范围的左边界。
2.以所有字符边框横坐标最大的一个点做一条垂直于x轴的直线,作为判断范围的右边界。
3.以所有字符边框纵坐标最大的一个点做一条垂直于y轴的直线,作为判断范围的上边界。
4.以所有字符边框纵坐标最小的一个点做一条垂直于y轴的直线,作为判断范围的下边界。
这样,四条边界即组成判断范围。
图4是根据本发明实施例的倾斜图像校正的方法的校正线提取示意图。从图4中可以看到通过上述步骤确定的判断范围。
在本发明实施例中,端点字符框为图像的所有字符框中横坐标最大、最小,纵坐标最大、最小的四个字符框。也就是说,在判断范围确定横坐标最大、最小,纵坐标最大、最小的四个像素点,四个像素点所在的字符框即为端点字符框。在图4中,端点字符框为与判断范围产生重叠的最上方字符框、最下方字符框、最左侧字符框、最右侧字符框。
步骤S22:连接不同的端点字符框的中心点,形成至少一条测试线。
例如:连接最下方字符框与最左侧字符框的中心点,连接最上方字符框与最左侧字符框的中心点,连接最下方字符框与最右侧字符框的中心点,连接最上方字符框与最右侧字符框的中心点,可以形成四条测试线。
步骤S23:统计每条测试线在判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较:如果存在穿过的字符框的数量大于预设字符数阈值的测试线,则将该测试线作为校正线,结束流程。
在图4中,可选取预设字符数阈值为15,判断上述测试线是否穿过15个以上的字符框,将穿过15个以上的字符框的测试线确定为校正线。
步骤S24:如果不存在穿过的字符框的数量大于预设字符数阈值的测试线,则去除全部端点字符框,依次执行步骤S21、S22、S23、S24,并记录重复执行次数;当重复执行次数达到预设重复次数阈值时结束执行。
在本发明实施例中,如果不存在穿过的字符框的数量大于预设字符数阈值的测试线,则说明此次校正线提取失败,则将端点字符框去除,缩小判断范围,重新进行校正线的提取。在步骤S24中,如果此前的步骤没有确定校正线,则去除此前的全部端点字符框,重新执行步骤S21—S24;在每一次重新执行完成时,记录重复执行次数。一般地,重新提取的次数不超过3次,即重复执行次数取为3。在重复3次提取校正线的过程中,如果提取到校正线,则根据该校正线校正图像;否则,结束流程,说明校正线提取失败。
图5是根据本发明实施例的倾斜图像校正的方法的第二次判断范围确定示意图。从图5中可以看到:在第一次提取校正线失败后,将上述最上方字符框、最下方字符框、最左侧字符框、最右侧字符框去除,返回步骤S21缩小判断范围,进行校正线的第二次提取。
在本发明的实施例中,构建测试线并从中确定校正线还可以按照以下步骤执行:
步骤S41:建立容纳每一字符框的判断范围以及判断范围内的多个端点字符框。
步骤S42:针对每一端点字符框:在判断范围内确定该端点字符框的相邻字符框。以该端点字符框的中心点为起点,构建穿过相邻字符框中心点的射线。在本步骤中,基于端点字符框及其相邻字符框构建射线作为测试线,从中可确定校正线。
例如:在图4中,可以以最上方字符框的中心点为起点,构建通过其相邻字符框中心点的射线;以最下方字符框的中心点为起点,构建通过其相邻字符框中心点的射线;以最左侧字符框的中心点为起点,构建通过其相邻字符框中心点的射线;以最右侧字符框的中心点为起点,构建通过其相邻字符框中心点的射线。这样可以形成如图4所示的4条测试线。
在本发明实施例中,确定该端点字符框的相邻字符框可以包括:获取与该端点字符框的距离小于预设距离阈值且字符框面积小于预设面积阈值的至少一个字符框,将获取的字符框中与该端点字符框距离最小的字符框确定为该端点字符框的相邻字符框。其中:预设距离阈值与预设面积阈值可根据实际需求灵活设置,比如将预设距离阈值设置为端点字符框长边长度的二倍,将预设面积阈值设置为端点字符框面积的二倍。字符框之间的距离指的是字符框中心点之间的距离。通过上述设置,可以将与端点字符框距离较远或面积较大的字符框排除,确保相邻字符框与端点字符框距离较近且面积相近,由此可以减少干扰线的产生,提升图像校正质量。
步骤S43:统计每条射线在判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较:如果存在一条穿过的字符框的数量大于预设字符数阈值的射线,则将该射线作为校正线,结束流程。
步骤S44:如果不存在穿过的字符框的数量大于预设字符数阈值的射线,则去除端点字符框,依次步骤S41、S42、S43、S44,并记录重复执行次数;当重复执行次数达到预设重复次数阈值时结束执行。在本发明实施例中,重复执行次数可取为3。在重复3次提取校正线的过程中,如果提取到校正线,则根据该校正线校正图像;否则,结束流程,说明校正线提取失败。
在本发明的实施例中,构建测试线并从中确定校正线还可以按照以下步骤执行:
步骤S21:确定容纳每一字符框的判断范围以及判断范围内的多个端点字符框。
步骤S22:连接不同的端点字符框的中心点,形成至少一条测试线。
步骤S23:统计每条测试线在判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较。如果存在穿过的字符框的数量大于预设字符数阈值的测试线,则将该测试线作为校正线。
如果步骤S23没有提取到校正线,则按照以下步骤执行:
步骤S42:针对每一端点字符框:在所述判断范围内确定该端点字符框的相邻字符框。以该端点字符框的中心点为起点,构建穿过相邻字符框中心点的射线。
步骤S43:统计每条射线在判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较:如果存在一条穿过的字符框的数量大于预设字符数阈值的射线,则将该射线作为校正线,结束流程。
如果步骤S43没有提取到校正线,则去除端点字符框,依次执行步骤S21、S22、S23、S42、S43,并记录重复执行次数。当重复执行次数达到预设重复次数阈值时结束执行。
在本发明实施例中,确定校正线之后,计算校正线与目标方向的夹角,根据该夹角旋转图像以实现校正。所述夹角可以为校正线与X轴形成的锐角或直角。
具体地,如果确定的校正线只有一条,则利用其夹角计算图像的倾斜角度从而实现校正。由于本发明实施例中的目标方向——即特征线的期望方向——为X轴,因此可以认为上述夹角即为图像的倾斜角度,将图像旋转该夹角角度,使校正线处于X轴即可实现图像的校正。如果确定的校正线不只一条,可以计算各夹角的算术平均值,将图像旋转该平均值角度即可实现校正;也可以选取其中任一条作为校正线进行图像校正。
较佳地,在校正图像后,本发明实施例的倾斜图像校正的方法能够判断图像是否倒置。如果倒置,将其旋转180°实现图像的倒置校正。具体地,在本发明实施例中,倒置判断的过程如下:
1.确定校正线对应的字符串在现实中的图像中的位置。例如:校正线对应的“公民身份号码xxxxxxxx”在身份证的下方。
2.确定该字符串在待判断图像中的位置。
3.进行倒置判断:如果上述二位置相同,则没有倒置;否则即为倒置。例如:如果待判断图像中的上述字符串在图像上方,则判断图像为倒置;如果在下方,则判断为没有倒置。
接下来,如果图像没有倒置,对其不做处理。如果图像倒置,将其绕图像中心旋转180°得到最终的图像。
根据本发明实施例的倾斜图像校正的方法可以看出,因为采用了为切分的字符设置字符框,利用字符框构建若干测试线,根据穿过字符框的数量特征从测试线里确定校正线的技术特征,所以能够以较小的运算量实现倾斜图像的准确校正,能够大幅提高倾斜图像校正的效率,并为字符的后续识别提供基础,解决现有技术中运算量大、耗时较长、校正效率低的问题;由于从数量较少的测试线中选取校正线,且不需提取图像轮廓,所以避免了现有技术中干扰线较多、高噪声背景下轮廓难以提取的问题,提升了图像校正质量;通过判断校正线在校正后的图像中的位置来检测图像是否倒置,进而实现倒置图像的自动翻转,克服了现有技术中无法处理倒置图像的缺陷。
图6是根据本发明实施例的倾斜图像校正的装置60的主要部分的示意图。
如图6所示,本发明实施例的倾斜图像校正的装置60主要包括:切分模块601、测试线构建模块602、校正线提取模块603。其中:
切分模块601,可用于切分图像中的字符。
测试线构建模块602,可用于构建穿过切分的字符的至少一条测试线。
校正线提取模块603,可用于确定所述至少一条测试线中其穿过切分的字符的数量大于预设字符数阈值的测试线作为校正线来校正图像。
较佳地,切分模块601可包括:检测模块与字符框建立模块,其中:
检测模块,可用于检测图像中的字符。
字符框建立模块,可用于根据检测的字符的端点建立容纳所述字符的字符框。
此外,穿过切分的字符包括:穿过容纳切分的字符的字符框。
在本发明实施例中,测试线构建模块602可包括:第一确定模块、第一测试线生成模块以及第二测试线生成模块。其中:
第一确定模块,可用于确定容纳每一字符框的判断范围、以及所述判断范围内的多个端点字符框。
第一测试线生成模块,可用于连接不同的端点字符框的中心点,形成至少一条测试线。
第二测试线生成模块,可用于针对每一端点字符框:在所述判断范围内确定该端点字符框的相邻字符框;以该端点字符框的中心点为起点,构建穿过所述相邻字符框中心点的射线作为测试线。
在本发明实施例中,校正线提取模块603可包括校正线确定模块,可用于统计第一测试线生成模块、或第二测试线生成模块生成的每条测试线在所述判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较;如果存在一条穿过的字符框的数量大于预设字符数阈值的测试线,则将该测试线作为校正线。
本发明实施例的倾斜图像校正的装置60可进一步包括校正模块,可用于计算所述校正线与目标方向的夹角,根据所述夹角旋转图像以实现校正。
此外,本发明实施例的倾斜图像校正的装置60可包括倒置调整模块,可用于根据所述校正线在校正后的图像中的位置判断所述校正后的图像是否倒置:若是,将该图像旋转180°。
需要说明的是,本发明实施例的倾斜图像校正的装置60作为软件,可安装在计算机、移动终端等设备中。
从以上描述可以看出,因为采用了为切分的字符设置字符框,利用字符框构建若干测试线,根据穿过字符框的数量特征从测试线里确定校正线的技术特征,所以能够以较小的运算量实现倾斜图像的准确校正,能够大幅提高倾斜图像校正的效率,并为字符的后续识别提供基础,解决现有技术中运算量大、耗时较长、校正效率低的问题;由于从数量较少的测试线中选取校正线,且不需提取图像轮廓,所以避免了现有技术中干扰线较多、高噪声背景下轮廓难以提取的问题,提升了图像校正质量;通过判断校正线在校正后的图像中的位置来检测图像是否倒置,进而实现倒置图像的自动翻转,克服了现有技术中无法处理倒置图像的缺陷。
根据本发明公开的实施例,本发明还提供了一种电子设备。
本发明实施例的电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现本发明所提供的倾斜图像校正的方法。
下面参考图7,其示出了适于用来实现本发明实施例的电子设备的计算机系统700的结构示意图。图7示出的电子设备仅仅是一个示例,不应对本发明实施例的功能和使用范围带来任何限制。
如图7所示,计算机系统700包括中央处理单元(CPU)701,其可以根据存储在只读存储器(ROM)702中的程序或者从存储部分708加载到随机访问存储器(RAM)703中的程序而执行各种适当的动作和处理。在RAM703中,还存储有计算机系统700操作所需的各种程序和数据。CPU 701、ROM 702以及RAM 703通过总线704彼此相连。输入/输出(I/O)接口705也连接至总线704。
以下部件连接至I/O接口705:包括键盘、鼠标等的输入部分706;包括诸如阴极射线管(CRT)、液晶显示器(LCD)等以及扬声器等的输出部分707;包括硬盘等的存储部分708;以及包括诸如LAN卡、调制解调器等的网络接口卡的通信部分709。通信部分709经由诸如因特网的网络执行通信处理。驱动器710也根据需要连接至I/O接口705。可拆卸介质711,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器710上,以便从其上读出的计算机程序根据需要被安装入存储部分708。
特别地,根据本发明公开的实施例,上文的主要步骤图描述的过程可以被实现为计算机软件程序。例如,本发明实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行主要步骤图所示的方法的程序代码。在上述实施例中,该计算机程序可以通过通信部分709从网络上被下载和安装,和/或从可拆卸介质711被安装。在该计算机程序被中央处理单元701执行时,执行本发明的系统中限定的上述功能。
需要说明的是,本发明所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本发明中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。在本发明中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:无线、电线、光缆、RF等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本发明各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这根据所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本发明实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。所描述的单元也可以设置在处理器中,例如,可以描述为:一种处理器包括发送单元、获取单元、确定单元和第一处理单元。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定,例如,发送单元还可以被描述为“向所连接的服务端发送图片获取请求的单元”。
作为另一方面,本发明还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的设备中所包含的;也可以是单独存在,而未装配入该设备中的。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该设备执行时,使得该设备执行的步骤包括:切分图像中的字符;构建穿过切分的字符的至少一条测试线;确定所述至少一条测试线中其穿过切分的字符的数量大于预设字符数阈值的测试线作为校正线来校正图像。
根据本发明实施例的技术方案,通过为切分的字符设置字符框,利用字符框构建若干测试线,根据穿过字符框的数量特征从测试线里确定校正线,从而以较小的运算量实现了倾斜图像的准确校正,大幅提高了倾斜图像校正的效率,并为字符的后续识别提供了基础,解决了现有技术中运算量大、耗时较长、校正效率低的问题;由于从数量较少的测试线中选取校正线,且不需提取图像轮廓,避免了现有技术中干扰线较多、高噪声背景下轮廓难以提取的问题,提升了图像校正质量;通过判断校正线在校正后的图像中的位置来检测图像是否倒置,进而实现倒置图像的自动翻转,克服了现有技术中无法处理倒置图像的缺陷。
上述具体实施方式,并不构成对本发明保护范围的限制。本领域技术人员应该明白的是,取决于设计要求和其他因素,可以发生各种各样的修改、组合、子组合和替代。任何在本发明的精神和原则之内所作的修改、等同替换和改进等,均应包含在本发明保护范围之内。

Claims (13)

1.一种倾斜图像校正的方法,其特征在于,包括:
切分图像中的字符;
构建穿过切分的字符的至少一条测试线;
确定所述至少一条测试线中其穿过切分的字符的数量大于预设字符数阈值的测试线作为校正线来校正图像;
所述切分图像中的字符包括:检测图像中的字符,根据检测的字符的端点建立容纳所述字符的字符框,所述穿过切分的字符包括:穿过容纳该字符的字符框;以及,所述方法进一步包括:
确定容纳每一字符框的判断范围、以及所述判断范围内的多个端点字符框;
连接不同的端点字符框的中心点,形成至少一条测试线;
统计每条测试线在所述判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较;当确定存在该数量大于预设字符数阈值的测试线时,将该测试线作为校正线。
2.根据权利要求1所述的方法,其特征在于,所述方法进一步包括:
计算所述校正线与目标方向的夹角,根据所述夹角旋转图像以实现校正。
3.根据权利要求1或2所述的方法,其特征在于,所述方法进一步包括:
校正图像后,根据所述校正线在校正后的图像中的位置判断所述校正后的图像是否倒置:若是,将该图像旋转180°。
4.一种倾斜图像校正的方法,其特征在于,包括:
切分图像中的字符;
构建穿过切分的字符的至少一条测试线;
确定所述至少一条测试线中其穿过切分的字符的数量大于预设字符数阈值的测试线作为校正线来校正图像;
所述切分图像中的字符包括:检测图像中的字符,根据检测的字符的端点建立容纳所述字符的字符框,所述穿过切分的字符包括:穿过容纳该字符的字符框;以及,所述方法进一步包括:
建立容纳每一字符框的判断范围、以及所述判断范围内的多个端点字符框;
针对每一端点字符框:在所述判断范围内确定该端点字符框的相邻字符框;以该端点字符框的中心点为起点,构建穿过所述相邻字符框中心点的每条射线;
统计每条射线在所述判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较;当确定存在该数量大于预设字符数阈值的射线时,将该射线作为校正线。
5.根据权利要求4所述的方法,其特征在于,确定该端点字符框的相邻字符框包括:获取与该端点字符框的距离小于预设距离阈值、且字符框面积小于预设面积阈值的至少一个字符框,将所述至少一个字符框中与该端点字符框距离最小的字符框确定为该端点字符框的相邻字符框。
6.根据权利要求5所述的方法,其特征在于,所述方法进一步包括:
计算所述校正线与目标方向的夹角,根据所述夹角旋转图像以实现校正。
7.根据权利要求4-6任一所述的方法,其特征在于,所述方法进一步包括:
校正图像后,根据所述校正线在校正后的图像中的位置判断所述校正后的图像是否倒置:若是,将该图像旋转180°。
8.一种倾斜图像校正的装置,其特征在于,包括:
切分模块,用于切分图像中的字符;
测试线构建模块,用于构建穿过切分的字符的至少一条测试线;
校正线提取模块,用于确定所述至少一条测试线中其穿过切分的字符的数量大于预设字符数阈值的测试线作为校正线来校正图像;
切分模块包括:检测模块,用于检测图像中的字符;字符框建立模块,用于根据检测的字符的端点建立容纳所述字符的字符框;
以及,测试线构建模块包括:
第一确定模块,用于确定容纳每一字符框的判断范围、以及所述判断范围内的多个端点字符框;
第一测试线生成模块,用于连接不同的端点字符框的中心点,形成至少一条测试线;
第二测试线生成模块,用于针对每一端点字符框:在所述判断范围内确定该端点字符框的相邻字符框;以该端点字符框的中心点为起点,构建穿过所述相邻字符框中心点的射线作为测试线。
9.根据权利要求8所述的装置,其特征在于,校正线提取模块包括:
校正线确定模块,用于统计第一测试线生成模块、或第二测试线生成模块生成的每条测试线在所述判断范围内穿过的字符框的数量,并将该数量与预设字符数阈值进行比较;当确定存在该数量大于预设字符数阈值的测试线时,将该测试线作为校正线。
10.根据权利要求9所述的装置,其特征在于,所述装置进一步包括:
校正模块,用于计算所述校正线与目标方向的夹角,根据所述夹角旋转图像以实现校正。
11.根据权利要求8-10任一所述的装置,其特征在于,所述装置进一步包括:
倒置调整模块,用于根据所述校正线在校正后的图像中的位置判断所述校正后的图像是否倒置:若是,将该图像旋转180°。
12.一种电子设备,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-7中任一所述的方法。
13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述程序被处理器执行时实现如权利要求1-7中任一所述的方法。
CN201710316489.7A 2017-05-08 2017-05-08 倾斜图像校正的方法和装置 Active CN107239776B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201710316489.7A CN107239776B (zh) 2017-05-08 2017-05-08 倾斜图像校正的方法和装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201710316489.7A CN107239776B (zh) 2017-05-08 2017-05-08 倾斜图像校正的方法和装置

Publications (2)

Publication Number Publication Date
CN107239776A CN107239776A (zh) 2017-10-10
CN107239776B true CN107239776B (zh) 2020-05-01

Family

ID=59984942

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201710316489.7A Active CN107239776B (zh) 2017-05-08 2017-05-08 倾斜图像校正的方法和装置

Country Status (1)

Country Link
CN (1) CN107239776B (zh)

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108268868B (zh) * 2017-07-28 2020-07-10 平安科技(深圳)有限公司 身份证图像的倾斜值获取方法及装置、终端、存储介质
CN110188747A (zh) * 2019-04-28 2019-08-30 广州华多网络科技有限公司 一种文本图像的倾斜校正方法、装置以及图像处理设备

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847209A (zh) * 2010-06-01 2010-09-29 福建新大陆电脑股份有限公司 一种字符图像校正方法
CN102955941A (zh) * 2011-08-31 2013-03-06 汉王科技股份有限公司 身份信息录入方法和装置
CN106295638A (zh) * 2016-07-29 2017-01-04 北京小米移动软件有限公司 证件图像倾斜校正方法和装置
CN106407979A (zh) * 2016-10-25 2017-02-15 深圳怡化电脑股份有限公司 一种票据字符校正的方法及装置

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN101847209A (zh) * 2010-06-01 2010-09-29 福建新大陆电脑股份有限公司 一种字符图像校正方法
CN102955941A (zh) * 2011-08-31 2013-03-06 汉王科技股份有限公司 身份信息录入方法和装置
CN106295638A (zh) * 2016-07-29 2017-01-04 北京小米移动软件有限公司 证件图像倾斜校正方法和装置
CN106407979A (zh) * 2016-10-25 2017-02-15 深圳怡化电脑股份有限公司 一种票据字符校正的方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
一种快速文本图像倾斜校正方法;曾凡锋 等;《计算机应用与软件》;20150430;第32卷(第4期);181-185页第3节 *

Also Published As

Publication number Publication date
CN107239776A (zh) 2017-10-10

Similar Documents

Publication Publication Date Title
CN107169489B (zh) 倾斜图像校正的方法和装置
US8873835B2 (en) Methods and apparatus for correcting disparity maps using statistical analysis on local neighborhoods
CN111079772B (zh) 图像边缘提取处理方法、装置及存储介质
US10943140B2 (en) Image processing to detect a rectangular object
US10176395B2 (en) Automatic correction of skewing of digital images
US9679354B2 (en) Duplicate check image resolution
EP2660753B1 (en) Image processing method and apparatus
US9087253B2 (en) Method and system for determining edge line in QR code binary image
CN111695410A (zh) 违章举报方法、装置、计算机设备及存储介质
US20190138840A1 (en) Automatic ruler detection
CN111507055B (zh) 电路设计版图和电镜扫描图像的配准方法及系统、电路设计版图和其成像误差计算方法
CN108734161B (zh) 冠字号区域的识别方法、装置、设备及存储介质
CN107239776B (zh) 倾斜图像校正的方法和装置
CN108960247B (zh) 图像显著性检测方法、装置以及电子设备
EP2536123A1 (en) Image processing method and image processing apparatus
CN115345895B (zh) 用于视觉检测的图像分割方法、装置、计算机设备及介质
CN114067328A (zh) 识别文本的方法、装置和电子设备
CN114529570A (zh) 图像分割方法、图像识别方法、用户凭证补办方法及系统
CN108447107B (zh) 用于生成视频的方法和装置
CN111599080B (zh) 拼接纸币的检测方法、装置、金融机具设备及存储介质
US10713808B2 (en) Stereo matching method and system using rectangular window
CN114581890B (zh) 确定车道线的方法、装置、电子设备和存储介质
CN114708592B (zh) 图章密级的判断方法、装置、设备和计算机可读存储介质
US20220253637A1 (en) Patch generation in region of interest
US10395378B2 (en) Detecting periodic patterns and aperture problems for motion estimation

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
CB02 Change of applicant information
CB02 Change of applicant information

Address after: 101111 Room 221, 2nd Floor, Block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone

Applicant after: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.

Address before: 101111 Room 221, 2nd Floor, Block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone

Applicant before: BEIJING JINGDONG FINANCIAL TECHNOLOGY HOLDING Co.,Ltd.

GR01 Patent grant
GR01 Patent grant
CP01 Change in the name or title of a patent holder
CP01 Change in the name or title of a patent holder

Address after: 101111 Room 221, 2nd Floor, Block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone

Patentee after: Jingdong Technology Holding Co.,Ltd.

Address before: 101111 Room 221, 2nd Floor, Block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone

Patentee before: Jingdong Digital Technology Holding Co.,Ltd.

CP03 Change of name, title or address
CP03 Change of name, title or address

Address after: 101111 Room 221, 2nd Floor, Block C, 18 Kechuang 11th Street, Beijing Economic and Technological Development Zone

Patentee after: Jingdong Digital Technology Holding Co.,Ltd.

Address before: Room 221, floor 2, block C, No. 18, Kechuang 11th Street, Beijing Economic and Technological Development Zone, Beijing 101111

Patentee before: JINGDONG DIGITAL TECHNOLOGY HOLDINGS Co.,Ltd.