CN112419207A - 一种图像矫正方法及装置、系统 - Google Patents
一种图像矫正方法及装置、系统 Download PDFInfo
- Publication number
- CN112419207A CN112419207A CN202011285424.9A CN202011285424A CN112419207A CN 112419207 A CN112419207 A CN 112419207A CN 202011285424 A CN202011285424 A CN 202011285424A CN 112419207 A CN112419207 A CN 112419207A
- Authority
- CN
- China
- Prior art keywords
- image
- slope
- determining
- straight line
- linear
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 54
- 238000003702 image correction Methods 0.000 title abstract description 9
- 238000012545 processing Methods 0.000 claims abstract description 51
- 238000001514 detection method Methods 0.000 claims abstract description 24
- 238000004891 communication Methods 0.000 claims abstract description 21
- 230000003044 adaptive effect Effects 0.000 claims abstract description 15
- 230000009466 transformation Effects 0.000 claims description 23
- 238000003062 neural network model Methods 0.000 claims description 12
- 238000012937 correction Methods 0.000 claims description 5
- 238000003672 processing method Methods 0.000 abstract description 4
- 238000000605 extraction Methods 0.000 description 10
- 238000006243 chemical reaction Methods 0.000 description 6
- 238000005516 engineering process Methods 0.000 description 6
- 238000012549 training Methods 0.000 description 6
- 238000004364 calculation method Methods 0.000 description 4
- 238000013527 convolutional neural network Methods 0.000 description 4
- 239000011159 matrix material Substances 0.000 description 4
- 238000012015 optical character recognition Methods 0.000 description 4
- 230000006870 function Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 230000009286 beneficial effect Effects 0.000 description 2
- 230000008859 change Effects 0.000 description 2
- 238000010586 diagram Methods 0.000 description 2
- 238000003708 edge detection Methods 0.000 description 2
- 230000008570 general process Effects 0.000 description 2
- 230000010365 information processing Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 230000008719 thickening Effects 0.000 description 2
- 238000013500 data storage Methods 0.000 description 1
- 230000007547 defect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 230000002349 favourable effect Effects 0.000 description 1
- 230000005484 gravity Effects 0.000 description 1
- 238000007726 management method Methods 0.000 description 1
- 239000000463 material Substances 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 230000000750 progressive effect Effects 0.000 description 1
- 230000003068 static effect Effects 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T5/00—Image enhancement or restoration
- G06T5/20—Image enhancement or restoration by the use of local operators
- G06T5/30—Erosion or dilatation, e.g. thinning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
- G06F18/241—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
- G06F18/2415—Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/04—Architecture, e.g. interconnection topology
- G06N3/045—Combinations of networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G06T3/04—
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T3/00—Geometric image transformation in the plane of the image
- G06T3/60—Rotation of a whole image or part thereof
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/13—Edge detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/10—Segmentation; Edge detection
- G06T7/136—Segmentation; Edge detection involving thresholding
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/60—Analysis of geometric attributes
- G06T7/62—Analysis of geometric attributes of area, perimeter, diameter or volume
Abstract
本发明公开了一种图像矫正方法及装置、系统。所述方法包括:对图像进行灰度处理和自适应阈值的二值化处理,获得二值化图像;提取所述二值化图像中的轮廓,在所述轮廓中确定围成最大连通区域的轮廓为图像外轮廓;对所述图像外轮廓进行直线检测,根据预获取的图像形状特征以及检测到的直线特征,识别所述图像外轮廓的边线,确定所述边线的交点为所述图像的角点;根据所述图像的角点位置进行图像矫正。本发明通过自适应阈值的二值化处理方法可以保证存在反光情况的图像,在不同的亮度区域采用不同的阈值,以克服因图像反光情况采集不到图像信息的问题。
Description
技术领域
本发明涉及图像处理技术领域,特别涉及一种图像矫正方法及装置、系统。
背景技术
光学字符识别技术(OCR字符识别技术)主要是将识别到的图像中的字符形状翻译成计算机文字的技术,该技术广泛地应用于各种需要自动获取图像中文字信息的场景中。为了准确地识别字符,在使用OCR字符识别技术之前,需要对图像进行矫正处理,以消除图像中存在的无关背景区域、图像歪斜等问题,这就需要先识别出图像中目标对象的边线和角点,将图像中的目标对象和背景部分区分出来。目前,普遍采用的角点检测法包括三种:基于灰度图像的角点检测、基于二值图像的角点检测、基于轮廓曲线的角点检测。上述角点检测法在对一般图像的矫正过程中均能准确地识别到其角点,但是在实际应用中,由于拍摄角度、照片材质等问题,使得图像往往具有反光区域,本领域技术人员在操作过程中发现对于带有反光区域的图像,上述角点检测方法往往出现多识别、误识别的问题,从而导致图像矫正效果不佳,为后续的字符识别造成麻烦。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种图像矫正方法及装置、系统。所述技术方案如下:
第一方面,提供了一种图像矫正方法,所述方法包括:
对图像进行灰度处理和自适应阈值的二值化处理,获得二值化图像;
提取所述二值化图像中的轮廓,在所述轮廓中确定围成最大连通区域的轮廓为图像外轮廓;
对所述图像外轮廓进行直线检测,根据预获取的图像形状特征以及检测到的直线特征,识别所述图像外轮廓的边线,确定所述边线的交点为所述图像的角点;
根据所述图像的角点位置进行图像矫正。
进一步地,所述图像形状特征,包括:边斜率、图形中心位置信息;
所述根据预获取的图像形状特征以及检测到的直线特征,识别所述图像外轮廓的边线,包括:
获取所述直线特征,包括:直线长度、直线斜率、直线位置信息;
将所述边斜率与所述直线斜率对比,获得斜率对比结果,若所述斜率对比结果满足斜率条件,则确定长度最长的直线为所述边线;
将所述图形中心位置信息与所述边线的所述直线位置信息对比,根据所述边线与所述图形中心的位置关系,确定所述边线的位置。
进一步地,所述根据所述图像的角点位置进行图像矫正,包括:
识别所述角点的坐标,根据标准角点位置对所述角点的坐标进行透视变换。
进一步地,所述根据所述图像的角点位置进行图像矫正,还包括:
通过神经网络模型确定所述图像的旋转角度,对所述图像进行旋转变换。
进一步地,在所述对图像进行灰度处理和自适应阈值的二值化处理后,所述方法还包括:
对所述图像进行膨胀处理,以粗化所述图像中所有线条,所述膨胀处理后的图像作为所述二值化图像。
进一步地,确定所述最大连通区域,包括:
识别所述二值化图像中所有的连通区域;
计算所述连通区域的面积,确定所述面积最大的所述连通区域为所述最大连通区域。
进一步地,所述对所述图像外轮廓进行直线检测,包括:
将所述图像外轮廓复制到空白图片上;
采用霍夫直线法检测所述图像外轮廓中包含的直线。
第二方面,提供了一种图像矫正装置,所述装置包括:
图像处理模块,用于对图像进行灰度处理和自适应阈值的二值化处理,获得二值化图像;
外轮廓识别模块,用于提取所述二值化图像中的轮廓,在所述轮廓中确定围成的最大连通区域的轮廓为图像外轮廓;
边线识别模块,用于对所述图像外轮廓进行直线检测,根据预获取的图像形状特征以及检测到的直线特征,识别所述图像外轮廓的边线,确定所述边线的交点为所述图像的角点;
矫正模块,用于根据所述图像的角点位置进行图像矫正。
进一步地,所述图像形状特征,包括:边斜率、图形中心位置信息;
所述边线识别模块,包括:
直线特征获取模块,用于获取所述直线特征,包括:直线长度、直线斜率、直线位置信息;
边线确定模块,用于将所述边斜率与所述直线斜率对比,获得斜率对比结果,若所述斜率对比结果满足斜率条件,则确定长度最长的直线为所述边线;
边线位置确定模块,用于将所述图形中心位置信息与所述直线位置信息对比,根据所述边线与所述图形中心的位置关系,确定所述边线的位置。
进一步地,所述矫正模块,包括:
角点变换模块,用于识别所述角点的坐标,根据标准角点位置对所述角点的坐标进行透视变换。
进一步地,所述矫正模块,还包括:
旋转变换模块,用于通过神经网络模型确定所述图像的旋转角度,对所述图像进行旋转变换。
进一步地,所述图像处理模块,还包括:
膨胀处理模块,用于对所述图像进行膨胀处理,以粗化图像中所有线条,膨胀处理后的图像为最终得到的二值化图像。
进步一地,所述外轮廓识别模块,包括:
连通区域识别模块,用于识别二值化图像中所有的连通区域。
最大连通区域确定模块,用于计算连通区域的面积,确定面积最大的连通区域为最大连通区域。
进一步地,所述边线识别模块,包括:
直线检测模块,用于将图像外轮廓复制到空白图片上;采用霍夫直线法检测图像外轮廓中包含的直线。
第三方面,提供了一种计算机系统,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行上述第一方面任一项所述的方法。
本发明实施例提供的技术方案带来的有益效果是:
1、本发明通过自适应阈值的二值化处理方法可以保证存在反光情况的图像,在不同的亮度区域采用不同的阈值,以克服因图像反光情况采集不到图像信息的问题;
2、本发明在二值化处理后还对图像进行了膨胀操作,使得图像中的线条粗化,增强图像中的信息表现,有利于全面识别图像中线条,避免因反光情况导致图像线条不清晰,造成的无法识别的情况;
3、本发明采用了神经网络模型计算图像的旋转角度,能够适用没有特征标记的图像的旋转,通用性强,准确率高。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例提供的一种图像矫正方法流程图;
图2是本发明实施例提供的一种图像矫正装置结构示意图;
图3是本发明实施例提供的一种计算机系统结构示意图。
具体实施方式
为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
如背景技术所述,本发明主要为了解决存在反光等亮度不均匀问题的图像在图像矫正过程中,不能准确识别其中的角点,从而导致在OCR字符识别技术中,不能准确识别图像中证件、证书等的边框的问题。上述,角点通常指两条边的交点。角点检测是计算机视觉系统中用来获得图像特征的一种方法,也称为特征点检测。背景技术中提到的三种现有的角点检测方法中,被广泛使用的是基于灰度图像的角点检测方法,主要考虑图像亮度变化,将邻点亮度对比足够大的点定义为角点;基于二值图像的角点检测,是在图像进行普通的二值化处理后再进行角点识别;基于轮廓曲线的角点检测是通过识别图像的轮廓从而识别角点。由此可见,对于基于灰度图像的角点检测方法,当图像亮度不均匀时,通过亮度对比识别角点,有可能存在识别错误的问题;对于二值图像和轮廓曲线的角点检测方法,当图像亮度不均匀时,存在识别不到过亮的部分的线条的问题,也就存在漏识别角点和错误识别角点的缺陷。
为了解决上述技术问题,本发明实施例提供一种图像矫正方法及装置、系统,具体技术方案如下:
如图1所示,一种图像矫正方法,包括:
S1、对图像进行灰度处理和自适应阈值的二值化处理,获得二值化图像。
其中,图像可以由多种途经采集获得,具体可以是:照片、视频的截图、纸件扫描获得的扫描图等等,其中拍摄的照片比较容易出现过曝的情况,是本发明的主要处理对象。灰度处理是指在RGB模型中将原始的三颜色通道的图像变成单通道的灰度图像。图像的二值化,是指找到一个阈值,将灰度大于此阈值的灰度值设置为255,灰度小于此阈值的灰度值设置为0,从而保证图像上每一个像素只有两种可能的取值或灰度等级状态。对于普通的图像二值化方法,其阈值对于图像整体固定不变,不能根据图像中不同的亮度区域变化,导致图像中的细节内容被忽略。本发明实施例中所述的自适应阈值的二值化,是指将图像进行二值化,且对于图像中不同的亮度与其采用不同的阈值,由于该阈值对于不同的区域均不相同,因此在二值化处理时,图像中各亮度区域中的内容均能被突出出来,从而保证图像能够全面展现。具体地,自适应阈值的二值化处理方法主要为局部自适应阈值二值化,包括:局部均值处理、局部高斯处理等。
在一个实施例中,在对图像进行灰度处理和自适应阈值的二值化处理后,步骤S1还包括:
对图像进行膨胀处理,以粗化图像中所有线条,那么膨胀处理后的图像为最终得到的二值化图像。
其中,膨胀处理主要是加粗二值化图像中亮的区域,因此可以达到粗化图像中线条的目的。通过膨胀处理操作能够使图像中的线条更清晰,有利于后续的轮廓提取操作。
S2、提取二值化图像中的轮廓,在轮廓中确定围成最大连通区域的轮廓为图像外轮廓。
其中,对二值化图像的轮廓提取,可以获得一系列的轮廓曲线,具体的轮廓提取可以采用:canny边缘检测法、阈值分割与边缘查找相结合的方法,提取傅里叶变换的高频信息的方法等。轮廓提取方法的主要目的是为了找到图像中灰阶差比较大的位置,从而识别轮廓。本发明实施例中由于S1中已经对图像进行了自适应阈值的二值化处理和膨胀化处理,是图像中的线条更加清晰,有利于提高轮廓检测的效率。
在一个实施例中,确定最大连通区域,包括:
S21、识别二值化图像中所有的连通区域。
S22、计算连通区域的面积,确定面积最大的连通区域为最大连通区域。
其中,对于轮廓中连通区域的面积计算,可以采用contourArea函数,通过面积计算和比较,可以识别出面积最大的连通区域,一般情况下图像的外边框围成的区域面积最大,因此可以确定围成面积最大的连通区域的轮廓为图像外轮廓。
S3、对图像外轮廓进行直线检测,根据预获取的图像形状特征以及检测到的直线特征,识别图像外轮廓的边线,确定边线的交点为图像的角点。
其中,步骤S2识别出的图像外轮廓一般为曲线,但是对于证件、证书等的图像来说,其外边框为直线,因此需要在图像外轮廓的基础上,识别其中的直线。如前述,图像的角点通常为边的交点,那么对于证件、证书等由直线为边形成的规则形状的图像来说,边框的角点即为边线的交点。
在一个实施例中,步骤S3中对图像外轮廓进行直线检测,包括:
S31、将图像外轮廓复制到空白图片上;
S32、采用霍夫直线法检测图像外轮廓中包含的直线。
其中,将图像外轮廓复制到空白图片上,能够更清晰地识别图像外轮廓,从而更准确地基于图像外轮廓识别其中的直线,识别直线斜率、直线位置信息。霍夫直线法是基于霍夫变换实现的,霍夫变换是一种在图像中寻找直线、圆及其他简单形状的方法。
在一个实施例中,上述预获取的图像形状特征,包括:边斜率、图形中心位置信息;
步骤S3中根据预获取的图像形状特征以及检测到的直线特征,识别图像外轮廓的边线,包括:
S33、获取直线特征,包括:直线长度、直线斜率、直线位置信息。
S34、将边斜率与直线斜率对比,获得斜率对比结果,若斜率对比结果满足斜率条件,则确定长度最长的直线为边线
S35、将图形中心位置信息与直线位置信息对比,根据边线与图形中心的位置关系,确定边线的位置。
其中,上述步骤S33~S35是根据图像形状特征和直线特征确定边线和边线位置的步骤。图像形状特征是指图像外边缘围成形状的特征,例如:证书、证件等的图像形状通常为矩形,由于其图像可能存在倾斜、偏转的情况,因此矩形的边线可能存在倾斜。图像形状特征可以通过人工输入的方式获取,或者采用图像特征提取的方式获取,具体的预获取方法本发明实施例不做限制。获取直线特征可以采用特征提取的方式。经过步骤S2后,识别出的直线数量较多,本步骤的主要目的在于在识别出的众多直线中,确定与图像形状特征较为符合的直线中长度最长的为其图像的边线,并确定各边线中哪些是上下边线,哪些是左右边线。需要说明的是:图形中心位置信息是图像图形的中心点坐标,直线位置信息可以是直线上任一点的坐标,将直线上任一点的坐标位于图形中心点坐标左侧的边线确定为图像的左边线,其他各边线以此类推。斜率条件可以是一个斜率阈值范围。
S4、根据图像的角点位置进行图像矫正。
其中,前述步骤S1~S3主要为了识别图像的角点,角点识别后,可对存在倾斜或偏转的图像进行矫正。
在一个实施例中,步骤S4包括:
S41、识别角点的坐标,根据标准角点位置对角点的坐标进行透视变换。
S42、通过神经内网络模型确定图像的旋转角度,对图像进行旋转变换。
其中,透视变换是图像矫正常用的矫正方法,透视变换的一般过程包括:读取图像、获取图像角点、定义标准角点、根据图像角点和标准角点获取转换矩阵、根据转换矩阵执行图像转换。基于透视变换可以矫正倾斜的图像,是对角点位置的微调整,其中,标准角点为标准位置图像的角点。此外,由于拍照的角度不同,最后矫正的图像可能存在±90°或180°的大角度旋转,因此需要确定具体的旋转角度。在旋转变换中,对于特殊的图像可以识别图像中的代表性内容,通过检测该代表性内容区域的位置,实现角度计算,但是一般的图像中难以找到代表性的内容,因此本发明提出一种具有普遍适用性的确定旋转变换角度的方法,即通过神经网络模型实现softmax四分类的方法,输出图像的旋转角度。softmax四分类中,包括四个旋转角度:0°、90°、-90°、180°,神经网络模型采用训练过的深层CNN卷积神经网络模型,模型训练采用的训练样本可以通过摆正的图像加上随机旋转的图像给出标签,标签为旋转角度。因此训练后的模型输入待矫正图像后,可以根据训练样本中的内容特征(例如文本特征)与标签的关系判断待矫正图像的旋转角度。
需要说明的是:本发明实施例公开的图像矫正方法可以适用于矩形、平行四边形等具有角点且边界形状规则的图像的矫正,具体可以是:证件图像、文件图像、或者停车场等实物图像的矫正。
如图2所示,基于上述图像矫正方法,本发明实施例还公开一种图像矫正装置,包括:
图像处理模块201,用于对图像进行灰度处理和自适应阈值的二值化处理,获得二值化图像。
其中,灰度处理是指在RGB模型中将原始的三颜色通道的图像变成单通道的灰度图像。自适应阈值的二值化,是指将图像进行二值化,且对于图像中不同的亮度与其采用不同的阈值。
在一个实施例中,图像处理模块201,还包括:
膨胀处理模块,用于对图像进行膨胀处理,以粗化图像中所有线条,那么膨胀处理后的图像为最终得到的二值化图像。
其中,膨胀处理主要是加粗二值化图像中亮的区域,因此可以达到粗化图像中线条的目的。
外轮廓识别模块202,用于提取二值化图像中的轮廓,在轮廓中确定围成的最大连通区域的轮廓为图像外轮廓。
其中,轮廓提取可以采用:canny边缘检测法、阈值分割与边缘查找相结合的方法,提取傅里叶变换的高频信息的方法等。
在一个实施例中,外轮廓识别模块202,包括:
连通区域识别模块,用于识别二值化图像中所有的连通区域。
最大连通区域确定模块,用于计算连通区域的面积,确定面积最大的连通区域为最大连通区域。
其中,对于轮廓中连通区域的面积计算,可以采用contourArea函数。
边线识别模块203,用于对图像外轮廓进行直线检测,根据预获取的图像形状特征以及检测到的直线特征,识别图像外轮廓的边线,确定边线的交点为图像的角点。
在一个实施例中,边线识别模块203,包括:
直线检测模块,用于将图像外轮廓复制到空白图片上;采用霍夫直线法检测图像外轮廓中包含的直线。
在一个实施例中,图像形状特征包括:边斜率、图形中心位置信息。
边线识别模块203,还包括:
直线特征获取模块,用于获取直线特征,包括:直线长度、直线斜率、直线位置信息;
边线确定模块,用于将边斜率与直线斜率对比,获得斜率对比结果,若斜率对比结果满足斜率条件,则长度最长的直线为边线;
边线位置确定模块,用于将图形中心位置信息与直线位置信息对比,根据直线与图形中心的位置关系,确定边线的位置。
在斜率对比结果满足斜率条件,且位置对比结果满足重心条件的直线中,确定长度最长的直线为边线。
其中,图像形状特征是指图像外边缘围成形状的特征。图像形状特征可以利用交互模块,通过人工输入信息的方式获取,或者利用特征提取模块,采用图像特征提取的方式获取。直线特征获取模块,可以采用特征提取的方式获取直线特征。需要说明的是:图形中心位置信息是图像图形的中心点坐标,直线位置信息可以是直线上任一点的坐标,将直线上任一点的坐标位于图形中心点坐标左侧的边线确定为图像的左边线,其他各边线以此类推。斜率条件可以是一个斜率阈值范围。
矫正模块204,用于根据图像的角点位置进行图像矫正。
在一个实施例中,矫正模块204,包括:
角点变换模块,用于识别角点的坐标,根据标准角点位置对角点的坐标进行透视变换。
旋转变换模块,用于通过神经网络模型确定图像的旋转角度,对图像进行旋转变换。
其中,透视变换的一般过程包括:读取图像、获取图像角点、定义标准角点、根据图像角点和标准角点获取转换矩阵、根据转换矩阵执行图像转换。对于旋转变换模块,其可以包括两种变换方式,一种是识别图像中的代表性内容,通过检测该代表性内容区域的位置,计算旋转角度;一种是通过神经网络模型实现softmax四分类的方法,输出图像的旋转角度。softmax四分类中,包括四个旋转角度:0°、90°、-90°、180°,神经网络模型采用训练过的深层CNN卷积神经网络模型,模型训练时采用的训练样本可以通过摆正的图像加上随机旋转的方式给出标签。模型训练完成后,输入待矫正图像,神经网络模型可以判断出旋转的角度。
基于上述方法实施例,本发明实施例还提供一种计算机系统,包括:
一个或多个处理器;以及
与一个或多个处理器关联的存储器,存储器用于存储程序指令,程序指令在被一个或多个处理器读取执行时,执行上述图像矫正方法。
其中,图3示例性的展示出了计算机系统的架构,具体可以包括处理器310,视频显示适配器311,磁盘驱动器312,输入/输出接口313,网络接口314,以及存储器320。上述处理器310、视频显示适配器311、磁盘驱动器312、输入/输出接口313、网络接口314,与存储器320之间可以通过通信总线330进行通信连接。
其中,处理器310可以采用通用的CPU(Central Processing Unit,中央处理器)、微处理器、应用专用集成电路(Application Specific Integrated Circuit,ASIC)、或者一个或多个集成电路等方式实现,用于执行相关程序,以实现本申请所提供的技术方案。
存储器320可以采用ROM(Read Only Memory,只读存储器)、RAM(Random AccessMemory,随机存取存储器)、静态存储设备,动态存储设备等形式实现。存储器320可以存储用于控制电子设备300运行的操作系统321,用于控制电子设备300的低级别操作的基本输入输出系统322(BIOS)。另外,还可以存储网页浏览器323,数据存储管理系统324,以及设备标识信息处理系统325等等。上述设备标识信息处理系统325就可以是本申请实施例中具体实现前述各步骤操作的应用程序。总之,在通过软件或者固件来实现本申请所提供的技术方案时,相关的程序代码保存在存储器320中,并由处理器310来调用执行。
输入/输出接口313用于连接输入/输出模块,以实现信息输入及输出。输入输出/模块可以作为组件配置在设备中(图中未示出),也可以外接于设备以提供相应功能。其中输入设备可以包括键盘、鼠标、触摸屏、麦克风、各类传感器等,输出设备可以包括显示器、扬声器、振动器、指示灯等。
网络接口314用于连接通信模块(图中未示出),以实现本设备与其他设备的通信交互。其中通信模块可以通过有线方式(例如USB、网线等)实现通信,也可以通过无线方式(例如移动网络、WIFI、蓝牙等)实现通信。
总线330包括一通路,在设备的各个组件(例如处理器310、视频显示适配器311、磁盘驱动器312、输入/输出接口313、网络接口314,与存储器320)之间传输信息。
另外,该电子设备300还可以从虚拟资源对象领取条件信息数据库341中获得具体领取条件的信息,以用于进行条件判断,等等。
需要说明的是,尽管上述设备仅示出了处理器310、视频显示适配器311、磁盘驱动器312、输入/输出接口313、网络接口314,存储器320,总线330等,但是在具体实施过程中,该设备还可以包括实现正常运行所必需的其他组件。此外,本领域的技术人员可以理解的是,上述设备中也可以仅包含实现本申请方案所必需的组件,而不必包含图中所示的全部组件。
通过以上的实施方式的描述可知,本领域的技术人员可以清楚地了解到本申请可借助软件加必需的通用硬件平台的方式来实现。基于这样的理解,本申请的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在存储介质中,如ROM/RAM、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本申请各个实施例或者实施例的某些部分的方法。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统或系统实施例而言,由于其基本相似于方法实施例,所以描述得比较简单,相关之处参见方法实施例的部分说明即可。以上所描述的系统及系统实施例仅仅是示意性的,其中作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。本领域普通技术人员在不付出创造性劳动的情况下,即可以理解并实施。
本发明实施例提供的技术方案带来的有益效果是:
1、本发明通过自适应阈值的二值化处理方法可以保证存在反光情况的图像,在不同的亮度区域采用不同的阈值,以克服因图像反光情况采集不到图像信息的问题;
2、本发明在二值化处理后还对图像进行了膨胀操作,使得图像中的线条粗化,增强图像中的信息表现,有利于全面识别图像中线条,避免因反光情况导致图像线条不清晰,造成的无法识别的情况;
3、本发明采用了神经网络模型计算图像的旋转角度,能够适用没有特征标记的图像的旋转,通用性强,准确率高。
上述所有可选技术方案,可以采用任意结合形成本发明的可选实施例,在此不再一一赘述。
以上所述仅为本发明的较佳实施例,并不用以限制本发明,凡在本发明的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本发明的保护范围之内。
Claims (10)
1.一种图像矫正方法,其特征在于,包括:
对图像进行灰度处理和自适应阈值的二值化处理,获得二值化图像;
提取所述二值化图像中的轮廓,在所述轮廓中确定围成最大连通区域的轮廓为图像外轮廓;
对所述图像外轮廓进行直线检测,根据预获取的图像形状特征以及检测到的直线特征,识别所述图像外轮廓的边线,确定所述边线的交点为所述图像的角点;
根据所述图像的角点位置进行图像矫正。
2.如权利要求1所述的方法,其特征在于,所述图像形状特征,包括:边斜率、图形中心位置信息;
所述根据预获取的图像形状特征以及检测到的直线特征,识别所述图像外轮廓的边线,包括:
获取所述直线特征,包括:直线长度、直线斜率、直线位置信息;
将所述边斜率与所述直线斜率对比,获得斜率对比结果,若所述斜率对比结果满足斜率条件,则确定长度最长的直线为所述边线;
将所述图形中心位置信息与所述边线的所述直线位置信息对比,根据所述边线与所述图形中心的位置关系,确定所述边线的位置。
3.如权利要求1所述的方法,其特征在于,所述根据所述图像的角点位置进行图像矫正,包括:
识别所述图像中角点的坐标,根据标准角点位置对所述角点的坐标进行透视变换。
4.如权利要求3所述的方法,其特征在于,所述根据所述图像的角点位置进行图像矫正,还包括:
通过神经网络模型确定所述图像的旋转角度,对所述图像进行旋转变换。
5.如权利要求1~4任一项所述的方法,其特征在于,在所述对图像进行灰度处理和自适应阈值的二值化处理后,所述方法还包括:
对所述图像进行膨胀处理,以粗化所述图像中所有线条,所述膨胀处理后的图像作为所述二值化图像。
6.如权利要求1~4任一项所述的方法,其特征在于,确定所述最大连通区域,包括:
识别所述二值化图像中所有的连通区域;
计算所述连通区域的面积,确定所述面积最大的所述连通区域为所述最大连通区域。
7.如权利要求1~4任一项所述的方法,其特征在于,所述对所述图像外轮廓进行直线检测,包括:
将所述图像外轮廓复制到空白图片上;
采用霍夫直线法检测所述图像外轮廓中包含的直线。
8.一种图像矫正装置,其特征在于,包括:
图像处理模块,用于对图像进行灰度处理和自适应阈值的二值化处理,获得二值化图像;
外轮廓识别模块,用于提取所述二值化图像中的轮廓,在所述轮廓中确定围成的最大连通区域的轮廓为图像外轮廓;
边线识别模块,用于对所述图像外轮廓进行直线检测,根据预获取的图像形状特征以及检测到的直线特征,识别所述图像外轮廓的边线,确定所述边线的交点为所述图像的角点;
矫正模块,用于根据所述图像的角点位置进行图像矫正。
9.如权利要求8所述的装置,其特征在于,所述图像形状特征,包括:边斜率、图形中心位置信息;
所述边线识别模块,包括:
直线特征获取模块,用于获取所述直线特征,包括:直线长度、直线斜率、直线位置信息;
边线确定模块,用于将所述边斜率与所述直线斜率对比,获得斜率对比结果,若所述斜率对比结果满足斜率条件,则确定长度最长的直线为所述边线;
边线位置确定模块,用于将所述图形中心位置信息与所述直线位置信息对比,根据所述边线与所述图形中心的位置关系,确定所述边线的位置。
10.一种计算机系统,其特征在于,包括:
一个或多个处理器;以及
与所述一个或多个处理器关联的存储器,所述存储器用于存储程序指令,所述程序指令在被所述一个或多个处理器读取执行时,执行上述权利要求1~7任一项所述的方法。
Priority Applications (2)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011285424.9A CN112419207A (zh) | 2020-11-17 | 2020-11-17 | 一种图像矫正方法及装置、系统 |
CA3139448A CA3139448A1 (en) | 2020-11-17 | 2021-11-17 | Image correction method, device and system |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202011285424.9A CN112419207A (zh) | 2020-11-17 | 2020-11-17 | 一种图像矫正方法及装置、系统 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN112419207A true CN112419207A (zh) | 2021-02-26 |
Family
ID=74831542
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202011285424.9A Pending CN112419207A (zh) | 2020-11-17 | 2020-11-17 | 一种图像矫正方法及装置、系统 |
Country Status (2)
Country | Link |
---|---|
CN (1) | CN112419207A (zh) |
CA (1) | CA3139448A1 (zh) |
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023123763A1 (zh) * | 2021-12-31 | 2023-07-06 | 上海合合信息科技股份有限公司 | 一种文档图像的方向校正方法与装置 |
CN117173185A (zh) * | 2023-11-03 | 2023-12-05 | 东北大学 | 轧制板材的区域检测方法及装置、存储介质、计算机设备 |
Families Citing this family (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN115100224B (zh) * | 2022-06-29 | 2024-04-23 | 中国矿业大学 | 一种煤矿巷道掘进迎头交叉裂隙提取方法及系统 |
Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683139A (zh) * | 2017-02-20 | 2017-05-17 | 南京航空航天大学 | 基于遗传算法的鱼眼相机标定系统及其图像畸变矫正方法 |
CN110738604A (zh) * | 2019-07-31 | 2020-01-31 | 武汉大学 | 基于Canny算子和Hough变换的大倾角证件图像矫正方法及系统 |
US20200082208A1 (en) * | 2018-09-06 | 2020-03-12 | International Business Machines Corporation | Image binarization using mean restrain |
-
2020
- 2020-11-17 CN CN202011285424.9A patent/CN112419207A/zh active Pending
-
2021
- 2021-11-17 CA CA3139448A patent/CA3139448A1/en active Pending
Patent Citations (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN106683139A (zh) * | 2017-02-20 | 2017-05-17 | 南京航空航天大学 | 基于遗传算法的鱼眼相机标定系统及其图像畸变矫正方法 |
US20200082208A1 (en) * | 2018-09-06 | 2020-03-12 | International Business Machines Corporation | Image binarization using mean restrain |
CN110738604A (zh) * | 2019-07-31 | 2020-01-31 | 武汉大学 | 基于Canny算子和Hough变换的大倾角证件图像矫正方法及系统 |
Cited By (3)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
WO2023123763A1 (zh) * | 2021-12-31 | 2023-07-06 | 上海合合信息科技股份有限公司 | 一种文档图像的方向校正方法与装置 |
CN117173185A (zh) * | 2023-11-03 | 2023-12-05 | 东北大学 | 轧制板材的区域检测方法及装置、存储介质、计算机设备 |
CN117173185B (zh) * | 2023-11-03 | 2024-01-19 | 东北大学 | 轧制板材的区域检测方法及装置、存储介质、计算机设备 |
Also Published As
Publication number | Publication date |
---|---|
CA3139448A1 (en) | 2022-05-17 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110060237B (zh) | 一种故障检测方法、装置、设备及系统 | |
WO2021233266A1 (zh) | 边缘检测方法和装置、电子设备和存储介质 | |
CN112419207A (zh) | 一种图像矫正方法及装置、系统 | |
CN110348264B (zh) | 一种qr二维码图像校正方法及系统 | |
CN109738450B (zh) | 笔记本键盘的检测方法和装置 | |
JP2002133426A (ja) | 多値画像から罫線を抽出する罫線抽出装置 | |
CN112183038A (zh) | 一种表格识别套打方法、计算机设备及计算机可读存储介质 | |
CN110647882A (zh) | 图像校正方法、装置、设备及存储介质 | |
CN108830133A (zh) | 合同影像图片的识别方法、电子装置及可读存储介质 | |
CN109948521B (zh) | 图像纠偏方法和装置、设备及存储介质 | |
CN107545223B (zh) | 图像识别方法及电子设备 | |
CN112396050B (zh) | 图像的处理方法、设备以及存储介质 | |
CN109409356B (zh) | 一种基于swt的多方向中文印刷体文字检测方法 | |
CN111898610B (zh) | 卡片缺角检测方法、装置、计算机设备及存储介质 | |
CN112115948A (zh) | 一种基于深度学习的芯片表面字符识别方法 | |
JP2014164528A (ja) | 文字認識装置、文字認識方法及びプログラム | |
JP6542230B2 (ja) | 投影ひずみを補正するための方法及びシステム | |
CN110288040B (zh) | 一种基于拓扑验证的图像相似评判方法及设备 | |
CN117152165B (zh) | 感光芯片缺陷的检测方法、装置、存储介质及电子设备 | |
CN112419225B (zh) | 一种基于引脚分割的sop型芯片检测方法及系统 | |
CN111340040B (zh) | 一种纸张字符识别方法、装置、电子设备及存储介质 | |
WO2021195873A1 (zh) | 识别sfr测试卡图像中感兴趣区域的方法及装置、介质 | |
CN117372415A (zh) | 喉镜图像识别方法、装置、计算机设备及存储介质 | |
CN110610163B (zh) | 一种自然场景下基于椭圆拟合的表格提取方法及系统 | |
JP3303246B2 (ja) | 画像処理装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
RJ01 | Rejection of invention patent application after publication |
Application publication date: 20210226 |
|
RJ01 | Rejection of invention patent application after publication |