CN110059711A - 图像的对齐方法、装置及设备 - Google Patents

图像的对齐方法、装置及设备 Download PDF

Info

Publication number
CN110059711A
CN110059711A CN201910081583.8A CN201910081583A CN110059711A CN 110059711 A CN110059711 A CN 110059711A CN 201910081583 A CN201910081583 A CN 201910081583A CN 110059711 A CN110059711 A CN 110059711A
Authority
CN
China
Prior art keywords
image
characteristic point
aligned
characteristic
pair
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910081583.8A
Other languages
English (en)
Inventor
郭明宇
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Advanced New Technologies Co Ltd
Advantageous New Technologies Co Ltd
Original Assignee
Alibaba Group Holding Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alibaba Group Holding Ltd filed Critical Alibaba Group Holding Ltd
Priority to CN201910081583.8A priority Critical patent/CN110059711A/zh
Publication of CN110059711A publication Critical patent/CN110059711A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/243Aligning, centring, orientation detection or correction of the image by compensating for image skew or non-uniform image deformations
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/757Matching configurations of points or features

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Image Analysis (AREA)

Abstract

本说明书实施例提供一种图像的对齐方法、装置及设备,在图像的对齐方法中,确定待对齐图像。获取与待对齐图像相匹配的、已对齐的图像模板。根据特征提取算法,在待对齐图像上提取N个特征点,以及在图像模板上提取M个特征点。将N个特征点与M个特征点进行特征匹配,以得到多组匹配成功的特征点对。根据所述多组匹配成功的特征点对,计算最优投影变换矩阵。根据最优投影变换矩阵,对待对齐图像进行投影变换,得到对齐后的图像。

Description

图像的对齐方法、装置及设备
技术领域
本说明书一个或多个实施例涉及图像处理技术领域,尤其涉及一种图像的对齐方法、装置及设备。
背景技术
在对图像进行识别时,如果图像存在倾斜等情况,则会影响图像识别算法的准确率。因此,在对图像进行识别之前,可以先对待识别图像对齐,即将倾斜的图像转正,之后再进行识别。
传统的图像的对齐方法可以如下:检测待对齐图像的内容区域R。在R中通过像素分割方法,切分出目标像素与其它像素。使用边缘提取算法,提取出目标像素与其它像素之间的边缘像素。将边缘像素拟合为四条线段形成四边形,将四边形的四个端点映射到矩形的四个端点上,并计算映射投影变换矩阵M。根据M,对待对齐图像进行投影变换,从而得到对齐后的目标图像。由此可以看出,传统的图像的对齐方法需要执行内容区域检测、目标像素分割、边缘检测以及拟合四边形等耗时长且准确率低的步骤。
因此,需要提供一种高效率、高准确率的图像的对齐方法。
发明内容
本说明书一个或多个实施例描述了一种图像的对齐方法、装置及设备,可以提高图像对齐的效率以及准确率。
第一方面,提供了一种图像的对齐方法,包括:
确定待对齐图像;
获取与所述待对齐图像相匹配的、已对齐的图像模板;
根据特征提取算法,在所述待对齐图像上提取N个特征点,以及在所述图像模板上提取M个特征点;
将所述N个特征点与所述M个特征点进行特征匹配,以得到多组匹配成功的特征点对;
根据所述多组匹配成功的特征点对,计算最优投影变换矩阵;
根据所述最优投影变换矩阵,对所述待对齐图像进行投影变换,得到对齐后的图像。
第二方面,提供了一种图像的对齐装置,包括:
确定单元,用于确定待对齐图像;
获取单元,用于获取与所述确定单元确定的所述待对齐图像相匹配的、已对齐的图像模板;
提取单元,用于根据特征提取算法,在所述待对齐图像上提取N个特征点,以及在所述图像模板上提取M个特征点;
匹配单元,用于将所述提取单元提取的所述N个特征点与所述M个特征点进行特征匹配,以得到多组匹配成功的特征点对;
计算单元,用于根据所述多组匹配成功的特征点对,计算最优投影变换矩阵;
投影变换单元,用于根据所述计算单元计算得到的所述最优投影变换矩阵,对所述待对齐图像进行投影变换,得到对齐后的图像。
第三方面,提供了一种图像的对齐设备,包括:
存储器;
一个或多个处理器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序被所述处理器执行时实现以下步骤:
确定待对齐图像;
获取与所述待对齐图像相匹配的、已对齐的图像模板;
根据特征提取算法,在所述待对齐图像上提取N个特征点,以及在所述图像模板上提取M个特征点;
将所述N个特征点与所述M个特征点进行特征匹配,以得到多组匹配成功的特征点对;
根据所述多组匹配成功的特征点对,计算最优投影变换矩阵;
根据所述最优投影变换矩阵,对所述待对齐图像进行投影变换,得到对齐后的图像。
本说明书一个或多个实施例提供的图像的对齐方法、装置及设备,确定待对齐图像。获取与待对齐图像相匹配的、已对齐的图像模板。根据特征提取算法,在待对齐图像上提取N个特征点,以及在图像模板上提取M个特征点。将N个特征点与M个特征点进行特征匹配,以得到多组匹配成功的特征点对。根据所述多组匹配成功的特征点对,计算最优投影变换矩阵。根据最优投影变换矩阵,对待对齐图像进行投影变换,得到对齐后的图像。由此,可以大大提高图像对齐的效率以及准确率。
附图说明
为了更清楚地说明本说明书实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
图1为本说明书提供的图像的对齐方法应用场景示意图;
图2为本说明书一个实施例提供的图像的对齐方法流程图;
图3为本说明书提供的证件图像的对齐方法示意图;
图4为本说明书一个实施例提供的图像的对齐装置示意图;
图5为本说明书一个实施例提供的图像的对齐设备示意图。
具体实施方式
下面结合附图,对本说明书提供的方案进行描述。
在描述本说明提供的方案之前,先对本方案的发明构思作以下说明。
目前,在很多的场景下都会用到图像的文字或字符识别技术。如,在实名认证场景中,通常需要通过识别光学字符识别(Optical Character Recognition,OCR)算法,对证件图像中的文字和/或字符进行识别。OCR算法的识别过程如下:检测暗、亮的模式确定字符形状,然后用字符识别方法将形状翻译成计算机文字。然而,当证件图像出现倾斜等情况时,会大大影响识别算法的准确率。因此,可以先对证件图像进行对齐,之后再进行识别。
本申请的申请人考虑到,证件图像的类型比较有限,且同一类型的证件图像通常包括统一排版的内容。以证件图像为身份证图像为例来说,其从上至下,从左至右所包含的内容分别为:姓名、性别、民族、出生年月日、住址以及公民身份证号。因此,可以考虑基于已对齐的同类型证件图像(以下称模板图像),来识别待对齐证件图像。那么如何实现两者的结合呢?
申请人了解到,图像拼接技术就是将数张有重叠部分的图像(可能是不同时间、不同视角或者不同传感器获得的)拼成一幅大型的无缝高分辨率图像的技术。因此,可以考虑将待对齐证件图像与模板图像进行拼接,来实现图像的对齐。该拼接过程可以通过在待对齐证件图像以及模板图像上提取特征点的方法来实现。其具体实现过程后续说明,在此不复赘述。
需要说明的是,虽然上述仅对证件图像的对齐方法的发明构思进行了描述,但本说明书的对齐对象不限制于证件图像,与证件图像具有相类似特征(如,固定排版等)的其它图像均适用于上述对齐方法,本说明对此不作限定。
以下对本说明书提供的方案进行详细阐述。
图1为本说明书提供的图像的对齐方法应用场景示意图。图1中的实名认证系统102可以为任一需要对用户的身份进行认证的系统。如,可以为银行系统、支付系统以及其它相类似的业务系统。当实名认证系统102获取到用户的待对齐图像时,可以将该待对齐图像发送给图像对齐系统104。图像对齐系统104获取与待对齐图像相匹配的、已对齐的图像模板。根据特征提取算法,在待对齐图像上提取N个特征点,以及在图像模板上提取M个特征点。将N个特征点与M个特征点进行特征匹配,以得到多组匹配成功的特征点对。根据所述多组匹配成功的特征点对,计算最优投影变换矩阵。根据最优投影变换矩阵,对待对齐图像进行投影变换,得到对齐后的图像。
图2为本说明书一个实施例提供的图像的对齐方法流程图。所述方法的执行主体可以为具有处理能力的设备:服务器或者系统或者装置,如,可以为图1中的图像对齐系统104等。如图2所示,所述方法具体可以包括:
步骤202,确定待对齐图像。
该待对齐图像可以是由实名认证系统102发送的。其可以为证件图像,也可以为与证件图像具有相类似特征(如,固定排版等)的其它图像。在本说明书中,以待对齐图像为证件图像为例进行说明。
步骤204,获取与待对齐图像相匹配的、已对齐的图像模板。
在一个例子中,可以是从模板库中获取上述相匹配的图像模板。这里的模板库中可以预先存储有多种类型的图像模板。这里的类型是以图像内容的类型来定义的。如,可以包括但不限于身份证的图像模板(即图像内容为身份证信息)、银行卡的图像模板(即图像内容为银行卡信息)或者其它证件的图像模板。以某类型图像模板为例来说,其可以是通过人工对预先收集的该类型图像进行预处理后得到的。这里的预处理可以包括但不限于裁剪和/或矫正等。其中,裁剪可以理解为是从证件图像中切割出证件区域。矫正可以理解为是将倾斜的证件图像或者证件区域转正。
上述获取与待对齐图像相匹配的图像模板也可以理解为:在模板库中查找与待对齐图像包含相同类型图像内容的图像模板。如,在待对齐图像为身份证图像时,即在待对齐图像所包含的图像内容为身份证信息时,与其相匹配的图像模板可以为:身份证的图像模板。可以理解的是,由于证件图像通常包括统一排版的内容。因此,在本说明书中,待对齐图像与图像模板所包含的图像内容的排版可以相同。
步骤206,根据特征提取算法,在待对齐图像上提取N个特征点,以及在图像模板上提取M个特征点。
其中,N和M均为大于等于4的正整数。在本说明书中,N和M可以相等也可以不相等。
这里的特征提取算法可以包括但不限于尺度不变特征转换(Scale-InvariantFeature Transform,SIFT)算法、加速鲁棒特征(Speed Up Robust Features,SURF)算法、快速特征提取(FAST)算法、二进制强大的独立基本特征(Binary Robust IndependentElementary Features,BREIF)算法以及二进制简单描述符(Oriented FAST and RotatedBRIEF,ORB)算法等。通过特征提取算法,在图像上提取特征点为传统常规技术,在此不复赘述。
需要说明的是,通过特征提取算法在图像上提取的特征点具有对应的特征向量。对应于不同的特征提取算法,该特征向量的维度以及所代表的物理含义通常也是不一致的。基于上述特征向量,可以实现图像间特征点的特征匹配。
步骤208,将N个特征点与M个特征点进行特征匹配,以得到多组匹配成功的特征点对。
在一种实现方式中,可以基于前述特征向量,穷举计算N个特征点与M个特征点之间的相似度距离。当N个特征点中的第i特征点与M个特征点中第j特征点之间的相似度距离小于阈值时,将第i特征点与第j特征点确定为一组匹配成功的特征点对。其中,1≤i≤N;1≤j≤M。可以理解的是,在针对每个特征点对的相似度距离进行如上是否小于阈值的判断之后,就可以得到多组匹配成功的特征点对。
需要说明的是,由于可能会存在N(M)个特征点中某个特征点与M(N)个特征点中两个以上特征点之间的相似度距离都小于阈值的情况。因此,在得到上述多组匹配成功的特征点对之后,还可以执行如下步骤:
判断多组匹配成功的特征点对中是否存在包含相同特征点的两组以上目标特征点对。当存在时,对两组以上目标特征点对的相似度距离进行比较。保留相似度距离最小的目标特征点对,并删除其它目标特征点对。
举例来说,假设通过相似度距离与阈值的比较,得到的多组匹配成功的特征点对为:(特征点A,特征点X)、(特征点A,特征点Y)、(特征点B,特征点Z)、(特征点C,特征点P)以及(特征点D,特征点Q)。由于前两组特征点对包含了相同的特征点A,因此可以将该两组特征点对选取为目标特征点对。假设第一组特征点对(即特征点A与特征点X)的相似度距离大于第二组特征点对(即特征点A与特征点Y)的相似度距离,则可以保留第二组特征点对:(特征点A,特征点Y)。从而,最终得到的特征点对可以为:(特征点A,特征点Y)、(特征点B,特征点Z)、(特征点C,特征点P)以及(特征点D,特征点Q)。
应理解,上述只是举例说明,在实际应用中,获取的特征点对通常为百余对或者千余对,本说明书对此不作限定。
需要说明的是,本说明书通过保留相似度距离最小的特征点对,可以保证选取的特征点对最相似,进而可以提升图像之间重叠部分判断的准确性。
在其它实现方式中,也可以基于前述特征向量,穷举计算N个特征点与M个特征点之间的相似度。当计算特征点之间的相似度时,则可以选取相似度大于阈值的特征点对作为匹配成功的特征点对。
应理解,根据上述多组匹配成功的特征点对,就可以确定出待对齐图像与图像模板之间的重叠部分。基于该重叠部分,就可以实现该两幅图像的准确拼接,进而可以提高图像对齐的准确率。
步骤210,根据多组匹配成功的特征点对,计算最优投影变换矩阵。
在待对齐图像为二维图像时,上述最优投影变换矩阵的大小一般为:3*3。
上述步骤210也可以理解为:求解特征点对中待对齐图像上的特征点(表示为:Pi)映射到图像模板上的特征点(表示为:Pt)的最优投影变换矩阵。
在一个例子中,特征点Pt、特征点Pi以及投影变换举证之间的关系可以表示为如下公式:
其中,(xt,yt)可以为特征点Pt的二维坐标,(xi,yi)可以为特征点Pi的二维坐标,可以为投影变换矩阵。
通常,基于四个特征点对的二维坐标,就可以唯一地确定出一个投影变换矩阵。当特征点对的数目比较多时,会求解出多个投影变换矩阵。本说明书可以从求解出的多个投影变换矩阵中选取出最优投影变换矩阵。
步骤212,根据最优投影变换矩阵,对待对齐图像进行投影变换,得到对齐后的图像。
需要说明的是,基于投影矩阵对图像进行投影变换为传统常规技术,在此不复赘述。
可以理解的是,在执行完步骤212之后,就实现了待对齐图像与图像模板之间的拼接,而拼接结果即为待对齐图像对齐后的图像。
综上,本说明书实施例提供的图像的对齐方法,通过将待对齐图像与相匹配的图像模板进行图像拼接,来实现待对齐图像的对齐。如前所述,由于两者之间所包含图像内容的类型和/或排版相同,从而可以实现准确拼接。此外,由于图像模板中通常只包含证件区域,从而可以保证本方案只关注有效区域,进而可以提高图像对齐效率。
此外,由于本方案去掉了传统技术中内容区域检测、目标像素分割、边缘检测以及拟合四边形的四个步骤,精简为提取特征点的步骤,从而降低了对齐算法的复杂度,极大得降低了算法耗时。其次,上述四个步骤通常都有一定误差,并容易受到图像中背景的干扰,这会影响最终对齐效果(例如,将白色的证件放在白纸上拍摄的图像,就很难得到正确的像素分割结果)。而本说明书通过获取待对齐图像与图像模板之间相匹配的特征点对的方法,可以保证对齐算法只关注待对齐图像的正文内容,对齐效果更加准确。
以下以待对齐图像为证件图像为例,对其对齐过程进行说明。
图3为本说明书提供的证件图像的对齐方法示意图。图3中,在确定待对齐证件图像之后,首先获取与该待对齐证件图像相匹配的、已对齐的证件图像模板。之后,通过特征提取算法,从该两幅图像(即待对齐证件图像和证件图像模板)中提取特征点。将从两幅图像中提取的特征点进行特征匹配,并得到多组匹配成功的特征点对。基于得到的多组匹配成功的特征点对,计算最优投影变换矩阵。最后,根据该最优投影变换矩阵,对待对齐证件图像进行投影变换,从而得到已对齐证件图像。
本说明书实施例提供的证件图像的对齐方法,可以提高证件图像对齐的效率和准确率。
与上述图像的对齐方法对应地,本说明书一个实施例还提供的一种图像的对齐装置,如图4所示,该装置可以包括:
确定单元402,用于确定待对齐图像。
获取单元404,用于获取与确定单元402确定的待对齐图像相匹配的、已对齐的图像模板。
其中,待对齐图像与图像模板可以包含相同类型的图像内容;和/或,待对齐图像与图像模板所包含的图像内容的排版相同。
提取单元406,用于根据特征提取算法,在待对齐图像上提取N个特征点,以及在图像模板上提取M个特征点。
这里的特征提取算法可以包括以下任一种:尺度不变特征转换SIFT算法、加速鲁棒特征SURF算法、快速特征提取算法、二进制强大的独立基本特征BREIF算法以及二进制简单描述符ORB算法等。
匹配单元408,用于将提取单元406提取的N个特征点与M个特征点进行特征匹配,以得到多组匹配成功的特征点对。
上述特征点具有对应的特征向量。匹配单元408具体可以用于:
基于特征向量,穷举计算N个特征点与M个特征点之间的相似度距离。
当N个特征点中的第i特征点与M个特征点中第j特征点之间的相似度距离小于阈值时,将第i特征点与第j特征点确定为一组匹配成功的特征点对。其中,1≤i≤N;1≤j≤M。
计算单元410,用于根据多组匹配成功的特征点对,计算最优投影变换矩阵。
投影变换单元412,用于根据计算单元410计算得到的最优投影变换矩阵,对待对齐图像进行投影变换,得到对齐后的图像。
可选地,该装置还可以包括:
判断单元414,用于判断多组匹配成功的特征点对中是否存在包含相同特征点的两组以上目标特征点对。
比较单元416,用于当判断单元414判断存在两组以上目标特征点对时,对两组以上目标特征点对的相似度距离进行比较。
处理单元418,用于保留相似度距离最小的目标特征点对,并删除其它目标特征点对。
本说明书上述实施例装置的各功能模块的功能,可以通过上述方法实施例的各步骤来实现,因此,本说明书一个实施例提供的装置的具体工作过程,在此不复赘述。
本说明书一个实施例提供的图像的对齐装置,确定单元402确定待对齐图像。获取单元404获取与待对齐图像相匹配的、已对齐的图像模板。提取单元406根据特征提取算法,在待对齐图像上提取N个特征点,以及在图像模板上提取M个特征点。匹配单元408将N个特征点与M个特征点进行特征匹配,以得到多组匹配成功的特征点对。计算单元410根据多组匹配成功的特征点对,计算最优投影变换矩阵。投影变换单元412根据最优投影变换矩阵,对待对齐图像进行投影变换,得到对齐后的图像。由此,可以提高图像对齐的效率和准确率。
本说明书一个实施例提供的图像的对齐装置可以为图1中图像对齐系统104的一个模块或者单元。
与上述图像的对齐方法对应地,本说明书实施例还提供了一种图像的对齐设备,如图5所示,该设备可以包括:存储器502、一个或多个处理器504以及一个或多个程序。其中,该一个或多个程序存储在存储器502中,并且被配置成由一个或多个处理器504执行,该程序被处理器504执行时实现以下步骤:
确定待对齐图像。
获取与待对齐图像相匹配的、已对齐的图像模板。
根据特征提取算法,在待对齐图像上提取N个特征点,以及在图像模板上提取M个特征点。
将N个特征点与M个特征点进行特征匹配,以得到多组匹配成功的特征点对。
根据多组匹配成功的特征点对,计算最优投影变换矩阵。
根据最优投影变换矩阵,对待对齐图像进行投影变换,得到对齐后的图像。
本说明书一个实施例提供的图像的对齐设备,可以提高图像对齐的效率和准确率。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于设备实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
结合本说明书公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于RAM存储器、闪存、ROM存储器、EPROM存储器、EEPROM存储器、寄存器、硬盘、移动硬盘、CD-ROM或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于服务器中。当然,处理器和存储介质也可以作为分立组件存在于服务器中。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
上述对本说明书特定实施例进行了描述。其它实施例在所附权利要求书的范围内。在一些情况下,在权利要求书中记载的动作或步骤可以按照不同于实施例中的顺序来执行并且仍然可以实现期望的结果。另外,在附图中描绘的过程不一定要求示出的特定顺序或者连续顺序才能实现期望的结果。在某些实施方式中,多任务处理和并行处理也是可以的或者可能是有利的。
以上所述的具体实施方式,对本说明书的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本说明书的具体实施方式而已,并不用于限定本说明书的保护范围,凡在本说明书的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本说明书的保护范围之内。

Claims (11)

1.一种图像的对齐方法,包括:
确定待对齐图像;
获取与所述待对齐图像相匹配的、已对齐的图像模板;
根据特征提取算法,在所述待对齐图像上提取N个特征点,以及在所述图像模板上提取M个特征点;
将所述N个特征点与所述M个特征点进行特征匹配,以得到多组匹配成功的特征点对;
根据所述多组匹配成功的特征点对,计算最优投影变换矩阵;
根据所述最优投影变换矩阵,对所述待对齐图像进行投影变换,得到对齐后的图像。
2.根据权利要求1所述的方法,所述特征点具有对应的特征向量;所述将所述N个特征点与所述M个特征点进行特征匹配,以得到多组匹配成功的特征点对,包括:
基于所述特征向量,穷举计算所述N个特征点与所述M个特征点之间的相似度距离;
当所述N个特征点中的第i特征点与所述M个特征点中第j特征点之间的相似度距离小于阈值时,将所述第i特征点与所述第j特征点确定为一组匹配成功的特征点对;
其中,1≤i≤N;1≤j≤M。
3.根据权利要求2所述的方法,还包括:
判断所述多组匹配成功的特征点对中是否存在包含相同特征点的两组以上目标特征点对;
当存在时,对所述两组以上目标特征点对的相似度距离进行比较;
保留相似度距离最小的目标特征点对,并删除其它目标特征点对。
4.根据权利要求1所述的方法,所述待对齐图像与所述图像模板包含相同类型的图像内容;和/或,所述待对齐图像与所述图像模板所包含的图像内容的排版相同。
5.根据权利要求1-4任一项所述的方法,所述特征提取算法包括以下任一种:尺度不变特征转换SIFT算法、加速鲁棒特征SURF算法、快速特征提取算法、二进制强大的独立基本特征BREIF算法以及二进制简单描述符ORB算法。
6.一种图像的对齐装置,包括:
确定单元,用于确定待对齐图像;
获取单元,用于获取与所述确定单元确定的所述待对齐图像相匹配的、已对齐的图像模板;
提取单元,用于根据特征提取算法,在所述待对齐图像上提取N个特征点,以及在所述图像模板上提取M个特征点;
匹配单元,用于将所述提取单元提取的所述N个特征点与所述M个特征点进行特征匹配,以得到多组匹配成功的特征点对;
计算单元,用于根据所述多组匹配成功的特征点对,计算最优投影变换矩阵;
投影变换单元,用于根据所述计算单元计算得到的所述最优投影变换矩阵,对所述待对齐图像进行投影变换,得到对齐后的图像。
7.根据权利要求6所述的装置,所述特征点具有对应的特征向量;所述匹配单元具体用于:
基于所述特征向量,穷举计算所述N个特征点与所述M个特征点之间的相似度距离;
当所述N个特征点中的第i特征点与所述M个特征点中第j特征点之间的相似度距离小于阈值时,将所述第i特征点与所述第j特征点确定为一组匹配成功的特征点对;
其中,1≤i≤N;1≤j≤M。
8.根据权利要求7所述的装置,还包括:
判断单元,用于判断所述多组匹配成功的特征点对中是否存在包含相同特征点的两组以上目标特征点对;
比较单元,用于当所述判断单元判断存在所述两组以上目标特征点对时,对所述两组以上目标特征点对的相似度距离进行比较;
处理单元,用于保留相似度距离最小的目标特征点对,并删除其它目标特征点对。
9.根据权利要求6所述的装置,所述待对齐图像与所述图像模板包含相同类型的图像内容;和/或,所述待对齐图像与所述图像模板所包含的图像内容的排版相同。
10.根据权利要求6-9任一项所述的装置,所述特征提取算法包括以下任一种:尺度不变特征转换SIFT算法、加速鲁棒特征SURF算法、快速特征提取算法、二进制强大的独立基本特征BREIF算法以及二进制简单描述符ORB算法。
11.一种图像的对齐设备,包括:
存储器;
一个或多个处理器;以及
一个或多个程序,其中所述一个或多个程序存储在所述存储器中,并且被配置成由所述一个或多个处理器执行,所述程序被所述处理器执行时实现以下步骤:
确定待对齐图像;
获取与所述待对齐图像相匹配的、已对齐的图像模板;
根据特征提取算法,在所述待对齐图像上提取N个特征点,以及在所述图像模板上提取M个特征点;
将所述N个特征点与所述M个特征点进行特征匹配,以得到多组匹配成功的特征点对;
根据所述多组匹配成功的特征点对,计算最优投影变换矩阵;
根据所述最优投影变换矩阵,对所述待对齐图像进行投影变换,得到对齐后的图像。
CN201910081583.8A 2019-01-28 2019-01-28 图像的对齐方法、装置及设备 Pending CN110059711A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910081583.8A CN110059711A (zh) 2019-01-28 2019-01-28 图像的对齐方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910081583.8A CN110059711A (zh) 2019-01-28 2019-01-28 图像的对齐方法、装置及设备

Publications (1)

Publication Number Publication Date
CN110059711A true CN110059711A (zh) 2019-07-26

Family

ID=67316453

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910081583.8A Pending CN110059711A (zh) 2019-01-28 2019-01-28 图像的对齐方法、装置及设备

Country Status (1)

Country Link
CN (1) CN110059711A (zh)

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539914A (zh) * 2020-03-24 2020-08-14 上海交通大学 一种手机照片质量比较评价方法、系统及终端
CN111695441A (zh) * 2020-05-20 2020-09-22 平安科技(深圳)有限公司 图像文档处理方法、装置及计算机可读存储介质
CN112613506A (zh) * 2020-12-23 2021-04-06 金蝶软件(中国)有限公司 图像中的文本识别方法、装置、计算机设备和存储介质

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819835A (zh) * 2012-07-26 2012-12-12 中国航天科工集团第三研究院第八三五七研究所 一种图像拼接中筛选特征点匹配对的方法
CN106709500A (zh) * 2015-11-13 2017-05-24 国网辽宁省电力有限公司检修分公司 一种图像特征匹配的方法
CN107330856A (zh) * 2017-06-17 2017-11-07 南京理工大学 一种基于投影变换和薄板样条的全景成像方法
CN107392947A (zh) * 2017-06-28 2017-11-24 西安电子科技大学 基于轮廓共面四点集的2d‑3d图像配准方法

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN102819835A (zh) * 2012-07-26 2012-12-12 中国航天科工集团第三研究院第八三五七研究所 一种图像拼接中筛选特征点匹配对的方法
CN106709500A (zh) * 2015-11-13 2017-05-24 国网辽宁省电力有限公司检修分公司 一种图像特征匹配的方法
CN107330856A (zh) * 2017-06-17 2017-11-07 南京理工大学 一种基于投影变换和薄板样条的全景成像方法
CN107392947A (zh) * 2017-06-28 2017-11-24 西安电子科技大学 基于轮廓共面四点集的2d‑3d图像配准方法

Cited By (5)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111539914A (zh) * 2020-03-24 2020-08-14 上海交通大学 一种手机照片质量比较评价方法、系统及终端
CN111695441A (zh) * 2020-05-20 2020-09-22 平安科技(深圳)有限公司 图像文档处理方法、装置及计算机可读存储介质
WO2021151274A1 (zh) * 2020-05-20 2021-08-05 平安科技(深圳)有限公司 图像文档处理方法、装置、电子设备及计算机可读存储介质
CN111695441B (zh) * 2020-05-20 2024-05-10 平安科技(深圳)有限公司 图像文档处理方法、装置及计算机可读存储介质
CN112613506A (zh) * 2020-12-23 2021-04-06 金蝶软件(中国)有限公司 图像中的文本识别方法、装置、计算机设备和存储介质

Similar Documents

Publication Publication Date Title
US9858472B2 (en) Three-dimensional facial recognition method and system
RU2668717C1 (ru) Генерация разметки изображений документов для обучающей выборки
US10303968B2 (en) Method and apparatus for image recognition
US8538164B2 (en) Image patch descriptors
CN104217203B (zh) 复杂背景卡面信息识别方法及系统
Bulatovich et al. MIDV-2020: a comprehensive benchmark dataset for identity document analysis
CN104318568B (zh) 一种图像配准的方法和系统
CN110807454B (zh) 基于图像分割的文字定位方法、装置、设备及存储介质
CN110059711A (zh) 图像的对齐方法、装置及设备
US10832030B2 (en) Method and apparatus of selecting candidate fingerprint image for fingerprint recognition
CN111079571A (zh) 证卡信息识别及其边缘检测模型训练方法、装置
WO2022134831A1 (zh) 证件图片生成方法、装置、设备及存储介质
CN112613506A (zh) 图像中的文本识别方法、装置、计算机设备和存储介质
US20160125253A1 (en) Method and apparatus for image matching
CN113011426A (zh) 一种识别证件的方法和装置
RU2673015C1 (ru) Способы и системы оптического распознавания символов серии изображений
Rizvi et al. Optical character recognition based intelligent database management system for examination process control
CN112580499A (zh) 文本识别方法、装置、设备及存储介质
Shukla et al. An approach for skew detection using hough transform
Steger et al. Failure detection for facial landmark detectors
Lin et al. A case study on mathematical expression recognition to GPU
CN104462111A (zh) 图像检索数据库建立方法
Zhang et al. Transform invariant text extraction
Bonarrigo et al. A robust pipeline for rapid feature-based pre-alignment of dense range scans
Alsimry et al. A new approach for finding duplicated words in scanned Arabic documents based on OCR and SURF.

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
TA01 Transfer of patent application right

Effective date of registration: 20201015

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Innovative advanced technology Co.,Ltd.

Address before: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant before: Advanced innovation technology Co.,Ltd.

Effective date of registration: 20201015

Address after: Cayman Enterprise Centre, 27 Hospital Road, George Town, Grand Cayman Islands

Applicant after: Advanced innovation technology Co.,Ltd.

Address before: A four-storey 847 mailbox in Grand Cayman Capital Building, British Cayman Islands

Applicant before: Alibaba Group Holding Ltd.

TA01 Transfer of patent application right
RJ01 Rejection of invention patent application after publication

Application publication date: 20190726

RJ01 Rejection of invention patent application after publication