CN111242124A - 一种证件分类方法、装置及设备 - Google Patents

一种证件分类方法、装置及设备 Download PDF

Info

Publication number
CN111242124A
CN111242124A CN202010029903.8A CN202010029903A CN111242124A CN 111242124 A CN111242124 A CN 111242124A CN 202010029903 A CN202010029903 A CN 202010029903A CN 111242124 A CN111242124 A CN 111242124A
Authority
CN
China
Prior art keywords
certificate
candidate
type
identified
types
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202010029903.8A
Other languages
English (en)
Other versions
CN111242124B (zh
Inventor
陈志军
甘宇飞
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Alipay Labs Singapore Pte Ltd
Original Assignee
Alipay Labs Singapore Pte Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Alipay Labs Singapore Pte Ltd filed Critical Alipay Labs Singapore Pte Ltd
Priority to CN202010029903.8A priority Critical patent/CN111242124B/zh
Publication of CN111242124A publication Critical patent/CN111242124A/zh
Application granted granted Critical
Publication of CN111242124B publication Critical patent/CN111242124B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/23Clustering techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/24Aligning, centring, orientation detection or correction of the image
    • G06V10/245Aligning, centring, orientation detection or correction of the image by locating a pattern; Special marks for positioning
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Multimedia (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本说明书实施例提供一种证件分类方法、装置及设备。方案包括:采用分类模型对获取的证件图像进行初步识别,得到针对多种证件类型的多个置信度分数之后;对置信度分数大于第一预设分数的多个候选证件类型以及待识别证件进行二次比对,具体地,分别提取出多个候选证件类型中的标志区域和固定文字区域的多个特征向量,再提取出待识别证件中标志区域和固定文字区域的特征向量;计算第一特征向量与多个第二特征向量的相似度,在得到的多个相似度值中,将最大的相似度值对应的候选证件类型确定为待识别证件的类型。

Description

一种证件分类方法、装置及设备
技术领域
本说明书一个或多个实施例涉及计算机技术领域,尤其涉及一种证件分类方法、装置及设备。
背景技术
目前,随着互联网技术的发展,网上办理业务已经越来越普遍,越来越多的业务,如通信行业、金融行业、出入境等领域都需要对用户的证件信息进行采集和登记,以进行实名制管理。在对证件进行识别认证时,首先需要对证件进行分类,但是随着科学技术与经济的发展,证件种类逐渐增多,对证件进行分类显得更加困难。
现有技术中基于传统机器学习的多类证件检测分类模型对证件进行分类,在面临日益增多的证件类型时,分类的准确率较低,已经不能满足市场的需求。
因此,需要提供一种更可靠的证件分类方案。
发明内容
有鉴于此,本说明书一个或多个实施例提供了一种证件分类方法、装置及设备,用于提高证件分类的准确率。
为解决上述技术问题,本说明书实施例是这样实现的:
本说明书实施例提供的一种证件分类方法,包括:
获取待识别证件的证件图像;
采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
确定所述置信度分数大于第一预设分数的多个候选证件类型;
对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
本说明书实施例提供的一种证件分类装置,包括:
证件图像获取模块,用于获取待识别证件的证件图像;
识别模块,用于采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
第一候选证件类型确定模块,用于确定所述置信度分数大于第一预设分数的多个候选证件类型;
第一特征向量提取模块,用于对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
第二特征向量提取模块,用于分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
相似度计算模块,用于计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
证件类型确定模块,用于将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
本说明书实施例提供的一种证件分类设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待识别证件的证件图像;
采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
确定所述置信度分数大于第一预设分数的多个候选证件类型;
对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
本说明书实施例提供的一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现一种证件分类方法。
本说明书一个实施例实现了能够达到以下有益效果:在通过对采用分类模型对所述证件图像进行识别后,将置信度分数大于第一预设分数的多个候选证件类型再进行细粒度的特征提取;对待识别证件以及多个候选证件类型中的标志区域和固定文字区域进行特征提取,分别得到待识别证件的第一特征向量和多个证件类型对应的多个第二特征向量;计算第一特征向量与多个第二特征向量的相似度,得到多个相似度值;将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型对多种候选证件类型;通过将待识别证件和候选证件类型进行二次比对,提高了证件分类的准确率。
附图说明
此处所说明的附图用来提供对本说明书一个或多个实施例的进一步理解,构成本说明书一个或多个实施例的一部分,本说明书的示意性实施例及其说明用于解释本说明书一个或多个实施例,并不构成对本说明书一个或多个实施例的不当限定。在附图中:
图1为本说明书实施例中一种证件分类方法的整体方案示意图;
图2为本说明书实施例提供的一种证件分类方法的流程示意图;
图3为本说明书实施例提供的一种证件分类方法中的证件示意图;
图4为本说明书实施例提供的一种证件分类方法中分类结果为单峰结构的示意图;
图5为本说明书实施例提供的一种证件分类方法中分类结果为多峰结构的示意图;
图6为本说明书实施例提供的一种证件分类方法中特征聚类示意图;
图7为本说明书实施例提供的一种证件分类方法中二次比对流程示意图;
图8为本说明书实施例提供的对应于图2的一种证件分类装置的结构示意图;
图9为本说明书实施例提供的对应于图2的一种证件分类设备的结构示意图。
具体实施方式
为使本说明书一个或多个实施例的目的、技术方案和优点更加清楚,下面将结合本说明书具体实施例及相应的附图对本说明书一个或多个实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例仅是本说明书的一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本说明书一个或多个实施例保护的范围。
以下结合附图,详细说明本说明书各实施例提供的技术方案。
图1为本说明书实施例中一种证件分类方法的整体方案示意图。如图1所示,将待识别证件先进行CNN分类,得到每种证件类型对应的置信度分数,按照置信度分数将经过CNN分类得到的分类结果分为单峰结构和多峰结构,其中,多峰结构可以指的是大于第一预设分数的置信度分数存在多个,比如:置信度分数大于0.1的置信度分数有三个,这三个置信度分数分别对应类别4、类别7和类别9,此时,由于这三个类别的置信度分数接近,待识别证件属于这些多峰对应类别的概率接近,不能直接采用现有技术中的简单CNN分类模型来进行分类,需要进行细粒度识别,进行二次比对,进一步确定这三种候选证件类型与待识别证件的相似度分数,如图1中所示,假设经过二次比对后,证件类别4与待识别证件的相似度分数为0.67,证件类别7与待识别证件的相似度分数为0.99,证件类别9与待识别证件的相似度分数为0.5,此时,证件类别7与待识别证件的相似度分数最高,可以将证件类别7确定为待识别证件的类别。
单峰结构可以指的是大于第二预设分数的置信度分数只有一个,比如,置信度分数大于0.5的置信度分数只有一个,此时,直接将置信度分数大于0.5的证件类别5确定为待识别证件的证件类型。
接下来,将针对说明书实施例提供的一种证件分类方法结合附图进行具体说明:
图2为本说明书实施例提供的一种证件分类方法的流程示意图。从程序角度而言,流程的执行主体可以为搭载于应用服务器的程序或应用客户端。
如图2所示,该流程可以包括以下步骤:
步骤202:获取待识别证件的证件图像。
证件可以指用来证明用户身份、经历等证书和文件,比如:各个国家的居民身份证、护照、学生证和社保卡等证件。
待识别证件的证件图像可以是通过终端扫描或拍摄该待识别证件得到的,待识别证件的证件图像在本说明书中可以是证件的正面图像,当然,也可以根据实际需求将输入证件的反面图像作为证件图像,对此,本说明书并不进行限定。
步骤204:采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型。
分类模型可以是已有的卷积神经网络(Convolutional Neural Networks,以下简称CNN),该分类模型可以是提前采用证件类型训练得到的,采用分类模型对证件图像进行识别时,将待识别证件的证件图像输入训练完成的分类模型中,可以得到对应的分类结果。比如:采用分类模型可以将证件A识别为身份证、护照以及社保卡等证件类型,一种证件类型可以对应一个置信度分数。
一般情况下,输入一张的证件的N+1个分类结果进行训练,将训练样本中的证件识别成N种证件+1种其他类型,比如:输入1000中已知的证件的分类结果,进行训练,训练之后的分类模型可以输出1000种证件类别和一种不属于学习到的类别中的证件的其他类别。
步骤206:确定所述置信度分数大于第一预设分数的多个候选证件类型。
置信度,也可以称为可靠度,或置信水平、置信系数,它可以指特定个体对待特定命题真实性相信的程度,也就是概率是对个人信念合理性的量度。比如:在识别证件A时,识别证件A的证件类型为身份证时,对应身份证的置信度分数为0.6,可以认为“证件A为身份证”这一结论的可靠度为0.6。
一个证件对应所有证件类型的置信度分数之和为1,比如:识别证件A的证件类型为类型1,类型2,类型3,此时,类型1对应的置信度分数为X,类型2对应的置信度分数为Y,类型3对应的置信度分数为Z,那么,X+Y+Z=1。
设定置信度分数大于或等于0.2的都有可能是待识别证件的证件类型,此时,可能存在多种候选证件类型。
步骤208:对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量。
待识别证件中的标志区域可以是固定不变的标志区域,比如:马来西亚身份证中的国徽、芯片等;中国居民身份证上在性别项目的位置,有定向光变色的“长城”图案,在相片下有光变光存储的“中国CHINA”字样,以及背面的国徽等,都可以认为是证件中的标志区域。
固定文字区域可以是每张证件中固定不变的文字,比如:中国居民身份证的正面中的“姓名”、“性别”、“民族”、“出生”、“住址”以及“公民身份号码”,反面的“中华人民共和国”以及“居民身份证”等字样都可以认为是证件中的固定文字区域。
为了详细说明证件中的各个区域,可以结合附图3进行说明:
图3为本说明书实施例提供的一种证件分类方法中的证件示意图。如图3所示,以马来西亚身份证为例,包括标志区域301、文字区域以及人像区域303。其中,标志区域301可以包括国徽,芯片等,文字区域可以包括固定文字区域3021以及可变文字区域3022,这里需要强调的是,图3中框住的部分并非是全部,框住部分仅用于解释证件中可能包括的部分,而不是精确框定证件中的各个部分。其中,标志区域301和固定文字区域3021是每个马来西亚身份证中的固定部分。其中,固定文字区域3021中左上角的"KAD PENGENALANMALAYSIA",意为“马来西亚身份证”,旁边分别是MyKad标志以及马来西亚国旗。接着下面为身份证号码,而芯片下显示的是持卡人的名字和地址。持卡人照片位于芯片的右边。
证件中的标志区域和固定文字区域往往是标志证件类型的重要信息,比如:证件中的国徽往往可以识别出该证件属于哪个国家,证件中的证件名称可以识别出证件的具体类别。因此,需要对证件中的标志区域和固定文字区域中的特征进行提取,以便于后续对证件类型进行识别。
这里提到的第一特征向量可以有多个,具体地,可以一张证件中的全部标志区域对应一个特征向量,全部固定文字区域对应一个特征向量;也可以是每一个标志区域对应一个特征向量,每一个固定文字区域对应一个特征向量。
步骤210:分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量。
由于候选证件类型有多个,为了确定待识别证件属于哪种证件类型,需要将待识别证件与候选证件类型中的各个证件进行比对。在具体比对时,可以通过比对证件的标志区域和固定文字区域的相似度,来确定待识别证件所属的证件类型。因此,可以将候选证件类型中的每一种证件类型中的标志区域的特征向量以及固定文字区域中的特征向量提取出来,便于与待识别证件中提取出来的第一特征向量进行比对。这里提到的第二特征向量可以有多个,每一种证件类型中的一张证件也可以对应多个第二特征向量,比如:每一类证件的中一张证件可以对应每个标志区域和每个固定文字区域对应的特征向量,比如:证件A中包括3个标志区域和2个固定文字区域,此时,证件A可以对应5个特征向量,也可以将3个标志区域中的向量合并为一个特征向量,将2个固定文字区域中的向量合并为一个特征向量,这样,证件A就仅对应两个第二特征向量。当然,根据实际的需求,在实际应用场景中,也可以将所有区域对应的特征向量合并为一个特征向量。
步骤212:计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值。
在比对第一特征向量与多个第二特征向量的相似度时,可以采用计算向量相似度的方法进行计算。相似度就是比较两个事物的相似性。一般可以通过计算特征向量之间的距离来计算相似度,比如:采用余弦相似度、欧氏距离、曼哈顿距离等方法进行计算。待识别证件与每种证件类型进行相似度计算,能够得到待识别证件与多个证件类型比较之后的相似度值。
步骤214:将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
相似度值越大,可以认为对比的双方越相似,因此,可以将最大的相似度值对应的候选证件类型确定为待识别证件的类型。比如:待识别证件与A,B,C三种候选证件类型计算相似度之后,得到的相似度值分别为:证件类型A:0.9,证件类型B:0.6,证件类型C:0.4,此时可以将证件类型A作为待识别证件的证件类型。
应当理解,本说明书一个或多个实施例所述的方法其中部分步骤的顺序可以根据实际需要相互交换,或者其中的部分步骤也可以省略或删除。
图2中的方法,在通过对采用分类模型对所述证件图像进行识别后,将置信度分数大于第一预设分数的多个候选证件类型再进行细粒度的特征提取;对待识别证件以及多个候选证件类型中的标志区域和固定文字区域进行特征提取,分别得到待识别证件的第一特征向量和多个证件类型对应的多个第二特征向量;计算第一特征向量与多个第二特征向量的相似度,得到多个相似度值;将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型对多种候选证件类型;通过将待识别证件和候选证件类型进行二次比对,提高了证件分类的准确率。
基于图2的方法,本说明书实施例还提供了该方法的一些具体实施方案,下面进行说明。
采用分类模型对证件图像进行识别,得到的结果一般是多个证件类型对应的置信度分数,现有技术的方法中,直接将置信度分数最高的证件类型作为待识别证件的证件类型,这种方法随着证件类别的急剧增加,准确率会降低,比如:身份证和护照中都存在人像、姓名以及出生日期等等,在采用分类模型进行识别之后,可能会存在多个置信度分数接近的情况,比如:采用分类模型识别证件A,得到分类结果为:证件类型1,置信度分数为0.3,证件类型2,置信度分数为0.3,证件类型3,置信度分数为0.3,证件类型4,置信度分数为0.1,此时,证件类型1、证件类型2和证件类型3的置信度分数相同,此时无法准确确定出待识别证件的证件类型,但是,如果采用分类模型对待识别证件进行识别之后,大于第二预设分数的候选证件类型只有一个,那么该证件类型就是待识别证件的证件类型,具体可以采用以下步骤:
所述采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数之后,还可以包括:
确定所述置信度分数大于第二预设分数的一个候选证件类型;所述第二预设分数大于所述第一预设分数;
将所述置信度分数大于第二预设分数的候选证件类型确定为所述待识别证件的类型。
为了更好地理解,可以结合图4进行说明。
图4为本说明书实施例提供的一种证件分类方法中分类结果为单峰结构的示意图。如图4所示,分别采用条形图和折线图表示分类结果,图中横坐标表示证件类型标号,纵坐标表示置信度分数值,在采用分类模型对待识别证件进行识别之后,得到的N+1个结果中(图中为10个结果),证件类型5对应的置信度分值比较高,在0.8左右,其他的证件类型的置信度分数都比较低,都小于0.1。这种分类结果可以认为是单峰结构,即有一个结果的置信度分数远远高于其他结果的置信度分数,这种情况下,置信度分数最高的证件类型5可以认为是待识别证件的证件类型。
但是得到的置信度分数还可能会呈现多峰结构,如图5所示:
图5为本说明书实施例提供的一种证件分类方法中分类结果为多峰结构的示意图。图5中分别采用条形图和折线图表示分类结果,图中横坐标表示证件类型标号,纵坐标表示置信度分数值,在采用分类模型对待识别证件进行识别之后,得到的为10个结果中,证件类型4、证件类型7以及证件类型9的置信度分数比较接近,都在0.3左右,整体呈现多个峰值的结构,可以称为多峰结构,即N+1个结果中,有至少2个的置信度分值大于某个阈值(比如0.1),此时,证件类型4、证件类型7以及证件类型9都有可能是待识别证件的证件类型,此时,需要对待识别证件和多种候选证件类型进行二次比对,具体比对方法可以采用以下方法:
所述分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量之前,还可以包括:
对所述多个所述候选证件类型中的一个候选证件类型,获取所述一个候选证件类型的多个证件样本;
根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域;
采用卷积神经网络分别提取所述标志区域和所述固定文字区域中的特征向量,得到所述多个证件样本的多个特征向量;
对所述多个特征向量按照区域进行聚类,得到所述标志区域的第一聚类中心向量,以及所述固定文字区域的第二聚类中心向量;
基于所述第一聚类中心向量与所述第二聚类中心向量,得到所述一个候选证件类型对应的第二特征向量。
需要说明的是,这里提供的用于进行特征向量提取的卷积神经网络与对证件进行初步识别的分类模型并不相同。分类模型用于对待识别证件进行初步识别,而这里的卷积神经网络模型用于提取证件中对应区域的特征向量。
在实际应用场景中,每个证件可以分为人像区域、标志区域以及文字区域,在进行区域标定时,可以是根据人为提前设定的标准尺寸进行标定,比如:提前设置每张证件四个角的位置坐标,然后限定各个区域对应的坐标范围。具体地,所述根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域之前,还可以包括:
确定所述候选证件边角的四个顶点的初始位置坐标;
根据所述候选证件边角的四个顶点的初始位置坐标将所述候选证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。
仿射变换是在几何上定义为两个向量空间之间的一个仿射变换或者仿射映射,由一个非奇异的线性变换(运用一次函数进行的变换)接上一个平移变换组成。仿射变换主要包括平移变换、旋转变换、缩放变换、倾斜变换以及翻转变换。有六个自由度仿射变换保持二维图形的“平直性”和“平行性”,但是角度会改变。
将全部的候选证件进行仿射变换并归一化至标准尺寸,可以理解为对候选证件类型中的证件进行预处理,其目的是为了能够更好地标定出各个证件中的区域,以便于在二次比对时,能够按照划分的区域进行对齐比较。
在实际应用中,当分类结果呈现多峰结构时,可以理解为存在多个候选证件类型,此时,需要进行二次比对,在进行二次比对时,具体是将证件的相同区域的特征向量进行比对,例如:将待识别证件的标志区域与候选证件类型中的标志区域进行比对,将待识别证件的人像区域与候选证件类型中的人像区域进行比对。因此,在比对之前,需要对每类证件进行区域标定。由于,在上面的阐述中已经知道各个证件的标准尺寸,因此,在实际应用中,可以根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域。
在标定好区域之后,由于标志区域和固定文字区域中的信息是固定不变的,最能标识证件的类型。因此,采用卷积神经网络对候选证件类型中的证件样本的标志区域和固定文字区域进行特征提取,可以得到多个证件样本的多个特征向量。
在得到多个证件样本对应的多个特征向量之后,可以按照区域进行聚类,如图6所示,图6为本说明书实施例提供的一种证件分类方法中特征聚类示意图。图6中以标志区域为例,采用统一的CNN网络分别对同一类型的两张证件(证件A和证件B)中的国旗标志所在的标志区域进行特征提取,从证件A中提取得到特征向量Feature1,从证件B中提取得到特征向量Feature2,将两个证件的标志区域提取出来的特征向量进行聚类,聚类得到的Feature3可以作为标志区域的特征向量。
按照区域进行聚类,得到所述标志区域的第一聚类中心向量,以及所述固定文字区域的第二聚类中心向量;基于所述第一聚类中心向量与所述第二聚类中心向量,得到所述一个候选证件类型对应的第二特征向量。例如:候选证件类型X的证件样本中有证件1-3,采用卷积神经网络分别提取出:证件1中的标志区域的特征向量A1,固定文字区域的特征向量B1,证件2中的标志区域的特征向量A2,固定文字区域的特征向量B2,证件3中的标志区域的特征向量A3,固定文字区域的特征向量B3,可以将A1、A2、A3进行聚类,得到第一聚类中心向量A,将B1、B2、B3进行聚类,得到第一聚类中心向量B,第一聚类中心向量A可以作为候选证件类型X的标志区域对应的第二特征向量,第二聚类中心向量B可以作为候选证件类型X的固定文字区域对应的第二特征向量。
在进行二次对比时,待识别证件也需要提取其标志区域和固定文字区域对应的特征向量,具体方法如下:
所述对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量,具体可以包括:
根据所述待识别证件在标准尺寸下的位置坐标确定所述待识别证件的标志区域和固定文字区域;
采用卷积神经网络提取所述待识别证件的标志区域和所述固定文字区域中的特征向量;
对所述特征向量按照区域进行聚类,得到所述待识别证件的标志区域的第三聚类中心向量,以及所述待识别证件的固定文字区域的第四聚类中心向量;
基于所述第三聚类中心向量与所述第四聚类中心向量,得到所述待识别证件的第一特征向量。
所述根据所述待识别证件在标准尺寸下的位置坐标确定所述待识别证件的标志区域和固定文字区域之前,还可以包括:
确定所述待识别证件边角的四个顶点的初始位置坐标;
根据所述待识别证件边角的四个顶点的初始位置坐标将所述待识别证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。
在对待识别证件的标志区域和固定文字区域进行特征向量提取时,采用的方法原理与对候选证件类型中的证件样本中的标志区域和固定文字区域进行特征向量提取的原理相似,可以参照上述对候选证件类型中证件样本的第二特征向量的提取方法,此处不再进行赘述。
通过上述方法,对待识别证件和候选证件类型进行细粒度的特征向量提取,具体提取待识别证件和候选证件类型中的标志区域和固定文字区域对应的特征向量,抽取不变的通用特征向量;对每种候选证件类型不变的通用特征进行聚类,以类中心代表这个区域特征,可以剔除受到的光照、质量等因素的影响,以提高二次比对的准确度,进一步提高对证件进行分类的准确率。
图2的方法步骤中,采用分类模型对待识别证件进行初步识别,对CNN结果进行分析,得到候选证件类型,可以缩小所属分类候选类型范围。在采用分类模型对待识别证件进行初步识别之前,需要采用样本训练得到分类模型,具体的训练过程可以采用以下步骤:
所述采用分类模型对所述证件图像进行识别之前,还可以包括:
获取已知证件类型的训练样本;
提取所述训练样本对应的第三特征向量;
将所述第三特征向量输入待训练的分类模型进行训练,得到所述分类模型输出的对所述训练样本中各个证件的证件类型分类结果;
将全部所述训练样本中的证件类型分类结果与全部所述训练样本的已知证件类型进行比对,得到比对结果;
当所述比对结果表示全部所述训练样本中的证件类型分类结果与全部所述训练样本的已知证件类型相比,准确率达到预设阈值时,得到训练完成的分类模型。
在具体进行模型训练时,训练样本可以是已知证件类型的样本,提取训练样本中的特征向量之后就可以对待训练分类模型进行训练,训练模型时,还存在测试样本,训练样本和测试样本可以相同,也可以不同,可以将已知证件类型的全部样本输入到训练后的分类模型中,得到分类结果之后,将得到的分类结果与已知的证件类型进行一一比对,如果准确率得到要求,可以认为模型训练完成。
通过上述方法,可以对待识别证件进行初步识别,缩小待识别证件所属分类候选类型的范围,为后续证件分类减少工作量,从而提高证件分类的效率。
在分别提取得到待识别证件和各种候选证件类型中的标志区域和固定文字区域的特征向量之后,可以按照区域对待识别证件和各种候选证件类型进行比对,具体比对时,可以通过计算相似度的方法来进行比对,具体可以采用以下方法:
所述计算所述第一特征向量与所述多个第二特征向量的相似度,具体可以包括:
针对任意一种候选证件类型,将所述待识别证件中标志区域中的特征向量与所述候选证件类型中标志区域的特征向量进行相似度计算,得到第一分值;
将所述待识别证件中固定文字区域中的特征向量与所述候选证件类型中固定文字区域的特征向量进行相似度计算,得到第二分值;
采用人脸检测算法检测所述候选证件类型中的人像区域中是否存在人像,得到第一检测结果;
采用文字检测算法检测所述候选证件类型中的可变文字区域中是否存在文字,得到第二检测结果;
根据所述第一分值、所述第二分值、所述第一检测结果与所述第二检测结果计算所述待识别证件与任意一种所述候选证件类型之间的相似度值。
需要说明的是,证件中的文字区域一般可以分为固定文字区域和可变文字区域,比如:中国居民身份证中的“姓名”、“性别”、“出生”等字样是固定不变的,属于固定文字区域,而每个人的姓名可以不同,性别有差异,出生日期也不同,这些可变的文字属于可变文字区域。每个人的长相都存在差异,因此,人像区域属于可变的区域。在提取特征向量时,仅提取固定不变的区域对应的特征向量,可变的区域只需要判断或检测是否存在同类型的信息即可。比如:检测人像区域是否都有人像,可变文字区域中是否都有文字即可。
在比较两个证件是否相似时,可以通过比对证件中各个区域中的固定信息的相似度以及存在的区域,两张同类型的证件,应该包括相同的区域,并且其证件中的标志区域和固定文字区域应该是相同的,因此,在具体比较证件的相似度时,可以计算固定不变的区域(标志区域和固定文字区域)的特征向量的相似度,并检测人像区域是否有人像,可变文字区域是否有文字,根据得到的相似度的值以及检测的结果就可以计算待识别证件与任意一种候选证件类型之间的相似度。
其中,根据所述第一分值、所述第二分值、所述第一检测结果与所述第二检测结果计算所述待识别证件与任意一种所述候选证件类型之间的相似度值时,可以采用多种方法。具体地,可以将检测结果也对应赋予分值,然后将检测结果与计算得到的相似度值按照预设规则进行加权,得到最终的相似度分值。具体地,可以采用人脸检测算法检测所述候选证件类型中的人像区域,判断所述候选证件类型中的人像区域中是否存在人像,当所述候选证件类型中的人像区域中存在人像时,得到的分值为1;当候选证件类型中的人像区域中不存在人像时,得到的分值为0。采用文字检测算法检测候选证件类型中的可变文字区域,判断候选证件类型中的可变文字区域中是否存在文字,当存在文字时,得到的分值为1,不存在文字时,得到的分值为0。如果以赋予检测结果分值的方法,可以结合下面的附图7进行说明:
图7为本说明书实施例提供的一种证件分类方法中二次比对流程示意图,如图7所示,从待识别证件中提取出各个区域对应的特征向量(Feature0、Feature1、Feature2)以及检测结果(Face1、Text1),从候选证件类型A中提取出各个区域对应的特征向量(Feature0’、Feature1’、Feature2’)以及检测结果(Face2、Text2),按照区域进行对齐对比,Feature0与Feature0’进行比对得到分数score0,Feature1与Feature1’进行比对得到分数score1……,最终将所有分数按照预设规则进行整合,得到最终的相似度分数score,将最终的相似度分数score作为待识别证件与候选证件类型A的相似度分数。当然,附图7中在进行二次对比时,是按照划分出来的各个小区域分别进行比对,在实际应用中,也可以将属于同一区域的特征向量进行聚类,然后再进行比对,例如可以将芯片区域与国徽区域统称为标志区域,聚类为一个特征向量,然后进行比对。附图7中显示的过程仅用于解释进行细粒度划分区域之后进行比对,并不对本方案造成任何限定。
例如:将待识别证件A中标志区域中的特征向量与候选证件类型(证件1、证件2和证件3)中标志区域的特征向量进行相似度计算,得到第一分值,分别为:证件A与证件1(0.7),证件A与证件2(0.8),证件A与证件3(0.9);将待识别证件A中固定文字区域中的特征向量与候选证件类型(证件1、证件和证件3)中固定文字区域的特征向量进行相似度计算,得到第二分值,分别为:证件A与证件1(0.3),证件A与证件2(0.4),证件A与证件3(0.8),检测人像区域结果:证件1(有人像,分值为1),证件2(有人像,分值为1),证件3(有人像,分值为1),检测可变文字区域结果:证件1(有文字,分值为1),证件2(有文字,分值为1),证件3(有文字,分值为1),假设预设规则为简单求和,则得到的待识别证件A与候选证件类型之间的相似度值分别为:证件A与证件1的相似度值=0.7+0.3+1+1=3,证件A与证件2的相似度值=0.8+0.4+1+1=3.2,证件A与证件3的相似度值=0.9+0.8+1+1=3.7,证件A与证件3的相似度值最大,可以将证件3对应的证件类型作为待识别证件A的证件类型。
当然,在进行加权时,也可以对第一分值、第二分值、第一检测结果以及第二检测结果进行权重赋值,赋值后再按照预设规则进行加权求和。另外,此处根据所述第一分值、所述第二分值、所述第一检测结果与所述第二检测结果计算所述待识别证件与任意一种所述候选证件类型之间的相似度值的方法可以根据实际情况进行设置,本说明书实施例对此不进行限定。
通过上述方法,将待识别证件与候选证件类型进行二次比对,能够提高证件分类的准确率。
本说明书实施例中的方法,可以实现以下技术效果:
1)采用CNN分类模型对待识别证件进行初步识别,并对识别结果进行分析,缩小了待识别证件所属候选证件类型的范围,为后续证件分类减少工作量,从而提高证件分类的效率。
2)对各种证件进行区域标定,抽取不变区域中的通用特征,并对证件中不变区域的特征向量进行聚类,以类中心代表这个区域的特征向量,可以剔除受到的光照、质量等因素的影响。
3)将分类证件和候选分类进行二次比对,可以大大提高证件分类的准确率。
基于同样的思路,本说明书实施例还提供了上述方法对应的装置。图8为本说明书实施例提供的对应于图2的一种证件分类装置的结构示意图。如图8所示,该装置可以包括:
证件图像获取模块802,用于获取待识别证件的证件图像;
识别模块804,用于采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
第一候选证件类型确定模块806,用于确定所述置信度分数大于第一预设分数的多个候选证件类型;
第一特征向量提取模块808,用于对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
第二特征向量提取模块810,用于分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
相似度计算模块812,用于计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
证件类型确定模块814,用于将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
可选的,所述装置,还可以用于:
确定所述置信度分数大于第二预设分数的一个候选证件类型;所述第二预设分数大于所述第一预设分数;
将所述置信度分数大于第二预设分数的候选证件类型确定为所述待识别证件的类型。
可选的,所述装置,还可以包括:
证件样本获取模块,用于对所述多个所述候选证件类型中的一个候选证件类型,获取所述一个候选证件类型的多个证件样本;
候选证件类型标志区域和固定文字区域确定模块,用于根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域;
候选证件类型特征向量提取模块,用于采用卷积神经网络分别提取所述标志区域和所述固定文字区域中的特征向量,得到所述多个证件样本的多个特征向量;
聚类模块,用于对所述多个特征向量按照区域进行聚类,得到所述标志区域的第一聚类中心向量,以及所述固定文字区域的第二聚类中心向量;
第二特征向量提取模块,用于基于所述第一聚类中心向量与所述第二聚类中心向量,得到所述一个候选证件类型对应的第二特征向量。
可选的,所述第一特征向量提取模块808,具体可以包括:
待识别证件标志区域和固定文字区域确定单元,用于根据所述待识别证件在标准尺寸下的位置坐标确定所述待识别证件的标志区域和固定文字区域;
待识别证件特征向量提取单元,用于采用卷积神经网络提取所述待识别证件的标志区域和所述固定文字区域中的特征向量;
聚类单元,用于对所述特征向量按照区域进行聚类,得到所述待识别证件的标志区域的第三聚类中心向量,以及所述待识别证件的固定文字区域的第四聚类中心向量;
第一特征向量提取单元,用于基于所述第三聚类中心向量与所述第四聚类中心向量,得到所述待识别证件的第一特征向量。
可选的,候选证件类型标志区域和固定文字区域确定模块,还可以用于:
确定所述候选证件边角的四个顶点的初始位置坐标;
根据所述候选证件边角的四个顶点的初始位置坐标将所述候选证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。
可选的,所述待识别证件标志区域和固定文字区域确定单元,还可以用于:
确定所述待识别证件边角的四个顶点的初始位置坐标;
根据所述待识别证件边角的四个顶点的初始位置坐标将所述待识别证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。
可选的,所述装置,还可以包括:
训练样本获取模块,用于获取已知证件类型的训练样本;
第三特征向量提取模块,用于提取所述训练样本对应的第三特征向量;
训练模块,用于将所述第三特征向量输入待训练的分类模型进行训练,得到所述分类模型输出的对所述训练样本中各个证件的证件类型分类结果;
比对模块,用于将全部所述训练样本中的证件类型分类结果与全部所述训练样本的已知证件类型进行比对,得到比对结果;
分类模型确定模块,用于当所述比对结果表示全部所述训练样本中的证件类型分类结果与全部所述训练样本的已知证件类型相比,准确率达到预设阈值时,得到训练完成的分类模型。
可选的,所述相似度计算模块812,具体可以包括:
第一分值确定单元,用于针对任意一种候选证件类型,将所述待识别证件中标志区域中的特征向量与所述候选证件类型中标志区域的特征向量进行相似度计算,得到第一分值;
第二分值确定单元,用于将所述待识别证件中固定文字区域中的特征向量与所述候选证件类型中固定文字区域的特征向量进行相似度计算,得到第二分值;
第一检测单元,用于采用人脸检测算法检测所述候选证件类型中的人像区域中是否存在人像,得到第一检测结果;
第二检测单元,用于采用文字检测算法检测所述候选证件类型中的可变文字区域中是否存在文字,得到第二检测结果;
相似度值计算单元,用于根据所述第一分值、所述第二分值、所述第一检测结果与所述第二检测结果计算所述待识别证件与任意一种所述候选证件类型之间的相似度值。
基于同样的思路,本说明书实施例还提供了上述方法对应的设备。图9为本说明书实施例提供的对应于图2的一种实体名称匹配设备的结构示意图。如图9所示,设备900可以包括:
至少一个处理器910;以及,
与所述至少一个处理器通信连接的存储器930;其中,
所述存储器930存储有可被所述至少一个处理器910执行的指令920,所述指令被所述至少一个处理器910执行。
所述指令可以使所述至少一个处理器910能够:
获取待识别证件的证件图像;
采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
确定所述置信度分数大于第一预设分数的多个候选证件类型;
对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
基于同样的思路,本说明书实施例还提供了上述方法对应的计算机可读介质。计算机可读介质上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现以下方法:
获取待识别证件的证件图像;
采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
确定所述置信度分数大于第一预设分数的多个候选证件类型;
对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
在20世纪90年代,对于一个技术的改进可以很明显地区分是硬件上的改进(例如,对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而,随着技术的发展,当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此,不能说一个方法流程的改进就不能用硬件实体模块来实现。例如,可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray,FPGA))就是这样一种集成电路,其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上,而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且,如今,取代手工地制作集成电路芯片,这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现,它与程序开发撰写时所用的软件编译器相类似,而要编译之前的原始代码也得用特定的编程语言来撰写,此称之为硬件描述语言(Hardware Description Language,HDL),而HDL也并非仅有一种,而是有许多种,如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等,目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚,只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中,就可以很容易得到实现该逻辑方法流程的硬件电路。
控制器可以按任何适当的方式实现,例如,控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit,ASIC)、可编程逻辑控制器和嵌入微控制器的形式,控制器的例子包括但不限于以下微控制器:ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320,存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道,除了以纯计算机可读程序代码方式实现控制器以外,完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件,而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至,可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。
上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
为了描述的方便,描述以上装置时以功能分为各种单元分别描述。当然,在实施本说明书一个或多个实施例时可以把各单元的功能在同一个或多个软件和/或硬件中实现。
本领域内的技术人员应明白,本说明书一个或多个实施例可提供为方法、系统、或计算机程序产品。因此,本说明书一个或多个实施例可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且,本说明书一个或多个实施例可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。
本说明书一个或多个实施例是参照根据本说明书一个或多个实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
在一个典型的配置中,计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。
内存可能包括计算机可读介质中的非永久性存储器,随机存取存储器(RAM)和/或非易失性内存等形式,如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。
计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitorymedia),如调制的数据信号和载波。
还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。
本说明书一个或多个实施例可以在由计算机执行的计算机可执行指令的一般上下文中描述,例如程序模块。一般地,程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本说明书一个或多个实施例,在这些分布式计算环境中,由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中,程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。
本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
以上所述仅为本说明书的实施例而已,并不用于限制本说明书一个或多个实施例。对于本领域技术人员来说,本说明书一个或多个实施例可以有各种更改和变化。凡在本说明书一个或多个实施例的精神和原理之内所作的任何修改、等同替换、改进等,均应包含在本说明书一个或多个实施例的权利要求范围之内。

Claims (11)

1.一种证件分类方法,包括:
获取待识别证件的证件图像;
采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
确定所述置信度分数大于第一预设分数的多个候选证件类型;
对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
2.如权利要求1所述的方法,所述采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数之后,还包括:
确定所述置信度分数大于第二预设分数的一个候选证件类型;所述第二预设分数大于所述第一预设分数;
将所述置信度分数大于第二预设分数的候选证件类型确定为所述待识别证件的类型。
3.如权利要求1所述的方法,所述分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量之前,还包括:
对所述多个所述候选证件类型中的一个候选证件类型,获取所述一个候选证件类型的多个证件样本;
根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域;
采用卷积神经网络分别提取所述标志区域和所述固定文字区域中的特征向量,得到所述多个证件样本的多个特征向量;
对所述多个特征向量按照区域进行聚类,得到所述标志区域的第一聚类中心向量,以及所述固定文字区域的第二聚类中心向量;
基于所述第一聚类中心向量与所述第二聚类中心向量,得到所述一个候选证件类型对应的第二特征向量。
4.如权利要求1所述的方法,所述对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量,具体包括:
根据所述待识别证件在标准尺寸下的位置坐标确定所述待识别证件的标志区域和固定文字区域;
采用卷积神经网络提取所述待识别证件的标志区域和所述固定文字区域中的特征向量;
对所述特征向量按照区域进行聚类,得到所述待识别证件的标志区域的第三聚类中心向量,以及所述待识别证件的固定文字区域的第四聚类中心向量;
基于所述第三聚类中心向量与所述第四聚类中心向量,得到所述待识别证件的第一特征向量。
5.如权利要求3所述的方法,所述根据所述多个证件样本在标准尺寸下的位置坐标确定所述证件样本的标志区域和固定文字区域之前,还包括:
确定所述候选证件边角的四个顶点的初始位置坐标;
根据所述候选证件边角的四个顶点的初始位置坐标将所述候选证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。
6.如权利要求4所述的方法,所述根据所述待识别证件在标准尺寸下的位置坐标确定所述待识别证件的标志区域和固定文字区域之前,还包括:
确定所述待识别证件边角的四个顶点的初始位置坐标;
根据所述待识别证件边角的四个顶点的初始位置坐标将所述待识别证件进行仿射变换并归一化至标准尺寸;
确定所述四个顶点在所述标准尺寸下的位置坐标。
7.如权利要求1所述的方法,所述采用分类模型对所述证件图像进行识别之前,还包括:
获取已知证件类型的训练样本;
提取所述训练样本对应的第三特征向量;
将所述第三特征向量输入待训练的分类模型进行训练,得到所述分类模型输出的对所述训练样本中各个证件的证件类型分类结果;
将全部所述训练样本中的证件类型分类结果与全部所述训练样本的已知证件类型进行比对,得到比对结果;
当所述比对结果表示全部所述训练样本中的证件类型分类结果与全部所述训练样本的已知证件类型相比,准确率达到预设阈值时,得到训练完成的分类模型。
8.如权利要求1所述的方法,所述计算所述第一特征向量与所述多个第二特征向量的相似度,具体包括:
针对任意一种候选证件类型,将所述待识别证件中标志区域中的特征向量与所述候选证件类型中标志区域的特征向量进行相似度计算,得到第一分值;
将所述待识别证件中固定文字区域中的特征向量与所述候选证件类型中固定文字区域的特征向量进行相似度计算,得到第二分值;
采用人脸检测算法检测所述候选证件类型中的人像区域中是否存在人像,得到第一检测结果;
采用文字检测算法检测所述候选证件类型中的可变文字区域中是否存在文字,得到第二检测结果;
根据所述第一分值、所述第二分值、所述第一检测结果与所述第二检测结果计算所述待识别证件与任意一种所述候选证件类型之间的相似度值。
9.一种证件分类装置,包括:
证件图像获取模块,用于获取待识别证件的证件图像;
识别模块,用于采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
候选证件类型确定模块,用于确定所述置信度分数大于第一预设分数的多个候选证件类型;
第一特征向量提取模块,用于对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
第二特征向量提取模块,用于分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
相似度计算模块,用于计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
证件类型确定模块,用于将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
10.一种证件分类设备,包括:
至少一个处理器;以及,
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够:
获取待识别证件的证件图像;
采用分类模型对所述证件图像进行识别,得到针对多种证件类型的多个置信度分数,所述一个置信度分数对应于一种证件类型;
确定所述置信度分数大于第一预设分数的多个候选证件类型;
对所述待识别证件中的标志区域和固定文字区域进行特征提取,得到所述待识别证件的第一特征向量;
分别获取所述多个候选证件类型中标志区域和固定文字区域对应的第二特征向量,得到多个第二特征向量;
计算所述第一特征向量与所述多个第二特征向量的相似度,得到多个相似度值;
将最大的相似度值对应的候选证件类型确定为所述待识别证件的类型。
11.一种计算机可读介质,其上存储有计算机可读指令,所述计算机可读指令可被处理器执行以实现权利要求1至8中任一项所述的证件分类方法。
CN202010029903.8A 2020-01-13 2020-01-13 一种证件分类方法、装置及设备 Active CN111242124B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010029903.8A CN111242124B (zh) 2020-01-13 2020-01-13 一种证件分类方法、装置及设备

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010029903.8A CN111242124B (zh) 2020-01-13 2020-01-13 一种证件分类方法、装置及设备

Publications (2)

Publication Number Publication Date
CN111242124A true CN111242124A (zh) 2020-06-05
CN111242124B CN111242124B (zh) 2023-10-31

Family

ID=70864151

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010029903.8A Active CN111242124B (zh) 2020-01-13 2020-01-13 一种证件分类方法、装置及设备

Country Status (1)

Country Link
CN (1) CN111242124B (zh)

Cited By (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232336A (zh) * 2020-09-02 2021-01-15 深圳前海微众银行股份有限公司 一种证件识别方法、装置、设备及存储介质
CN112686844A (zh) * 2020-12-10 2021-04-20 广州广电运通金融电子股份有限公司 基于视频质检场景的阈值设定方法、存储介质和系统
CN112686248A (zh) * 2020-12-10 2021-04-20 广州广电运通金融电子股份有限公司 证件增减类别检测方法、装置、可读存储介质和终端
CN113657398A (zh) * 2021-08-18 2021-11-16 北京百度网讯科技有限公司 图像识别方法和装置
CN114550244A (zh) * 2022-02-11 2022-05-27 支付宝(杭州)信息技术有限公司 一种活体检测方法、装置及设备
CN114627089A (zh) * 2022-03-21 2022-06-14 成都数之联科技股份有限公司 缺陷识别方法、装置、计算机设备及计算机可读存储介质
CN115502166A (zh) * 2022-08-24 2022-12-23 艾斯特国际安全技术(深圳)有限公司 证件自动识别损毁方法、系统、装置及存储介质
CN116269443A (zh) * 2023-04-03 2023-06-23 中国人民解放军海军特色医学中心 一种密闭舱水下作业时驾驶员疲劳检测方法及系统

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009025856A (ja) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd 帳票識別プログラム及び帳票識別装置
CN106257495A (zh) * 2015-06-19 2016-12-28 阿里巴巴集团控股有限公司 一种数字识别方法及装置
US20170132866A1 (en) * 2014-06-20 2017-05-11 Theodore Kuklinski A self-learning system and methods for automatic document recognition, authentication, and information extraction
CN110245714A (zh) * 2019-06-20 2019-09-17 厦门美图之家科技有限公司 图像识别方法、装置及电子设备
CN110263694A (zh) * 2019-06-13 2019-09-20 泰康保险集团股份有限公司 一种票据识别方法及装置
CN110298338A (zh) * 2019-06-20 2019-10-01 北京易道博识科技有限公司 一种文档图像分类方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP2009025856A (ja) * 2007-07-17 2009-02-05 Hitachi Computer Peripherals Co Ltd 帳票識別プログラム及び帳票識別装置
US20170132866A1 (en) * 2014-06-20 2017-05-11 Theodore Kuklinski A self-learning system and methods for automatic document recognition, authentication, and information extraction
CN106257495A (zh) * 2015-06-19 2016-12-28 阿里巴巴集团控股有限公司 一种数字识别方法及装置
CN110263694A (zh) * 2019-06-13 2019-09-20 泰康保险集团股份有限公司 一种票据识别方法及装置
CN110245714A (zh) * 2019-06-20 2019-09-17 厦门美图之家科技有限公司 图像识别方法、装置及电子设备
CN110298338A (zh) * 2019-06-20 2019-10-01 北京易道博识科技有限公司 一种文档图像分类方法及装置

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
陈增照;何秀玲;杨扬;董才林;: "基于多特征融合的票据分类技术及应用", no. 09, pages 2 - 3 *

Cited By (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112232336A (zh) * 2020-09-02 2021-01-15 深圳前海微众银行股份有限公司 一种证件识别方法、装置、设备及存储介质
CN112686844A (zh) * 2020-12-10 2021-04-20 广州广电运通金融电子股份有限公司 基于视频质检场景的阈值设定方法、存储介质和系统
CN112686248A (zh) * 2020-12-10 2021-04-20 广州广电运通金融电子股份有限公司 证件增减类别检测方法、装置、可读存储介质和终端
CN112686248B (zh) * 2020-12-10 2022-07-22 广州广电运通金融电子股份有限公司 证件增减类别检测方法、装置、可读存储介质和终端
CN112686844B (zh) * 2020-12-10 2022-08-30 深圳广电银通金融电子科技有限公司 基于视频质检场景的阈值设定方法、存储介质和系统
CN113657398A (zh) * 2021-08-18 2021-11-16 北京百度网讯科技有限公司 图像识别方法和装置
CN114550244A (zh) * 2022-02-11 2022-05-27 支付宝(杭州)信息技术有限公司 一种活体检测方法、装置及设备
CN114627089A (zh) * 2022-03-21 2022-06-14 成都数之联科技股份有限公司 缺陷识别方法、装置、计算机设备及计算机可读存储介质
CN115502166A (zh) * 2022-08-24 2022-12-23 艾斯特国际安全技术(深圳)有限公司 证件自动识别损毁方法、系统、装置及存储介质
CN115502166B (zh) * 2022-08-24 2024-07-26 艾斯特国际安全技术(深圳)有限公司 证件自动识别损毁方法、系统、装置及存储介质
CN116269443A (zh) * 2023-04-03 2023-06-23 中国人民解放军海军特色医学中心 一种密闭舱水下作业时驾驶员疲劳检测方法及系统

Also Published As

Publication number Publication date
CN111242124B (zh) 2023-10-31

Similar Documents

Publication Publication Date Title
CN111242124B (zh) 一种证件分类方法、装置及设备
US8744196B2 (en) Automatic recognition of images
CN104217203B (zh) 复杂背景卡面信息识别方法及系统
Bulatovich et al. MIDV-2020: a comprehensive benchmark dataset for identity document analysis
WO2010092952A1 (ja) パターン認識装置
US10354134B1 (en) Feature classification with spatial analysis
CN109766885A (zh) 一种文字检测方法、装置、电子设备及存储介质
Shi et al. Stroke detector and structure based models for character recognition: a comparative study
CN111291797A (zh) 一种防伪识别方法、装置及电子设备
CN113111880B (zh) 证件图像校正方法、装置、电子设备及存储介质
Petrova et al. Weighted combination of per-frame recognition results for text recognition in a video stream
CN112232336A (zh) 一种证件识别方法、装置、设备及存储介质
Mondal et al. Review and comparison of face detection techniques
CN111310634A (zh) 证件类型识别模板的生成方法、证件识别方法及装置
Igorevna et al. Document image analysis and recognition: a survey
WO2014198055A1 (en) Image processing including adjoin feature based object detection, and/or bilateral symmetric object segmentation
CN112287763A (zh) 图像处理方法、装置、设备及介质
Tsai et al. Recognition of Vehicle License Plates from a Video Sequence.
Chatbri et al. An application-independent and segmentation-free approach for spotting queries in document images
CN114299509A (zh) 一种获取信息的方法、装置、设备及介质
CN110287973A (zh) 一种基于低秩鲁棒线性鉴别分析的图像特征提取方法
Ou et al. ERCS: An efficient and robust card recognition system for camera-based image
Kuramoto et al. Accuracy improvement of viewpoint-free scene character recognition by rotation angle estimation
Soghadi et al. License plate detection and recognition by convolutional neural networks
CN114443834A (zh) 一种证照信息提取的方法、装置及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant