CN118053165A

CN118053165A - 证件类型识别模板的生成方法、证件识别方法及装置

Info

Publication number: CN118053165A
Application number: CN202410281584.8A
Authority: CN
Inventors: 郭明宇
Original assignee: Alipay Labs Singapore Pte Ltd
Current assignee: Alipay Labs Singapore Pte Ltd
Priority date: 2020-02-10
Filing date: 2020-02-10
Publication date: 2024-05-17
Also published as: CN111310634B; CN111310634A

Abstract

本说明书实施例公开了证件类型识别模板的生成方法、证件识别方法及装置。所述证件类型识别模板的生成方法，包括：获取证件的第一图像；根据用户在所述第一图像上的第一操作，确定所述第一图像的第一区域，所述第一区域具有人脸图像信息；根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有标识信息；根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板。

Description

证件类型识别模板的生成方法、证件识别方法及装置

技术领域

本申请涉及证件识别及计算机技术领域，尤其涉及一种证件类型识别模板的生成方法、证件识别方法、装置及设备。

背景技术

现有技术中，为了加快证件识别速度，越来越多的证件扫描装置被用来对证件进行自动识别。但是，传统的证件扫描识别产品只能针对某种固定证件进行扫描，如果需要对一种新的证件进行识别，就需要重新进行算法研发来生成新的证件模板，然后采用这个证件模板对新的证件进行识别。但是，生成证件模板的过程往往需要比较长的研发周期，从而造成证件扫描装置的新类型证件的扩展能力较弱。

需要提供更快速的证件模板的生成方案。

发明内容

有鉴于此，本申请实施例提供了一种证件类型识别模板的生成方法、证件识别方法、装置及设备，用于加快证件模板的生成速度。

为解决上述技术问题，本说明书实施例是这样实现的：

本说明书实施例提供的一种证件类型识别模板的生成方法，包括：

获取证件的第一图像；

根据用户在所述第一图像上的第一操作，确定所述第一图像的第一区域，所述第一区域具有人脸图像信息；

根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有标识信息；

根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板。

本说明书实施例提供的一种证件识别方法，包括：

获取用户选择的目标证件类型；

调取所述目标证件类型对应的证件模板，所述证件模板是预先根据用户的操作生成的，所述证件模板中包括人脸图像信息和标识信息；

获取待识别证件的第一图像；

基于所述证件模板，确定所述第一图像的人脸置信度；

基于所述证件模板，确定所述第一图像的标识相似度；

当所述人脸置信度和所述标识相似度满足设定要求时，确定所述待识别证件为所述目标证件类型。

本说明书实施例提供的一种证件类型识别模板的生成装置，包括：

第一图像获取模块，用于获取证件的第一图像；

第一区域确定模块，用于根据用户在所述第一图像上的第一操作，确定所述第一图像的第一区域，所述第一区域具有人脸图像信息；

第二区域确定模块，用于根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有标识信息；

证件模板生成模块，用于根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板。

本说明书实施例提供的一种证件识别装置，包括：

目标证件类型获取模块，用于获取用户选择的目标证件类型；

证件模板调取模块，用于调取所述目标证件类型对应的证件模板，所述证件模板是预先根据用户的操作生成的，所述证件模板中包括人脸图像信息和标识信息；

第一图像获取模块，用于获取待识别证件的第一图像；

人脸置信度确定模块，用于基于所述证件模板，确定所述第一图像的人脸置信度；

标识相似度确定模块，用于基于所述证件模板，确定所述第一图像的标识相似度；

待识别证件确定模块，用于当所述人脸置信度和所述标识相似度满足设定要求时，确定所述待识别证件为所述目标证件类型。

本说明书实施例提供的一种证件类型识别模板的生成设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

所述存储器存储有可被所述至少一个处理器执行的指令，所述指令被所述至少一个处理器执行，以使所述至少一个处理器能够：

获取证件的第一图像；

本说明书实施例提供的一种证件识别设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

获取用户选择的目标证件类型；

获取待识别证件的第一图像；

基于所述证件模板，确定所述第一图像的人脸置信度；

基于所述证件模板，确定所述第一图像的标识相似度；

本说明书实施例提供的一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现上述方法。

本说明书实施例采用的上述至少一个技术方案能够达到以下有益效果：

本说明书实施例通过获取证件的第一图像；根据用户在所述第一图像上的第一操作，确定所述第一图像的第一区域，所述第一区域具有人脸图像信息；根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有标识信息；根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板，然后根据生成的证件模板去对证件进行识别。本说明书实施例通过人机交互的方式快速提取人脸图像信息和标识信息等特征信息，然后根据该特征信息生成证件模板，极大的加快了证件模板的生成速度。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1为本说明书实施例提供的一种证件类型识别模板的生成方法的流程示意图；

图2为本说明书实施例提供的一种证件识别方法的流程示意图；

图3为本说明书实施例提供的对应于图1的一种证件类型识别模板的生成装置的结构示意图；

图4为本说明书实施例提供的对应于图2的一种证件识别装置的结构示意图；

图5为本说明书实施例提供的对应于图1的一种证件类型识别模板的生成设备的结构示意图；

图6为本说明书实施例提供的对应于图2的一种证件识别设备的结构示意图。

具体实施方式

为使本申请的目的、技术方案和优点更加清楚，下面将结合本申请具体实施例及相应的附图对本申请技术方案进行清楚、完整地描述。显然，所描述的实施例仅是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

传统的证件扫描识别产品只能针对某种固定证件进行扫描，如果需要对一种新的证件进行识别，就需要重新进行算法研发来生成新的证件模板，然后采用这个证件模板对新的证件进行识别。但是，生成证件模板的过程往往需要比较长的研发周期，从而造成证件扫描装置的新类型证件的扩展能力较弱。例如，大陆身份证扫描SDK，可以在手机端对大陆身份证进行扫描，如果需要支持某种未知类型证件，例如港澳台通行证，就需要重新研发相关算法模型，研发周期较长，从而导致新证件扩展能力较弱。

为了解决上述问题，本说明书实施例提供了一种基于人机交互的方式快速自定义证件模板，结合用户的交互操作确定证件的关键信息，例如某证件左下角需要有某个图像标识等，使得极易扩展一种新的证件类型的自动扫描体验。然后采用通用算法模型进行计算，如采用通用对齐模型、通用OCR和通用证件防伪系列算法，来完成证件模板的生成，极大的提高了证件模板的生成速度。

其中，OCR是指电子设备(例如扫描仪或数码相机)检查纸上打印的字符，通过检测暗、亮的模式确定其形状，然后用字符识别方法将形状翻译成计算机文字的过程。

以下结合附图，详细说明本申请各实施例提供的技术方案。

图1为本说明书实施例提供的一种证件类型识别模板的生成方法的流程示意图。从程序角度而言，流程的执行主体可以为搭载于应用服务器的程序或应用客户端。从应用角度而言，该方法可以应用于证件识别装置。

如图1所示，该流程可以包括以下步骤：

步骤102：获取证件的第一图像。

当用户想要在证件识别装置识别一种证件，而该证件未在证件识别装置上进行存储，那么就需要生成该证件的证件模板，然后采用该证件模板对该类型的证件进行识别。

证件识别装置，可以理解为装载了某种证件识别软件或者SDK的设备，可以是客户端，也可以是服务器。最常用的可以是移动终端。

这里的证件可以理解为证件识别装置无法识别的证件类型的证件，而这个证件类型的证件是存在的，只是没有存储在该证件识别装置中。而现在要做的操作就是生成该类型证件的证件模板，即新增一种证件类型的证件模板。

当需要在证件识别装置中新增一种证件类型的证件时，首先需要用户提供一个该证件类型的证件，然后通过相机或者摄像头获取该证件的第一图像。第一图像可以是一张图像，也可以是多张图像。第一图像还可以理解为符合某种要求或者标准的图像，这些不做具体限定。

步骤104：根据用户在所述第一图像上的第一操作，确定所述第一图像的第一区域，所述第一区域具有人脸图像信息。

在第一图像上，用户需要指定证件的一些特征信息。在大部分证件上，为了对证件的使用者进行限定，往往会在证件上显示人脸图像信息。因此，特征信息可以包括人脸图像信息。

为了获取人脸图像信息，可以根据用户在第一图像的第一特征区域指定操作拖选矩形框选择证件上的人脸头像区域，用来确定显示人脸图像信息的位置，即第一区域。用户可以主动进行第一特征区域指定操作，然后将第一区域的特征信息的属性限定为人脸图像信息。用户还可以根据提示信息来进行属性信息为人脸图像信息的特征区域的指定。上述范围均为本说明书实施例的保护范围。

步骤106：根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有标识信息。

除了人脸图像信息，证件上还会包括一些标识信息，因此还需要用户需要指定证件的一些标识类型的特征信息。其中，标识信息可以包括图像标识信息和文字标识信息。图像标识信息可以包括一些防伪标识，如镭射贴、变色墨水等。文字标识信息可以包括如证件名、姓名等。文字信息可以为多国语言的文字或者数字。

为了获取标识信息，可以根据用户在第一图像的第二操作来确定显示标识信息的位置，即第二区域。用户可以主动进行第二操作，然后对第二区域的特征信息的属性限定为标识信息。用户还可以根据提示信息来进行属性信息为标识信息的特征区域的指定。上述范围均为本说明书实施例的保护范围。

另外，需要注明的是，第一区域和第二区域与证件的特征信息相关，其中，第一区域可以是一个区域，也可以是多个区域。同理，第二区域可以是一个区域，也可以是多个区域。另外，第一区域和可以区域可以相互独立，也可以有部分的重合区域，也可以完全重合。

步骤108：根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板。

确定了特征区域，就可以对特征区域内的特征信息进行提取，然后根据特征信息以及特征信息所处的位置(即第一区域和第二区域)来生成证件模板。

例如，对显示人脸图像信息的第一区域进行特征提取时，可以采用人脸识别算法，识别例如人脸图像的尺寸大小、所述位置以及人脸图像比例等等的信息。

对显示标识信息的第二区域进行特征提取时，可以采用通用OCR、图像识别算法等进行特征提取。用户可以拖选矩形框选择证件上的标题等关键区域，用图像相似度模型提取该区域的特征并保存。

最后将证件的所有特征信息进行组合，生成证件模板，来对该类型的证件进行识别。

图1中的方法，通过获取证件的第一图像；根据用户在所述第一图像上的第一操作，确定所述第一图像的第一区域，所述第一区域具有人脸图像信息；根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有标识信息；根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板，然后根据生成的证件模板去对证件进行识别。本发明通过人机交互的方式快速提取人脸图像信息和标识信息等特征信息，然后根据该特征信息生成证件模板，极大的加快了证件模板的生成速度。

基于图1的方法，本说明书实施例还提供了该方法的一些具体实施方式，下面进行说明。

为了提高证件模板的准确度，在获取证件的第一图像时，可以获取多张图像，然后对多张图像采用图1的方案进行处理，得到多套特征信息，然后提取多套特征信息的共同部分，生成证件模板。

另外，还可以采用多张同一类型的证件共同生成证件模板，每一个证件都采用图1的方案进行处理，然后提取多个证件的特征信息的共同部分，生成证件模板。

为了添加一种新增类型的证件，还需要确定证件的证件名称。确定该正将名称的方法有多种：一种方法是，在一些证件上包括证明名称，因此可以根据用户的操作对第一图像中的文字部分中提取，得到证件名称信息。另一种方法是，获取用户输入的所述证件的证件名称信息。上述两种方法都可以得到证件的证件名称。一种更好的方法是结合上述两种方式，在用户输入证件名称之后，采用文字识别的证件名称信息对用户输入的证件名称信息进行确定，从而共同完成对新增证件的证件名称的确定。

为了提高第一图像的精度，在所述根据用户在所述第一图像上的第一操作，确定所述第一图像的第一区域，所述第一区域具有人脸图像信息之前，所述方法还可以包括：

对所述第一图像进行处理，将所述第一图像调整为符合设定拍摄角度的规范图像。

在对证件进行拍摄时，由于拍摄角度的不合理，得到的第一图像的形状往往与证件的形状存在差异，因此，就需要对第一图像的形状进行调整，调整为所述证件的形状相同，才能够保证针对第一图像提取的特征信息是正确的。

多数的证件都有特定的形状，例如矩形，那么可以采用以下方法对第一图像进行处理，具体如下：

调用证件角点回归模型确定所述第一图像的四个角点；

调用投影变换函数，根据所述四个角点，将所述第一图像映射成为矩形图像。

首先调用证件角点回归模型获得证件左上、右上、右下、左下四个角点，然后调用投影变换函数，将证件四个角点代表的四边形映射成为矩形。另外，除了对第一图像的形状进行调整，还需要将第一图像的尺寸调整为与证件相同的尺寸。

为了防止不法分子采用证件的复印件、照片等冒用该复印件对应的证件来进行验证，证件模板还需要包括证件的材质信息，具体的，所述方法还可以包括：

确定所述证件的材质信息；

所述根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板，具体包括：

根据所述第一区域的图像特征、所述第二区域的标识特征和所述材质信息生成所述证件模板。

确定所述证件的材质信息可以采用多种方法，可以由用户直接输入，如PVC卡，磨砂卡或铜版卡等，还可以采用材质识别算法对证件的材质信息进行识别。如果采用识别算法，可以对证件的图像信息进行识别，例如上文提到的第一图像，也可以另外采集其他图像。

对于证件的材质，用户通过人眼不能够有效的进行识别，因此会导致材质信息不准确，为了提高材质的识别精度，所述确定所述证件的材质信息，具体可以包括：

获取在闪光灯状态下拍摄的所述证件的第二图像；

调用材质分类模型对所述第二图像进行识别，输出所述证件的材质信息。

对于一般环境下获取的图像，采用质分类模型对该图像进行识别的时候，无法对材质进行有效的识别，造成识别精度低的问题。为了提高材质的识别精度，本说明书实施例采用在闪光灯状态下拍摄的所述证件的第二图像作为材质识别的图像，然后采用材质分类模型所述第二图像进行识别，最终获得证件的材质信息，并进行保存。

由于标识信息可以包括图像标识和文字标识，那么，所述根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有标识信息，具体可以包括：

根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二图像区域，所述第二图像区域具有图像标识；

和/或，根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二文字区域，所述第二文字区域具有文字标识。

如果一个区域只包括图像，那么根据用户的第二操作，可以确定该区域的属性为图像，那么可以采用图像识别算法来对第二图像区域的图像信息进行特征识别。

如果一个区域只包括文字，那么根据用户的第二操作，可以确定该区域的属性为文字，那么可以采用文字识别算法来对第二图像区域的文字信息进行识别。

如果一个区域包括图像和文字两种，那么根据用户的第二操作，可以确定该区域的属性为图像和文字，那么可以采用图像识别算法和文字识别算法来对第二图像区域的文字信息进行特征识别。

证件中除了包括一些固定的文字信息之后，还包括一些非固定的文字信息，如姓名、生日等随者证件人的持有者发生变化的文字信息。对于这些文字信息，如果只采用文字识别算法进行识别是不能达到模板的效果的。针对这一问题，用户在确定了这些可变信息之后，可以采用属性备注的方式来对这些文字进行限定。例如，用户拖选矩形框选择证件上的文字区域，并标注每个区域对应的标题(或属性信息)，例如“姓名”、“地址”、“生日”等。例如：对于文字信息“1991年10月21日”，用户可以标注其属性为生日；对于文字信息“王五”，用户可以标注其属性为姓名。这样标注后，再根据证件模板去对证件识别时，就可以先确定相应区域的文字信息的属性信息来与证件模板进行匹配。

为了减少用户的操作次数，提高用户的用户体验，在所述根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板之前，所述方法还可以包括：

根据所述用户在所述第一图像上的第三操作，确定所述第一图像的第三文字区域，所述第三文字区域具有文字信息；

识别所述第三文字区域中的文字信息；

采用语义分析算法对所述文字信息进行分析，得到所述文字信息的词语属性；

所述根据所述第一区域的图像特征、所述第二区域的标识特征和所述第三文字区域的属性信息生成所述证件模板。

上述操作全部由计算机执行，可以减少用户的操作次数。

其中，属性信息不仅仅可以包括姓名、地址、生日等，还可以包括发证单位，使用范围，等等，这些可以根据证件类型的不同加以扩充。

在采用语义分析算法对所述文字信息进行分析，得到所述文字信息的词语属性之后，为了提高准确性，还可以发出提示信息用来提示用户对该词语属性的正确性进行确定，如果该词语属性不是给文字的属性，还可以提示用户输入正确的词语属性。

基于同样的思路，本说明书实施例还提供了采用根据上述方法生成的证件模板对证件进行识别的方法。

图2为本说明书实施例提供的一种证件识别方法的流程示意图；从程序角度而言，流程的执行主体可以为搭载于应用服务器的程序或应用客户端。从应用角度而言，该方法可以应用于证件识别装置。

如图2所示，该流程可以包括以下步骤：

步骤202：获取用户选择的目标证件类型。

目标证件类型可以理解为待识别证件需要验证的证件类型。

由于证件识别装置可以识别多种类型的证件，为了提供识别效率，当需要在对某种证件的类型进行识别的时候，需要用户确定待识别证件的类型是什么，然后在证件类型列表中进行选择或者输入目标证件类型。

步骤204：调取所述目标证件类型对应的证件模板，所述证件模板是预先根据用户的操作生成的，所述证件模板中包括人脸图像信息和标识信息。

证件识别装置中存储了包括多种证件模板，证件模板与证件类型一一对应，通过对证件类型进行搜索就可以找到目标证件类型对应的证件模板。这个证件模板是采用图1的方法生成的，证件模板中包括人脸图像信息和标识信息，以及人脸图像信息和标识信息的存储位置。其中，标识信息可以包括图像标识，还可以包括文字标识，具体内容可以参见图1中证件模板的描述，这里不再赘述。

步骤206：获取待识别证件的第一图像。

在对待识别证件进行识别的时候，需要获取待识别证件的第一图像。第一图像可以是一张，也可以是多张。另外，第一图像还可以是经过筛选的符合预设标准的图像。

步骤208：基于所述证件模板，确定所述第一图像的人脸置信度。

采用证件模板中显示人脸图像信息的指定区域来提取待识别证件的第一图像的人脸图像信息，然后采用人脸识别算法确定所述人脸图像信息的人脸置信度。

这里的人脸识别算法可以是只确定该图像信息是否是人脸图像，那么根据该算法计算得到的人脸置信度就是表示与人脸相似的程度。

另外，人脸识别算法除了确定该图像信息是否是人脸图像之后，还可以包括与证件模板中的人脸图像信息相关的信息，例如人脸图像的尺寸大小，人脸的比例等等。那么根据该算法计算得到的人脸置信度除了表示与人脸相似的程度之外，还可以表示与证件模板中的人脸图像的相似程度。

步骤210：基于所述证件模板，确定所述第一图像的标识相似度。

采用证件模板中显示标识信息的指定区域来提取待识别证件的第一图像的标识信息，然后对证件模板中的标识信息与待识别证件的标识信息进行对比，得到标识相似度。

具体的，根据证件模板中的指定区域来对第一图像的关键标识区域裁剪，提取关键标识区域的特征信息，对比证件模板中该区域存储标识信息，得到标识相似度。需要说明的是，由于标识信息可能包括多个，那么标识相似度也可能包括多个。

步骤212：当所述人脸置信度和所述标识相似度满足设定要求时，确定所述待识别证件为所述目标证件类型。

如果人脸置信度和标识相似度都符合设定要求，就可以说明待识别证件与目标证件类型的证件模板相符合，那么可以确定待识别证件的类型为目标证件类型。

另外，设定要求可以是多个，如人脸置信度对应第一设定要求，标识相似度对应第二设定要求，那么所述人脸置信度和所述标识相似度满足设定要求，就表示人脸置信度符合第一设定要求，且标识相似度符合第二设定要求。如果，只有一个条件符合，那么说明都不满足设定要求。其中，当第一设定要求和第二设定要求均为数值时，两者对应的数值可以相同，也可以不同。

另外，设定要求也可以是总的要求，即将人脸置信度和标识相似度按照预设规则合成一个总置信度(或者相似度)，然后对总置信度设定一个要求，只要总置信度符合设定要求，就可以确定待识别证件的类型为目标证件类型。

另外，由于标识信息包括多个，那么标识相似度也可以包括多个，那么在对标识相似度进行判定的时候，可以是对每个标识相似度进行单独判定是否符合要求，还可以是计算多个标识相似度的总相似度来进行综合判定，这里不做具体限定。

在本说明书的一个或多个实施例中，确定所述第一图像的标识相似度，具体可以包括：

基于所述证件模板，确定所述第一图像的图像标识相似度；

基于所述证件模板，确定所述第一图像的文字标识相似度。

由于标识信息可以包括图像标识和文字标识，因此，需要分别确定图像标识和文字标识的相似度。在对图像标识和文字标识进行特征提取的时候，可以采用相同的算法，也可以采用不同的算法。

对于一些非固定的文字信息，如证件持有人的姓名和生日等，还需要特殊的方式来计算相似度，具体的，所述基于所述证件模板，确定所述第一图像的文字标识相似度，可以包括：

采用文字识别算法识别所述第一图像的文字信息；

采用语义分析算法对所述文字信息进行分析，得到文字信息的词语属性；

判断所述词语属性与所述证件模板中对应位置的文字的词语属性是否相同，得到判断结果。

上述方案中，采用了语义分析算法对文字信息进行分析，从而得到文件信息的词语属性，然后再将该词语属性与证件模板中的该处文字的词语属性进行对比，判断是否相同。

另外，在一些实施例中，不同的词语属性对应于不同的数据库，每个数据库的词语的属性均为其对应的词语属性。那么在判断文字信息的词语属性与证件模板中的文字信息的词语属性是否相同时，可以采用以下方法：根据证件模板中的文字信息的词语属性调用该词语属性对应的数据库，然后通过搜索该数据库确定，待识别证件的文字信息是否存在于该数据库，如果存在，则说明词语属性相同，如果不存在，则说明词语属性不相同。

为了提高对待识别证件的特征提取准确度，在所述基于所述证件模板，确定所述第一图像的人脸置信度之前，所述方法还可以包括：对所述第一图像进行处理，将所述第一图像调整为符合所述证件模板的规范图像。

其中，对所述第一图像进行处理，具体可以包括：

调用证件角点回归模型确定所述第一图像的四个角点；

首先调用证件角点回归模型获得证件左上、右上、右下、左下四个角点，然后调用投影变换函数，将证件四个角点代表的四边形映射成为矩形。另外，除了对第一图像的形状进行调整，还需要将第一图像的尺寸调整为与证件模板相同的尺寸。

为了防止不法分子采用证件的复印件、照片等冒用该复印件对应的证件来进行验证，还需要对待识别证件的材质信息进行对比，具体的，所述方法还可以包括：

确定所述待识别证件的材质信息；

确定所述材质信息与所述证件模板的材质信息的材质相似度；

判断所述材质相似度是否符合预设阈值，若否，确定所述待识别证件为所述目标证件类型的伪造件。

确定所述待识别证件的材质信息可以采用多种方法，可以由用户直接输入材质信息，如PVC卡，磨砂卡或铜版卡等，还可以采用材质识别算法对待识别证件的材质信息进行识别。如果采用识别算法，可以对待识别证件的图像信息进行识别，例如上文提到的第一图像，也可以另外采集其他图像。

对于证件的材质，用户通过人眼不能够有效的进行识别，因此会导致材质信息不准确，为了提高材质的识别精度，所述确定所述待识别证件的材质信息，具体可以包括：

获取相机在闪光灯状态下拍摄的所述待识别证件的第二图像；

调用材质分类模型对所述第二图像进行识别，输出所述待识别证件的材质信息。

对于一般环境下获取的图像，采用质分类模型对该图像进行识别的时候，无法对材质进行有效的识别，造成识别精度低的问题。为了提高材质的识别精度，本说明书实施例采用在闪光灯状态下拍摄的所述待识别证件的第二图像作为材质识别的图像，然后采用材质分类模型所述第二图像进行识别，最终获得待识别证件的材质信息，用于与证件模板中的材质信息进行对比。

在本说明书的一个或多个实施例中，获取待识别证件的第一图像，具体可以包括：

获取所述待识别证件的多张图像；

基于清晰度计算所述多张图像的质量分数；

挑选所述质量分数最高的图像作为第一图像。

为了提高识别精度，本方法还可以从待识别证件的多张图像中来挑选质量好的图像作为第一图像。其中，可以采用清晰度作为质量分数的评判标准，还可以采用图像亮度等其他参数作为评判标准，还可以采用多个参数作为评判标准。

基于上述描述，一种证件识方法的实施例的流程如下：

1、选择证件类型。

2、根据证件类型加载相应的模板图片、材质信息以及用户编辑的信息。

3、初始化摄像头参数，获取待识别证件的图像。

4、对于每帧图像，判断人脸置信度和关键标识相似度：a.对用户编辑的人脸区域裁剪，调用人脸分类模型，得到人脸置信度；b.对用户编辑的关键标识区域裁剪，调用图像相似度模型，得到裁剪区域特征，对比模板中该区域的相似度，得到各个关键标识区域的置信度；c.用户界面可以根据置信度调整相应边框颜色和亮度。

5、如果人脸置信度和关键标识相似度都通过阈值，则保存该帧证件图像。

6、自动开启闪光灯，采集闪光帧图像。

7、根据证件图像和闪光帧图像，执行证件防伪算法。包括计算证件是否为翻拍或复印件，计算证件材质与模板是否一致，计算图像标识和文字标识与模板是否一致，获得证件真伪信息。

8、执行证件OCR算法，结合模板保存关键信息区域，并进行语义归类(姓名、地址、生日等)。

9、显示证件OCR结果与防伪结果。

基于同样的思路，本说明书实施例还提供了上述方法对应的装置。图3为本说明书实施例提供的对应于图1的一种证件类型识别模板的生成装置的结构示意图。如图3所示，该装置可以包括：

第一图像获取模块301，用于获取证件的第一图像；

第一区域确定模块302，用于根据用户在所述第一图像上的第一操作，确定所述第一图像的第一区域，所述第一区域具有人脸图像信息；

第二区域确定模块303，用于根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有标识信息；

证件模板生成模块304，用于根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板。

可选的，所述第二区域确定模块303，具体可以包括：

第二图像区域确定单元，用于根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二图像区域，所述第二图像区域具有图像标识；

第二文字区域确定单元，用于根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二文字区域，所述第二文字区域具有文字标识。

可选的，所述装置还可以包括：

第三文字区域确定模块，用于根据所述用户在所述第一图像上的第三操作，确定所述第一图像的第三文字区域，所述第三文字区域具有文字信息；

文字信息识别模块，用于识别所述第三文字区域中的文字信息；

语义分析模块，用于采用语义分析算法对所述文字信息进行分析，得到所述文字信息的词语属性；

所述证件模板生成模块304，具体可以用于根据所述第一区域的图像特征、所述第二区域的标识特征和所述第三文字区域的属性信息生成所述证件模板。

可选的，所述装置还可以包括：

图像调整模块，用于对所述第一图像进行处理，将所述第一图像调整为符合设定拍摄角度的规范图像。

可选的，所述图像调整模块，具体可以包括：

角点确定单元，用于调用证件角点回归模型确定所述第一图像的四个角点；

图像映射单元，用于调用投影变换函数，根据所述四个角点，将所述第一图像映射成为矩形图像。

可选的，所述装置还可以包括：

材质信息确定模块，用于确定所述证件的材质信息；

所述证件模板生成模块304，具体可以用于根据所述第一区域的图像特征、所述第二区域的标识特征和所述材质信息生成所述证件模板。

可选的，所述材质信息确定模块，具体可以包括：

第二图像获取单元，用于获取在闪光灯状态下拍摄的所述证件的第二图像；

材质信息确定单元，用于调用材质分类模型对所述第二图像进行识别，输出所述证件的材质信息。

可选的，所述装置还可以包括：

证件名称信息获取模块，用于获取用户输入的所述证件的证件名称信息。

基于同样的思路，本说明书实施例还提供了上述方法对应的装置。图4为本说明书实施例提供的对应于图2的一种证件识别装置的结构示意图。如图4所示，该装置可以包括：

目标证件类型获取模块401，用于获取用户选择的目标证件类型；

证件模板调取模块402，用于调取所述目标证件类型对应的证件模板，所述证件模板是预先根据用户的操作生成的，所述证件模板中包括人脸图像信息和标识信息；

第一图像获取模块403，用于获取待识别证件的第一图像；

人脸置信度确定模块404，用于基于所述证件模板，确定所述第一图像的人脸置信度；

标识相似度确定模块405，用于基于所述证件模板，确定所述第一图像的标识相似度；

待识别证件确定模块406，用于当所述人脸置信度和所述标识相似度满足设定要求时，确定所述待识别证件为所述目标证件类型。

可选的，所述标识相似度确定模块405，具体可以包括：

图像标识相似度确定单元，用于基于所述证件模板，确定所述第一图像的图像标识相似度；

文字标识相似度确定单元，用于基于所述证件模板，确定所述第一图像的文字标识相似度。

可选的，所述文字标识相似度确定单元，具体可以包括：

文字信息识别子单元，用于采用文字识别算法识别所述第一图像的文字信息；

词语属性确定子单元，用于采用语义分析算法对所述文字信息进行分析，得到文字信息的词语属性；

判断子单元，用于判断所述词语属性与所述证件模板中对应位置的文字的词语属性是否相同，得到判断结果。

可选的，所述装置还可以包括：

第一图像调整模块，用于对所述第一图像进行处理，将所述第一图像调整为符合所述证件模板的规范图像。

可选的，第一图像调整模块，具体可以包括：

四个角点确定单元，用于调用证件角点回归模型确定所述第一图像的四个角点；

可选的，所述装置还可以包括：

材质信息确定模块，用于确定所述待识别证件的材质信息；

材质相似度确定模块，用于确定所述材质信息与所述证件模板的材质信息的材质相似度；

材质判断模块，用于判断所述材质相似度是否符合预设阈值，若否，确定所述待识别证件为所述目标证件类型的伪造件。

可选的，所述材质信息确定模块，具体可以包括：

第二图像获取单元，用于获取相机在闪光灯状态下拍摄的所述待识别证件的第二图像；

材质信息确定单元，用于调用材质分类模型对所述第二图像进行识别，输出所述待识别证件的材质信息。

可选的，所述第一图像获取模块403，具体可以包括：

多张图像获取单元，用于获取所述待识别证件的多张图像；

质量分数单元，用于基于清晰度计算所述多张图像的质量分数；

图像挑选单元，用于挑选所述质量分数最高的图像作为第一图像。

基于同样的思路，本说明书实施例还提供了上述方法对应的设备。

图5为本说明书实施例提供的对应于图1的一种证件类型识别模板的生成设备的结构示意图。如图5所示，设备500可以包括：

至少一个处理器510；以及，

与所述至少一个处理器通信连接的存储器530；其中，

所述存储器530存储有可被所述至少一个处理器510执行的指令520，所述指令被所述至少一个处理器510执行，以使所述至少一个处理器510能够：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

获取证件的第一图像；

图6为本说明书实施例提供的对应于图2的一种证件识别设备的结构示意图。如图6所示，设备600可以包括：

至少一个处理器610；以及，

与所述至少一个处理器通信连接的存储器630；其中，

所述存储器630存储有可被所述至少一个处理器610执行的指令620，所述指令被所述至少一个处理器610执行，以使所述至少一个处理器610能够：

获取用户选择的目标证件类型；

获取待识别证件的第一图像；

基于所述证件模板，确定所述第一图像的人脸置信度；

基于所述证件模板，确定所述第一图像的标识相似度；

本说明书实施例还提供了一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现上文中任一所述的方法。

在20世纪90年代，对于一个技术的改进可以很明显地区分是硬件上的改进(例如，对二极管、晶体管、开关等电路结构的改进)还是软件上的改进(对于方法流程的改进)。然而，随着技术的发展，当今的很多方法流程的改进已经可以视为硬件电路结构的直接改进。设计人员几乎都通过将改进的方法流程编程到硬件电路中来得到相应的硬件电路结构。因此，不能说一个方法流程的改进就不能用硬件实体模块来实现。例如，可编程逻辑器件(Programmable Logic Device,PLD)(例如现场可编程门阵列(Field Programmable GateArray，FPGA))就是这样一种集成电路，其逻辑功能由用户对器件编程来确定。由设计人员自行编程来把一个数字系统“集成”在一片PLD上，而不需要请芯片制造厂商来设计和制作专用的集成电路芯片。而且，如今，取代手工地制作集成电路芯片，这种编程也多半改用“逻辑编译器(logic compiler)”软件来实现，它与程序开发撰写时所用的软件编译器相类似，而要编译之前的原始代码也得用特定的编程语言来撰写，此称之为硬件描述语言(Hardware Description Language，HDL)，而HDL也并非仅有一种，而是有许多种，如ABEL(Advanced Boolean Expression Language)、AHDL(Altera Hardware DescriptionLanguage)、Confluence、CUPL(Cornell University Programming Language)、HDCal、JHDL(Java Hardware Description Language)、Lava、Lola、MyHDL、PALASM、RHDL(RubyHardware Description Language)等，目前最普遍使用的是VHDL(Very-High-SpeedIntegrated Circuit Hardware Description Language)与Verilog。本领域技术人员也应该清楚，只需要将方法流程用上述几种硬件描述语言稍作逻辑编程并编程到集成电路中，就可以很容易得到实现该逻辑方法流程的硬件电路。

控制器可以按任何适当的方式实现，例如，控制器可以采取例如微处理器或处理器以及存储可由该(微)处理器执行的计算机可读程序代码(例如软件或固件)的计算机可读介质、逻辑门、开关、专用集成电路(Application Specific Integrated Circuit，ASIC)、可编程逻辑控制器和嵌入微控制器的形式，控制器的例子包括但不限于以下微控制器：ARC 625D、Atmel AT91SAM、Microchip PIC18F26K20以及Silicone Labs C8051F320，存储器控制器还可以被实现为存储器的控制逻辑的一部分。本领域技术人员也知道，除了以纯计算机可读程序代码方式实现控制器以外，完全可以通过将方法步骤进行逻辑编程来使得控制器以逻辑门、开关、专用集成电路、可编程逻辑控制器和嵌入微控制器等的形式来实现相同功能。因此这种控制器可以被认为是一种硬件部件，而对其内包括的用于实现各种功能的装置也可以视为硬件部件内的结构。或者甚至，可以将用于实现各种功能的装置视为既可以是实现方法的软件模块又可以是硬件部件内的结构。

上述实施例阐明的系统、装置、模块或单元，具体可以由计算机芯片或实体实现，或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的，计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。

为了描述的方便，描述以上装置时以功能分为各种单元分别描述。当然，在实施本申请时可以把各单元的功能在同一个或多个软件和/或硬件中实现。

本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、CD-ROM、光学存储器等)上实施的计算机程序产品的形式。

本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。

这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。

这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。

在一个典型的配置中，计算设备包括一个或多个处理器(CPU)、输入/输出接口、网络接口和内存。

内存可能包括计算机可读介质中的非永久性存储器，随机存取存储器(RAM)和/或非易失性内存等形式，如只读存储器(ROM)或闪存(flash RAM)。内存是计算机可读介质的示例。

计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括，但不限于相变内存(PRAM)、静态随机存取存储器(SRAM)、动态随机存取存储器(DRAM)、其他类型的随机存取存储器(RAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、快闪记忆体或其他内存技术、只读光盘只读存储器(CD-ROM)、数字多功能光盘(DVD)或其他光学存储、磁盒式磁带，磁带式磁盘存储或其他磁性存储设备或任何其他非传输介质，可用于存储可以被计算设备访问的信息。按照本文中的界定，计算机可读介质不包括暂存电脑可读媒体(transitory media)，如调制的数据信号和载波。

还需要说明的是，术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含，从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素，而且还包括没有明确列出的其他要素，或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下，由语句“包括一个……”限定的要素，并不排除在包括所述要素的过程、方法、商品或者设备中还存在另外的相同要素。

本申请可以在由计算机执行的计算机可执行指令的一般上下文中描述，例如程序模块。一般地，程序模块包括执行特定任务或实现特定抽象数据类型的例程、程序、对象、组件、数据结构等等。也可以在分布式计算环境中实践本申请，在这些分布式计算环境中，由通过通信网络而被连接的远程处理设备来执行任务。在分布式计算环境中，程序模块可以位于包括存储设备在内的本地和远程计算机存储介质中。

本说明书中的各个实施例均采用递进的方式描述，各个实施例之间相同相似的部分互相参见即可，每个实施例重点说明的都是与其他实施例的不同之处。尤其，对于系统实施例而言，由于其基本相似于方法实施例，所以描述的比较简单，相关之处参见方法实施例的部分说明即可。

以上所述仅为本申请的实施例而已，并不用于限制本申请。对于本领域技术人员来说，本申请可以有各种更改和变化。凡在本申请的精神和原理之内所作的任何修改、等同替换、改进等，均应包含在本申请的权利要求范围之内。

Claims

1.一种证件类型识别模板的生成方法，包括：

获取证件的第一图像；

根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有所述证件的标识信息；

根据所述第一区域的人脸图像特征和所述第二区域的标识特征，生成用于识别待识别证件是否为所述证件所属的证件类型的证件模板。

2.如权利要求1所述的方法，所述根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，具体包括：

根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二图像区域与第二文字区域中的至少一种；其中，所述第二图像区域具有图像标识；所述第二文字区域具有文字标识。

3.如权利要求1所述的方法，在所述根据所述第一区域的人脸图像特征和所述第二区域的标识特征生成证件模板之前，所述方法还包括：

识别所述第三文字区域中的文字信息；

根据所述第一区域的图像特征、所述第二区域的标识特征和所述第三文字区域的属性信息生成所述证件模板。

4.如权利要求1所述的方法，在所述根据用户在所述第一图像上的第一操作，确定所述第一图像的第一区域之前，所述方法还包括：

5.如权利要求4所述的方法，对所述第一图像进行处理，具体包括：

调用证件角点回归模型确定所述第一图像的四个角点；

6.如权利要求1所述的方法，所述方法还包括：

确定所述证件的材质信息；

根据所述第一区域的人脸图像特征、所述第二区域的标识特征和所述材质信息生成所述证件模板。

7.如权利要求6所述的方法，所述确定所述证件的材质信息，具体包括：

获取在闪光灯状态下拍摄的所述证件的第二图像；

调用材质分类模型对所述第二图像进行识别，输出所述证件的材质信息；或者，

获取用户输入的所述证件的材质信息。

8.如权利要求1所述的方法，所述方法还包括：

获取用户输入的所述证件的第一证件名称信息；或者，

根据用户的操作对所述第一图像中的文字进行识别，得到所述证件的第二证件名称信息；或者，

获取用户输入的所述证件的第一证件名称信息；

根据用户的操作对所述第一图像中的文字进行识别，得到所述证件的第二证件名称信息；

根据所述第二证件名称信息与所述第一证件名称信息，确定所述证件的证件名称信息。

9.如权利要求1-8中任意一项所述的方法，所述根据所述第一区域的人脸图像特征和所述第二区域的标识特征，生成用于识别待识别证件是否为所述证件所属的证件类型的证件模板，具体包括：

采用人脸识别算法提取所述第一区域的人脸图像特征；

采用文字识别算法、图像识别算法、图像相似度模型中的至少一种提取所述第二区域的标识特征；

对所述第一区域的人脸图像特征及所述第二区域的标识特征进行组合，生成用于识别待识别证件是否为所述证件所属的证件类型的证件模板。

10.一种证件识别方法，包括：

获取用户选择的目标证件类型；

调取所述目标证件类型对应的证件模板，所述证件模板是预先采用如权利要求1-9中任意一项所述的证件类型识别模板的生成方法而生成的模型；

获取待识别证件的第一图像；

基于所述证件模板，确定所述第一图像的人脸置信度；

基于所述证件模板，确定所述第一图像的标识相似度；

若所述人脸置信度和所述标识相似度满足设定要求，则确定所述待识别证件为所述目标证件类型。

11.如权利要求10所述的方法，所述基于所述证件模板，确定所述第一图像的标识相似度，具体包括：

基于所述证件模板，确定所述第一图像的图像标识相似度；

基于所述证件模板，确定所述第一图像的文字标识相似度。

12.如权利要求11所述的方法，所述基于所述证件模板，确定所述第一图像的文字标识相似度，具体包括：

采用文字识别算法识别所述第一图像的文字信息；

判断所述第一图像的文字信息的词语属性与所述证件模板中对应位置的文字的词语属性是否相同，得到判断结果。

13.如权利要求12所述的方法，所述判断所述第一图像的文字信息的词语属性与所述证件模板中对应位置的文字的词语属性是否相同，具体包括：

采用语义分析算法对所述第一图像的文字信息进行分析，得到所述第一图像的文字信息的词语属性；

判断所述第一图像的文字信息的词语属性与所述证件模板中对应位置的文字的词语属性是否相同；或者，

对所述证件模板中对应位置的文字信息的词语属性对应的数据库进行搜索，判断所述第一图像的文字信息是否存在于所述数据库。

14.如权利要求10所述的方法，在所述基于所述证件模板，确定所述第一图像的人脸置信度之前，所述方法还包括：

对所述第一图像进行处理，将所述第一图像调整为符合所述证件模板的规范图像。

15.如权利要求14所述的方法，对所述第一图像进行处理，具体包括：

调用证件角点回归模型确定所述第一图像的四个角点；

16.如权利要求10所述的方法，所述方法还包括：

确定所述待识别证件的材质信息；

判断所述材质相似度是否符合预设阈值；

若否，确定所述待识别证件为所述目标证件类型的伪造件。

17.如权利要求16所述的方法，所述确定所述待识别证件的材质信息，具体包括：

18.如权利要求10所述的方法，所述获取待识别证件的第一图像，具体包括：

获取所述待识别证件的多张图像；

基于清晰度计算所述多张图像的质量分数；

挑选所述质量分数最高的图像作为第一图像。

19.一种证件类型识别模板的生成装置，包括：

第一图像获取模块，用于获取证件的第一图像；

第二区域确定模块，用于根据所述用户在所述第一图像上的第二操作，确定所述第一图像的第二区域，所述第二区域具有所述证件的标识信息；

证件模板生成模块，用于根据所述第一区域的人脸图像特征和所述第二区域的标识特征，生成用于识别待识别证件是否为所述证件所属的证件类型的证件模板。

20.如权利要求19所述的装置，所述第二区域确定模块，具体用于：

21.如权利要求19或20所述的装置，所述证件模板生成模块，具体用于：

采用人脸识别算法提取所述第一区域的人脸图像特征；

22.一种证件识别装置，包括：

证件模板调取模块，用于调取所述目标证件类型对应的证件模板，所述证件模板是预先采用如权利要求1-9中任意一项所述的证件类型识别模板的生成方法而生成的模型；

第一图像获取模块，用于获取待识别证件的第一图像；

待识别证件确定模块，用于若所述人脸置信度和所述标识相似度满足设定要求，则确定所述待识别证件为所述目标证件类型。

23.一种证件类型识别模板的生成设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

获取证件的第一图像；

24.一种证件识别设备，包括：

至少一个处理器；以及，

与所述至少一个处理器通信连接的存储器；其中，

获取用户选择的目标证件类型；

获取待识别证件的第一图像；

基于所述证件模板，确定所述第一图像的人脸置信度；

基于所述证件模板，确定所述第一图像的标识相似度；

25.一种计算机可读介质，其上存储有计算机可读指令，所述计算机可读指令可被处理器执行以实现权利要求1至18中任意一项所述的方法。