CN113111880A

CN113111880A - 证件图像校正方法、装置、电子设备及存储介质

Info

Publication number: CN113111880A
Application number: CN202110520231.5A
Authority: CN
Inventors: 陈李健; 张蓉
Original assignee: Ping An Life Insurance Company of China Ltd
Current assignee: Ping An Life Insurance Company of China Ltd
Priority date: 2021-05-12
Filing date: 2021-05-12
Publication date: 2021-07-13
Anticipated expiration: 2041-05-12
Also published as: CN113111880B

Abstract

本申请实施例涉及人工智能技术领域，具体公开了一种证件图像校正方法、装置、电子设备及存储介质。该方法包括：获取待校正图像，所述待校正图像中包含有证件图像，所述证件图像为证件在所述待校正图像中的图像区域；将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点，所述关键点用于表征与所述关键点对应的关键词在所述证件图像中的位置；根据所述证件的类型获取与所述证件的类型对应的图像模板；据所述证件图像中的关键点以及所述图像模板，对所述证件图像进行校正。本申请实施例有利于提高证件图像校正精度。

Description

证件图像校正方法、装置、电子设备及存储介质

技术领域

本申请涉及人工智能技术领域，具体涉及一种证件图像校正方法、装置、电子设备及存储介质。

背景技术

证件自动识别主要采用图像识别方法。一般情况下，用户拍摄一张证件的照片，然后，对用户拍摄的照片进行文字提取，得到证件中的文字，对文字进行识别，以验证证件的真假。然后，由于用户拍摄出的照片中证件只占照片的一小部分，其他区域均为无用的背景。同时，图像中证件的摆放可能会是任意角度的，或者存在倾斜。这给证件的识别都带来了干扰，因此，为了提高证件识别成功率，在拍摄完证件照片之后，都会对证件照片进行校正。

目前，主要通过以下两种方式进行证件照片的校正：一类是采用传统图像处理方法找到证件照片中证件的4条边，从而得到证件的四个顶点，再利用仿射变换矫正证件区域，该类方法确定在于其依赖边缘检测，一旦光照、背景发生变化，则很难找到证件的4条边，导致校正精度低。另一类方法是通过深度神经网络模型直接预测出证件的4个顶点，这类方法的缺点在于，需要针对每一种证件单独训练模型，在应用时，需要使用多个模型应对多种证件，此外，证件的4个顶点特征不够明显，尤其在背景和证件区别较小的时候，所以存在预测顶点不够准确的情况。

因此，现有的对证件照的校正方法比较单一，校正精度较低。

发明内容

本申请实施例提供了一种证件图像校正方法、装置、电子设备及存储介质，通过关键点的识别，提高证件图像的校正精度。

第一方面，本申请实施例提供一种证件图像校正方法，包括：

获取待校正图像，所述待校正图像中包含有证件图像，所述证件图像为证件在所述待校正图像中的图像区域；

将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点，所述关键点用于表征与所述关键点对应的关键词在所述证件图像中的位置；

根据所述证件的类型获取与所述证件的类型对应的图像模板；

根据所述证件图像中的关键点以及所述图像模板，对所述证件图像进行校正。

第二方面，本申请实施例提供一种证件图像校正装置，包括：

获取单元，用于获取待校正图像，所述待校正图像中包含有证件图像，所述证件图像为证件在所述待校正图像中的图像区域；

处理单元，用于将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点，所述关键点用于表征与所述关键点对应的关键词在所述证件图像中的位置；根据所述证件的类型获取与所述证件的类型对应的图像模板；据所述证件图像中的关键点以及所述图像模板，对所述证件图像进行校正。

第三方面，本申请实施例提供一种电子设备，包括：处理器，所述处理器与存储器相连，所述存储器用于存储计算机程序，所述处理器用于执行所述存储器中存储的计算机程序，以使得所述电子设备执行如第一方面所述的方法。

第四方面，本申请实施例提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序使得计算机执行如第一方面所述的方法。

第五方面，本申请实施例提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机可操作来使计算机执行如第一方面所述的方法。

实施本申请实施例，具有如下有益效果：

可以看出，在本申请实施例中，先从待校正图像中截取出证件图像，然后，识别出该证件图像的关键点，最后，基于识别出的关键点对该证件图像进行校正。由于该关键点是用于表征关键词的位置的关键点，而每个证件图像中都必然会有关键词，而且每个关键词在图像中的内容和结构基本都是固定的、图像特征比较明显和固定，能够抗击不同的图像光照、拍摄角度、背景的干扰，从而可以准确的识别出各种证件下的关键点，进而提高对证件图像的校正精度。

附图说明

为了更清楚地说明本申请实施例中的技术方案，下面将对实施例描述中所需要使用的附图作简单地介绍，显而易见地，下面描述中的附图是本申请的一些实施例，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他的附图。

图1为本申请实施例提供的一种图像校正方法的流程示意图；

图2为本申请实施例提供的一种截取证件图像的示意图；

图3为本申请实施例提供的另一种图像校正方法的流程示意图；

图4为本申请实施例提供的一种基于关键点进行证件图像的示意图；

图5为本申请实施例提供的又一种图像校正方法的流程示意图；

图6为本申请实施例提供的一种选取目标关键点的示意图；

图7为本申请实施例提供的一种图像校正装置的功能单元组成框图；

图8为本申请实施例提供的一种图像校正装置的结构示意图。

具体实施方式

下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例是本申请一部分实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例，都属于本申请保护的范围。

本申请的说明书和权利要求书及所述附图中的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象，而不是用于描述特定顺序。此外，术语“包括”和“具有”以及它们任何变形，意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、系统、产品或设备没有限定于已列出的步骤或单元，而是可选地还包括没有列出的步骤或单元，或可选地还包括对于这些过程、方法、产品或设备固有的其它步骤或单元。

在本文中提及“实施例”意味着，结合实施例描述的特定特征、结果或特性可以包含在本申请的至少一个实施例中。在说明书中的各个位置出现该短语并不一定均是指相同的实施例，也不是与其它实施例互斥的独立的或备选的实施例。本领域技术人员显式地和隐式地理解的是，本文所描述的实施例可以与其它实施例相结合。

参阅图1，图1为本申请实施例提供的一种证件图像校正方法的流程示意图。该方法应用于证件图像校正装置。该方法包括以下步骤内容：

101：证件图像校正装置获取待校正图像，所述待校正图像中包含有证件图像，所述证件图像为证件在所述待校正图像中的图像区域。

示例性的，证件图像校正装置可以从图像库中读取待校正图像或者实时对证件进行拍摄，得到待校正图像。本申请不对获取待校正图像的方式进行限定。

示例性的，在获取到该待校正图像之后，需要从该待校正图像中截取出该证件图像。如图2所示，可以从该待校正图像中截取出该证件图像，即矩形框框出的图像为证件图像。其中，从该待校正图像中截取出该证件图像可以通过神经网络进行目标识别截取出来，且该神经网络可以为SSD或YOLO。

其中，该证件可以为身份证、护照、驾驶证、社保卡，等等。

102：证件图像校正装置将证件图像输入到完成训练的神经网络，得到证件图像中的关键点，关键点用于表征与关键点对应的关键词在证件图像中的位置，关键词为所述证件图像用于表征证件信息的关键词。

对于证件图像来说，证件图像中的关键词包括但不限于：姓名、性别、年龄、身份证号、出生日期，等等。

在本申请的一个实施方式中，获取证件图像样本，该证件图像样本携带有标签，该标签用于标识该证件图像样本中各个关键点的像素坐标；将该证件图像样本输入到第一神经网络中，预测各个关键点的像素坐标；然后，基于预测出的关键点的像素坐标以及标签标识的各个关键点的像素坐标，确定第一损失；根据该第一损失以及梯度下降法调整第一神经网络的网络参数，得到完成训练的第一神经网络。

因此，证件图像校正装置将该证件图像输入到该完成训练的第一神经网络进行特征提取，得到证件图像的第一特征图；然后，根据该第一神经网络对该第一特征图进行语义分割，得到证件图像的第一概率分割图，其中，该第一概率分割图用于表示证件图像中的各个像素点属于关键点的概率；根据该证件图像中的各个像素点属于关键点的概率，确定关键点，其中，该关键点对应的像素点属于关键点的概率大于第一阈值，即将属于关键点的概率大于第一阈值的像素点作为关键点，并将该像素点的像素坐标输出，得到该关键点。

其中，该第一神经网络可以为人体姿态检测网络或者人脸关键点预测网络。

在本申请的另一个实施方式中，获取证件图像样本，该证件图像样本携带有标签，该证件图像样本携带的标签用于标识每个像素点属于关键词的概率；然后，将该证件图像样本输入到第二神经网络，得到证件图像的概率分割图，该概率分割图用于表示该证件图像样本中各个像素点属于关键词的概率；最后，根据该概率分割图以及该标签标识的每个像素点属于关键词的概率，确定第二损失，并基于该第二损失以及梯度下降法，调整该第二神经网络的网络参数，得到完成训练的第二神经网络。

其中，该第二神经网络可以为图像分割网络，比如，U-net、V-net或者全卷积神经网络，等等。

因此，证件图像校正装置可以将该证件图像输入到完成训练的第二神经网络进行特征提取，得到第二特征图；然后，根据该第二神经网络对该第二特征图进行语义分割，得到该证件图像的第二概率分割图，其中，该第二概率分割图用于表示证件图像中各个像素点属于关键词的概率；然后，将属于关键词的概率大于第二阈值的像素点作为候选像素点，并将候选像素点中位置相邻的像素点进行连通域合并，得到与所述证件图像中的关键词对应的连通域，并将该连通域的中心像素点作为证件图像中的关键点。

103：证件图像校正装置根据证件的类型获取与证件的类型对应的图像模板。

示例性的，可根据该证件的类型，获取与该证件对应的图像模板，其中，该证件的类型可以为身份证、驾驶证、居住证、护照，等等。比如，该证件为身份证，则获取与身份证对应的图像模板，即标准的身份证图像。

104：证件图像校正装置根据证件图像中的关键点以及图像模板，对证件图像进行校正。

示例性，该关键点的数量为多个，则获取所述图像模板中与所述多个关键点中的每个关键点对应的预设关键点；从图像模板中提取与所述每个关键点对应的预设关键点的像素坐标；以预设关键点在所述图像模板中的像素坐标为基准对所述证件图像中每个关键点的像素坐标进行调整，以对所述证件图像进行校正。

在本申请的一个实施方式中，在确定该证件图像中的关键点之后，还可以通过该神经网络该关键点所表征的关键词的词类型。比如，该第二神经网络可以为多任务网络，除了预测该证件图像中每个像素点属于关键词的概率，且对每个像素点进行分类，得到每个像素点属于各个预设词类型的概率，并根据每个像素点属于各个预设词类型的概率确定该证件图像中的每个关键词的词类型，即可以确定出每个关键点所表征的关键词的词类型。

其中，各个预设词类型可以为“姓名”、“性别”、“身份证号”、“年龄”、“家庭住址”，等等。

下面以第二神经网络为全卷积神经网络为例说明，同时预测证件图像中各个像素点属于关键词的概率，以及属于各个预设词类型的概率。

示例性的，通过该第二神经网络对该证件图像进行特征提取，得到该证件图像对应的第二特征图；然后，通过该第二神经网络中的一个卷积核为1*1的第一卷积层对该第二特征图进行卷积处理，得到各个像素点属于关键词的第二概率分割图，以及通过卷积核为1*1的多个第二卷积层对该第二特征图进行卷积处理，得到各个像素点属于各个预设词类型的多个第三概率分割图，其中，每个第三概率分割图用于表征各个像素点属于与该第三概率分割图对应的预设词类型的概率。然后，分别确定该关键点在该多个第三概率分割图中的取值，将取值最大的第三概率分割图所对应的预设词类型作为该关键点对应的词类型，得到该证件图像关键词的词类型，也就得到了每个关键点所表征的关键词的词类型。

进一步的，可从校正后的证件图像中提取与关键点对应的文字内容(即证件信息)，比如，关键点为与“姓名”对应的关键点时，则从该证件中提取出姓名；示例性的，可以通过光学字符识别(Optical Character Recognition，OCR)提取关键点对应的文字内容。然后，根据每个关键点对应的关键词的类型，对每个关键点对应的文字内容进行验证，即验证该证件图像的真假。示例性的，对该文字内容进行词嵌入处理，得到第一语义向量；对关键点所表征的关键词的词类型进行编码，得到第二语义向量；对该第一语义向量和第二语义向量进行拼接，得到目标语义向量；最后，根据该目标语义向量对该文字内容进行验证，即根据该目标语义向量进行二分类，确定该文字内容的合理性。

可以看出，在本申请实施例中还可以识别出每个关键点对应的关键词的类型，这样在对每个关键点对应的文字内容进行验证时，可以结合该每个关键点对应的关键词的类型进行验证，这样在对文字内容进行验证，相当于加入先验加入了先验信息，可以提高对文字内容的验证效率和精度。

下面结合附图详细说明两种证件图像校正方法。

参阅图3，图3为本申请实施例提供的另一种图像校正方法的流程示意图。该方法应用于图像校正装置。该方法包括以下步骤内容：

301：根据每个关键点的像素坐标中纵坐标从大到小的顺序，对所述多个关键点进行排序，得到所述每个关键点对应的第一顺序。

302：按照每个预设关键点的像素坐标中纵坐标的大小，对与所述多个关键点对应的多个预设关键点进行排序，得到所述每个预设关键点对应的第二顺序。

303：将与所述第一顺序中的关键点取值相同的所述第二顺序中的预设关键点组成关键点对。

应理解，上述是按照从大小的顺序进行排序，当然，在实际应用中，也可以按照从小到大的顺序进行排序，只需保持对关键点和预设关键点的排序方式相同即可。

示例性的，证件图像需要校正，一般来说，都是证件图像倾斜了，然而，这种倾斜与图像模板相比只会改变关键点的横坐标的顺序，并不会改变各个关键点的纵坐标的顺序。比如，如图4所示，左边的证件图像倾斜，导致与图像模板下的各个关键点相比，横坐标的顺序有变化，而纵坐标的顺序未变化。因此，在关键点的排序方式与预设关键点的排序方式相同时(比如都按照从大到小或者都按照从小到大的顺序进行排序)，该至少一个关键点对中的每个关键点对包括一个关键点和一个预设关键点，且一个关键点对应的第一顺序与一个预设关键点对应的第二顺序的取值相同。这样就可以从图像模板中找到与每个关键点对应的预设关键点，组成关键点对。

304：将所述关键点对中关键点的像素坐标作为变换前的像素坐标，以及将关键点对中预设关键点的像素坐标作为变换后的像素坐标，得到仿射变换矩阵。

示例性的，将关键点对中的关键点作为的像素坐标变换前的像素坐标组成第一矩阵A，将关键点中的预设关键点的像素坐标作为变换后的像素坐标组成第二矩阵B。然后，根据该第一矩阵A和第二矩阵B确定仿射变换矩阵，其中，仿射变换矩阵用于将第一矩阵A变换为第二矩阵B。

305：利用所述仿射变换矩阵，对所述证件图像进行校正。

示例性的，将证件图像中各个像素点的像素坐标组成一个矩阵，基于该矩阵以及仿射变换矩阵，对该证件图像进行校正，得到校正后的图像。

参阅图5，图5为本申请实施例提供的又一种图像校正方法的流程示意图。该方法应用于图像校正装置。该方法包括以下步骤内容：

501：从所述预设关键点中筛选出在图像坐标系中位于同一列或者同一行的多个目标预设关键点。

其中，该多个目标预设关键点为该在图像坐标系下位于同一列或者同一行的预设关键点。本申请中以位于同一列的预设关键点为例进行说明。

502：对所述多个目标预设关键点进行直线拟合，得到第一直线段。

示例性的，可以对该多个目标预设关键点中距离最远的两个目标预设关键点连接，得到该第一直线段。

503：根据确定所述多个关键点中第一相邻的两个关键点的像素横坐标之间的第一差值，以及确定所述多个关键点中第二相邻的两个关键点的像素横坐标之间的第二差值，其中，所述第一相邻的两个关键点和所述第二相邻的两个关键点均为所述多个关键点中任意相邻的两个关键点，且存在一个相同的关键点。

504：将所述第一差值与所述第二差值之间的比值作为第一比值。

505：确定所述第一相邻的两个关键点的像素纵坐标之间的第三差值，以及确定所述第二相邻的两个关键点的像素纵坐标之间的第四差值。

506：将所述第三差值与所述第四差值之间的比值作为第二比值。

507：在所述第一比值与所述第二比值相同的情况下，将所述第一相邻的两个关键点和所述第二相邻的两个关键点作为多个目标关键点。

应理解，图像倾斜并未改变图像的结构，也就未改变像素点在证件图像中的位置关系，也就是说，倾斜之前处于同一行或者同一列(即位于一条直线上)的像素点，倾斜之后仍然位于一条直线，只不过这条直线不再水平或者竖直。因此，可以找到倾斜之后的像素点，并将这些像素点拟合成一条直线段。对于满足同一条直线上的像素点来说，其必然满足以下关系：所述多个关键点第一相邻的两个关键点与第二相邻的两个关键点之间的第一比值与第二比值相同，其中，所述第一比值为所述第一相邻的两个关键点的横坐标之间的差值与所述第二相邻的两个关键点的横坐标之间的差值的比值，所述第二比值为所述第一相邻的两个关键点的纵坐标之间的差值与所述第二相邻的两个关键点的总坐标之间的差值的比值，所述第一相邻的两个关键点和所述第二相邻的两个关键点均为所述至少一个第一目标关键点中的任意相邻的两个第一关键点，且所述第一相邻的两个关键点和所述第二相邻的两个关键点存在一个相同的关键点。也就是说，任意三个相邻的关键点所组成的任意两个相邻的关键点的横坐标与纵坐标之间的差值构成的三角形相似。如图6所示，这三个相邻的关键点在同一条直线上，则满足dy1/dy2＝dx1/dx2。

然后，将找到的满足比值相同的所有相邻的两个关键点全部作为该多个目标关键点。

508：对多个目标关键点进行直线拟合，得到第二直线段。

示例性的，确定该至少一个目标关键点上距离最远的两个目标关键点，将该两个目标关键点进行连接，得到该第二直线段。

509：确定所述第一直线段和所述第二直线段在图像坐标系下的夹角，并利用所述夹角对所述证件图像进行校正。

示例性的，在同一图像坐标系下，确定该第一直线段和第二直线段之间的夹角，该夹角表示了证件图像的倾斜角度；然后，利用该夹角对该证件图像进行旋转，即倾斜了多少角度，逆方向旋转多少度，可将证件图像校正到正常角度，即图像模板所对应的角度。

参阅图7，图7本申请实施例提供的一种证件图像校正装置的功能单元组成框图。证件图像校正装置700包括：获取单元701和处理单元702，其中：

获取单元701，用于获取待校正图像，所述待校正图像中包含有证件图像，所述证件图像为证件在所述待校正图像中的图像区域；

处理单元702，用于将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点，所述关键点用于表征与所述关键点对应的关键词在所述证件图像中的位置；根据所述证件的类型获取与所述证件的类型对应的图像模板；据所述证件图像中的关键点以及所述图像模板，对所述证件图像进行校正。

在一些可能的实施方式中，在将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点方面，处理单元702，具体用于：

将所述证件图像输入到完成训练的第一神经网络进行特征提取，得到所述证件图像的第一特征图；

根据所述第一神经网络，对所述证件图像的第一特征图进行语义分割，得到所述证件图像的第一概率分割图，其中，所述第一概率分割图用于表示所述证件图像中的各个像素点属于关键点的概率；

将属于关键点的概率大于第一阈值的像素点作为关键点。

将所述证件图像输入到完成训练的第二神经网络进行特征提取，得到所述证件图像对应的第二特征图；

根据所述第二神经网络，对所述证件图像对应的第二特征图进行语义分割，得到所述证件图像的第二概率分割图，所述第二概率分割图包括用于表示所述证件图像中各个像素点属于关键词的概率；

将概率大于第二阈值的像素点作为候选像素点；

将候选像素点中位置相邻的候选像素点进行连通域合并，得到与所述证件图像中的关键词对应的连通域；

将所述连通域的中心像素点作为所述证件图像中的关键点。

在一些可能的实施方式中，所述关键点的数量为多个，在根据所述证件图像中的关键点以及所述图像模板，对所述证件图像进行校正方面，处理单元702，具体用于：

获取所述图像模板中与每个所述关键点对应的预设关键点；

从所述图像模板中提取所述预设关键点的像素坐标；

以预设关键点在所述图像模板中的像素坐标为基准对所述证件图像中每个关键点的像素坐标进行调整，以对所述证件图像进行校正。

在一些可能的实施方式中，在以预设关键点在所述图像模板中的像素坐标为基准对所述证件图像中每个关键点的像素坐标进行调整，以对所述证件图像进行校正方面，处理单元702，具体用于：

按照所述每个关键点的像素坐标中纵坐标从大到小的顺序，对所述多个关键点进行排序，得到所述每个关键点对应的第一顺序；

按照所述第一顺序对所述预设关键点进行排序，得到每个预设关键点对应的第二顺序；

将与所述第一顺序中的关键点取值相同的所述第二顺序中的预设关键点组成关键点对；

将所述关键点对中关键点的像素坐标作为变换前的像素坐标，以及将关键点对中预设关键点的像素坐标作为变换后的像素坐标，得到仿射变换矩阵；

利用所述仿射变换矩阵，对所述证件图像进行校正。

从所述预设关键点中筛选出在图像坐标系中位于同一列或者同一行的多个目标预设关键点；

对所述多个目标预设关键点进行直线拟合，得到第一直线段；

确定所述多个关键点中第一相邻的两个关键点的像素横坐标之间的第一差值，以及确定所述多个关键点中第二相邻的两个关键点的像素横坐标之间的第二差值，其中，所述第一相邻的两个关键点和所述第二相邻的两个关键点均为所述多个关键点中任意相邻的两个关键点，且存在一个相同的关键点；

将所述第一差值与所述第二差值之间的比值作为第一比值；

确定所述第一相邻的两个关键点的像素纵坐标之间的第三差值，以及确定所述第二相邻的两个关键点的像素纵坐标之间的第四差值；

将所述第三差值与所述第四差值之间的比值作为第二比值；

在所述第一比值与所述第二比值相同的情况下，将所述第一相邻的两个关键点和所述第二相邻的两个关键点作为多个目标关键点；

对所述多个目标关键点进行直线拟合，得到第二直线段；

确定所述第一直线段和所述第二直线段在图像坐标系下的夹角，并利用所述夹角对所述证件图像进行校正。

在一些可能的实施方式中，在将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点时，处理单元702，还用于：

通过所述神经网络预测所述关键点所表征的关键词的词类型；以及用于

从校正后的证件图像中提取与所述关键点对应的文字内容；

对所述文字内容进行词嵌入处理，得到第一语义向量；

对所述关键点所表征的关键词的词类型进行编码，得到第二语义向量；

将所述第一语义向量与所述第二语义向量进行拼接，得到目标语义向量；

根据所述目标语义向量，对所述文字内容进行验证。

参阅图8，图8为本申请实施例提供的一种电子设备的结构示意图。如图8所示，电子设备800包括收发器801、处理器802和存储器803。它们之间通过总线804连接。存储器803用于存储计算机程序和数据，并可以将存储器803存储的数据传输给处理器802。

处理器802用于读取存储器803中的计算机程序执行以下操作：

控制收发器801获取待校正图像，所述待校正图像中包含有证件图像，所述证件图像为证件在所述待校正图像中的图像区域；

将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点，所述关键点用于表征与所述关键点对应的关键词在所述证件图像中的位置；根据所述证件的类型获取与所述证件的类型对应的图像模板；据所述证件图像中的关键点以及所述图像模板，对所述证件图像进行校正。

在一些可能的实施方式中，在将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点方面，处理器802具体用于执行以下操作：

将属于关键点的概率大于第一阈值的像素点作为关键点。

将概率大于第二阈值的像素点作为候选像素点；

将所述连通域的中心像素点作为所述证件图像中的关键点。

在一些可能的实施方式中，所述关键点的数量为多个，在根据所述证件图像中的关键点以及所述图像模板，对所述证件图像进行校正方面，处理器802具体用于执行以下操作：

获取所述图像模板中与每个所述关键点对应的预设关键点；

从所述图像模板中提取所述预设关键点的像素坐标；

在一些可能的实施方式中，在以预设关键点在所述图像模板中的像素坐标为基准对所述证件图像中每个关键点的像素坐标进行调整，以对所述证件图像进行校正方面，处理器802具体用于执行以下操作：

利用所述仿射变换矩阵，对所述证件图像进行校正。

将所述第一差值与所述第二差值之间的比值作为第一比值；

将所述第三差值与所述第四差值之间的比值作为第二比值；

对所述多个目标关键点进行直线拟合，得到第二直线段；

在一些可能的实施方式中，将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点时，处理器802还用于执行以下操作：

通过所述神经网络预测所述关键点所表征的关键词的词类型。

从校正后的证件图像中提取与所述关键点对应的文字内容；

对所述文字内容进行词嵌入处理，得到第一语义向量；

根据所述目标语义向量，对所述文字内容进行验证。

具体地，上述收发器801可为图7所述的实施例的证件图像校正装置700的获取单元701，上述处理器802可以为图7所述的实施例的证件图像校正装置700的处理单元702。

应理解，本申请中的电子设备可以包括智能手机(如Android手机、iOS手机、Windows Phone手机等)、平板电脑、掌上电脑、笔记本电脑、移动互联网设备MID(MobileInternet Devices，简称：MID)或穿戴式设备等。上述电子设备仅是举例，而非穷举，包含但不限于上述电子设备。在实际应用中，上述电子设备还可以包括：智能车载终端、计算机设备等等。

本申请实施例还提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现如上述方法实施例中记载的任何一种证件图像校正方法的部分或全部步骤。

本申请实施例还提供一种计算机程序产品，所述计算机程序产品包括存储了计算机程序的非瞬时性计算机可读存储介质，所述计算机程序可操作来使计算机执行如上述方法实施例中记载的任何一种证件图像校正方法的部分或全部步骤。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于可选实施例，所涉及的动作和模块并不一定是本申请所必须的。

在上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的装置，可通过其它的方式实现。例如，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，装置或单元的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件程序模块的形式实现。

所述集成的单元如果以软件程序模块的形式实现并作为独立的产品销售或使用时，可以存储在一个计算机可读取存储器中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在一个存储器中，包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。而前述的存储器包括：U盘、只读存储器(ROM，Read-Only Memory)、随机存取存储器(RAM，Random Access Memory)、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。

本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令相关的硬件来完成，该程序可以存储于一计算机可读存储器中，存储器可以包括：闪存盘、只读存储器(英文：Read-Only Memory，简称：ROM)、随机存取器(英文：Random Access Memory，简称：RAM)、磁盘或光盘等。

以上对本申请实施例进行了详细介绍，本文中应用了具体个例对本申请的原理及实施方式进行了阐述，以上实施例的说明只是用于帮助理解本申请的方法及其核心思想；同时，对于本领域的一般技术人员，依据本申请的思想，在具体实施方式及应用范围上均会有改变之处，综上所述，本说明书内容不应理解为对本申请的限制。

Claims

1.一种证件图像校正方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点，包括：

将属于关键点的概率大于第一阈值的像素点作为关键点。

3.根据权利要求1所述的方法，其特征在于，所述将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点，包括：

将概率大于第二阈值的像素点作为候选像素点；

将所述连通域的中心像素点作为所述证件图像中的关键点。

4.根据权利要求1-3中任一项所述的方法，所述关键点的数量为多个，所述根据所述证件图像中的关键点以及所述图像模板，对所述证件图像进行校正，包括：

获取所述图像模板中与每个所述关键点对应的预设关键点；

从所述图像模板中提取所述预设关键点的像素坐标；

5.根据权利要求4所述的方法，其特征在于，所述以预设关键点在所述图像模板中的像素坐标为基准对所述证件图像中每个关键点的像素坐标进行调整，以对所述证件图像进行校正，包括：

利用所述仿射变换矩阵，对所述证件图像进行校正。

6.根据权利要求4所述的方法，所述以预设关键点在所述图像模板中的像素坐标为基准对所述证件图像中每个关键点的像素坐标进行调整，以对所述证件图像进行校正，包括：

将所述第一差值与所述第二差值之间的比值作为第一比值；

将所述第三差值与所述第四差值之间的比值作为第二比值；

对所述多个目标关键点进行直线拟合，得到第二直线段；

7.根据权利要求1-6中任一项所述的方法，其特征在于，所述将所述证件图像输入到完成训练的神经网络，得到所述证件图像中的关键点时，所述方法还包括：

通过所述神经网络预测所述关键点所表征的关键词的词类型；

所述方法还包括：

从校正后的证件图像中提取与所述关键点对应的文字内容；

对所述文字内容进行词嵌入处理，得到第一语义向量；

根据所述目标语义向量，对所述文字内容进行验证。

8.一种证件图像校正装置，其特征在于，包括：

9.一种电子设备，其特征在于，包括：处理器和存储器，所述处理器与所述存储器相连，所述存储器用于存储计算机程序，所述处理器用于执行所述存储器中存储的计算机程序，以使得所述电子设备执行如权利要求1-7中任一项所述的方法。

10.一种计算机可读存储介质，其特征在于，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行以实现如权利要求1-7任一项所述的方法。