CN114677700A

CN114677700A - 身份标识的识别方法和装置、存储介质及电子设备

Info

Publication number: CN114677700A
Application number: CN202210374274.1A
Authority: CN
Inventors: 廖红虹
Original assignee: Tencent Technology Shenzhen Co Ltd
Current assignee: Tencent Technology Shenzhen Co Ltd
Priority date: 2022-04-11
Filing date: 2022-04-11
Publication date: 2022-06-28

Abstract

本申请公开了一种身份标识的识别方法和装置、存储介质及电子设备。其中，该方法包括：获取待识别的身份证件图像，其中，身份证件图像为对目标对象的身份证件进行图像采集后得到的；对身份证件图像中所显示的目标对象的身份标识进行识别，以得到与目标对象的身份标识中的每个标识字符各自匹配的候选字符集；在获取到与标识字符相匹配的标识字符验证码的情况下，比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码；根据比对的结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。本申请解决了对身份标识中的形近字的识别准确率较低的技术问题。

Description

身份标识的识别方法和装置、存储介质及电子设备

技术领域

本申请涉及计算机领域，具体而言，涉及一种身份标识的识别方法和装置、存储介质及电子设备。

背景技术

如今，在很多场合都需要对用户进行实名验证，如利用用户持有的身份证件对其进行身份识别。目前常用的方式是通过光学字符识别(Optical Character Recognition，简称OCR)模型来识别身份证件上用户的中文身份标识。但由于汉字中存在很多形状及其相似的形近字，因而，在通过OCR模型识别时，很容易就会出现将一个汉字识别成与其非常相似的另一个汉字，从而导致身份识别失败。

也就是说，在相关技术中提供的身份标识的识别方法中，受到形近字的影响，导致识别结果准确性较低的问题。

针对上述的问题，目前尚未提出有效的解决方案。

发明内容

本申请实施例提供了一种身份标识的识别方法和装置、存储介质及电子设备，以至少解决对身份标识中的形近字的识别准确率较低的技术问题。

根据本申请实施例的一个方面，提供了一种身份标识的识别方法，包括：获取待识别的身份证件图像，其中，上述身份证件图像为对目标对象的身份证件进行图像采集后得到的；对上述身份证件图像中所显示的上述目标对象的身份标识进行识别，以得到与上述目标对象的身份标识中的每个标识字符各自匹配的候选字符集，其中，上述候选字符集中包括与上述标识字符相关联的至少两个候选字符；在获取到与上述标识字符相匹配的标识字符验证码的情况下，比对上述标识字符验证码及与上述标识字符相关联的各个候选字符各自匹配的候选字符验证码；根据比对的结果从上述候选字符集中识别出上述目标对象的身份标识中包含的目标标识字符。

根据本申请实施例的另一方面，还提供了一种身份标识的识别装置，包括：获取单元，用于获取待识别的身份证件图像，其中，上述身份证件图像为对目标对象的身份证件进行图像采集后得到的；第一识别单元，用于对上述身份证件图像中所显示的上述目标对象的身份标识进行识别，以得到与上述目标对象的身份标识中的每个标识字符各自匹配的候选字符集，其中，上述候选字符集中包括与上述标识字符相关联的至少两个候选字符；比对单元，用于在获取到与上述标识字符相匹配的标识字符验证码的情况下，比对上述标识字符验证码及与上述标识字符相关联的各个候选字符各自匹配的候选字符验证码；第二识别单元，用于根据比对的结果从上述候选字符集中识别出上述目标对象的身份标识中包含的目标标识字符。

根据本申请实施例的又一方面，还提供了一种计算机可读的存储介质，该计算机可读的存储介质中存储有计算机程序，其中，该计算机程序被设置为运行时执行上述身份标识的识别方法。

根据本申请实施例的又一个方面，提供一种计算机程序产品或计算机程序，该计算机程序产品或计算机程序包括计算机指令，该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行如以上身份标识的识别方法。

根据本申请实施例的又一方面，还提供了一种电子设备，包括存储器和处理器，上述存储器中存储有计算机程序，上述处理器被设置为通过所述计算机程序执行上述的身份标识的识别方法。

在本申请实施例中，对获取到的待识别的身份证件图像中所显示的目标对象的身份标识进行识别，以得到与目标对象的身份标识中的每个标识字符各自匹配的候选字符集。在获取到与标识字符相匹配的标识字符验证码的情况下，比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码；根据比对的结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。在上述方法中，在得到目标对象的身份标识中的每个标识字符各自匹配的候选字符集后，会根据标识字符验证码与标识字符相关联的各个候选字符各自匹配的候选字符验证码的比对结果，从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。从而使得在识别身份标识时，根据标识字符验证码与候选字符验证码的比对结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符，而不再局限于仅仅通过OCR模型来识别身份证件图像中的身份标识，扩展了身份标识的识别渠道，将两种身份标识的识别方式融合起来，提高了对身份标识中的形近字的识别能力，进而解决了相关技术存在的对身份标识中的形近字的识别准确率较低的技术问题。

附图说明

此处所说明的附图用来提供对本申请的进一步理解，构成本申请的一部分，本申请的示意性实施例及其说明用于解释本申请，并不构成对本申请的不当限定。在附图中：

图1是根据本申请实施例的一种可选的身份标识的识别方法的应用环境的示意图；

图2是根据本发明实施例的一种可选的身份标识的识别方法的流程图；

图3是根据本发明实施例的一种可选的身份标识的识别方法的示意图；

图4是根据本发明实施例的另一种可选的身份标识的识别方法的示意图；

图5是根据本发明实施例的又一种可选的身份标识的识别方法的流程图；

图6是根据本发明实施例的又一种可选的身份标识的识别方法的示意图；

图7是根据本发明实施例的又一种可选的身份标识的识别方法的示意图；

图8是根据本发明实施例的又一种可选的身份标识的识别方法的示意图；

图9是根据本发明实施例的又一种可选的身份标识的识别方法的示意图；

图10是根据本发明实施例的又一种可选的身份标识的识别方法的示意图；

图11是根据本申请实施例的一种可选的身份标识的识别装置的结构示意图；

图12是根据本申请实施例的一种可选的电子设备的结构示意图。

具体实施方式

为了使本技术领域的人员更好地理解本申请方案，下面将结合本申请实施例中的附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分的实施例，而不是全部的实施例。基于本申请中的实施例，本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例，都应当属于本申请保护的范围。

需要说明的是，本申请的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象，而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换，以便这里描述的本申请的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外，术语“包括”和“具有”以及他们的任何变形，意图在于覆盖不排他的包含，例如，包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元，而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。

根据本申请实施例的一个方面，提供了一种身份标识的识别方法，可选地，作为一种可选的实施方式，上述身份标识的识别方法可以但不限于应用于如图1所示的环境中的虚拟道具的获取系统。

其中，该虚拟道具的获取系统可以包括但不限于终端设备102、网络104、服务器106、数据库108。终端设备102中运行有目标客户端。上述终端设备102中包括人机交互屏幕，处理器及存储器。人机交互屏幕用于显示采集到的身份证件图像和目标标识字符；还用于提供人机交互接口以接收人机交互操作。处理器用于响应上述人机交互操作生成交互指令，并将该交互指令发送给服务器。存储器用于存储相关数据，如目标对象的身份标识中的每个标识字符各自匹配的候选字符集，及与标识字符相匹配的标识字符验证码等。

此外，服务器106中包括处理引擎，处理引擎用于对数据库108执行存储或读取操作。具体地，处理引擎从数据库108中读取相关数据，以进行比对，然后将从候选字符集中识别出目标对象的身份标识中包含的目标标识字符信息返回给终端设备102，从而实现在终端设备102中显示身份标识中包含的目标标识字符。然后，服务器106还将获取终端设备返回的目标标识字符的获取结果，并将其存储至数据库108中。

可选地，在本实施例中，上述终端设备可以是配置有目标客户端的终端设备，可以包括但不限于以下至少之一：手机(如Android手机、iOS手机等)、笔记本电脑、平板电脑、掌上电脑、MID(Mobile Internet Devices，移动互联网设备)、PAD、台式电脑、智能电视等。目标客户端可以是视频客户端、即时通信客户端、浏览器客户端、教育客户端等。上述网络可以包括但不限于：有线网络，无线网络，其中，该有线网络包括：局域网、城域网和广域网，该无线网络包括：蓝牙、WIFI及其他实现无线通信的网络。上述服务器可以是单一服务器，也可以是由多个服务器组成的服务器集群，或者是云服务器。

具体过程如以下步骤：如步骤S100，通过图像采集设备，如：终端设备102上的摄像头，采集身份证件图像。然后如步骤S102，将待识别的身份证件图像通过网络104发送给服务器106。在服务器106上执行步骤S104-步骤S106：对身份证件图像中所显示的目标对象的身份标识进行识别，以得到与目标对象的身份标识中的每个标识字符各自匹配的候选字符集，其中，候选字符集中包括与标识字符相关联的至少两个候选字符；在获取到与标识字符相匹配的标识字符验证码的情况下，比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码；根据比对的结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。然后如步骤S108，将目标对象的身份标识中包含的目标标识字符通过网络104发送给终端设备102。进一步，终端设备102将把获取结果通过网络104发送给服务器106，以存储到数据库108中。上述仅是一种示例，本实施例中对此不作任何限定。

需要说明的是，在本实施例中，对获取到的待识别的身份证件图像中所显示的目标对象的身份标识进行识别，以得到与目标对象的身份标识中的每个标识字符各自匹配的候选字符集。在获取到与标识字符相匹配的标识字符验证码的情况下，比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码；根据比对的结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。在上述方法中，在得到目标对象的身份标识中的每个标识字符各自匹配的候选字符集后，会根据标识字符验证码与标识字符相关联的各个候选字符各自匹配的候选字符验证码的比对结果，从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。从而使得在识别身份标识时，根据标识字符验证码与候选字符验证码的比对结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符，而不再局限于仅仅通过OCR模型来识别身份证件图像中的身份标识，扩展了身份标识的识别渠道，将两种身份标识的识别方式融合起来，提高了对身份标识中的形近字的识别能力，进而解决了相关技术存在的对身份标识中的形近字的识别准确率较低的技术问题。

可选地，作为一种可选的实施方式，如图2所示，上述身份标识的识别方法包括：

S202，获取待识别的身份证件图像，其中，身份证件图像为对目标对象的身份证件进行图像采集后得到的；

可选地，在本实施例中，上述待识别的身份证件图像的采集方式可以包括但不限于以下之一：终端设备实时拍摄得到，从本地存储的图片读取得到，通过其他渠道转发或者扫描获取到。本申请实施例中涉及的识别场景中的身份证件为用于区分不同对象的证明文件，可以但不限于以卡片形式出现。例如：居民的居民身份证件、公民的护照证件、公民的签证、公民的出生证明、公民的通行证等。上述目标对象可以但不限于为需要使用身份证件来证明身份的用户或其他对象。

S204，对身份证件图像中所显示的目标对象的身份标识进行识别，以得到与目标对象的身份标识中的每个标识字符各自匹配的候选字符集，其中，所述候选字符集中包括与所述标识字符相关联的至少两个候选字符；

可选地，在本申请实施例中，上述对身份证件图像中所显示的目标对象的身份标识进行识别的方式可以包括但不限于：先检测定位到目标对象的身份标识，再对识别检测到的文字区域包含的具体文字符号进行识别。

可选地，在本实施例中，上述标识字符可以包括但不限于为简体中文字、繁体中文字、英文字母、法文字母、数字、标点符号。

S206，在获取到与标识字符相匹配的标识字符验证码的情况下，比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码；

可选地，在本实施例中，上述标识字符验证码可以包括但不限于为从身份证件图像中的功能区域中识别得到的。上述各个候选字符各自匹配的候选字符验证码可以包括但不限于为对与标识字符相关联的各个候选字符进行对应地加密得到的字符串。上述比对的方式可以但不限于为将与标识字符相关联的各个候选字符各自匹配的候选字符验证码，依次与标识字符验证码进行比对。

S208，根据比对的结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。

可选地，在本实施例中，上述比对的结果可以但不限于为候选字符集中与标识字符验证码匹配的标识字符。

需要说明的是，在本实施例中，身份证件图像以某个居民的居民身份证件图像为例，在通过终端设备的摄像头采集到居民身份证件图像后，先检测定位到身份标识所在的功能区域。然后识别检测到的功能区域中的具体文字符号，以得到每个标识字符各自匹配的候选字符集。接着，将从身份证件图像中的功能区域中识别得到的标识字符验证码，依次和对与标识字符相关联的各个候选字符进行对应地加密得到的字符串，进行比对，以得到候选字符集中与标识字符验证码匹配的目标标识字符。

结合图3所示，具体说明身份标识的识别过程：姓名为“张三”的居民的居民身份证图像中包含居民的证件照片310、日期标识308，居民的身份标识302。身份标识302为该居民的姓名。先检测定位到身份标识202所在的图像区域。接着，对姓名“张三”在居民身份证图像中所在的区域进行识别，得到与该姓名中每个字符各自对应的候选字符集304。假设在候选字符集304中，第一行中的5个字为上述文字识别模型中对候选字符“张”进行识别后所得到的5个结果，分别是：怅、帐、胀、张、强。第二行中的5个字为上述文字识别模型中对候选字符“三”进行识别后所得到的5个结果，分别是：主、王、土、三、干。然后对“怅、帐、胀、张、强、主、王、土、三、干”这5个字进行加密，将这5个字按照一定的映射关系转化为相应的字符串，得到候选字符验证码306。，在识别出身份证上相应的区域中的具体的文字符号是“00021002”后，将字符串“0002”依次与候选字符验证码306中的第一行的5个形近字所对应的加密字符串进行比对，根据比对结果，确定出第一行中的第4个字“张”为身份标识302中包含的目标标识字符。类似地，将字符串“1002”依次与候选字符验证码306中的第二行的5个形近字所对应的加密字符串进行比对，根据比对结果，确定出第一行中的第4个字“三”为身份标识302中包含的目标标识字符。

上述图3为一种可选示例，本申请实施例对于身份标识的识别方法中涉及的身份证件图像上姓名的呈现位置，标识字符验证码的获取方式等不作任何限定。

通过本申请提供的实施例，在上述方法中，在得到目标对象的身份标识中的每个标识字符各自匹配的候选字符集后，会根据标识字符验证码与标识字符相关联的各个候选字符各自匹配的候选字符验证码的比对结果，从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。从而使得在识别身份标识时，根据标识字符验证码与候选字符验证码的比对结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符，而不再局限于仅仅通过OCR模型来识别身份证件图像中的身份标识，扩展了身份标识的识别渠道，将两种身份标识的识别方式融合起来，提高了对身份标识中的形近字的识别能力，进而解决了相关技术存在的对身份标识中的形近字的识别准确率较低的技术问题。

作为一种可选的方案，对身份证件图像中所显示的目标对象的身份标识进行识别，以得到与目标对象的身份标识中的每个标识字符各自匹配的候选字符集包括：

S1，从身份证件图像中确定出目标对象的身份标识所在的身份标识区域；

S2，通过身份识别网络对身份标识区域进行识别，以得到与每个标识字符各自匹配的候选字符集，其中，身份识别网络中包括至少两种特征转录层。

需要说明的是，上述身份表示区域的边界线可以包括但不限于为矩形框、或者是多边形框。上述特征转录层可以包括但不限于为时序分类(Connectionist TemporalClassification，简称CTC)转录层、注意力机制(Attention)转录层。例如：如图4所示，身份证件图像中包含身份标识——“张三”，标识字符为“张”和“三”。使用包括CTC转录层、Attention转录层在内的身份识别网络404对姓名“张三”所在的身份标识区域402进行识别，分别得到与标识字符“张”匹配的候选字符集406-1：{怅、帐、胀、张、强}，与标识字符“三”匹配的候选字符集406-2：{主、王、土、三、干}。

通过本申请提供的实施例，通过包含至少两种特征转录层的身份识别网络，对目标对象的身份标识所在的身份标识区域进行识别，得到与每个标识字符各自匹配的候选字符集。从而实现了定位到特定的待识别的身份标识区域，利用多种转录层将特征信息转化为识别结果。提高了候选字符集中字符的多样性，进而提高了识别标识字符的准确性，

作为一种可选的方案，通过身份识别网络对身份标识区域进行识别，以得到与每个标识字符各自匹配的候选字符集包括：

S1，在所述身份识别网络的特征提取层中，提取所述身份标识区域的图像特征信息；

S2，在与所述特征提取层相连接的关系预测层中，基于从所述图像特征信息提取出的上下文信息预测字符关联关系；

S3，在与所述关系预测层相连接的第一特征转录层中生成第一字符标签序列，并在与所述关系预测层相连接的第二特征转录层中生成第二字符标签序列，其中，所述第一特征转录层与所述第二特征转录层为具有不同架构的转录层；

S4，在与所述特征提取层相连接的第三特征转录层中生成第三字符标签序列，其中，所述第二特征转录层与所述第三特征转录层为具有相同架构的转录层；

S5，从所述第一字符标签序列、所述第二字符标签序列及所述第三字符标签序列中，确定出与每个所述标识字符各自匹配的所述候选字符集。

需要说明的是，上述特征提取层可以包括但不限于为任意一种深度网络，如：卷积神经网络(Convolutional Neural Networks，简称CNN)层。上述关系预测层可以包括但不限于为循环神经网络(Recurrent Neural Network，简称RNN)层。上述第一特征转录层可以包括但不限于为CTC转录层、Attention转录层。上述第二特征转录层与上述第一特征转录层是不同的。上述第二特征转录层可以包括但不限于CTC转录层、Attention转录层。上述第三特征转录层可以包括但不限于为CTC转录层、Attention转录层。在本实施例中，特征提取层以卷积神经网络(CNN)层为例进行说明，关系预测层以循环神经网络层为例进行说明，第一特征转录层以CTC转录层为例进行说明，第一特征转录层以Attention转录层为例进行说明，第一特征转录层以Attention转录层为例进行说明。

例如，如身份识别网络识别流程图，即图5中所示，对于身份标识区域，如步骤S502，先利用卷积神经网络(CNN)层，提取出身份标识区域的图像特征信息。接着如步骤S506-1，将卷积神经网络(CNN)层生成的图像特征信息，通过Attention转录层转换成第三字符标签序列。然后如步骤S504，再将图像特征信息输入到循环神经网络层，以基于图像特征信息提取出身份标识区域的图像信息中的上下文信息，对第一字符标签序列和第二字符标签序列中的字符关联关系进行预测。接着如步骤S506-2，将循环神经网络层生成的每一帧图像，通过CTC转录层转换成第一字符标签序列。如步骤S506-3，将循环神经网络层生成的每一帧图像，通过Attention转录层转换成第二字符标签序列。最后，从第一字符标签序列、第二字符标签序列和第三字符标签序列中，确定出与标识字符“张”匹配的候选字符集：{张、胡、胀、强、长、...}，与标识字符“三”匹配的候选字符集：{三、主、二、...}。

需要说明的是，由于“Attention”机制与CTC在处理身份证件图像时，对于图像特征的关注的方式是不同的。具体来讲，“Attention”机制可以使得网络工作过程中可以像人一样将注意力放在不同位置，每次只关注一个字符，可以获得长时间的依赖，捕捉局部和全局的关系，并且每一步的计算都是独立的所以可以很好的并行加速。而CTC是对图像片段进行切片，每次只关注一片。

进一步，因为“Attention”机制抛弃了时间序列的语序顺序，所以可以避免把身份标识区域变成一个时间序列，避免先后关系上的依赖。即避免所有的特征都“同质化”，可以提升特征的多样性，从而提高正确识别出身份标识中包含的目标标识字符的概率。

通过本申请提供的实施例，通过身份识别网络中的特征提取层，来提取身份标识区域的图像特征信息，通过与特征提取层相连接的关系预测层预测字符关联关系，在与关系预测层相连接的第一特征转录层中生成第一字符标签序列，在与所述关系预测层相连接的第二特征转录层中生成第二字符标签序列，在与特征提取层相连接的第三特征转录层中生成第三字符标签序列，其中，所述第二特征转录层与所述第三特征转录层为具有相同架构的转录层。从上述三种字符标签序列中确定出与每个标识字符各自匹配的候选字符集。从而实现提升生成特征的多样性，从而提高候选字符集中包含正确字符的概率。

作为一种可选的方案，从第一字符标签序列、所述第二字符标签序列及第三字符标签序列中，确定出与每个所述标识字符各自匹配的所述候选字符集包括：

S1，对第一字符标签序列中的字符、第二字符标签序列中的字符及第三字符标签序列中的字符进行投票操作；

S2，根据投票的结果确定出与每个标识字符各自匹配的候选字符集。

需要说明的是，上述候选字符集中的候选字符的个数可以但不限于为5个。上述投票操作可以包括但不限于：对第一标签序列、第二标签序列与第三标签序列中的每个字符的置信度进行累加，选出累加后置信度最高的前5个字符。

例如，如图6中所示，以标识字符“张”为例，假设根据标识字符所对应的置信度由高到低的顺序，从第一标签序列中选出前5个结果，分别是：{张、胡、胀、强、长}，每个结果对应的置信度(从左到右)分别为：a1、a2、a3、a4、a5。假设根据标识字符所对应的置信度由高到低的顺序，从第二标签序列中选出前5个结果，分别是{帐、张、怅、胀、强、怅}，每个结果对应的置信度(从左到右)分别为：b1、b2、b3、b4、b5。假设根据标识字符所对应的置信度由高到低的顺序，从第三标签序列中选出前5个结果，分别是{张、强、胀、涨、怅}，每个结果对应的置信度(从左到右)分别为：c1、c2、c3、c4、c5。对上述15个结果的置信度进行累加，得到累加结果：{张：a1+b2+c1、胡：a2、胀：a3+b4+c3、强：a4+b4+c2、长：a5、帐：b1、怅：b3、怅：b5+c5、涨：c4}。将累加结果中的字符按照置信度由高到低排序，假设前5名是：{张、强、胀、涨、怅}。那么标识字符“张”所匹配的候选字符集为：{张、强、胀、涨、怅}。

通过本申请提供的实施例，对各个转录层输出的标签序列中的字符进行投票，进而根据投票的结果确定出与每个标识字符各自匹配的候选字符集。从而融合了不同转录层输出的结果，提高了候选字符集中存在正确的字符的概率。

作为一种可选的方案，通过身份识别网络从身份证件图像中确定出目标对象的身份标识所在的身份标识区域包括：

S1，对身份证件图像中的各个像素进行分类，以得到文本像素，其中，位于文本区域内的像素被分类为文本像素；

S2，将相互连接的所述文本像素连接成连通区域；

S3，在识别出连通区域内的文本像素所指示的文本字符的语义信息的情况下，将具有相关语义信息的文本字符划分为同一个功能区域，得到多个功能区域；

S4，从所述多个功能区域中确定出身份标识区域。

需要说明的是，上述身份标识区域可以包括但不限于为姓名所在的区域。上述通确定目标对象的身份标识所在的身份标识区域的方式可以但不限于为后处理算法(Progressive Scale Expansion Algorithm-PSE，简称PSENet)。

例如：如图7中所示，对于身份证件图像702中的每个像素，判断其是否属于文本区域。若像素p1属于文本区域，那么像素p1为文本像素；若像素p1不属于文本区域，那么像素p1就不是文本像素。接着，将相互连接的文本像素连接起来，构成多个连通区域。其中，连通区域704-1内的文本像素指示的文本字符的语义信息与连通区域704-2内的文本像素指示的文本字符的语义信息呈现一定的相关性。将连通区域704-1与连通区域704-2划分为同一个功能区域。最后，从多个划定的功能区域中确定出“张三”所在的区域。

通过本申请提供的实施例，使用语义分割对身份证件图像中的每个像素进行分类，进而能够区分出身份证件图像中每个像素的属性，从而检测出任意形状的文本位置。

作为一种可选的方案，在获取到与标识字符相匹配的标识字符验证码的情况下，比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码包括：

S1，将目标对象的身份标识中的每个标识字符依次作为待识别的当前标识字符，并获取与当前标识字符相匹配的当前标识字符验证码；

S2，遍历与当前标识字符相匹配的当前候选字符集，将当前候选字符集中的各个候选字符依次作为当前候选字符；

S3，比对当前标识字符验证码及与当前候选字符匹配的当前候选字符验证码；

S4，在当前标识字符验证码与当前候选字符验证码不匹配的情况下，获取下一个候选字符作为当前候选字符；

S5，在当前标识字符验证码与当前候选字符验证码匹配的情况下，将当前候选字符确定为与当前标识字符匹配的目标标识字符。

需要说明的是，上述字符验证码可以但不限于为中文电码(Chinese CommercialCode，简称CCC码)。例如：如图8中所示，将目标对象中的身份标识“张三”中的标识字符{张、三}以此作为待识别的当前标识字符。假设将“张”作为待识别的当前标识字符，并从验证码区域802中获取到与“张”相匹配的中文电码0002。假设与“张”匹配的当前候选字符集804为：{怅、帐、胀、张、强}。那么先比对“怅”的中文电码1898与0002。若不匹配，则继续比对“帐”的中文电码6348与0002。若不匹配，则继续比对“胀”的中文电码5195与0002。若不匹配，则继续比对“张”的中文电码0002与0002。比对成功后，将当前候选字符“张”确定为与当前标识字符“张”匹配的目标标识字符。因为形近字的中文电码通常是不相同的，所以候选字符集804中的字符对应的中文电码通常是不同的。在获取到当前标识字符的验证码，即中文电码的情况下，依次逐一比对当前标识字符所对应的中文电码和候选字符集804中的字符所对应的中文电码，可以提高确定目标标识字符的准确性。

通过本申请提供的实施例，通过遍历与所述当前标识字符相匹配的当前候选字符集，比对当前标识字符验证码与当前候选字符匹配的当前候选字符验证码，从而确定出与当前标识字符匹配的目标标识字符。从而实现了使用中文电码辅助提高了身份识别网络对标识字符的识别的准确性。提高了确定目标标识字符的过程的可靠性。

作为一种可选的方案，在比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码之前，还包括：

S1，对身份证件图像中所显示的所述目标对象的身份验证码进行识别，以得到与目标对象的身份标识中的每个标识字符各自对应的标识字符验证码。

需要说明的是，上述识别方式可以但不限于为通过光学字符识别(OpticalCharacter Recognition，简称OCR)模型来识别。上述身份验证码可以但不限于为中文电码。

例如：如图9中所示，身份证件图像中显示有验证码区域902，验证码区域902中显示有身份标识“张三”所对应的中文电码。由于光学字符识别模型对数字的识别准确率非常高(通常可以达到99％以上)，所以可以利用光学字符识别模型对验证码区域902的数字进行识别，可以得到该身份证件图像上中文姓名“张三”对应的中文电码“0002 1002”。

通过本申请提供的实施例，在比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码之前，对身份证件图像中所显示的所述目标对象的身份验证码进行识别，以得到与目标对象的身份标识中的每个标识字符各自对应的标识字符验证码。从而实现了从身份证件图像中确定出与身份标识字符对应的身份标识字符验证码。

作为一种可选的方案，在比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码之前，包括：

S1，按照预先配置的字符与字符验证码之间的映射关系，将各个候选字符分别转换为对应的候选字符验证码。

需要说明的是，上述字符与字符验证码之间的映射关系可以但不限于为：{汉字、字母和符号}与中文电码之间的对应关系。

例如：预先根据{汉字、字母和符号}与中文电码之间的对应关系配置好字符与字符验证码之间的映射关系。中文电码采用了四位阿拉伯数字作代号，从0001到9999按四位数字顺序排列，用四位阿拉伯数字标识最多一万个汉字、字母和符号。假设候选字符集为：{张、强}，将候选字符“张”转换为对应的中文电码1728，将候选字符“强”转换为对应的中文电码1730，将候选字符“1”转换为对应的中文电码1730。

需要说明的是，中文字中的形近字所对应的中文电码通常是不同的。也就是说，身份识别网络识别到的候选字符中可能包含形近字，而这些候选字符所对应的中文电码通常是不同的。

通过本申请提供的实施例，按照预先配置的字符与字符验证码之间的映射关系，将各个候选字符分别转换为对应的候选字符验证码。从而实现了确定各个候选字符所对应的候选字符验证码。为后续比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码做准备。

需要说明的是，在本实施例中，身份证件图像以某个公民的护照证件图像为例，在通过终端设备的摄像头采集到护照证件图像后，先检测定位到身份标识所在的图像区域。然后识别检测到的图像区域中的具体文字符号，以得到每个标识字符各自匹配的候选字符集。接着，将从身份证件图像中的身份标识所在的图像区域中识别得到的标识字符验证码，依次和对与标识字符相关联的各个候选字符相对应的中文电码，进行比对，以得到候选字符集中与标识字符验证码匹配的目标标识字符。

结合图10所示，具体说明身份标识的识别过程：姓名为“张三”的公民的护照证件图像中包含证件照片1004、日期标识1006和公民的身份标识1002，身份标识1002为该居民的姓名。通过PSENet算法对身份标识1002所在的区域的图像像素进行分类，确定出“张三”所在的区域。接着，利用身份识别网络对姓名“张三”在居民身份证图像中所在的区域进行识别，得到与该姓名中每个字符各自对应的候选字符集，选出候选字符集中置信度较高的5个字符，计算出置信度较高的5个字符对应的中文电码。其中，与标识字符“张”匹配的信度较高的5个候选字符对应的中文电码1008-1具体为：{1898、6348、1898、1728、1730}。与标识字符“三”匹配的信度较高的5个候选字符对应的中文电码1008-2具体为：{0031、3769、0960、0005、1003}。采用OCR模型对身份证上与标识字符“张”、“三”相匹配相应的区域进行识别得到标识字符验证码，在识别出身份证上相应的区域中的文字是“1728 0005”后，将标识字符验证码1010-1，即“1728”依次与中文电码1008-1中的第一行的5个字符对应的中文电码进行比对，根据比对结果，确定出第一行中的第4个字“张”为身份标识1002中包含的目标标识字符。类似地，将标识字符验证码1010-2，即“0005”依次与中文电码1008-2中的第二行的5个形近字进行比对，根据比对结果，确定出第一行中的第4个字“三”为身份标识1002中包含的目标标识字符。

上述图10为示例，本实施例中对此不做任何限定。

需要说明的是，对于前述的各方法实施例，为了简单描述，故将其都表述为一系列的动作组合，但是本领域技术人员应该知悉，本申请并不受所描述的动作顺序的限制，因为依据本申请，某些步骤可以采用其他顺序或者同时进行。其次，本领域技术人员也应该知悉，说明书中所描述的实施例均属于优选实施例，所涉及的动作和模块并不一定是本申请所必须的。

根据本申请实施例的另一个方面，还提供了一种用于实施上述身份标识的识别方法的身份标识的识别装置。如图11中所示，该装置包括：

获取单元1102，用于获取待识别的身份证件图像，其中，身份证件图像为对目标对象的身份证件进行图像采集后得到的；

第一识别单元1104，用于对身份证件图像中所显示的目标对象的身份标识进行识别，以得到与目标对象的身份标识中的每个标识字符各自匹配的候选字符集，其中，候选字符集中包括与标识字符相关联的至少两个候选字符；

比对单元1106，用于在获取到与标识字符相匹配的标识字符验证码的情况下，比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码；

第二识别单元1108，用于根据比对的结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。

可选地，在本实施例中，上述各个单元模块所要实现的实施例，可以参考上述各个方法实施例，这里不再赘述。

根据本申请实施例的又一个方面，还提供了一种用于实施上述身份标识的识别方法的电子设备，该电子设备可以是图12所示的终端设备或服务器。本实施例以该电子设备为服务器例来说明。如图12所示，该电子设备包括存储器1202和处理器1204，该存储器1202中存储有计算机程序，该处理器1204被设置为通过计算机程序执行上述任一项方法实施例中的步骤。

可选地，在本实施例中，上述电子设备可以位于计算机网络的多个网络设备中的至少一个网络设备。

可选地，在本实施例中，上述处理器可以被设置为通过计算机程序执行以下步骤：

S1，获取待识别的身份证件图像，其中，身份证件图像为对目标对象的身份证件进行图像采集后得到的；

S2，用于对身份证件图像中所显示的目标对象的身份标识进行识别，以得到与目标对象的身份标识中的每个标识字符各自匹配的候选字符集，其中，候选字符集中包括与标识字符相关联的至少两个候选字符；

S3，在获取到与标识字符相匹配的标识字符验证码的情况下，比对标识字符验证码及与标识字符相关联的各个候选字符各自匹配的候选字符验证码；

S4，根据比对的结果从候选字符集中识别出目标对象的身份标识中包含的目标标识字符。

可选地，本领域普通技术人员可以理解，图12所示的结构仅为示意，电子设备也可以是智能手机(如Android手机、iOS手机等)、平板电脑、掌上电脑以及移动互联网设备(Mobile Internet Devices，MID)、PAD等终端设备。图12其并不对上述电子设备的结构造成限定。例如，电子设备还可包括比图12中所示更多或者更少的组件(如网络接口等)，或者具有与图12所示不同的配置。

其中，存储器1202可用于存储软件程序以及模块，如本申请实施例中的身份标识的识别方法和装置对应的程序指令/模块，处理器1204通过运行存储在存储器1202内的软件程序以及模块，从而执行各种功能应用以及数据处理，即实现上述的身份标识的识别方法。存储器1202可包括高速随机存储器，还可以包括非易失性存储器，如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中，存储器1202可进一步包括相对于处理器1204远程设置的存储器，这些远程存储器可以通过网络连接至终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。其中，存储器1202具体可以但不限于用于存储相关属性数据，如目标对象的身份标识中的每个标识字符各自匹配的候选字符集，及与标识字符相匹配的标识字符验证码等信息。作为一种示例，如图12所示，上述存储器1202中可以但不限于包括上述身份标识的识别装置中的获取单元1102、第一识别单元1104、比对单元1106及第二识别单元1108。此外，还可以包括但不限于上述身份标识的识别装置中的其他模块单元，本示例中不再赘述。

可选地，上述的传输装置1206用于经由一个网络接收或者发送数据。上述的网络具体实例可包括有线网络及无线网络。在一个实例中，传输装置1206包括一个网络适配器(Network Interface Controller，NIC)，其可通过网线与其他网络设备与路由器相连从而可与互联网或局域网进行通讯。在一个实例中，传输装置1206为射频(Radio Frequency，RF)模块，其用于通过无线方式与互联网进行通讯。

此外，上述电子设备还包括：显示器1208，用于显示上述识别出的目标对象的身份标识中包含的目标标识字符；和连接总线1210，用于连接上述电子设备中的各个模块部件。

在其他实施例中，上述终端设备或者服务器可以是一个分布式系统中的一个节点，其中，该分布式系统可以为区块链系统，该区块链系统可以是由该多个节点通过网络通信的形式连接形成的分布式系统。其中，节点之间可以组成点对点(P2P，Peer To Peer)网络，任意形式的计算设备，比如服务器、终端等电子设备都可以通过加入该点对点网络而成为该区块链系统中的一个节点。

根据本申请的一个方面，提供了一种计算机程序产品，该计算机程序产品包括计算机程序/指令，该计算机程序/指令包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。在该计算机程序被中央处理器执行时，执行本申请实施例提供的各种功能。

计算机系统包括中央处理器(Central Processing Unit，CPU)，其可以根据存储在只读存储器(Read-Only Memory，ROM)中的程序或者从存储部分加载到随机访问存储器(Random Access Memory，RAM)中的程序而执行各种适当的动作和处理。在随机访问存储器中，还存储有系统操作所需的各种程序和数据。中央处理器、在只读存储器以及随机访问存储器通过总线彼此相连。输入/输出接口(Input/Output接口，I/O接口)也连接至总线。

以下部件连接至输入/输出接口：包括键盘、鼠标等的输入部分；包括诸如阴极射线管(Cathode Ray Tube，CRT)、液晶显示器(Liquid Crystal Display，LCD)等以及扬声器等的输出部分；包括硬盘等的存储部分；以及包括诸如局域网卡、调制解调器等的网络接口卡的通信部分。通信部分经由诸如因特网的网络执行通信处理。驱动器也根据需要连接至输入/输出接口。可拆卸介质，诸如磁盘、光盘、磁光盘、半导体存储器等等，根据需要安装在驱动器上，以便于从其上读出的计算机程序根据需要被安装入存储部分。

特别地，根据本申请的实施例，各个方法流程图中所描述的过程可以被实现为计算机软件程序。例如，本申请的实施例包括一种计算机程序产品，其包括承载在计算机可读介质上的计算机程序，该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中，该计算机程序可以通过通信部分从网络上被下载和安装，和/或从可拆卸介质被安装。在该计算机程序被中央处理器执行时，执行本申请的系统中限定的各种功能。

上述本申请实施例序号仅仅为了描述，不代表实施例的优劣。

根据本申请的一个方面，提供了一种计算机可读存储介质，计算机设备的处理器从计算机可读存储介质读取该计算机指令，处理器执行该计算机指令，使得该计算机设备执行上述各种可选实现方式中提供的身份标识的识别方法。

可选地，在本实施例中，上述计算机可读存储介质可以被设置为存储用于执行以下步骤的计算机程序：

可选地，在本实施例中，本领域普通技术人员可以理解上述实施例的各种方法中的全部或部分步骤是可以通过程序来指令终端设备相关的硬件来完成，该程序可以存储于一计算机可读存储介质中，存储介质可以包括：闪存盘、只读存储器(Read-Only Memory，ROM)、随机存取器(Random Access Memory，RAM)、磁盘或光盘等。

上述实施例中的集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时，可以存储在上述计算机可读取的存储介质中。基于这样的理解，本申请的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来，该计算机软件产品存储在存储介质中，包括若干指令用以使得一台或多台计算机设备(可为个人计算机、服务器或者网络设备等)执行本申请各个实施例所述方法的全部或部分步骤。

在本申请的上述实施例中，对各个实施例的描述都各有侧重，某个实施例中没有详述的部分，可以参见其他实施例的相关描述。

在本申请所提供的几个实施例中，应该理解到，所揭露的客户端，可通过其它的方式实现。其中，以上所描述的装置实施例仅仅是示意性的，例如所述单元的划分，仅仅为一种逻辑功能划分，实际实现时可以有另外的划分方式，例如多个单元或组件可以结合或者可以集成到另一个系统，或一些特征可以忽略，或不执行。另一点，所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口，单元或模块的间接耦合或通信连接，可以是电性或其它的形式。

所述作为分离部件说明的单元可以是或者也可以不是物理上分开的，作为单元显示的部件可以是或者也可以不是物理单元，即可以位于一个地方，或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。

另外，在本申请各个实施例中的各功能单元可以集成在一个处理单元中，也可以是各个单元单独物理存在，也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现，也可以采用软件功能单元的形式实现。

以上所述仅是本申请的优选实施方式，应当指出，对于本技术领域的普通技术人员来说，在不脱离本申请原理的前提下，还可以做出若干改进和润饰，这些改进和润饰也应视为本申请的保护范围。

Claims

1.一种身份标识的识别方法，其特征在于，包括：

获取待识别的身份证件图像，其中，所述身份证件图像为对目标对象的身份证件进行图像采集后得到的；

对所述身份证件图像中所显示的所述目标对象的身份标识进行识别，以得到与所述目标对象的身份标识中的每个标识字符各自匹配的候选字符集，其中，所述候选字符集中包括与所述标识字符相关联的至少两个候选字符；

在获取到与所述标识字符相匹配的标识字符验证码的情况下，比对所述标识字符验证码及与所述标识字符相关联的各个候选字符各自匹配的候选字符验证码；

根据比对的结果从所述候选字符集中识别出所述目标对象的身份标识中包含的目标标识字符。

2.根据权利要求1所述的方法，其特征在于，所述对所述身份证件图像中所显示的所述目标对象的身份标识进行识别，以得到与所述目标对象的身份标识中的每个标识字符各自匹配的候选字符集包括：

从所述身份证件图像中确定出所述目标对象的身份标识所在的身份标识区域；

通过身份识别网络对所述身份标识区域进行识别，以得到与每个所述标识字符各自匹配的所述候选字符集，其中，所述身份识别网络中包括至少两种特征转录层。

3.根据权利要求2所述的方法，其特征在于，所述通过身份识别网络对所述身份标识区域进行识别，以得到与每个所述标识字符各自匹配的所述候选字符集包括：

在所述身份识别网络的特征提取层中，提取所述身份标识区域的图像特征信息；

在与所述特征提取层相连接的关系预测层中，基于从所述图像特征信息提取出的上下文信息预测字符关联关系；

在与所述关系预测层相连接的第一特征转录层中生成第一字符标签序列，并在与所述关系预测层相连接的第二特征转录层中生成第二字符标签序列，其中，所述第一特征转录层与所述第二特征转录层为具有不同架构的转录层；

在与所述特征提取层相连接的第三特征转录层中生成第三字符标签序列，其中，所述第二特征转录层与所述第三特征转录层为具有相同架构的转录层；

从所述第一字符标签序列、所述第二字符标签序列及所述第三字符标签序列中，确定出与每个所述标识字符各自匹配的所述候选字符集。

4.根据权利要求3所述的方法，其特征在于，所述从所述第一字符标签序列、所述第二字符标签序列及所述第三字符标签序列中，确定出与每个所述标识字符各自匹配的所述候选字符集包括：

对所述第一字符标签序列中的字符、所述第二字符标签序列中的字符及所述第三字符标签序列中的字符进行投票操作；

根据投票的结果确定出与每个所述标识字符各自匹配的所述候选字符集。

5.根据权利要求2所述的方法，其特征在于，所述通过身份识别网络从所述身份证件图像中确定出所述目标对象的身份标识所在的身份标识区域包括：

对所述身份证件图像中的各个像素进行分类，以得到文本像素，其中，位于文本区域内的像素被分类为所述文本像素；

将相互连接的所述文本像素连接成连通区域；

在识别出所述连通区域内的文本像素所指示的文本字符的语义信息的情况下，将具有相关语义信息的文本字符划分为同一个功能区域，得到多个功能区域；

从所述多个功能区域中确定出所述身份标识区域。

6.根据权利要求1所述的方法，其特征在于，在获取到与所述标识字符相匹配的标识字符验证码的情况下，比对所述标识字符验证码及与所述标识字符相关联的各个候选字符各自匹配的候选字符验证码包括：

将所述目标对象的身份标识中的每个标识字符依次作为待识别的当前标识字符，并获取与所述当前标识字符相匹配的当前标识字符验证码；

遍历与所述当前标识字符相匹配的当前候选字符集，将所述当前候选字符集中的各个候选字符依次作为当前候选字符；

比对所述当前标识字符验证码及与所述当前候选字符匹配的当前候选字符验证码；

在所述当前标识字符验证码与所述当前候选字符验证码不匹配的情况下，获取下一个候选字符作为所述当前候选字符；

在所述当前标识字符验证码与所述当前候选字符验证码匹配的情况下，将所述当前候选字符确定为与所述当前标识字符匹配的目标标识字符。

7.根据权利要求1至6中任一项所述的方法，其特征在于，在比对所述标识字符验证码及与所述标识字符相关联的各个候选字符各自匹配的候选字符验证码之前，还包括：

对所述身份证件图像中所显示的所述目标对象的身份验证码进行识别，以得到与所述目标对象的身份标识中的每个标识字符各自对应的标识字符验证码。

8.根据权利要求1至6中任一项所述的方法，其特征在于，在比对所述标识字符验证码及与所述标识字符相关联的各个候选字符各自匹配的候选字符验证码之前，包括：

按照预先配置的字符与字符验证码之间的映射关系，将各个所述候选字符分别转换为对应的所述候选字符验证码。

9.一种身份标识的识别装置，其特征在于，包括：

获取单元，用于获取待识别的身份证件图像，其中，所述身份证件图像为对目标对象的身份证件进行图像采集后得到的；

第一识别单元，用于对所述身份证件图像中所显示的所述目标对象的身份标识进行识别，以得到与所述目标对象的身份标识中的每个标识字符各自匹配的候选字符集，其中，所述候选字符集中包括与所述标识字符相关联的至少两个候选字符

比对单元，用于在获取到与所述标识字符相匹配的标识字符验证码的情况下，比对所述标识字符验证码及与所述标识字符相关联的各个候选字符各自匹配的候选字符验证码；

第二识别单元，用于根据比对的结果从所述候选字符集中识别出所述目标对象的身份标识中包含的目标标识字符。

10.一种计算机可读的存储介质，其特征在于，所述计算机可读的存储介质包括存储的程序，其中，所述程序被处理器运行时执行所述权利要求1至8任一项中所述的方法。

11.一种计算机程序产品，包括计算机程序/指令，其特征在于，该计算机程序/指令被处理器执行时实现权利要求1至8任一项所述方法的步骤。

12.一种电子设备，包括存储器和处理器，其特征在于，所述存储器中存储有计算机程序，所述处理器被设置为通过所述计算机程序执行所述权利要求1至8任一项中所述的方法。