CN111860522B - 身份证图片处理方法、装置、终端及存储介质 - Google Patents

身份证图片处理方法、装置、终端及存储介质 Download PDF

Info

Publication number
CN111860522B
CN111860522B CN202010718806.XA CN202010718806A CN111860522B CN 111860522 B CN111860522 B CN 111860522B CN 202010718806 A CN202010718806 A CN 202010718806A CN 111860522 B CN111860522 B CN 111860522B
Authority
CN
China
Prior art keywords
picture
identity card
sample
network
risk loss
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202010718806.XA
Other languages
English (en)
Other versions
CN111860522A (zh
Inventor
熊军
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Life Insurance Company of China Ltd
Original Assignee
Ping An Life Insurance Company of China Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Life Insurance Company of China Ltd filed Critical Ping An Life Insurance Company of China Ltd
Priority to CN202010718806.XA priority Critical patent/CN111860522B/zh
Publication of CN111860522A publication Critical patent/CN111860522A/zh
Application granted granted Critical
Publication of CN111860522B publication Critical patent/CN111860522B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/26Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion
    • G06V10/267Segmentation of patterns in the image field; Cutting or merging of image elements to establish the pattern region, e.g. clustering-based techniques; Detection of occlusion by performing operations on regions, e.g. growing, shrinking or watersheds
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • Artificial Intelligence (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本发明涉及人工智能技术领域,提供一种身份证图片处理方法、装置、终端及存储介质,包括:级联语义分割网络及分类网络得到目标网络并基于所述目标网络训练多任务模型;将包含身份证的图片输入至所述多任务模型中;获取所述多任务模型输出的身份证掩码图片及类别标识;计算所述身份证掩码图片中所述身份证的四个顶点的坐标;根据所述四个顶点的坐标及所述类别标识,将所述身份证掩码图片透视变换为标准身份证图片。本发明能够精确的分割出文字朝向为正向的身份证。此外,本发明还涉及区块链技术,所述标准身份证图片可存储于区块链节点中。

Description

身份证图片处理方法、装置、终端及存储介质
技术领域
本发明涉及人工智能技术领域,具体涉及一种身份证图片处理方法、装置、终端及存储介质。
背景技术
目前,越来越多的应用场景,例如,线上购买理财产品,需要用户上传身份证图片。现有技术中,为了能够自动的识别身份证上面的信息,可以采用图片拍照识别,实现自动录入,大大节省人力和时间成本,同时也提高录入的准确率。
然而,采用图片识别技术,对身份证图片的拍摄要求较高,拍摄时需要相机正对身份证,并且不能倾斜。然而,限于用户拍摄水平的限制,常会接收到不符合要求的图片,导致无法准确识别身份证图片中的信息。
发明内容
鉴于以上内容,有必要提出一种身份证图片处理方法、装置、终端及存储介质,能够解决语义分割因缺乏方向信息导致透视变换的信息识别不准确的问题,能够精确的分割出文字朝向为正向的身份证。
本发明的第一方面提供一种身份证图片处理方法,所述身份证图片处理方法包括:
级联语义分割网络及分类网络得到目标网络并基于所述目标网络训练多任务模型;
将包含身份证的图片输入至所述多任务模型中;
获取所述多任务模型输出的身份证掩码图片及类别标识;
计算所述身份证掩码图片中所述身份证的四个顶点的坐标;
根据所述四个顶点的坐标及所述类别标识,将所述身份证掩码图片透视变换为标准身份证图片。
根据本发明的一个可选的实施例,所述级联语义分割网络及分类网络得到目标网络包括:
将所述分类网络设置于所述语义分割网络中的Xception层之后,所述语义分割网络用于输出掩码图片,所述分类网络用于输出所述掩码图片的类别标识。
根据本发明的一个可选的实施例,所述基于所述目标网络训练多任务模型包括:
获取多张包含身份证的样本图片;
对每张样本图片进行处理得到样本掩码图片;
检测并确定所述样本掩码图片中所述身份证的四个顶点的坐标;
标注所述样本掩码图片的类别标识;
基于所述样本掩码图片及对应的四个顶点的坐标和类别标识构造数据集;
基于所述目标网络训练所述数据集得到多任务模型。
根据本发明的一个可选的实施例,所述语义分割网络包括第一风险损失函数,所述分类网络包括第二风险损失函数,所述基于所述目标网络训练所述数据集得到多任务模型包括:
输入所述数据集至所述目标网络中;
通过所述第一风险损失函数计算所述数据集的第一风险损失值;
通过所述第二风险损失函数计算所述数据集的第二风险损失值;
计算所述第一风险损失值与所述第二风险损失值之和为目标风险损失值;
判断所述目标风险损失值是否小于预设损失阈值;
当确定所述目标风险损失值小于所述预设损失阈值时,结束对所述目标网络的训练,更新所述目标网络的参数并基于更新参数后的目标网络输出多任务模型。
根据本发明的一个可选的实施例,所述对每张样本图片进行处理得到样本掩码图片包括:
检测所述样本图片中的身份证对应的区域;
将所述样本图片中所述身份证对应的区域之外的区域确定为处理区域;
将所述样本图片中所述处理区域内的像素值归一化处理,得到掩码图片。
根据本发明的一个可选的实施例,所述检测所述样本图片中的身份证对应的区域包括:
对所述样本图片进行边缘检测得到边缘检测图片;
识别所述边缘检测图片中的每个线条的长度及宽度;
将长度大于预设长度阈值及宽度大于预设宽度阈值的线条确定为目标线条;
将所述目标线条拼接的区域确定为身份证对应的区域。
根据本发明的一个可选的实施例,所述身份证图片处理方法还包括:
采用预设的模板定位出所述标准身份证图片中的字符区域;
分割出所述字符区域中的每一个字符;
通过光学字符识别算法识别出所述每一个字符。
本发明的第二方面提供一种身份证图片处理装置,所述身份证图片处理装置包括:
模型训练模块,用于级联语义分割网络及分类网络得到目标网络并基于所述目标网络训练多任务模型;
图片输入模块,用于将包含身份证的图片输入至所述多任务模型中;
标识获取模块,用于获取所述多任务模型输出的身份证掩码图片及类别标识;
坐标计算模块,用于计算所述身份证掩码图片中所述身份证的四个顶点的坐标;
透视变换模块,用于根据所述四个顶点的坐标及所述类别标识,将所述身份证掩码图片透视变换为标准身份证图片。
本发明的第三方面提供一种终端,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现所述身份证图片处理方法。
本发明的第四方面提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述身份证图片处理方法。
综上所述,本发明所述的身份证图片处理方法、装置、终端及存储介质,通过训练多任务模型,将身份证从包含身份证的图片中自动的分割出来并确定了身份证的摆放位置及方向,解决了语义分割因缺乏方向信息导致透视变换的信息识别不准确的问题,从而精确的分割出文字朝向为正向的身份证,进而能够更好的应用于身份证识别的前处理中,提高后期对身份证进行识别的准确率。
附图说明
图1是本发明实施例一提供的身份证图片处理方法的流程图。
图2是本发明实施例二提供的多任务模型训练方法的流程图。
图3是本发明实施例三提供的身份证图片处理装置的结构图。
图4是本发明实施例四提供的模型训练模块的子功能模块图。
图5是本发明实施例五提供的终端的结构示意图。
具体实施方式
为了能够更清楚地理解本发明的上述目的、特征和优点,下面结合附图和具体实施例对本发明进行详细描述。需要说明的是,在不冲突的情况下,本发明的实施例及实施例中的特征可以相互组合。
除非另有定义,本文所使用的所有的技术和科学术语与属于本发明的技术领域的技术人员通常理解的含义相同。本文中在本发明的说明书中所使用的术语只是为了描述具体的实施例的目的,不是旨在于限制本发明。
实施例一
图1是本发明实施例一提供的身份证图片处理方法的流程图。所述身份证图片处理方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S11,级联语义分割网络及分类网络得到目标网络并基于所述目标网络训练多任务模型。
其中,所述语义分割网络可以为Deeplab系列的网络结构,分类网络为常用的网络结构,不再一一举例。将语义分割网络与分类网络进行级联得到目标网络,所述语义分割网络用于输出掩码图片,所述分类网络用于输出所述掩码图片的类别标识。
通过将语义分割网络及分类网络进行级联得到的目标网络训练出多任务模型,第一方面实现对包含身份证的图片的分割(即将身份证从图片的背景中分离出来),第二方面实现对分割后的身份证图片的分类(即确定分割后的身份证图片中的身份证的位置及方向)。
关于多任务模型的训练过程请参见图2及其相关描述。
S12,将包含身份证的图片输入至所述多任务模型中。
可以通过图片采集设备采集包含身份证的图片,并将包含身份证的图片发送给终端。终端接收到包含身份证的图片后,输入至所述多任务模型中。
S13,获取所述多任务模型输出的身份证掩码图片及类别标识。
所述多任务模型输出的所述身份证掩码图片与所述包含身份证的图片的尺寸相同,但所述包含身份证的图片的背景部分对应在所述身份证掩码图片中为黑色,即终端调用所述多任务模型实现了将包含身份证的图片中的身份证从背景中分离出来。
所述多任务模型输出的所述类别标识能够表明所述身份证掩码图片中的预设字段距离身份证的四个顶点中的哪一个顶点最近,也即确定了包含身份证的图片中的身份证的方向信息。
所述预设字段可以是姓名。
S14,计算所述身份证掩码图片中所述身份证的四个顶点的坐标。
在得到掩码图片后,终端可以通过角点检测算法检测出所述身份证的四个顶点,并确定这四个顶点在所述掩码图片中的坐标值。
S15,根据所述四个顶点的坐标及所述类别标识,将所述身份证掩码图片透视变换为标准身份证图片。
分类模型分出的类别共有8类,分别为正面1、正面2、正面3、正面4、反面1、反面2、反面3及反面4,其中,正面代表身份证朝上的一面,反面代表身份证朝下的一面。正面1、正面2、正面3、正面4是从用户观看显示屏幕的角度出发以身份证中的姓名所在的方向进行划分的,反面1、反面2、反面3及反面4是从用户观看显示屏幕的角度出发以身份证中的国徽图标所在的方向进行划分的。
关于透视变换为现有技术,本发明在此不再详细阐述。
由于拍摄环境及用户拍摄的角度不同导致包含身份证的图片的大小、方向及背景等存在差异,本实施例通过训练多任务模型,将身份证从包含身份证的图片中自动的分割出来并确定了身份证的摆放位置及方向,解决了语义分割因缺乏方向信息导致透视变换的信息识别不准确的问题,从而精确的分割出文字朝向为正向的身份证,进而能够更好的应用于身份证识别的前处理中,提高后期对身份证进行识别的准确率。
此外,本案由于类别标识有8类,涵盖了身份证的正反两面,因而不仅能够对正面的身份证图片进行矫正处理,还能对反面的身份证图片进行矫正处理。
在一个可选的实施例中,所述身份证图片处理方法还可以包括:
采用预设的模板定位出所述标准身份证图片中的字符区域;
分割出所述字符区域中的每一个字符;
通过光学字符识别算法识别出所述每一个字符。
该可选的实施案例中,由于前期通过多任务模型将包含身份证的图片矫正为标准身份证图片,因而可以设置一个标准的模板,通过所述标准的模板即可快速定位出所述标准身份证图片中的字符区域,相较于现有技术中对字符进行检测,不仅速度快、简单,且准确率更高。
需要强调的是,为进一步保证上述标准身份证图片的私密和安全性,上述标准身份证图片还可以存储于一区块链的节点中。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
实施例二
图2是本发明实施例二提供的多任务模型训练方法的流程图。所述多任务模型训练方法具体包括以下步骤,根据不同的需求,该流程图中步骤的顺序可以改变,某些可以省略。
S21,获取多张包含身份证的样本图片。
终端可以事先通过爬虫的方式获取多张包含身份证的样本图片,也可以通过请求业务系统发送多张包含身份证的样本图片。
S22,对每张样本图片进行处理得到样本掩码图片。
在一个可选的实施例中,所述对每张样本图片进行处理得到样本掩码图片包括:
检测所述样本图片中的身份证对应的区域;
将所述样本图片中所述身份证对应的区域之外的区域确定为处理区域;
将所述样本图片中所述处理区域内的像素值归一化处理,得到掩码图片。
示例性的,将样本图片中身份证对应的区域之外的区域的像素值归一化为0。
该可选的实施例中,通过将样本图片中身份证对应的区域之外的区域的像素值归一化处理,实现了将身份证从样本图片中分割出来的效果,且将背景部分的像素值归一化处理,有利于在训练多任务模型时,减少计算量,提高所述多任务模型的收敛速度。
在一个可选的实施例中,所述检测所述样本图片中的身份证对应的区域包括:
对所述样本图片进行边缘检测得到边缘检测图片;
识别所述边缘检测图片中的每个线条的长度及宽度;
将长度大于预设长度阈值及宽度大于预设宽度阈值的线条确定为目标线条;
将所述目标线条拼接的区域确定为身份证对应的区域。
可以通过多次试验确定预设长度阈值及预设宽度阈值的大小。
该可选的实施例中,通过对样本图片进行边缘检测得到多个线条,并根据线条的长度及宽度快速的确定出身份证的四条边,进而快速的定位出身份证的区域,实现将身份证从背景中分割出来。另外,还能通过判断线条能不能满足预设长度阈值和预设宽度阈值,进而达到了检测图片中是否存在身份证的效果。
S23,检测并确定所述样本掩码图片中所述身份证的四个顶点的坐标。
终端可以通过角点检测算法检测出所述样本掩码图片中所述身份证的四个顶点,并确定这四个顶点在所述样本掩码图片中的坐标值。
S24,标注所述样本掩码图片的类别标识。
终端提供有标注工具,用户通过所述标准工具对所述样本掩码图片的类别标识进行标注。
S25,基于所述样本掩码图片及对应的四个顶点的坐标和类别标识构造数据集。
将每一张所述样本掩码图片及对应的四个顶点坐标和类别标识构建一个多元组。
多个多元组构成了训练多任务模型的数据集。
S26,基于所述目标网络训练所述数据集得到多任务模型。
在一个可选的实施例中,选择Deeplab系列中的Deeplabv3,并将Deeplabv3网络中的pooling的stride改为1,再加上1padding,其好处是不会减小池化后的图片的尺寸,且能够保留池化层整合特征的特性。
在一个可选的实施例中,所述语义分割网络包括第一风险损失函数,所述分类网络包括第二风险损失函数。
所述基于所述目标网络训练所述数据集得到多任务模型包括:
输入所述数据集至所述目标网络中;
通过所述第一风险损失函数计算所述数据集的第一风险损失值;
通过所述第二风险损失函数计算所述数据集的第二风险损失值;
计算所述第一风险损失值与所述第二风险损失值之和为目标风险损失值;
判断所述目标风险损失值是否小于预设损失阈值;
当确定所述目标风险损失值小于所述预设损失阈值时,结束对所述目标网络的训练,更新所述目标网络的参数并基于更新参数后的目标网络输出多任务模型。
关于更新所述目标网络的参数并基于更新参数后的目标网络输出多任务模型为现有技术,本发明不再详细阐述。
相比于现有网络结构中设置一个风险损失函数,该可选的实施例,通过在两个网络结构中均设置一个风险损失函数,并计算风险损失函数的风险损失值之和小于预设损失阈值时,确定目标网络训练结束,并得到多任务模型,如此能够确保多任务模型输出的身份证掩码图片及类别标识均有较高的准确率。
需要强调的是,为进一步保证上述多任务模型的私密和安全性,上述多任务模型还可以存储于一区块链的节点中。
实施例三
图3是本发明实施例三提供的身份证图片处理装置的结构图。
在一些实施例中,所述身份证图片处理装置30可以包括多个由程序代码段所组成的功能模块。所述身份证图片处理装置30中的各个程序段的程序代码可以存储于终端的存储器中,并由至少一个处理器所执行,以执行(详见图1描述)身份证图片处理的功能。
本实施例中,所述身份证图片处理装置30根据其所执行的功能,可以被划分为多个功能模块。所述功能模块可以包括:模型训练模块301、图片输入模块302、标识获取模块303、坐标计算模块304、透视变换模块305及字符识别模块306。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述模型训练模块301,用于级联语义分割网络及分类网络得到目标网络并基于所述目标网络训练多任务模型。
其中,所述语义分割网络可以为Deeplab系列的网络结构,分类网络为常用的网络结构,不再一一举例。将语义分割网络与分类网络进行级联得到目标网络,所述语义分割网络用于输出掩码图片,所述分类网络用于输出所述掩码图片的类别标识。
通过将语义分割网络及分类网络进行级联得到的目标网络训练出多任务模型,第一方面实现对包含身份证的图片的分割(即将身份证从图片的背景中分离出来),第二方面实现对分割后的身份证图片的分类(即确定分割后的身份证图片中的身份证的位置及方向)。
所述图片输入模块302,用于将包含身份证的图片输入至所述多任务模型中。
可以通过图片采集设备采集包含身份证的图片,并将包含身份证的图片发送给终端。终端接收到包含身份证的图片后,输入至所述多任务模型中。
所述标识获取模块303,用于获取所述多任务模型输出的身份证掩码图片及类别标识。
所述多任务模型输出的所述身份证掩码图片与所述包含身份证的图片的尺寸相同,但所述包含身份证的图片的背景部分对应在所述身份证掩码图片中为黑色,即终端调用所述多任务模型实现了将包含身份证的图片中的身份证从背景中分离出来。
所述多任务模型输出的所述类别标识能够表明所述身份证掩码图片中的预设字段距离身份证的四个顶点中的哪一个顶点最近,也即确定了包含身份证的图片中的身份证的方向信息。
所述预设字段可以是姓名。
所述坐标计算模块304,用于计算所述身份证掩码图片中所述身份证的四个顶点的坐标。
在得到掩码图片后,终端可以通过角点检测算法检测出所述身份证的四个顶点,并确定这四个顶点在所述掩码图片中的坐标值。
所述透视变换模块305,用于根据所述四个顶点的坐标及所述类别标识,将所述身份证掩码图片透视变换为标准身份证图片。
分类模型分出的类别共有8类,分别为正面1、正面2、正面3、正面4、反面1、反面2、反面3及反面4,其中,正面代表身份证朝上的一面,反面代表身份证朝下的一面。正面1、正面2、正面3、正面4是从用户观看显示屏幕的角度出发以身份证中的姓名所在的方向进行划分的,反面1、反面2、反面3及反面4是从用户观看显示屏幕的角度出发以身份证中的国徽图标所在的方向进行划分的。
关于透视变换为现有技术,本发明在此不再详细阐述。
由于拍摄环境及用户拍摄的角度不同导致包含身份证的图片的大小、方向及背景等存在差异,本实施例通过训练多任务模型,将身份证从包含身份证的图片中自动的分割出来并确定了身份证的摆放位置及方向,解决了语义分割因缺乏方向信息导致透视变换的信息识别不准确的问题,从而精确的分割出文字朝向为正向的身份证,进而能够更好的应用于身份证识别的前处理中,提高后期对身份证进行识别的准确率。
此外,本案由于类别标识有8类,涵盖了身份证的正反两面,因而不仅能够对正面的身份证图片进行矫正处理,还能对反面的身份证图片进行矫正处理。
所述字符识别模块306,用于采用预设的模板定位出所述标准身份证图片中的字符区域;分割出所述字符区域中的每一个字符;通过光学字符识别算法识别出所述每一个字符。
该可选的实施案例中,由于前期通过多任务模型将包含身份证的图片矫正为标准身份证图片,因而可以设置一个标准的模板,通过所述标准的模板即可快速定位出所述标准身份证图片中的字符区域,相较于现有技术中对字符进行检测,不仅速度快、简单,且准确率更高。
需要强调的是,为进一步保证上述标准身份证图片的私密和安全性,上述标准身份证图片还可以存储于一区块链的节点中。
本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
实施例四
图4是本发明实施例四提供的模型训练模块的子功能模块图。
在一些实施例中,所述模型训练模块301可以被划分为多个子功能模块。所述多个子功能模块可以包括:样本获取子模块3011、样本处理子模块3012、坐标确定子模块3013、样本标识子模块3014、数据构造子模块3015及模型训练子模块3016。本发明所称的模块是指一种能够被至少一个处理器所执行并且能够完成固定功能的一系列计算机程序段,其存储在存储器中。在本实施例中,关于各模块的功能将在后续的实施例中详述。
所述样本获取子模块3011,用于获取多张包含身份证的样本图片。
终端可以事先通过爬虫的方式获取多张包含身份证的样本图片,也可以通过请求业务系统发送多张包含身份证的样本图片。
所述样本处理子模块3012,用于对每张样本图片进行处理得到样本掩码图片。
在一个可选的实施例中,所述样本处理子模块3012对每张样本图片进行处理得到样本掩码图片包括:
检测所述样本图片中的身份证对应的区域;
将所述样本图片中所述身份证对应的区域之外的区域确定为处理区域;
将所述样本图片中所述处理区域内的像素值归一化处理,得到掩码图片。
示例性的,将样本图片中身份证对应的区域之外的区域的像素值归一化为0。
该可选的实施例中,通过将样本图片中身份证对应的区域之外的区域的像素值归一化处理,实现了将身份证从样本图片中分割出来的效果,且将背景部分的像素值归一化处理,有利于在训练多任务模型时,减少计算量,提高所述多任务模型的收敛速度。
在一个可选的实施例中,所述检测所述样本图片中的身份证对应的区域包括:
对所述样本图片进行边缘检测得到边缘检测图片;
识别所述边缘检测图片中的每个线条的长度及宽度;
将长度大于预设长度阈值及宽度大于预设宽度阈值的线条确定为目标线条;
将所述目标线条拼接的区域确定为身份证对应的区域。
可以通过多次试验确定预设长度阈值及预设宽度阈值的大小。
该可选的实施例中,通过对样本图片进行边缘检测得到多个线条,并根据线条的长度及宽度快速的确定出身份证的四条边,进而快速的定位出身份证的区域,实现将身份证从背景中分割出来。另外,还能通过判断线条能不能满足预设长度阈值和预设宽度阈值,进而达到了检测图片中是否存在身份证的效果。
所述坐标确定子模块3013,用于检测并确定所述样本掩码图片中所述身份证的四个顶点的坐标。
终端可以通过角点检测算法检测出所述样本掩码图片中所述身份证的四个顶点,并确定这四个顶点在所述样本掩码图片中的坐标值。
所述样本标识子模块3014,用于标注所述样本掩码图片的类别标识。
终端提供有标注工具,用户通过所述标准工具对所述样本掩码图片的类别标识进行标注。
所述数据构造子模块3015,用于基于所述样本掩码图片及对应的四个顶点的坐标和类别标识构造数据集。
将每一张所述样本掩码图片及对应的四个顶点坐标和类别标识构建一个多元组。
多个多元组构成了训练多任务模型的数据集。
所述模型训练子模块3016,用于基于所述目标网络训练所述数据集得到多任务模型。
在一个可选的实施例中,选择Deeplab系列中的Deeplabv3,并将Deeplabv3网络中的pooling的stride改为1,再加上1padding,其好处是不会减小池化后的图片的尺寸,且能够保留池化层整合特征的特性。
在一个可选的实施例中,所述语义分割网络包括第一风险损失函数,所述分类网络包括第二风险损失函数。
所述模型训练子模块3016基于所述目标网络训练所述数据集得到多任务模型包括:
输入所述数据集至所述目标网络中;
通过所述第一风险损失函数计算所述数据集的第一风险损失值;
通过所述第二风险损失函数计算所述数据集的第二风险损失值;
计算所述第一风险损失值与所述第二风险损失值之和为目标风险损失值;
判断所述目标风险损失值是否小于预设损失阈值;
当确定所述目标风险损失值小于所述预设损失阈值时,结束对所述目标网络的训练,更新所述目标网络的参数并基于更新参数后的目标网络输出多任务模型。
关于更新所述目标网络的参数并基于更新参数后的目标网络输出多任务模型为现有技术,本发明不再详细阐述。
相比于现有网络结构中设置一个风险损失函数,该可选的实施例,通过在两个网络结构中均设置一个风险损失函数,并计算风险损失函数的风险损失值之和小于预设损失阈值时,确定目标网络训练结束,并得到多任务模型,如此能够确保多任务模型输出的身份证掩码图片及类别标识均有较高的准确率。
需要强调的是,为进一步保证上述多任务模型的私密和安全性,上述多任务模型还可以存储于一区块链的节点中。
实施例五
参阅图5所示,为本发明实施例三提供的终端的结构示意图。在本发明较佳实施例中,所述终端5包括存储器51、至少一个处理器52、至少一条通信总线53及收发器54。
本领域技术人员应该了解,图5示出的终端的结构并不构成本发明实施例的限定,既可以是总线型结构,也可以是星形结构,所述终端5还可以包括比图示更多或更少的其他硬件或者软件,或者不同的部件布置。
在一些实施例中,所述终端5是一种能够按照事先设定或存储的指令,自动进行数值计算和/或信息处理的终端,其硬件包括但不限于微处理器、专用集成电路、可编程门阵列、数字处理器及嵌入式设备等。所述终端5还可包括客户设备,所述客户设备包括但不限于任何一种可与客户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、数码相机等。
需要说明的是,所述终端5仅为举例,其他现有的或今后可能出现的电子产品如可适应于本发明,也应包含在本发明的保护范围以内,并以引用方式包含于此。
在一些实施例中,所述存储器51中存储有程序代码,且所述至少一个处理器52可调用所述存储器51中存储的程序代码以执行相关功能。例如,上述实施例中所述的各个模块是存储在所述存储器51中的程序代码,并由所述至少一个处理器52所执行,从而实现所述各个模块的功能。所述存储器51包括只读存储器(Read-Only Memory,ROM)、可编程只读存储器(Programmable Read-Only Memory,PROM)、可擦除可编程只读存储器(ErasableProgrammable Read-Only Memory,EPROM)、一次可编程只读存储器(One-timeProgrammable Read-Only Memory,OTPROM)、电子擦除式可复写只读存储器(Electrically-Erasable Programmable Read-Only Memory,EEPROM)、只读光盘(CompactDisc Read-Only Memory,CD-ROM)或其他光盘存储器、磁盘存储器、磁带存储器、或者能够用于携带或存储数据的计算机可读的任何其他介质。
在一些实施例中,所述至少一个处理器52是所述终端5的控制核心(ControlUnit),利用各种接口和线路连接整个终端5的各个部件,通过运行或执行存储在所述存储器51内的程序或者模块,以及调用存储在所述存储器51内的数据,以执行终端5的各种功能和处理数据。例如,所述至少一个处理器52执行所述存储器中存储的程序代码时实现本发明实施例中所述的身份证图片处理方法的全部或者部分步骤。所述至少一个处理器52可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(Central Processingunit,CPU)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。
在一些实施例中,所述至少一条通信总线53被设置为实现所述存储器51以及所述至少一个处理器52等之间的连接通信。
本发明实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现所述身份证图片处理方法中的全部或者部分步骤;或者,实现身份证图片处理装置中的全部或者部分功能。
尽管未示出,所述终端5还可以包括给各个部件供电的电源(比如电池),优选的,电源可以通过电源管理装置与所述至少一个处理器52逻辑相连,从而通过电源管理装置实现管理充电、放电、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述终端5还可以包括多种传感器、蓝牙模块、Wi-Fi模块等,在此不再赘述。
上述以软件功能模块的形式实现的集成的单元,可以存储在一个计算机可读取存储介质中。上述软件功能模块存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,终端,或者网络设备等)或处理器(processor)执行本发明各个实施例所述身份证图片处理方法的部分。
在本发明所提供的几个实施例中,应该理解到,所揭露的装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此外,显然“包括”一词不排除其他单元或,单数不排除复数。装置权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

Claims (7)

1.一种身份证图片处理方法,其特征在于,所述身份证图片处理方法包括:
级联语义分割网络及分类网络得到目标网络,包括:将所述分类网络设置于所述语义分割网络中的Xception层之后,所述语义分割网络用于输出掩码图片,所述分类网络用于输出所述掩码图片的类别标识;所述语义分割网络包括第一风险损失函数,所述分类网络包括第二风险损失函数;
基于所述目标网络训练多任务模型,包括:获取多张包含身份证的样本图片;对每张样本图片进行处理得到样本掩码图片;检测并确定所述样本掩码图片中所述身份证的四个顶点的坐标;标注所述样本掩码图片的类别标识;基于所述样本掩码图片及对应的四个顶点的坐标和类别标识构造数据集;输入所述数据集至所述目标网络中;通过所述第一风险损失函数计算所述数据集的第一风险损失值;通过所述第二风险损失函数计算所述数据集的第二风险损失值;计算所述第一风险损失值与所述第二风险损失值之和为目标风险损失值;判断所述目标风险损失值是否小于预设损失阈值;当确定所述目标风险损失值小于所述预设损失阈值时,结束对所述目标网络的训练,更新所述目标网络的参数并基于更新参数后的目标网络输出多任务模型;
将包含身份证的图片输入至所述多任务模型中;
获取所述多任务模型输出的身份证掩码图片及类别标识;
计算所述身份证掩码图片中所述身份证的四个顶点的坐标;
根据所述四个顶点的坐标及所述类别标识,将所述身份证掩码图片透视变换为标准身份证图片。
2.如权利要求1所述的身份证图片处理方法,其特征在于,所述对每张样本图片进行处理得到样本掩码图片包括:
检测所述样本图片中的身份证对应的区域;
将所述样本图片中所述身份证对应的区域之外的区域确定为处理区域;
将所述样本图片中所述处理区域内的像素值归一化处理,得到掩码图片。
3.如权利要求2所述的身份证图片处理方法,其特征在于,所述检测所述样本图片中的身份证对应的区域包括:
对所述样本图片进行边缘检测得到边缘检测图片;
识别所述边缘检测图片中的每个线条的长度及宽度;
将长度大于预设长度阈值及宽度大于预设宽度阈值的线条确定为目标线条;
将所述目标线条拼接的区域确定为身份证对应的区域。
4.如权利要求1至3中任意一项所述的身份证图片处理方法,其特征在于,所述身份证图片处理方法还包括:
采用预设的模板定位出所述标准身份证图片中的字符区域;
分割出所述字符区域中的每一个字符;
通过光学字符识别算法识别出所述每一个字符。
5.一种身份证图片处理装置,其特征在于,所述身份证图片处理装置包括:
模型训练模块,用于级联语义分割网络及分类网络得到目标网络,包括:将所述分类网络设置于所述语义分割网络中的Xception层之后,所述语义分割网络用于输出掩码图片,所述分类网络用于输出所述掩码图片的类别标识;所述语义分割网络包括第一风险损失函数,所述分类网络包括第二风险损失函数;
所述模型训练模块,还用于基于所述目标网络训练多任务模型,包括:获取多张包含身份证的样本图片;对每张样本图片进行处理得到样本掩码图片;检测并确定所述样本掩码图片中所述身份证的四个顶点的坐标;标注所述样本掩码图片的类别标识;基于所述样本掩码图片及对应的四个顶点的坐标和类别标识构造数据集;输入所述数据集至所述目标网络中;通过所述第一风险损失函数计算所述数据集的第一风险损失值;通过所述第二风险损失函数计算所述数据集的第二风险损失值;计算所述第一风险损失值与所述第二风险损失值之和为目标风险损失值;判断所述目标风险损失值是否小于预设损失阈值;当确定所述目标风险损失值小于所述预设损失阈值时,结束对所述目标网络的训练,更新所述目标网络的参数并基于更新参数后的目标网络输出多任务模型;
图片输入模块,用于将包含身份证的图片输入至所述多任务模型中;
标识获取模块,用于获取所述多任务模型输出的身份证掩码图片及类别标识;
坐标计算模块,用于计算所述身份证掩码图片中所述身份证的四个顶点的坐标;
透视变换模块,用于根据所述四个顶点的坐标及所述类别标识,将所述身份证掩码图片透视变换为标准身份证图片。
6.一种终端,其特征在于,所述终端包括处理器,所述处理器用于执行存储器中存储的计算机程序时实现如权利要求1至4中任意一项所述身份证图片处理方法。
7.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至4中任意一项所述身份证图片处理方法。
CN202010718806.XA 2020-07-23 2020-07-23 身份证图片处理方法、装置、终端及存储介质 Active CN111860522B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202010718806.XA CN111860522B (zh) 2020-07-23 2020-07-23 身份证图片处理方法、装置、终端及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202010718806.XA CN111860522B (zh) 2020-07-23 2020-07-23 身份证图片处理方法、装置、终端及存储介质

Publications (2)

Publication Number Publication Date
CN111860522A CN111860522A (zh) 2020-10-30
CN111860522B true CN111860522B (zh) 2024-02-02

Family

ID=72949804

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202010718806.XA Active CN111860522B (zh) 2020-07-23 2020-07-23 身份证图片处理方法、装置、终端及存储介质

Country Status (1)

Country Link
CN (1) CN111860522B (zh)

Families Citing this family (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112183549B (zh) * 2020-10-26 2022-05-27 公安部交通管理科学研究所 一种基于语义分割的境外驾驶证版面文字定位方法
CN112270305A (zh) * 2020-11-17 2021-01-26 北京有竹居网络技术有限公司 卡片图像识别方法、装置和电子设备
CN113159037B (zh) * 2021-05-25 2023-08-08 中国平安人寿保险股份有限公司 图片矫正方法、装置、计算机设备及存储介质
CN116129456B (zh) * 2023-02-09 2023-07-25 广西壮族自治区自然资源遥感院 一种产权权属信息识别录入方法及系统

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447169A (zh) * 2018-11-02 2019-03-08 北京旷视科技有限公司 图像处理方法及其模型的训练方法、装置和电子系统
CN109697440A (zh) * 2018-12-10 2019-04-30 浙江工业大学 一种身份证信息提取方法
CN109961040A (zh) * 2019-03-20 2019-07-02 深圳市华付信息技术有限公司 身份证区域定位方法、装置、计算机设备及存储介质
CN110059680A (zh) * 2019-04-24 2019-07-26 杭州智趣智能信息技术有限公司 一种身份证图像的检测方法、装置及设备
CN110188795A (zh) * 2019-04-24 2019-08-30 华为技术有限公司 图像分类方法、数据处理方法和装置
CN110399873A (zh) * 2019-07-11 2019-11-01 汉王科技股份有限公司 身份证图像获取方法、装置、电子设备及存储介质
CN110503097A (zh) * 2019-08-27 2019-11-26 腾讯科技(深圳)有限公司 图像处理模型的训练方法、装置及存储介质
CN110647880A (zh) * 2019-08-12 2020-01-03 深圳市华付信息技术有限公司 一种移动端身份证图像遮挡判断方法
CN110659646A (zh) * 2019-08-21 2020-01-07 北京三快在线科技有限公司 一种多任务证件图像自动处理方法、装置、设备及可读存储介质
CN110874594A (zh) * 2019-09-23 2020-03-10 平安科技(深圳)有限公司 基于语义分割网络的人体外表损伤检测方法及相关设备
CN111062389A (zh) * 2019-12-10 2020-04-24 腾讯科技(深圳)有限公司 文字识别方法、装置、计算机可读介质及电子设备
CN111160352A (zh) * 2019-12-27 2020-05-15 创新奇智(北京)科技有限公司 一种基于图像分割的工件金属表面文字识别方法及系统
CN111340022A (zh) * 2020-02-24 2020-06-26 深圳市华云中盛科技股份有限公司 身份证信息识别方法、装置、计算机设备及存储介质

Family Cites Families (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US10320807B2 (en) * 2014-02-25 2019-06-11 Sal Khan Systems and methods relating to the authenticity and verification of photographic identity documents

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109447169A (zh) * 2018-11-02 2019-03-08 北京旷视科技有限公司 图像处理方法及其模型的训练方法、装置和电子系统
CN109697440A (zh) * 2018-12-10 2019-04-30 浙江工业大学 一种身份证信息提取方法
CN109961040A (zh) * 2019-03-20 2019-07-02 深圳市华付信息技术有限公司 身份证区域定位方法、装置、计算机设备及存储介质
CN110059680A (zh) * 2019-04-24 2019-07-26 杭州智趣智能信息技术有限公司 一种身份证图像的检测方法、装置及设备
CN110188795A (zh) * 2019-04-24 2019-08-30 华为技术有限公司 图像分类方法、数据处理方法和装置
CN110399873A (zh) * 2019-07-11 2019-11-01 汉王科技股份有限公司 身份证图像获取方法、装置、电子设备及存储介质
CN110647880A (zh) * 2019-08-12 2020-01-03 深圳市华付信息技术有限公司 一种移动端身份证图像遮挡判断方法
CN110659646A (zh) * 2019-08-21 2020-01-07 北京三快在线科技有限公司 一种多任务证件图像自动处理方法、装置、设备及可读存储介质
CN110503097A (zh) * 2019-08-27 2019-11-26 腾讯科技(深圳)有限公司 图像处理模型的训练方法、装置及存储介质
CN110874594A (zh) * 2019-09-23 2020-03-10 平安科技(深圳)有限公司 基于语义分割网络的人体外表损伤检测方法及相关设备
CN111062389A (zh) * 2019-12-10 2020-04-24 腾讯科技(深圳)有限公司 文字识别方法、装置、计算机可读介质及电子设备
CN111160352A (zh) * 2019-12-27 2020-05-15 创新奇智(北京)科技有限公司 一种基于图像分割的工件金属表面文字识别方法及系统
CN111340022A (zh) * 2020-02-24 2020-06-26 深圳市华云中盛科技股份有限公司 身份证信息识别方法、装置、计算机设备及存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
图像边缘提取在身份证人像采集系统中的应用;谢梅;王清禄;何振;;计算机工程(第01期);全文 *

Also Published As

Publication number Publication date
CN111860522A (zh) 2020-10-30

Similar Documents

Publication Publication Date Title
CN111860522B (zh) 身份证图片处理方法、装置、终端及存储介质
CN112052850B (zh) 车牌识别方法、装置、电子设备及存储介质
CN111932562B (zh) 基于ct序列的图像识别方法、装置、电子设备及介质
CN113705462B (zh) 人脸识别方法、装置、电子设备及计算机可读存储介质
CN112395390B (zh) 意图识别模型的训练语料生成方法及其相关设备
CN112559535B (zh) 基于多线程的异步任务处理方法、装置、设备及介质
CN113378958A (zh) 自动标注方法、装置、设备、存储介质及计算机程序产品
CN111949708A (zh) 基于时序特征提取的多任务预测方法、装置、设备及介质
CN111738182B (zh) 基于图像识别的身份验证方法、装置、终端及存储介质
CN117875320A (zh) 基于人工智能的数据处理方法、装置、设备及存储介质
CN113591580A (zh) 图像标注方法、装置、电子设备和存储介质
CN116681045A (zh) 报表生成方法、装置、计算机设备及存储介质
CN111429085A (zh) 合同数据生成方法、装置、电子设备及存储介质
CN116453226A (zh) 基于人工智能的人体姿态识别方法、装置及相关设备
CN112560721B (zh) 无感知模型切换方法、装置、电子设备及存储介质
CN111859985B (zh) Ai客服模型测试方法、装置、电子设备及存储介质
CN114881313A (zh) 基于人工智能的行为预测方法、装置及相关设备
CN111860357B (zh) 基于活体识别的出勤率计算方法、装置、终端及存储介质
CN115378806A (zh) 流量分配方法、装置、计算机设备及存储介质
CN112905470A (zh) 接口调用方法、装置、计算机设备及介质
CN115063913B (zh) 基于光学字符识别的身份信息录入方法、装置及相关设备
CN113792681B (zh) 基于点云匹配的信息采集方法、装置、电子设备及介质
CN114119203B (zh) 基于人工智能的资源管控方法、装置、电子设备及介质
CN113850836B (zh) 基于行为轨迹的员工行为识别方法、装置、设备及介质
CN115037481B (zh) 基于人工智能的电子签名方法、装置、电子设备及介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant