CN110689063A - 一种基于神经网络的证件识别的训练方法及装置 - Google Patents

一种基于神经网络的证件识别的训练方法及装置 Download PDF

Info

Publication number
CN110689063A
CN110689063A CN201910889895.1A CN201910889895A CN110689063A CN 110689063 A CN110689063 A CN 110689063A CN 201910889895 A CN201910889895 A CN 201910889895A CN 110689063 A CN110689063 A CN 110689063A
Authority
CN
China
Prior art keywords
certificate
information
image sample
ith
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910889895.1A
Other languages
English (en)
Other versions
CN110689063B (zh
Inventor
黄泽浩
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910889895.1A priority Critical patent/CN110689063B/zh
Publication of CN110689063A publication Critical patent/CN110689063A/zh
Priority to PCT/CN2020/099559 priority patent/WO2021051948A1/zh
Application granted granted Critical
Publication of CN110689063B publication Critical patent/CN110689063B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/22Indexing; Data structures therefor; Storage structures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F16/00Information retrieval; Database structures therefor; File system structures therefor
    • G06F16/20Information retrieval; Database structures therefor; File system structures therefor of structured data, e.g. relational data
    • G06F16/24Querying
    • G06F16/245Query processing
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • YGENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
    • Y02TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
    • Y02DCLIMATE CHANGE MITIGATION TECHNOLOGIES IN INFORMATION AND COMMUNICATION TECHNOLOGIES [ICT], I.E. INFORMATION AND COMMUNICATION TECHNOLOGIES AIMING AT THE REDUCTION OF THEIR OWN ENERGY USE
    • Y02D10/00Energy efficient computing, e.g. low power processors, power management or thermal management

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • General Physics & Mathematics (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Databases & Information Systems (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Software Systems (AREA)
  • Computational Linguistics (AREA)
  • Processing Or Creating Images (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本发明实施例公开了一种基于神经网络的证件识别的训练方法及装置,其中,所述方法包括:从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本,上述第i个子数据库用于存储上述第i个特征信息对应的样本数据;根据上述K个特征信息分别对应的K个信息样本生成上述证件的U个隐含信息;根据上述K个特征信息、上述U个隐含信息以及上述证件的结构化特征合成上述证件的第一图像样本;对上述第一图像样本进行证件场景的真实化处理,得到第二图像样本;将上述第二图像样本输入神经网络进行训练。本发明实施例所提方法,能提高用于证件识别的有效训练样本的获取效率。

Description

一种基于神经网络的证件识别的训练方法及装置
技术领域
本发明涉及计算机技术和通信技术领域,尤其涉及一种基于神经网络的证件识别的训练方法及装置。
背景技术
证件是指用来证明身份、经历等的证书和文件。在实际应用中,常常需要对证件进行识别和审核,以便确定身份、经历等信息。举例来说,随着经济的发展以及互联网的普及,许多线下业务都转移到线上电子业务,线上电子业务逐渐成为金融、电信和电商等行业的重要业务,电子业务办理中,可能需要用户通过智能手机、平板电脑或网络摄像头等设备上传客户的证件图片,例如,身份证的正反照。
传统证件识别是通过人工完成的,随着科技的发展,目前已经有多种图像识别技术可以进行证件图像识别。其中,大部分图像识别技术基于深度学习,而深度学习需要大量数据集训练,深度学习的图像增强算法很多,但是对于深度学习更多是依赖真实图片,然而身份证等证件图片为敏感图片,获取难度大。
综上所述,现有技术中用于证件识别的训练样本获取难度大,获取效率低。
发明内容
本发明实施例提供了一种基于神经网络的证件识别的训练方法及装置,能提高用于证件识别的训练样本的获取效率。
第一方面,本发明实施例提供了一种基于神经网络的证件识别的训练方法,该方法包括以下步骤:从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本,上述结构化数据库中包含K个子数据库,上述K个子数据库中的第i个子数据库用于存储上述第i个特征信息对应的样本数据;根据上述K个特征信息分别对应的K个信息样本生成上述证件的U个隐含信息;根据上述K个特征信息、上述U个隐含信息以及上述证件的结构化特征合成上述证件的第一图像样本;对上述第一图像样本进行证件场景的真实化处理,得到第二图像样本;将上述第二图像样本输入神经网络进行训练。
可选的,上述从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本之前,上述方法还包括:建立上述证件的结构化数据库。
可选的,上述建立证件的结构化数据库,包括:根据上述第i个特征信息的信息特征制定上述第i个特征信息的生成规则;根据上述第i个特征信息的生成规则生成上述第i个特征信息的信息样本;将上述第i个特征信息的信息样本存入上述结构化数据库的第i个子数据库。
可选的,上述对上述第一图像样本进行证件场景的真实化处理,得到第二图像样本,包括:为上述第一图像样本插入上述证件场景的背景样本,得到第三图像样本;基于上述证件场景的仿射参数,对上述第三图像样本进行仿射变换,得到第四图像样本;基于上述证件场景的随机参数,对上述第四图像样本进行模糊、膨胀和腐蚀,得到上述第二图像样本,上述随机参数为向量(x,y,z),上述x用于表征模糊程度,上述y用于表征膨胀程度,上述z用于表征腐蚀程度。
可选的,上述将上述第二图像样本输入神经网络进行训练之前,上述方法还包括:记录上述第二图像样本中上述证件的特征信息的位置信息和分类标签,以及上述第二图像样本中上述证件的隐含信息的位置信息和分类标签。
可选的,上述将上述第二图像样本输入神经网络进行训练,包括:将上述第二图像样本输入yolo神经网络进行定位分类训练。
可选的,上述证件包括身份证件或护照证件,上述证件的结构化特征包括特征信息的位置特征、及隐含信息的位置特征。
第二方面,本发明实施例还提供了一种基于神经网络的证件识别的训练装置,该装置能实现上述第一方面基于神经网络的证件识别的训练方法中服务器的功能,因此也能实现第一方面基于神经网络的证件识别的训练方法所具备的有益效果。其中,该装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。硬件或软件包括至少一个与上述功能相对应的模块。
可选的,该装置包括获取单元、第一生成单元、合成单元、处理单元和训练单元。
获取单元,用于从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本,上述结构化数据库中包含K个子数据库,上述K个子数据库中的第i个子数据库用于存储上述第i个特征信息对应的样本数据。
第一生成单元,用于根据上述K个特征信息分别对应的K个信息样本生成上述证件的U个隐含信息。
合成单元,用于根据上述K个特征信息、上述U个隐含信息以及上述证件的结构化特征合成上述证件的第一图像样本。
处理单元,用于对上述第一图像样本进行证件场景的真实化处理,得到第二图像样本。
训练单元,用于将上述第二图像样本输入神经网络进行训练。
可选的,上述获取单元从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本之前,上述装置还包括:建立单元,用于建立上述证件的结构化数据库。
可选的,上述建立单元包括:制定单元、生成单元和存储单元。
制定单元,用于根据上述第i个特征信息的信息特征制定上述第i个特征信息的生成规则。
第二生成单元,用于根据上述第i个特征信息的生成规则生成上述第i个特征信息的信息样本。
存储单元,用于将上述第i个特征信息的信息样本存入上述结构化数据库的第i个子数据库。
可选的,上述处理单元包括:插入单元、第一变换单元和第二变换单元。
插入单元,用于为上述第一图像样本插入上述证件场景的背景样本,得到第三图像样本。
第一变换单元,用于基于上述证件场景的仿射参数,对上述第三图像样本进行仿射变换,得到第四图像样本。
第二变换单元,用于基于上述证件场景的随机参数,对上述第四图像样本进行模糊、膨胀和腐蚀,得到上述第二图像样本,上述随机参数为向量(x,y,z),上述x用于表征模糊程度,上述y用于表征膨胀程度,上述z用于表征腐蚀程度。
可选的,上述训练单元将上述第二图像样本输入神经网络进行训练之前,上述装置还包括:记录单元,用于记录上述第二图像样本中上述证件的特征信息的位置信息和分类标签,以及上述第二图像样本中上述证件的隐含信息的位置信息和分类标签。
可选的,上述训练单元,具体用于:上述服务器将上述第二图像样本输入yolo神经网络进行定位分类训练。
可选的,上述证件包括身份证件或护照证件,上述证件的结构化特征包括特征信息的位置特征、及隐含信息的位置特征。
第三方面,本发明实施例还提供了一种服务器,该服务器能实现上述第一方面基于神经网络的证件识别的训练方法中服务器的功能,因此也能实现第一方面基于神经网络的证件识别的训练方法所具备的有益效果。其中,该服务器的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括至少一个与上述功能相对应的模块。该服务器包括存储器、处理器和收发器,存储器用于存储支持终端执行上述方法的计算机程序,所述计算机程序包括程序指令,处理器用于根据程序指令对服务器的动作进行控制管理,收发器用于支持服务器与其它通信设备的通信。
第四方面,本发明实施例还提供了一种基于神经网络的证件识别的训练系统,所述系统包括第二方面或第三方面描述的服务器,还包括业务终端。
第五方面,本发明实施例提供一种计算机可读存储介质,可读存储介质上存储有指令,当其在处理器上运行时,使得处理器执行上述第一方面描述的基于神经网络的证件识别的训练方法。
本发明实施例中,通过从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本,上述结构化数据库中包含K个子数据库,上述K个子数据库中的第i个子数据库用于存储上述第i个特征信息对应的样本数据;根据上述K个特征信息分别对应的K个信息样本生成上述证件的U个隐含信息;根据上述K个特征信息、上述U个隐含信息以及上述证件的结构化特征合成上述证件的第一图像样本;对上述第一图像样本进行证件场景的真实化处理后,输入神经网络进行训练。通过本发明实施例所提方案,可以提高用于证件识别的有效训练样本的获取效率,进而有效提高证件识别的训练效率。
附图说明
下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。
图1是本发明实施例提供的一种训练系统的系统架构示意图;
图2是本发明实施例提供的一种服务器的结构示意图;
图3是本发明实施例提供的一种基于神经网络的证件识别的训练方法的流程示意图;
图4是本发明实施例提供的一种基于神经网络的证件识别的训练装置的结构示意图。
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行描述。应当理解,当在本说明书和所附权利要求书中使用时,术语“包括”和“包含”指示所描述特征、整体、步骤、操作、元素和/或组件的存在,但并不排除一个或多个其它特征、整体、步骤、操作、元素、组件和/或其集合的存在或添加。此外,术语“第一”、“第二”和“第三”等是用于区别不同的对象,而并非用于描述特定的顺序。
需要说明的是,在本发明实施例中使用的术语是仅仅出于描述特定实施例的目的,而非旨在限制本发明。在本发明实施例和所附权利要求书中所使用的单数形式的“一种”、“所述”和“该”也旨在包括多数形式,除非上下文清楚地表示其他含义。还应当理解,本文中使用的术语“和/或”是指并包含一个或多个相关联的列出项目的任何或所有可能组合。
请参见图1,是本发明实施例涉及的一种证件的训练系统100的架构示意图,该系统包括结构化存储模块101、合成模块102以及训练模块103。其中,上述结构化存储模块101用于分类存储证件的特征信息的样本数据,上述合成模块102用于根据上述证件的特征信息的样本数据合成证件照图像样本,上述训练模块103用于对合成后的证件照图像样本进行训练。结构化存储模块101、合成模块102以及训练模块103中的任意两个模块可以在同一设备上,也可以在不同设备上。结构化存储模块101、合成模块102以及训练模块103可以在同一服务器上,该服务器可以是具有智能计算功能,并能与其他设备进行通信交互的网络设备。训练系统100中的各个模块之间的通信可以基于任何有线和无线网络,包括但不限于因特网、广域网、城域网、局域网、虚拟专用网络(Virtual Private Network,VPN)、无线通信网络等等。
需要说明的是,本申请实施例中的服务器可以是能够承担服务并保障服务能力的常规服务器,也可以是具有处理器、硬盘、内存和系统总线结构的能够承担服务并保障服务能力的终端设备。本申请实施例不作具体限定。
请参见图2,图2为本发明实施例提供的一种服务器200的硬件结构示意图。服务器200包括:存储器201、收发器202及与所述存储器201和收发器202耦合的处理器203。存储器201用于存储指令,处理器203用于执行指令,收发器202用于在处理器203的控制下与终端设备进行通信。当处理器203在执行指令时可根据指令执行基于神经网络的证件识别的训练方法。
其中,处理器203可以是中央处理器(英文:central processing unit,简称:CPU),通用处理器,数字信号处理器(英文:digital signal processor,简称:DSP),专用集成电路(英文:application-specific integrated circuit,简称:ASIC),现场可编程门阵列(英文:field programmable gate array,简称:FPGA)或者其他可编程逻辑器件、晶体管逻辑器件、硬件部件或者其任意组合。其可以实现或执行结合本发明实施例公开内容所描述的各种示例性的逻辑方框,模块和电路。处理器也可以是实现计算功能的组合,例如包含一个或多个微处理器组合,DSP和微处理器的组合等等。收发器202可以是通信接口、收发电路等,其中,通信接口是统称,可以包括一个或多个接口,例如服务器与终端设备之间的接口。
可选地,服务器200还可以包括总线204。其中,存储器201、收发器202以及处理器203可以通过总线204相互连接;总线204可以是外设部件互连标准(英文:peripheralcomponent interconnect,简称:PCI)总线或扩展工业标准结构(英文:extended industrystandard architecture,简称:EISA)总线等。总线204可以分为地址总线、数据总线、控制总线等。为便于表示,图2中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
除了图2所示的存储器201、收发器202、处理器203以及上述总线204之外,实施例中装置所在的服务器200通常根据该服务器的实际功能,还可以包括其他硬件,对此不再赘述。
在上述运行环境下,本发明实施例提供了如图3所示的基于神经网络的证件识别的训练方法。请参阅图3,所述基于神经网络的证件识别的训练方法包括:
S301、服务器从预先建立的结构化数据库的第i个子数据库中获取上述证件的K个特征信息中的第i个特征信息对应的信息样本,上述结构化数据库中包含K个子数据库,上述K个子数据库中的第i个子数据库用于存储上述K个特征信息中的第i个特征信息对应的样本数据。
本发明实施例中,证件包含K个特征信息。
举例来说,身份证的正面包括5个特征信息,分别是姓名、民族、地址、身份证号和身份证的证件照。护照内页的个人资料页包括5个特征信息,分别是类型/Type、国家码/Country Code、护照号/Passport No、姓/Surname、名/Given names、性别/Sex、出生地点/Place of birth、出生日期/Date of birth、签发地点/Place of issue、签发日期/Dateof issue、签发机关/Authority和护照的证件照。
可选的,上述服务器从预先建立的结构化数据库的的第i个子数据库中获取上述证件的K个特征信息中的第i个特征信息对应的信息样本之前,上述方法还包括:服务器建立证件的结构化数据库。
可选的,上述服务器建立证件的结构化数据库,可以包括如下S1至S3步骤:
S1、服务器根据上述K个特征信息中的第i个特征信息的信息特征制定上述第i个特征信息的生成规则。
S2、服务器根据上述K个特征信息中的第i个特征信息的生成规则生成上述第i个特征信息的信息样本。
S3、服务器将上述第i个特征信息的信息样本存入上述结构化数据库的第i个子数据库。
可以理解,证件的K个特征信息中的每种特征信息都符合一定的规则。举例来说,身份证正面照的5个特征信息分别是姓名、民族、地址、身份证号和证件照。其中,民族这一特征信息的内容应是中国56个民族中的一个或其他。民族这一特征信息的生成规则可以为:从56个民族中随机选择一个民族。姓名这一特征信息的内容为2至a个汉字,不包含已简化的繁体字、字母、数字和/或符号等,为大于2的正整数,a通常小于6。姓名这一特征信息的生成规则可以为:从中国姓氏中随机选择一个姓氏作为姓名的姓,姓氏的字数为b,从常用名汉字库中随机选择1至a-b个汉字作为姓名的名。证件照这一特征信息的人物要求为正面免冠彩色头像,头部占照片尺寸的三分之二,白色背景无边框,人像清晰,神态自然,无明显畸变。此外,证件照参数要求是像素为358×441、分辨率为350dpi以及尺寸为26mm×32mm。证件照这一特征信息的生成规则可以为:从具有使用权的人物肖像库中选择一张人物肖像,根据证件照的人物要求对人物肖像进行处理,再根据证件照的参数要求修改证件照。
本发明实施实例中,不限于上述S1至S3步骤,上述服务器建立证件的结构化数据库还可以包括其他步骤,这里不做具体限制。
可以理解,本发明实施例中,证件包含K个特征信息,则服务器为证件结构化数据库包含K个子数据库,其中上述K个子数据库中的第i个子数据库用于存储上述K个特征信息中的第i个特征信息对应的样本数据。
可选的,对于部分特征信息对应的子数据库需要进一步的内部分类。例如,身份证正面照的5个特征信息分别是姓名、民族、地址、身份证号和证件照。其中,身份证号和证件照具有内在关联,身份证号隐含了性别,因此同一身份证的证件照中的人物性别与身份证号有对应关系。为了后续合成的便利,将身份证号对应的子数据库中的样本数据分为两类存储,两类分别是女性身份证号和男性身份证号。将身份证的证件照对应的子数据库中的样本数据也分为两类存储,两类分别是女性证件照和男性证件照。
可选的,上述服务器从预先建立的结构化数据库的第i个子数据库中获取上述证件的K个特征信息中的第i个特征信息对应的信息样本,包括:针对上述证件的K个特征信息,服务器按照第一提取顺序从证件的结构化数据库中提取K个特征信息分别对应的信息样本。
可以理解,由前述可知,证件的K个特征信息间可能存在内在关联关系。举例来说,身份证正面照的5个特征信息分别是姓名、民族、地址、身份证号和证件照,同一身份证的证件照中的人物性别与身份证号有对应关系。为了使服务器提取的K个特征信息分别对应的信息样本满足K个特征信息间的内在关系,服务器可以按照第一提取顺序从证件的结构化数据库中提取K个特征信息分别对应的信息样本。例如,第一提取顺序中先提取身份证号,由身份证号确定性别后,再提取身份证的证件照。本发明实施例对第一提取顺序不做具体限定。
S302、服务器根据上述K个特征信息分别对应的K个信息样本生成上述证件的U个隐含信息。
可以理解,上述证件的隐含信息指可以从证件的特征信息中直接得到(或)推导出来的信息。
举例来说,身份证的正面照包括5个特征信息,分别是姓名、民族、地址、身份证号和身份证的证件照。身份证的正面照还包含两个隐含信息,分别是性别和出生日期。可以理解,出生日期可以直接从身份证号中得到,即身份证号的第七位至第十四为数字为该身份证号对应的出生日期码。可以理解,性别可以有身份证号推导得到,身份证号的第十七位数字为顺序码,女性身份证号的顺序码为偶数,男性身份证号的顺序码为奇数。
S303、服务器根据上述K个特征信息、上述U个隐含信息以及上述证件的结构化特征合成上述证件的第一图像样本。
可选的,上述证件的结构化特征指的是:以预设空白图像的左下角为参考点,上述K个特征信息和上述U个隐含信息间的位置关系;以预设尺寸为参考值,上述K个特征信息和上述U个隐含信息的尺寸比例。基于上述证件的结构化特征,可以将已经提取的证件的K个特征信息和U个隐含信息安置在预设空白图像的特定位置。
S304、服务器对上述第一图像样本进行证件场景的真实化处理,得到第二图像样本。
可选的,上述服务器对第一图像样本进行证件场景的真实化处理,得到第二图像样本,可以包括如下S4至S6步骤:
S4、服务器为上述第一图像样本插入上述证件场景的背景样本,得到第三图像样本。
S5、服务器基于上述证件场景的仿射参数,服务器对上述第三图像样本进行仿射变换,得到第四图像样本。
S6、服务器基于上述证件场景的随机参数,服务器对上述第四图像样本进行模糊、膨胀和腐蚀,得到上述第二图像样本,上述随机参数为向量(x,y,z),上述x用于表征模糊程度,上述y用于表征膨胀程度,上述z用于表征腐蚀程度。
本发明实施实例中,不限于上述S4至S6步骤,服务器对第一图像样本进行证件场景的真实化处理,得到第二图像样本还可以包括其他步骤,这里不做具体限制。
本发明实施例中,仿射变换(Affine Transformation)是一种二维坐标到二维坐标之间的线性变换,该变换保持二维图形的“平直性”(即变换后直线还是直线不会打弯,圆弧还是圆弧)和“平行性”(是指保二维图形间的相对位置关系不变,平行线还是平行线,相交直线的交角不变)。上述仿射变换可以通过一系列的原子变换的复合来实现,包括:平移、缩放、翻转和/或旋转。
可选的,证件场景的仿射参数包括证件场景的平移参数、证件场景的缩放参数、证件场景的翻转参数和证件场景的旋转参数。上述基于上述证件场景的仿射参数,服务器对上述第三图像样本进行仿射变换,得到第四图像样本,包括:基于上述证件场景的平移参数,服务器对上述第三图像样本进行平移,得到第五图像样本;基于上述证件场景的缩放参数,服务器对上述第五图像样本进行缩放,得到第六图像样本;基于上述证件场景的翻转参数,服务器对上述第六图像样本进行翻转,得到第七图像样本;基于上述证件场景的旋转参数,服务器对上述第七图像样本进行旋转变换,得到第四图像样本。
可以理解,本发明实施例中仿射变换包含了一系列的原子变换中的一或多个,且对多种变换的顺序不做限定。
可选的,上述服务器对上述第四图像样本进行模糊、膨胀和腐蚀,得到上述第二图像样本,包括:服务器对上述第四图像样本进行随机模糊,模糊度为0至x的随机数,x为大于等于0小于等于1的小数;服务器对上述模糊后的图像样本进行膨胀,膨胀度为0至y的随机数,y为大于等于0小于等于1的小数;服务器对膨胀后的图像样本进行腐蚀,腐蚀度为0至z的随机数,z为大于等于0小于等于1的小数,得到上述第二图像样本。
S305、服务器将上述第二图像样本输入神经网络进行训练。
可选的,上述服务器将上述第二图像样本输入神经网络进行训练,包括:服务器将上述第二图像样本输入yolo神经网络进行定位分类训练。
可选的,上述服务器将上述第二图像样本输入神经网络进行训练之前,上述方法还包括:服务器记录上述第二图像样本中上述证件的特征信息的位置信息和分类标签,以及上述第二图像样本中上述证件的隐含信息的位置信息和分类标签。
可选的,上述服务器将上述第二图像样本输入yolo神经网络进行定位分类训练,包括:服务器利用yolo神经网络对第二图像样本进行特征提取,获得m张a*a尺寸大小的特征图;将m张特征图中的每张特征图分为a*a个网络单元格,利用sigmoid函数对上述m张特征图中的目标对象进行中心坐标预测,基于中心坐标采用K-means聚类算法获取m个预测框的长和宽、上述m个预测框包含目标对象的置信度和上述m个预测框内目标对象所属类别的置信度;利用非极大值抑制算法对上述m个预测框进行过滤,获得K+U个检测框、上述K+U个检测框的目标检测分数和上述K+U个检测框的分类结果。
可选的,上述服务器利用非极大值抑制算法对上述m个预测框进行过滤,获得K+U个检测框、上述K+U个检测框的目标检测分数和分类结果,包括:利用非极大值抑制算法生成上述m个预测框的目标检测分数,将上述m个预测框的得分进行排序,选中最高分及其对应的预测框。遍历其余的预测框,如果存在预测框和当前最高分的预测框的重叠面积大于第三阈值,便将该预测框框删除。从未处理的预测框中继续选一个得分最高的,重复上述过程,直到选出K+U个检测框,并获取上述K+U个检测框的目标检测分数和分类结果。
可以理解,非极大值抑制算法基于目标检测分数产生检测框,分数最高的预测框被选中,其他与被选中预测框有明显重叠的预测框被抑制。该过程被不断递归的应用于其余预测框。
本发明实施例中,服务器从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本,上述结构化数据库中包含K个子数据库,上述K个子数据库中的第i个子数据库用于存储上述第i个特征信息对应的样本数据;根据上述K个特征信息分别对应的K个信息样本生成上述证件的U个隐含信息;根据上述K个特征信息、上述U个隐含信息以及上述证件的结构化特征合成上述证件的第一图像样本;对上述第一图像样本进行证件场景的真实化处理后,输入神经网络进行训练。通过本发明实施例所提方案,可以提高用于证件识别的有效训练样本的获取效率,进而有效提高证件识别的训练效率。
本发明实施例还提供了一种基于神经网络的证件识别的训练方法装置,该装置能实现图3所示的基于神经网络的证件识别的训练方法中的服务器的功能,也能实现该基于神经网络的证件识别的训练方法所具备的有益效果。其中,该装置的功能可以通过硬件实现,也可以通过硬件执行相应的软件实现。所述硬件或软件包括至少一个与上述功能相对应的模块。
请参阅图4,图4是本发明实施例提供的一种基于神经网络的证件识别的训练装置400的结构框图,所述装置包括:获取单元401、第一生成单元402、合成单元403、处理单元404和训练单元405。
获取单元401,用于从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本,上述结构化数据库中包含K个子数据库,上述K个子数据库中的第i个子数据库用于存储上述第i个特征信息对应的样本数据。
第一生成单元402,用于根据上述K个特征信息分别对应的K个信息样本生成上述证件的U个隐含信息。
合成单元403,用于根据上述K个特征信息、上述U个隐含信息以及上述证件的结构化特征合成上述证件的第一图像样本。
处理单元404,用于对上述第一图像样本进行证件场景的真实化处理,得到第二图像样本。
训练单元405,用于将上述第二图像样本输入神经网络进行训练。
可选的,上述获取单元401从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本之前,上述装置还包括:建立单元,用于建立上述证件的结构化数据库。
可选的,上述建立单元包括:制定单元、生成单元和存储单元。
制定单元,用于根据上述第i个特征信息的信息特征制定上述第i个特征信息的生成规则。
第二生成单元,用于根据上述第i个特征信息的生成规则生成上述第i个特征信息的信息样本。
存储单元,用于将上述第i个特征信息的信息样本存入上述结构化数据库的第i个子数据库。
可选的,上述处理单元404包括:插入单元、第一变换单元和第二变换单元。
插入单元,用于为上述第一图像样本插入上述证件场景的背景样本,得到第三图像样本。
第一变换单元,用于基于上述证件场景的仿射参数,对上述第三图像样本进行仿射变换,得到第四图像样本。
第二变换单元,用于基于上述证件场景的随机参数,对上述第四图像样本进行模糊、膨胀和腐蚀,得到上述第二图像样本,上述随机参数为向量(x,y,z),上述x用于表征模糊程度,上述y用于表征膨胀程度,上述z用于表征腐蚀程度。
可选的,上述训练单元405将上述第二图像样本输入神经网络进行训练之前,上述装置还包括:记录单元,用于记录上述第二图像样本中上述证件的特征信息的位置信息和分类标签,以及上述第二图像样本中上述证件的隐含信息的位置信息和分类标签。
可选的,上述训练单元405,具体用于:服务器将上述第二图像样本输入yolo神经网络进行定位分类训练。
可选的,上述证件包括身份证件或护照证件,上述证件的结构化特征包括特征信息的位置特征、及隐含信息的位置特征。
结合本发明实施例公开内容所描述的方法或者算法的步骤可以硬件的方式来实现,也可以是由处理器执行软件指令的方式来实现。软件指令可以由相应的软件模块组成,软件模块可以被存放于随机存取存储器(英文:random access memory,简称:RAM)、闪存、只读存储器(英文:read only memory,简称:ROM)、可擦除可编程只读存储器(英文:erasable programmable rom,简称:EPROM)、电可擦可编程只读存储器(英文:electrically eprom,简称:EEPROM)、寄存器、硬盘、移动硬盘、只读光盘(CD-ROM)或者本领域熟知的任何其它形式的存储介质中。一种示例性的存储介质耦合至处理器,从而使处理器能够从该存储介质读取信息,且可向该存储介质写入信息。当然,存储介质也可以是处理器的组成部分。处理器和存储介质可以位于ASIC中。另外,该ASIC可以位于网络设备中。当然,处理器和存储介质也可以作为分立组件存在于网络设备中。
本领域技术人员应该可以意识到,在上述一个或多个示例中,本发明实施例所描述的功能可以用硬件、软件、固件或它们的任意组合来实现。当使用软件实现时,可以将这些功能存储在计算机可读介质中或者作为计算机可读介质上的一个或多个指令或代码进行传输。计算机可读介质包括计算机存储介质和通信介质,其中通信介质包括便于从一个地方向另一个地方传送计算机程序的任何介质。存储介质可以是通用或专用计算机能够存取的任何可用介质。
以上所述的具体实施方式,对本发明实施例的目的、技术方案和有益效果进行了进一步详细说明,所应理解的是,以上所述仅为本发明实施例的具体实施方式而已,并不用于限定本发明实施例的保护范围,凡在本发明实施例的技术方案的基础之上,所做的任何修改、等同替换、改进等,均应包括在本发明实施例的保护范围之内。

Claims (10)

1.一种基于神经网络的证件识别的训练方法,其特征在于,所述方法包括:
从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本,所述结构化数据库中包含K个子数据库,所述K个子数据库中的第i个子数据库用于存储所述第i个特征信息对应的样本数据;
根据所述K个特征信息分别对应的K个信息样本生成所述证件的U个隐含信息;
根据所述K个特征信息、所述U个隐含信息以及所述证件的结构化特征合成所述证件的第一图像样本;
对所述第一图像样本进行证件场景的真实化处理,得到第二图像样本;
将所述第二图像样本输入神经网络进行训练。
2.根据权利要求1所述的方法,其特征在于,所述从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本之前,所述方法还包括:
建立所述证件的所述结构化数据库。
3.根据权利要求2所述的方法,其特征在于,所述建立所述证件的所述结构化数据库,包括:
根据所述第i个特征信息的信息特征制定所述第i个特征信息的生成规则;
根据所述第i个特征信息的生成规则生成所述第i个特征信息的信息样本;
将所述第i个特征信息的信息样本存入所述结构化数据库的第i个子数据库。
4.根据权利要求1所述的方法,其特征在于,所述对所述第一图像样本进行证件场景的真实化处理,得到第二图像样本,包括:
为所述第一图像样本插入所述证件场景的背景样本,得到第三图像样本;
基于所述证件场景的仿射参数,对所述第三图像样本进行仿射变换,得到第四图像样本;
基于所述证件场景的随机参数,对所述第四图像样本进行模糊、膨胀和腐蚀,得到所述第二图像样本,所述随机参数为向量(x,y,z),所述x用于表征模糊程度,所述y用于表征膨胀程度,所述z用于表征腐蚀程度。
5.根据权利要求1所述的方法,其特征在于,所述将所述第二图像样本输入神经网络进行训练之前,所述方法还包括:
记录所述第二图像样本中所述证件的特征信息的位置信息和分类标签,以及所述第二图像样本中所述证件的隐含信息的位置信息和分类标签。
6.根据权利要求5所述的方法,其特征在于,所述将所述第二图像样本输入神经网络进行训练,包括:将所述第二图像样本输入yolo神经网络进行定位分类训练。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述证件包括身份证件或护照证件,所述证件的结构化特征包括所述特征信息的位置特征、及隐含信息的位置特征。
8.一种基于神经网络的证件识别的训练方法装置,其特征在于,所述装置包括:
获取单元,用于从预先建立的结构化数据库的第i个子数据库中获取与证件的K个特征信息中的第i个特征信息对应的信息样本,所述结构化数据库中包含K个子数据库,所述K个子数据库的第i个子数据库用于存储所述第i个特征信息对应的样本数据;
生成单元,用于根据所述K个特征信息分别对应的K个信息样本生成所述证件的U个隐含信息;
合成单元,用于根据所述K个特征信息、所述U个隐含信息以及所述证件的结构化特征合成所述证件的第一图像样本;
处理单元,用于对所述第一图像样本进行证件场景的真实化处理,得到第二图像样本;
训练单元,用于将所述第二图像样本输入神经网络进行训练。
9.一种服务器,其特征在于,包括处理器、通信设备和存储器,所述处理器、通信设备和存储器相互连接,其中,所述存储器用于存储应用程序代码,所述处理器被配置用于调用所述应用程序代码,执行如权利要求1至7任一项所述的方法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行以实现权利要求1至7任一项所述的方法。
CN201910889895.1A 2019-09-18 2019-09-18 一种基于神经网络的证件识别的训练方法及装置 Active CN110689063B (zh)

Priority Applications (2)

Application Number Priority Date Filing Date Title
CN201910889895.1A CN110689063B (zh) 2019-09-18 2019-09-18 一种基于神经网络的证件识别的训练方法及装置
PCT/CN2020/099559 WO2021051948A1 (zh) 2019-09-18 2020-06-30 一种基于神经网络的证件识别的训练方法及装置

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910889895.1A CN110689063B (zh) 2019-09-18 2019-09-18 一种基于神经网络的证件识别的训练方法及装置

Publications (2)

Publication Number Publication Date
CN110689063A true CN110689063A (zh) 2020-01-14
CN110689063B CN110689063B (zh) 2023-07-25

Family

ID=69109731

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910889895.1A Active CN110689063B (zh) 2019-09-18 2019-09-18 一种基于神经网络的证件识别的训练方法及装置

Country Status (2)

Country Link
CN (1) CN110689063B (zh)
WO (1) WO2021051948A1 (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021051948A1 (zh) * 2019-09-18 2021-03-25 平安科技(深圳)有限公司 一种基于神经网络的证件识别的训练方法及装置
CN113807185A (zh) * 2021-08-18 2021-12-17 苏州涟漪信息科技有限公司 一种数据处理方法和装置

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN109034159A (zh) * 2018-05-28 2018-12-18 北京捷通华声科技股份有限公司 图像信息提取方法和装置
US20190180086A1 (en) * 2017-06-30 2019-06-13 Beijing Didi Infinity Technology And Development Co. Ltd. Systems and methods for verifying authenticity of id photo
CN110059689A (zh) * 2019-03-19 2019-07-26 平安科技(深圳)有限公司 样本集构建方法、装置、计算机设备和存储介质
CN110059684A (zh) * 2019-04-23 2019-07-26 杭州智趣智能信息技术有限公司 一种证件信息识别方法、转置、设备及介质
CN110070130A (zh) * 2019-04-23 2019-07-30 杭州智趣智能信息技术有限公司 一种证件信息识别方法、转置、设备及介质
CN110210242A (zh) * 2019-04-25 2019-09-06 深圳壹账通智能科技有限公司 一种数据脱敏的方法、装置、存储介质及计算机设备

Family Cites Families (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN108549881A (zh) * 2018-05-02 2018-09-18 杭州创匠信息科技有限公司 证件文字的识别方法和装置
US10242283B1 (en) * 2018-10-03 2019-03-26 Capital One Services, Llc Government ID card validation systems
CN110689063B (zh) * 2019-09-18 2023-07-25 平安科技(深圳)有限公司 一种基于神经网络的证件识别的训练方法及装置

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20190180086A1 (en) * 2017-06-30 2019-06-13 Beijing Didi Infinity Technology And Development Co. Ltd. Systems and methods for verifying authenticity of id photo
CN109034159A (zh) * 2018-05-28 2018-12-18 北京捷通华声科技股份有限公司 图像信息提取方法和装置
CN110059689A (zh) * 2019-03-19 2019-07-26 平安科技(深圳)有限公司 样本集构建方法、装置、计算机设备和存储介质
CN110059684A (zh) * 2019-04-23 2019-07-26 杭州智趣智能信息技术有限公司 一种证件信息识别方法、转置、设备及介质
CN110070130A (zh) * 2019-04-23 2019-07-30 杭州智趣智能信息技术有限公司 一种证件信息识别方法、转置、设备及介质
CN110210242A (zh) * 2019-04-25 2019-09-06 深圳壹账通智能科技有限公司 一种数据脱敏的方法、装置、存储介质及计算机设备

Cited By (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2021051948A1 (zh) * 2019-09-18 2021-03-25 平安科技(深圳)有限公司 一种基于神经网络的证件识别的训练方法及装置
CN113807185A (zh) * 2021-08-18 2021-12-17 苏州涟漪信息科技有限公司 一种数据处理方法和装置
CN113807185B (zh) * 2021-08-18 2024-02-27 苏州涟漪信息科技有限公司 一种数据处理方法和装置

Also Published As

Publication number Publication date
CN110689063B (zh) 2023-07-25
WO2021051948A1 (zh) 2021-03-25

Similar Documents

Publication Publication Date Title
CN110059689B (zh) 样本集构建方法、装置、计算机设备和存储介质
CN110852311A (zh) 一种三维人手关键点定位方法及装置
CN110427972B (zh) 证件视频特征提取方法、装置、计算机设备和存储介质
CN110738238B (zh) 一种证件信息的分类定位方法及装置
CN110689063B (zh) 一种基于神经网络的证件识别的训练方法及装置
WO2014162690A1 (ja) 情報処理装置、及び、画像処理方法
CN111858977B (zh) 票据信息采集方法、装置、计算机设备和存储介质
CN114758093A (zh) 基于图像序列的三维模型生成方法、装置、设备及介质
CN112699867A (zh) 一种固定版式目标图像要素信息提取方法及其系统
CN114444565A (zh) 一种图像篡改检测方法、终端设备及存储介质
CN114842478A (zh) 文本区域的识别方法、装置、设备及存储介质
CN112418206B (zh) 基于位置检测模型的图片分类方法及其相关设备
CN112380978B (zh) 基于关键点定位的多人脸检测方法、系统及存储介质
Forczmański et al. Comparative analysis of simple facial features extractors
US9171227B2 (en) Apparatus and method extracting feature information of a source image
CN112348008A (zh) 证件信息的识别方法、装置、终端设备及存储介质
Meena et al. Image splicing forgery detection techniques: A review
Sheng et al. Detection of content-aware image resizing based on Benford’s law
CN111695441B (zh) 图像文档处理方法、装置及计算机可读存储介质
CN115330998A (zh) 一种目标检测模型训练方法、装置、目标检测方法及装置
Senthilkumar et al. A robust wavelet based decomposition of facial images to improve recognition accuracy in standard appearance based statistical face recognition methods
CN114694150A (zh) 一种提升数字图像分类模型泛化能力的方法及系统
CN110751140A (zh) 字符批量识别方法、装置和计算机设备
JP7231529B2 (ja) 情報端末装置、サーバ及びプログラム
Matalov et al. Memory efficient local features descriptor for identity document detection on mobile and embedded devices

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant