CN109871845A - 证件图像提取方法及终端设备 - Google Patents

证件图像提取方法及终端设备 Download PDF

Info

Publication number
CN109871845A
CN109871845A CN201910023382.2A CN201910023382A CN109871845A CN 109871845 A CN109871845 A CN 109871845A CN 201910023382 A CN201910023382 A CN 201910023382A CN 109871845 A CN109871845 A CN 109871845A
Authority
CN
China
Prior art keywords
image
certificate
pixel
characteristic model
balance
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201910023382.2A
Other languages
English (en)
Other versions
CN109871845B (zh
Inventor
黄锦伦
熊冬根
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Technology Shenzhen Co Ltd
Original Assignee
Ping An Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Technology Shenzhen Co Ltd filed Critical Ping An Technology Shenzhen Co Ltd
Priority to CN201910023382.2A priority Critical patent/CN109871845B/zh
Publication of CN109871845A publication Critical patent/CN109871845A/zh
Priority to PCT/CN2019/118133 priority patent/WO2020143316A1/zh
Priority to JP2021500946A priority patent/JP2021531571A/ja
Priority to SG11202100270VA priority patent/SG11202100270VA/en
Priority to US17/167,075 priority patent/US11790499B2/en
Application granted granted Critical
Publication of CN109871845B publication Critical patent/CN109871845B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/90Dynamic range modification of images or parts thereof
    • G06T5/92Dynamic range modification of images or parts thereof based on global image properties
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/22Matching criteria, e.g. proximity measures
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/08Learning methods
    • G06N3/084Backpropagation, e.g. using gradient descent
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/60Image enhancement or restoration using machine learning, e.g. neural networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T5/00Image enhancement or restoration
    • G06T5/80Geometric correction
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19147Obtaining sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/19Recognition using electronic means
    • G06V30/191Design or setup of recognition systems or techniques; Extraction of features in feature space; Clustering techniques; Blind source separation
    • G06V30/19173Classification techniques
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/40Document-oriented image-based pattern recognition
    • G06V30/41Analysis of document content
    • G06V30/413Classification of content, e.g. text, photographs or tables
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • G06N20/10Machine learning using kernel methods, e.g. support vector machines [SVM]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N7/00Computing arrangements based on specific mathematical models
    • G06N7/01Probabilistic graphical models, e.g. probabilistic networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/10Image acquisition modality
    • G06T2207/10024Color image
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20084Artificial neural networks [ANN]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/30Subject of image; Context of image processing
    • G06T2207/30176Document

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Biophysics (AREA)
  • Molecular Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Biomedical Technology (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computational Linguistics (AREA)
  • General Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Image Analysis (AREA)
  • Geometry (AREA)
  • Image Processing (AREA)

Abstract

本发明适用于计算机应用技术领域,提供了一种证件图像提取方法、终端设备及计算机可读存储介质,包括:通过获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;根据原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;根据预先训练好的证件特征模型,从平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;根据证件的位置,从所述平衡图像中提取出所述证件的图像。根据证件特征模型在原始图像中定位证件的位置,并提取出图像中的证件图像,提高了从原始图像中提取证件图像的精确性。

Description

证件图像提取方法及终端设备
技术领域
本发明属于计算机应用技术领域,尤其涉及一种证件图像提取方法、终端设备及计算机可读存储介质。
背景技术
机器视觉是让“物”有了看的功能,不仅具有信息采集功能,还能进行处理和识别等高级功能。另外机器视觉的设备成本低,最常使用的设备是摄像头。据统计,近几年各大城市公共摄像头和家庭、企业摄像头安装比率都大大的增加,家庭和企业摄像头安装比率也很高,随着摄像头的普及,今后在各城市的角落或者家庭和企业中都会大量使用摄像头。随着摄像头快速普及,机器视觉的技术的相关应用将更加快速发展。随着机器视觉领域的发展,证件照身份核验技术也将在这个浪潮中得到更广泛的应用。
现有技术中可以随时调取布置在城市各处的摄像头进行身份核验,想要在数以万计的人群中查找特定人的信息变得简单。但是由于很多外界环境的影响,得到的证件图像质量较差,而不能精确得到证件图像。
发明内容
有鉴于此,本发明实施例提供了一种证件图像提取方法、终端设备及计算机可读存储介质,以解决现有技术中由于很多外界环境的影响,得到的证件图像质量较差、不精确的问题。
本发明实施例的第一方面提供了一种证件图像提取方法,包括:
用于获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;
用于根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;
根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;
根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。
本发明实施例的第二方面提供了一种终端设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
用于获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;
用于根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;
根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;
根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。
本发明实施例的第三方面提供了一种终端设备,包括:
获取单元,用于获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;
处理单元,用于根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;
确定单元,用于根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;
提取单元,用于根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。
本发明实施例的第四方面提供了一种计算机可读存储介质,所述计算机存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行上述第一方面的方法。
本发明实施例与现有技术相比存在的有益效果是:
本发明实施例通过获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;根据原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;根据预先训练好的证件特征模型,从平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;根据证件的位置,从所述平衡图像中提取出所述证件的图像。根据证件特征模型在原始图像中定位证件的位置,并提取出图像中的证件图像,提高了从原始图像中提取证件图像的精确性。
附图说明
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图1是本发明实施例一提供的证件图像提取方法的流程图;
图2是本发明实施例二提供的证件图像提取方法的流程图;
图3是本发明实施例三提供的终端设备的示意图;
图4是本发明实施例四提供的终端设备的示意图。
具体实施方式
以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本发明实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本发明。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本发明的描述。
为了说明本发明所述的技术方案,下面通过具体实施例来进行说明。
参见图1,图1是本发明实施例一提供的证件图像提取方法的流程图。本实施例中证件图像提取方法的执行主体为终端。终端包括但不限于智能手机、平板电脑、可穿戴设备等移动终端,还可以是台式电脑等。如图所示的证件图像提取方法可以包括以下步骤:
S101:获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到。
随着社会实名制的发展,对证件信息的快速、准确的釆集成为一个越来越重要的话题,硬件性能的提高及数字图像处理技术的高速发展,大大促进了证件信息采集系统性能的提升。作为影响证件信息采集系统整体功能的证件图像处理部分,对系统的效果影响大,并且,根据系统的不同其相应的处理也有所不同。随着国家法律法规的日渐完善,社会对于公共安全的要求越来越高,故有关部门在社会民生的多个领域都推行实名制,如上网实名制、开户实名制、手机实名制等等。若个人信息的提取单纯靠人工录入及核对,必将导致低下的工作效率和较高的出错率,给业务双方带来严重不便。证件信息釆集系统通过射频识别技术和图像识别技术,可以实现对证件信息的自动提取、身份证、护照等证件资料的录入。信息获取手段的丰富和图像处理技术的发展使证件阅读仪的体积更小,信息提取的速度更快,信息的出错率更低。在提高公共安全和管理效率的同时,也给业务双方带来极大便利。此外,证件信息采集系统也有利于实名制应用的拓展。证件信息采集系统的发展使得火车、汽车、地铁等人流量较大的场合也有条件开展实名制,这将极大的保障铁路、公路和城市轨道交通的安全。
移动智能终端是指像计算机一样装有各种操作系统,但体积相对计算机来说比较小,便于携带,且拥有无线上网功能,用户可以根据自己的需求下载对应操作系统的各种应用。生活中比较常见的移动智能终端有智能手机、平板电脑、车载电脑、可穿戴移动设备等。智能手机是目前较为常用的移动智能终端,用户可以按照自己喜好或者需求安装第三方服务商提供的应用,游戏或者功能性程序等,满足用户对于智能终端功能上的需求。近年来,随着科技的不断发展,各类证件也不再是一本证书,而是类似身份证的卡片。随着证件的使用,证件信息的录入也成为一个重要问题。传统的信息录入方式是采用人工方式先填写相关表格中信息,再由内部工作人员按照表格内容把关键信息存入计算机,或者是,到指定地点进行证件的扫描上传。前一种方式虽然不限制信息录入的地点,但每一次信息的录入都需要耗费大量的人力物力资源,并且容易出现错误的输入。后一种虽然在信息录入的效率和准确率上都有提高,但是使用地点却相对固定。移动智能终端的出现,使随时随地进行证件信息的录入成为可能。移动智能终端上的信息识别系统可以广泛的应用于服务性行业、交通系统、公安系统等需要对证件信息进行查验的部分,无需大量人员即可完成证件信息的采集查验,提高采集查验工作中证件信息识别的效率和准确率,具有广阔的应用前景。
在实际应用中,用户可以将通过移动终端拍摄的原始图像上传至服务器或者图像处理终端,图像处理终端在接收到原始图像之后,对该原始图像进行处理和识别。本方案中的应用场景可以是在用户证件图像获取并验证的网站中,向用户发送图像采集指令,用户通过自己的终端设备拍摄照片,例如身份证、护照等照片,通过移动终端中的应用软件或者网页将拍摄得到的图像发送执行主体,执行主体在获取到目标图像之后,对该原始图像进行处理和识别。
S102:根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像。
在实际应用中,表示图像最常用的颜色空间是红绿蓝(Red Green Blue,RGB)。真彩色图像三个颜色分量各有一个字节位表示,因此一个点的空间需要三个字节表示,一个1024×768的真彩图像需要1024×768×3=2.25MB。这样大的空间在早期计算机上是一笔很大开销,即使在一些内存空间相对小的环境中,比如手机,也显庞大。因此,用一个表格存放图像中的所有颜色,而实际图像数据不再是RGB数据,而是RGB数据在那个表格中的索引,为了控制索引大小,一般这个表格大小要求小于256个元素,即一个字节表示的范围,这个字节就可以表示这个图像中一个点的颜色。如果表格更小,一个点所用的索引位数就更小,这样1024×768真彩图像256色调色板仅需要1024×768×3=768.8KB。颜色量化过程往往要使用到两类调色版,一类是真彩色或者伪真彩色图像量化到调色板图像;另一类是调色板图像继续量化。随着计算机存储容量的不断提升,调色板图像逐渐淡出了个人计算机的舞台,但是在手机等一些特种设备中应用依然十分广泛,尤其是在手机游戏应用中。
随着计算机技术的不断发展,图形图像的处理已广泛应用于工业、农业、军事、医学、管理等各个领域。通过彩色扫描仪、摄像机等设备,可采集到自然界色彩斑斓的原始图像。而用计算机来显示时,由于显示设备所提供的能力和经济的原因,可表示的颜色数目总是有限的。另一方面,不同的计算机设备条件可显示的颜色数目往往不同,而同一幅图像我们希望在较低档次的机器设备条件下得到较好的再现。
在实际应用中,平衡是描述显示器中红、绿、蓝三基色混合生成后白色精确度的一项指标。白平衡是电视摄像领域一个非常重要的概念,通过它可以解决色彩还原和色调处理的一系列问题。白平衡是随着电子影像再现色彩真实而产生的,在专业摄像领域白平衡应用的较早,现在家用电子产品中也广泛地使用,然而技术的发展使得白平衡调整变得越来越简单容易,但许多使用者还不甚了解白平衡的工作原理,理解上存在诸多误区。它是实现摄像机图像能精确反映被摄物的色彩状况。在本实施例中,可以通过手动白平衡和自动白平衡等方式对原始图像进行白平衡处理,得到平衡图像。
S103:根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到。
在对证件字符进行识别时,方法主要有隐马尔可夫模型、神经网络、支持向量机和模板匹配。所有使用隐马尔可夫模型的方法都需要进行预处理和根据己有知识设定参数。这个方法通过复杂的预处理和参数化取得较高的识别率,也可以通过多层感知神经网络来训练证件特征模型,神经网络使用后向反馈的方法来进行训练这种网络必须训练很多次才能获得比较好的结果,这个过程是比较耗时的,而且隐藏层的层数和隐藏层神经元的个数都必须通过实验的方法来获得。可选的,神经网络的包含24个输入层神经元、15个隐藏层神经元、36个输出层神经元来识别平衡图像中的证件。
在人中脑中存在着无数的神经元,对于这些神经元来说,存在着千丝万缕的联系,经过一个组织之后构成一个紧密的神经网络结构,这个神经网络结构就可以实现人脑的复杂的计算和功能。在这里的神经网络主要是研究这些神经元的连接方式和组织结构。对于神经网络来说,可以划分为二种,一个是层状的,另一个是网状的。对于第一种来说,神经元之间是一个层次的排列的方式,对于每一层来说,这些神经元是并列排列,形成一个紧密的机构,对于层与层之间来说,通过神经元进行连接,但对于每一个层内部的神经元来说则是不能进行连接,第二种的神经网络结构来说,每一个的神经元则是可以进行互联。
需要说明的是,对于神经网络来说。需要经过一定的训练之后。学习到神经网络的处理的规则和方法。并且通过这些方法进行问题的处理和解决。对于前向多层网络的结构来说。具体有如下的几个步骤实现,首先需要对于前向多层网络提供一个训练的例子。在这个例子中包括了输入和输出的模式;对于上面的设计的训练自理来说。对于输入和输出允许存在着一定的误差;对于前向多层网络的输出需要进行改变。改变输出以便使得最后的输出能够得到一个比较好的输出。满足在误差范围内。
S104:根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。
在确定了平衡图像中的证件图像的位置之后,根据证件图像的位置,从平衡图像中提取该证件图像。具体的,其提取的方式可以是直接从平衡图像中裁剪的方式,将证件图像提取出来,还可以是删除掉除去证件图像之外的图像区域,保留证件的图像的方法,此处不做限定。
除此之外,还可以通过基于边缘和梯度的方法,检测证件图像的图像边缘,基于该图像边缘,将证件图像提取出来。基于边缘的证件图像方法认为自然场景中的证件图像与背景边缘存在较大差异性,该方法对字符进行边缘检测,从而通过边缘信息定位证件图像。可选的,可以通过Sobel算子、Robert算子、Laplace算子确定证件图像的图像边缘。其中,Sobel算子通过判断证件图像中某个像素点的梯度是否大于阈值来确定该点是否为边缘点,Robert算子适合文字与背景区别较大的图像,而且检测后获得的边缘较粗,Laplace算子对噪声非常敏感,容易产生双边效果,不直接用于检测边。也可以采用基于连通域的证件图像定位方法,将原始图像转变为二值图像,减少噪声的影响,使用形态学腐蚀膨胀算法将证件图像区域连通,利用证件图像与白色背景的区分度分割图像,再通过证件图像的各方面特征排除非证件图像连通域,从而得到证件图像区域基于连通域的证件图像定位方法,证件图像定位速度较快,可以提高证件图像及其证件图像中的文字的识别效率。
上述方案,通过获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。根据证件特征模型在原始图像中定位证件的位置,并提取出图像中的证件图像,提高了从原始图像中提取证件图像的精确性。
参见图2,图2是本发明实施例二提供的证件图像提取方法的流程图。本实施例中证件图像提取方法的执行主体为终端。终端包括但不限于智能手机、平板电脑、可穿戴设备等移动终端,还可以是台式电脑等。如图所示的证件图像提取方法可以包括以下步骤:
S201:采集历史证件图像,并对所述历史证件图像按照预设的目标图像要求进行筛选,得到目标图像。
在对原始图像进行识别和处理之前,我们需要先训练出证件特征模型来进行证件图像识别。因此本方案中可以先根据历史证件图像训练出证件特征模型,以从原始图像中提取出证件图像来。本方案中训练证件特征模型的数据可以是历史证件图像,历史证件图像包括在进行正式的证件图像提取之前,获取到的历史图像。
在实际应用中,获取到的历史证件图像可能存在不符合要求的图像,考虑到这种情况,本方案中对获取到的历史图像按照预设的目标图像要求进行筛选,得到目标图像。其中,预设的目标图像要求可以是图像的像素、大小或者拍摄时间要求,除此之外,还可以是检测图像的完整度,证件图像的类型要求等。这些要求可以是执行者来确定,此处不做限定,在确定了目标图像要求之后,将获取到的历史证件图像与目标图像要求进行匹配,确定匹配度大于匹配度阈值的历史证件图像作为目标图像。
通过获取各种摄像装置得到的证件图像,用于作为进行神经网络训练的初始样本。在神经网络的学习训练过程中,训练集的选取将直接影响网络学习训练的时间、权值矩阵与学习训练效果等。本方案中选择图像边缘比较明显,且边缘分布在图像的大部分区域的图像作为训练即集的初始样本,图像边缘比较清晰,颗粒边缘分布在整副图像中,而且其纹理特征比较丰富,使神经网络得到很好训练,络权值等网络信息会记住更多的边缘信息,可以比较好的检测图像。
S202:根据预设的证件图像模板对所述目标图像进行像素识别,在所述目标图像中确定至少一个中心像素点。
在确定图像样本中的中心像素点时,可以通过图像识别的方式确定图像样本具有突出代表性的像素点作为中心像素点。示例性的,当处理的原始图像是用户拍摄的身份证图像时,根据已知的身份证图像中的头像的大小和文字位置,可以确定头像的四个角为中心像素点,也可以确定某些文字为中心像素点,例如身份证中的第一个字或者每一行的第一个字等;进一步的,还可以预先设定所获取的图像类型,例如身份证照片、房产证照片等,并确定每种类型的图像模板以及该模板中的每个图像元素的位置或者与证件边框的距离等信息,通过这些信息进行识别,以精确确定图像样本中的中心像素点,通过中心像素点和以其为中心的周围的像素点进行学习训练,以从原始图像中定位证件的位置。
需要说明的是,中心像素点周围的像素点的个数可以是至少两个,优选的,可以确定中心像素点周围的8个像素点来进行学习训练,更加清楚的确定图像中每个像素的情况。
S203:设置训练模型的初始参数,根据所述初始参数、每个所述中心像素点和所述中心像素点周围的像素点的像素值进行学习训练,得到基于神经网络的证件特征模型。
对于任何一个神经网络模型,其应用过程中的学习训练都是关键的环节,只有通过学习训练,网络才能够具有联想、记忆和预测的能力。通常某些参数的确定对于学习训练过程至关重要。网络的初始参数包括网络初始结构、连接的权值、阈值及学习率等,不同的设置都会在一定程度上影响网络的收敛速度。初始参数的选择非常重要却也非常困难。除去必要的技术处理,网络构建主要靠的是观察与经验。
在训练证件特征模型时,首先确定模型初始值,网络的初始权值和阈值一般都是从[-1,1]或[0,1]随机选取,某些改进算法会对区间做适当的更改。其次对向量进行归一化处理,在学习训练过程中,结点输入不宜过大,过小的权值调节将不利于网络学习训练。训练图像是基于灰度的,因此图像矩阵均为介于[0,255]的整形数值,并且特征向量维数比较高,为了提高网络训练速度,将会对特征向量统一做归一化处理。把特征向量看作是行向量,表示为:
X=(x0,x1,…,x9);其中,x0,x1,…,x9分别用于表示中心像素点及其周围像素点的像素值。
本实施例中的中心像素点周围的像素点的数量可以是至少两个,优选的,可以是8个,以更加精确的说明中心像素点的周围像素点的情况,8位灰度图像的灰度值范围是[0,255],因此,实际处理中归一化公式为:
其中,x0用于表示中心像素点的像素值。
由于处理的对象是图像,图像样本集比较庞大,故采用对图像进行分块操作的思想。神经网络中每次输入一个图像样本,可以通过确定一个或者至少两个中心像素点,对这个中心像素点周围的模板像素,即包括以其为中心的周围8个像素,进行学习训练,把这些像素的灰度值以从上至下、从左至右的顺序依次送入输入层。输出层提供的期望输出像素的灰度值与实际输出层的输出像素灰度值之间存在一定的误差,误差沿反向传播,进而使每个神经元的阈值以及神经元之间的连接权值发生改变,因此网络可以有效记忆更多的边缘信息。反复进行上述过程直至误差缩小到规定的范围内,或者训练次数达到目标次数,训练任务完成。训练的要求规定可以随时停止网络的训练,同时为了方便日后利用神经网络进行检测,训练出来的权值和阈值全部存储在后端的数据库中,最后保存训练好的网络。
S204:获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到。
在本实施例中S204与图1对应的实施例中S101的实现方式完全相同,具体可参考图1对应的实施例中的S101的相关描述,在此不再赘述。
S205:根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像。
在获取到原始图像之后,根据原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像。
进一步的,步骤S205可以具体包括步骤S2051-S2052:
S2051:根据所述原始图像中的每个所述像素点在红、绿、蓝三个颜色分量中的分量值,估算所述原始图像中每个所述像素点的平均色差。
在对图像进行形态学处理或匹配、识别等处理之前,对图像进行的滤除干扰信息、增强有效信息等处理称为图像的预处理。对图像进行预处理的主要目的是消除图像中的干扰或无关的信息,恢复有用的真实信息,增强有关信息的可检测性和最大限度地简化数据,从而改进特征抽取、图像分割、匹配和识别的可靠性。对数字彩色图像进行的预处理一般是亮度、色彩的复原与增强。鉴于对各种预处理的比较及试验,发现白平衡处理对系统最后的分割结果有比较大的影响,而其它的预处理则影响不大。故本方案中预处理主要就是白平衡处理。
不同的光源具有不同的光谱成分和分布,这在色度学上称之为色温。一个白色的物体,在低色温的光线照射下会偏红,而在高色温的光线照射下会偏蓝。进行拍摄时,环境光源色温会对图像产生影响,使其不可避免地出现色彩上的偏差。为了尽可能减少外来光照对目标颜色造成的影响,在不同的色温条件下均能还原出被摄目标本来的色彩,需要进行色彩校正,以达成正确的色彩平衡。
当图像中的R、G、B三种颜色相等时,其色差为0,表现为白色。在图像处理中,一般采用YBR色彩模型来计算色差。YBR色彩系统与RGB色彩系统的对应关系如下:
在Y足够大、B和R足够小的空间里定义了一个区域,并将该区域中的所有像素看作是白色的,可以参与色差的计算。然后,用白色像素的平均色差来代表整个图像的色差,以取得较好的精度。根据系统的特点,我们给出了以下约束条件:Y-|B|-|R|>180;满足该约束条件的像素都看作是白色的,得到白色像素点的平均亮度及R,G,B分量的平均值Ravg、Gavg、Bavg
S2052:根据每个所述像素点的所述平均色差,计算每个所述像素点在红、绿、蓝三个颜色分量中增益量。
在实际应用中色彩增益用于表示图像的鲜活程度,增益量不外乎增加色彩对比度,使颜色更鲜艳更饱和,造成视觉较大的冲击力,另一方面有一定的锐化效果,使得边缘线条更加分明清晰。可以通过色彩增益对图像进行自动调节对比度、色彩饱和度等功能类似。数码相机的这种技术可以使得照片看起来更清晰,更抢眼。
根据上一步骤计算得到的平均色差,我们可以得到白平衡各分量的增益量为:
S2053:根据所述增益量,校正所述原始图像中的每个所述像素点的色温,得到所述平衡图像。
根据上一步骤得到的增益量,本方案对整个图像的每个像素进行色温校正,具体计算公式如下:
可选的,还可以进行图像的增强消除图像中的噪声或降低图像中的噪声,增强图像中的对比度等增强对文本区域的定位。图像的水平校正则是将原图像转换为文本水平分布的图像,增强文本区域定位准确度。图像增强方法可以为高斯模糊和锐化处理,图像高斯模糊处理是模糊细节,降噪的常用方法,高斯模糊处理将和点的8连通区域按照一定权重加权相加,将其中值作为点的像素值。使用高斯模糊平滑处理可以将图像中很多噪声平滑,将图像中目标图像的轮廓凸显出来。高斯模糊平滑处理只能适用于背景复杂,但是图像中目标轮廓很明显的图像,平滑处理可以平滑图像细节,对于噪声有平滑的同时,也会将一些不是很明显的轮廓细节也平滑掉。
除此之外,还可以对原始图像进行图像的平滑和滤波,对一些在图像的生成的过程中造成的图像的品质的下降采取一些措施。可以使得图像的质量得到改善。具体来说就是对图像丢失的部分信息进行有针对性的补偿。另外的一个方法就是对图像进行处理将图像的某一个部分的图像信息进行突出。对一些不是很重要的图像信息进行进一步的减少。在证件的图像处理中。经常需要使用证件采集的工具获取到证件的图像信息。在这个过程中经常会产生一些噪声。因此就需要设法降低噪声。通过这种方法就可以提高图像的品质。可以对产生的噪声进行干扰。获取到比较好的图像信息。增强重要的图像的信息。这个图像的预处理的技术就是图像的平滑。对于图像的平滑技术来说。主要是通过如下的二个方法和性能要求来实现图像的增强效果。首先是对于图像的线条和边缘轮廓等重要信息需要进行保留。不能随意的破坏。其次是对于图像需要使得图像的画面清晰和图像效果。
S206:根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到。
通过多层感知神经网络来训练证件特征模型,神经网络使用后向反馈的方法来进行训练这种网络必须训练很多次才能获得比较好的结果。这个过程是比较耗时的。而且隐藏层的层数和隐藏层神经元的个数都必须通过实验的方法来获得。可选的,神经网络的包含24个输入层神经元、15个隐藏层神经元、36个输出层神经元来识别平衡图像中的证件。
进一步的,步骤S206中可以具体包括步骤S2061:
S2061:若根据所述证件特征模型得到的所述证件的位置与所述证件的实际位置之间的距离差值大于或者等于预设的差值阈值,则修正所述证件特征模型的初始参数。
在根据证件特征模型检测原始图像中的证件图像的位置时,很可能出现检测结果与其实际结果出现出入的情况,在这种情况下,我们可以对证件特征模型的参数进行调整,以使之后的检测结果能够更加精确。具体的实施方式为:
确定根据所述证件特征模型得到的所述证件的位置与所述证件的实际位置之间的距离差值;
若所述距离差值大于或者等于所述差值阈值,则根据如下公式校正所述证件特征模型的初始参数:其中:wij(k)用于表示第k次训练时的权值;wij(k+1)用于表示第k+1次训练时的权值;η用于表示学习速率且η>0;E(k)用于表示前k次训练得到的证件图像的位置的期望值。
当神经网络实际输出值与期望输出值不统一时,求取误差信号,并将该信号从输出端反向传播,同时在传播过程中不断修正加权系数,以使误差函数最小,通常网络误差采用均方差,对权值进行修改。调整公式为:
式中wij(k)用于表示第k次训练时的权值;wij(k+1)用于表示第k+1次训练时的权值;η用于表示学习速率且η>0;E(k)用于表示前k次训练得到的证件图像的位置的期望值,表示第k次时的负梯度。
S207:根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。
在本实施例中S207与图1对应的实施例中S105的实现方式完全相同,具体可参考图1对应的实施例中的S105的相关描述,在此不再赘述。
上述方案,通过采集历史证件图像,并对所述历史证件图像按照预设的目标图像要求进行筛选,得到目标图像;根据预设的证件图像模板对所述目标图像进行像素识别,在所述目标图像中确定至少一个中心像素点;设置训练模型的初始参数,根据所述初始参数、每个所述中心像素点和所述中心像素点周围的像素点的像素值进行学习训练,得到基于神经网络的证件特征模型。获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。通过对获取到的待提取图像的原始图像进行预处理,根据证件特征模型对预处理之后的图像定位证件的位置,并提取出图像中的证件图像,提高了从原始图像中提取证件图像的精确性。
参见图3,图3是本发明实施例三提供的一种终端设备的示意图。终端设备包括的各单元用于执行图1~图2对应的实施例中的各步骤。具体请参阅图1~图2各自对应的实施例中的相关描述。为了便于说明,仅示出了与本实施例相关的部分。本实施例的终端设备300包括:
获取单元301,用于获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;
处理单元302,用于根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;
确定单元303,用于根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;
提取单元304,用于根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。
进一步的,所述终端设备还可以包括:
筛选单元,用于采集历史证件图像,并对所述历史证件图像按照预设的目标图像要求进行筛选,得到目标图像;
识别单元,用于根据预设的证件图像模板对所述目标图像进行像素识别,在所述目标图像中确定至少一个中心像素点;
训练单元,用于设置训练模型的初始参数,根据所述初始参数、每个所述中心像素点和所述中心像素点周围的像素点的像素值进行学习训练,得到基于神经网络的证件特征模型。
进一步的,所述确定单元303可以包括:
修正单元,用于若根据所述证件特征模型得到的所述证件的位置与所述证件的实际位置之间的距离差值大于或者等于预设的差值阈值,则修正所述证件特征模型的初始参数。
进一步的,所述修正单元可以包括:
距离计算单元,用于确定根据所述证件特征模型得到的所述证件的位置与所述证件的实际位置之间的距离差值;
参数校正单元,用于若所述距离差值大于或者等于所述差值阈值,则根据如下公式校正所述证件特征模型的初始参数:其中:wij(k)用于表示第k次训练时的权值;wij(k+1)用于表示第k+1次训练时的权值;η用于表示学习速率且η>0;E(k)用于表示前k次训练得到的证件图像的位置的期望值。
进一步的,所述处理单元302可以包括:
色差估算单元,用于根据所述原始图像中的每个所述像素点在红、绿、蓝三个颜色分量中的分量值,估算所述原始图像中每个所述像素点的平均色差;
增益计算单元,根据每个所述像素点的所述平均色差,计算每个所述像素点在红、绿、蓝三个颜色分量中增益量;
平衡处理单元,用于根据所述增益量,校正所述原始图像中的每个所述像素点的色温,得到所述平衡图像。
上述方案,通过获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;根据原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;根据预先训练好的证件特征模型,从平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;根据证件的位置,从所述平衡图像中提取出所述证件的图像。根据证件特征模型在原始图像中定位证件的位置,并提取出图像中的证件图像,提高了从原始图像中提取证件图像的精确性。
图4是本发明实施例四提供的终端设备的示意图。如图4所示,该实施例的终端设备4包括:处理器40、存储器41以及存储在所述存储器41中并可在所述处理器40上运行的计算机程序42。所述处理器40执行所述计算机程序42时实现上述各个证件图像提取方法实施例中的步骤,例如图1所示的步骤101至104。或者,所述处理器40执行所述计算机程序42时实现上述各装置实施例中各模块/单元的功能,例如图3所示单元301至304的功能。
示例性的,所述计算机程序42可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器41中,并由所述处理器40执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述所述计算机程序42在所述终端设备4中的执行过程。
所述终端设备4可以是桌上型计算机、笔记本、掌上电脑及云端服务器等计算设备。所述终端设备可包括,但不仅限于,处理器40、存储器41。本领域技术人员可以理解,图4仅仅是终端设备4的示例,并不构成对终端设备4的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述终端设备还可以包括输入输出设备、网络接入设备、总线等。
所称处理器40可以是中央处理单元(Central Processing Unit,CPU),还可以是其他通用处理器、数字信号处理器(Digital Signal Processor,DSP)、专用集成电路(Application Specific Integrated Circuit,ASIC)、现成可编程门阵列(Field-Programmable Gate Array,FPGA)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
所述存储器41可以是所述终端设备4的内部存储单元,例如终端设备4的硬盘或内存。所述存储器41也可以是所述终端设备4的外部存储设备,例如所述终端设备4上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card,FC)等。进一步地,所述存储器41还可以既包括所述终端设备4的内部存储单元也包括外部存储设备。所述存储器41用于存储所述计算机程序以及所述终端设备所需的其他程序和数据。所述存储器41还可以用于暂时地存储已经输出或者将要输出的数据。
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本申请的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
所述集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储介质中。
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

Claims (10)

1.一种证件图像提取方法,其特征在于,包括:
获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;
根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;
根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;
根据所述证件图像的位置,从所述平衡图像中提取出所述证件图像。
2.如权利要求1所述的证件图像提取方法,其特征在于,所述根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件的位置之前,还包括:
采集历史证件图像,并对所述历史证件图像按照预设的目标图像要求进行筛选,得到目标图像;
根据预设的证件图像模板识别所述目标图像中的像素,在所述目标图像中确定至少一个像素作为中心像素点;
设置训练模型的初始权值,根据所述初始权值、每个所述中心像素点和所述中心像素点周围的像素点的像素值计算证件图像的输出位置,并根据所述输出位置和预设的期望位置之间的差值调整所述初始权值得到目标权值,根据所述目标权值确定基于神经网络的证件特征模型。
3.如权利要求2所述的证件图像提取方法,其特征在于,所述根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件的位置,包括:
若根据所述证件特征模型得到的所述证件的位置与所述证件的实际位置之间的距离差值大于或者等于预设的差值阈值,则修正所述证件特征模型的初始参数。
4.如权利要求3所述的证件图像提取方法,其特征在于,所述若根据所述证件特征模型得到的所述证件的位置与所述证件的实际位置之间的距离差值大于或者等于预设的差值阈值,则修正所述证件特征模型的初始参数,包括:
确定根据所述证件特征模型得到的所述证件的位置与所述证件的实际位置之间的距离差值;
若所述距离差值大于或者等于所述差值阈值,则根据如下公式校正所述证件特征模型的初始参数:其中:wij(k)用于表示第k次训练时的权值;wij(k+1)用于表示第k+1次训练时的权值;η用于表示学习速率且η>0;E(k)用于表示前k次训练得到的证件图像的位置的期望值。
5.如权利要求1-4任一项所述的证件图像提取方法,其特征在于,所述根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像,包括:
根据所述原始图像中的每个所述像素点在红、绿、蓝三个颜色分量中的分量值,估算所述原始图像中每个所述像素点的平均色差;
根据每个所述像素点的所述平均色差,计算每个所述像素点在红、绿、蓝三个颜色分量中增益量;
根据所述增益量,校正所述原始图像中的每个所述像素点的色温,得到所述平衡图像。
6.一种终端设备,其特征在于,包括存储器以及处理器,所述存储器中存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时,实现如下步骤:
获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;
根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;
根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;
根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。
7.如权利要求6所述的终端设备,其特征在于,所述根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件的位置之前,还包括:
采集历史证件图像,并对所述历史证件图像按照预设的目标图像要求进行筛选,得到目标图像;
根据预设的证件图像模板对所述目标图像进行像素识别,在所述目标图像中确定至少一个中心像素点;
设置训练模型的初始参数,根据所述初始参数、每个所述中心像素点和所述中心像素点周围的像素点的像素值进行学习训练,得到基于神经网络的证件特征模型。
8.如权利要求6所述的终端设备,其特征在于,所述根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件的位置,包括:
若根据所述证件特征模型得到的所述证件的位置与所述证件的实际位置之间的距离差值大于或者等于预设的差值阈值,则修正所述证件特征模型的初始参数。
9.一种终端设备,其特征在于,包括:
获取单元,用于获取包含证件图像的原始图像;所述原始图像通过摄像装置拍摄得到;
处理单元,用于根据所述原始图像中的每个像素点在红、绿、蓝三个颜色分量中的分量值,对所述原始图像进行白平衡处理,得到平衡图像;
确定单元,用于根据预先训练好的证件特征模型,从所述平衡图像中确定所述证件图像的位置;所述证件特征模型为基于历史证件图像、证件图像模型以及预设的初始权值进行训练得到;
提取单元,用于根据所述证件图像的位置,从所述平衡图像中提取出所述证件的图像。
10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至5任一项所述方法的步骤。
CN201910023382.2A 2019-01-10 2019-01-10 证件图像提取方法及终端设备 Active CN109871845B (zh)

Priority Applications (5)

Application Number Priority Date Filing Date Title
CN201910023382.2A CN109871845B (zh) 2019-01-10 2019-01-10 证件图像提取方法及终端设备
PCT/CN2019/118133 WO2020143316A1 (zh) 2019-01-10 2019-11-13 证件图像提取方法及终端设备
JP2021500946A JP2021531571A (ja) 2019-01-10 2019-11-13 証明書画像抽出方法及び端末機器
SG11202100270VA SG11202100270VA (en) 2019-01-10 2019-11-13 Certificate image extraction method and terminal device
US17/167,075 US11790499B2 (en) 2019-01-10 2021-02-03 Certificate image extraction method and terminal device

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910023382.2A CN109871845B (zh) 2019-01-10 2019-01-10 证件图像提取方法及终端设备

Publications (2)

Publication Number Publication Date
CN109871845A true CN109871845A (zh) 2019-06-11
CN109871845B CN109871845B (zh) 2023-10-31

Family

ID=66917644

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910023382.2A Active CN109871845B (zh) 2019-01-10 2019-01-10 证件图像提取方法及终端设备

Country Status (5)

Country Link
US (1) US11790499B2 (zh)
JP (1) JP2021531571A (zh)
CN (1) CN109871845B (zh)
SG (1) SG11202100270VA (zh)
WO (1) WO2020143316A1 (zh)

Cited By (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929725A (zh) * 2019-12-06 2020-03-27 深圳市碧海扬帆科技有限公司 证件分类方法、装置及计算机可读存储介质
CN111310746A (zh) * 2020-01-15 2020-06-19 支付宝实验室(新加坡)有限公司 文本行检测方法、模型训练方法、装置、服务器及介质
WO2020143316A1 (zh) * 2019-01-10 2020-07-16 平安科技(深圳)有限公司 证件图像提取方法及终端设备
CN112333356A (zh) * 2020-10-09 2021-02-05 支付宝实验室(新加坡)有限公司 一种证件图像采集方法、装置和设备
CN112613497A (zh) * 2020-02-21 2021-04-06 支付宝实验室(新加坡)有限公司 用于确定官方文件的真实性的方法和系统
TWI823084B (zh) * 2020-04-29 2023-11-21 大陸商上海耕岩智能科技有限公司 圖像修復方法及裝置、存儲介質、終端

Families Citing this family (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112132812B (zh) * 2020-09-24 2023-06-30 平安科技(深圳)有限公司 证件校验方法、装置、电子设备及介质
CN114399454A (zh) * 2022-01-18 2022-04-26 平安科技(深圳)有限公司 图像处理方法、装置、电子设备及存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4998637B1 (ja) * 2011-06-07 2012-08-15 オムロン株式会社 画像処理装置、情報生成装置、画像処理方法、情報生成方法、制御プログラムおよび記録媒体
US20130182077A1 (en) * 2012-01-17 2013-07-18 David Holz Enhanced contrast for object detection and characterization by optical imaging
CN105120167A (zh) * 2015-08-31 2015-12-02 广州市幸福网络技术有限公司 一种证照相机及证照拍摄方法
WO2016207875A1 (en) * 2015-06-22 2016-12-29 Photomyne Ltd. System and method for detecting objects in an image
US20180276493A1 (en) * 2016-03-02 2018-09-27 Ping An Technology (Shenzhen) Co., Ltd. Method, device, system, and storage medium for automatically extracting a validity period of a driving license
US20180300578A1 (en) * 2014-06-27 2018-10-18 Blinker, Inc. Method and apparatus for identifying vehicle information from an image

Family Cites Families (18)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP3213230B2 (ja) * 1996-02-23 2001-10-02 株式会社ピーエフユー 画像データ読取装置
JP3393168B2 (ja) * 1996-07-26 2003-04-07 シャープ株式会社 画像入力装置
JP2006129442A (ja) * 2004-09-30 2006-05-18 Fuji Photo Film Co Ltd 画像補正装置および方法,ならびに画像補正プログラム
JP4677226B2 (ja) * 2004-12-17 2011-04-27 キヤノン株式会社 画像処理装置及び方法
JP4227135B2 (ja) * 2005-11-25 2009-02-18 株式会社東芝 光学的文字読取装置及びカラーバランス調整方法
JP2009239323A (ja) * 2006-07-27 2009-10-15 Panasonic Corp 映像信号処理装置
CN101038686B (zh) * 2007-01-10 2010-05-19 北京航空航天大学 一种基于信息融合的机读旅行证件识别方法
US8452089B2 (en) * 2011-03-31 2013-05-28 Sony Corporation System and method for effectively performing an image identification procedure
CN102147860A (zh) * 2011-05-16 2011-08-10 杭州华三通信技术有限公司 一种基于白平衡的车牌识别方法和装置
KR101901591B1 (ko) * 2011-11-01 2018-09-28 삼성전자주식회사 얼굴 인식 장치 및 그 제어방법
JP2013197848A (ja) * 2012-03-19 2013-09-30 ▲うぇい▼強科技股▲ふん▼有限公司 スキャナのためのオートホワイトバランス調整方法
CN105825243A (zh) * 2015-01-07 2016-08-03 阿里巴巴集团控股有限公司 证件图像检测方法及设备
JP2017059207A (ja) * 2015-09-18 2017-03-23 パナソニック インテレクチュアル プロパティ コーポレーション オブ アメリカPanasonic Intellectual Property Corporation of America 画像認識方法
WO2018173108A1 (ja) * 2017-03-21 2018-09-27 富士通株式会社 関節位置推定装置、関節位置推定方法及び関節位置推定プログラム
CN107844748B (zh) * 2017-10-17 2019-02-05 平安科技(深圳)有限公司 身份验证方法、装置、存储介质和计算机设备
US10831821B2 (en) * 2018-09-21 2020-11-10 International Business Machines Corporation Cognitive adaptive real-time pictorial summary scenes
KR20200076461A (ko) * 2018-12-19 2020-06-29 삼성전자주식회사 중첩된 비트 표현 기반의 뉴럴 네트워크 처리 방법 및 장치
CN109871845B (zh) * 2019-01-10 2023-10-31 平安科技(深圳)有限公司 证件图像提取方法及终端设备

Patent Citations (7)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
JP4998637B1 (ja) * 2011-06-07 2012-08-15 オムロン株式会社 画像処理装置、情報生成装置、画像処理方法、情報生成方法、制御プログラムおよび記録媒体
US20130182077A1 (en) * 2012-01-17 2013-07-18 David Holz Enhanced contrast for object detection and characterization by optical imaging
US20180300578A1 (en) * 2014-06-27 2018-10-18 Blinker, Inc. Method and apparatus for identifying vehicle information from an image
WO2016207875A1 (en) * 2015-06-22 2016-12-29 Photomyne Ltd. System and method for detecting objects in an image
CN105120167A (zh) * 2015-08-31 2015-12-02 广州市幸福网络技术有限公司 一种证照相机及证照拍摄方法
US20180276493A1 (en) * 2016-03-02 2018-09-27 Ping An Technology (Shenzhen) Co., Ltd. Method, device, system, and storage medium for automatically extracting a validity period of a driving license
JP2018533808A (ja) * 2016-03-02 2018-11-15 平安科技(深▲せん▼)有限公司 運転免許証有効期限自動抽出方法、装置、システム及び記憶媒体

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
吴遹 等: "一种机读旅行证件信息自动识别方法", 计算机工程与应用, vol. 43, no. 23, pages 236 - 238 *

Cited By (10)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020143316A1 (zh) * 2019-01-10 2020-07-16 平安科技(深圳)有限公司 证件图像提取方法及终端设备
US11790499B2 (en) 2019-01-10 2023-10-17 Ping An Technology (Shenzhen) Co., Ltd. Certificate image extraction method and terminal device
CN110929725A (zh) * 2019-12-06 2020-03-27 深圳市碧海扬帆科技有限公司 证件分类方法、装置及计算机可读存储介质
CN110929725B (zh) * 2019-12-06 2023-08-29 深圳市碧海扬帆科技有限公司 证件分类方法、装置及计算机可读存储介质
CN111310746A (zh) * 2020-01-15 2020-06-19 支付宝实验室(新加坡)有限公司 文本行检测方法、模型训练方法、装置、服务器及介质
CN111310746B (zh) * 2020-01-15 2024-03-01 支付宝实验室(新加坡)有限公司 文本行检测方法、模型训练方法、装置、服务器及介质
CN112613497A (zh) * 2020-02-21 2021-04-06 支付宝实验室(新加坡)有限公司 用于确定官方文件的真实性的方法和系统
TWI823084B (zh) * 2020-04-29 2023-11-21 大陸商上海耕岩智能科技有限公司 圖像修復方法及裝置、存儲介質、終端
CN112333356A (zh) * 2020-10-09 2021-02-05 支付宝实验室(新加坡)有限公司 一种证件图像采集方法、装置和设备
CN112333356B (zh) * 2020-10-09 2022-09-20 支付宝实验室(新加坡)有限公司 一种证件图像采集方法、装置和设备

Also Published As

Publication number Publication date
US20210166015A1 (en) 2021-06-03
CN109871845B (zh) 2023-10-31
WO2020143316A1 (zh) 2020-07-16
US11790499B2 (en) 2023-10-17
SG11202100270VA (en) 2021-02-25
JP2021531571A (ja) 2021-11-18

Similar Documents

Publication Publication Date Title
CN109871845A (zh) 证件图像提取方法及终端设备
CN108319953B (zh) 目标对象的遮挡检测方法及装置、电子设备及存储介质
CN108596277B (zh) 一种车辆身份识别方法、装置和存储介质
Fang et al. Bottom-up saliency detection model based on human visual sensitivity and amplitude spectrum
CN107944379B (zh) 基于深度学习的眼白图像超分辨率重建与图像增强方法
CN105359162B (zh) 用于图像中的与脸部有关的选择和处理的图像掩模
CN105917353B (zh) 用于生物认证的特征提取及匹配以及模板更新
CN112215180B (zh) 一种活体检测方法及装置
CN109685100A (zh) 字符识别方法、服务器及计算机可读存储介质
WO2020258667A1 (zh) 图像识别方法及装置、非易失性可读存储介质、计算机设备
CN106022317A (zh) 人脸识别方法及装置
CN107316029B (zh) 一种活体验证方法及设备
Ou et al. A novel rank learning based no-reference image quality assessment method
CN110232326A (zh) 一种三维物体识别方法、装置及存储介质
CN112651333B (zh) 静默活体检测方法、装置、终端设备和存储介质
CN106709916A (zh) 图像质量评估方法及装置
CN109977832A (zh) 一种图像处理方法、装置及存储介质
CN108875759A (zh) 一种图像处理方法、装置及服务器
CN109409305A (zh) 一种人脸图像清晰度评价方法及装置
CN109117810A (zh) 疲劳驾驶行为检测方法、装置、计算机设备及存储介质
CN111784665A (zh) 基于傅里叶变换的oct图像质量评估方法、系统及装置
CN107369086A (zh) 一种身份证打码系统及方法
CN107590804A (zh) 基于通道特征和卷积神经网络的屏幕图像质量评价方法
CN109801224A (zh) 一种图片处理方法、装置、服务器和存储介质
CN108597172A (zh) 一种森林火灾识别方法、装置、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant