CN110276355A - 训练分类器的方法、装置、电子设备和计算机可读存储介质 - Google Patents

训练分类器的方法、装置、电子设备和计算机可读存储介质 Download PDF

Info

Publication number
CN110276355A
CN110276355A CN201910480429.8A CN201910480429A CN110276355A CN 110276355 A CN110276355 A CN 110276355A CN 201910480429 A CN201910480429 A CN 201910480429A CN 110276355 A CN110276355 A CN 110276355A
Authority
CN
China
Prior art keywords
card image
classifier
information
project
output
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN201910480429.8A
Other languages
English (en)
Inventor
卢永晨
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing ByteDance Network Technology Co Ltd
Original Assignee
Beijing ByteDance Network Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing ByteDance Network Technology Co Ltd filed Critical Beijing ByteDance Network Technology Co Ltd
Priority to CN201910480429.8A priority Critical patent/CN110276355A/zh
Publication of CN110276355A publication Critical patent/CN110276355A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • G06F18/2155Generating training patterns; Bootstrap methods, e.g. bagging or boosting characterised by the incorporation of unlabelled data, e.g. multiple instance learning [MIL], semi-supervised techniques using expectation-maximisation [EM] or naïve labelling
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N3/00Computing arrangements based on biological models
    • G06N3/02Neural networks
    • G06N3/04Architecture, e.g. interconnection topology
    • G06N3/045Combinations of networks
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/14Image acquisition
    • G06V30/148Segmentation of character regions
    • G06V30/153Segmentation of character regions using recognition of characters or words

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Data Mining & Analysis (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Artificial Intelligence (AREA)
  • General Engineering & Computer Science (AREA)
  • Evolutionary Computation (AREA)
  • Computing Systems (AREA)
  • Biomedical Technology (AREA)
  • General Health & Medical Sciences (AREA)
  • Computational Linguistics (AREA)
  • Biophysics (AREA)
  • Mathematical Physics (AREA)
  • Software Systems (AREA)
  • Molecular Biology (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Health & Medical Sciences (AREA)
  • Evolutionary Biology (AREA)
  • Multimedia (AREA)
  • Image Analysis (AREA)

Abstract

本公开公开了一种训练分类器的方法,其特征在于,包括:获取身份证图像集合,所述身份证图像集合中的身份证图像与标签信息对应,所述标签信息指示与所述标签信息对应的身份证图像的预设区域所包括的字符;确定分类器的输出项目,所述分类器的输出项目与所述标签信息对应;根据所述身份证图像集合训练所述分类器。本公开实施例提供的训练分类器的方法、装置、电子设备和计算机可读存储介质,能够根据身份证图像集合高效训练分类器,从而通过该分类器识别身份证图像对应的字符进而准确确定有效期项目信息,出生项目信息,和/或身份证号码项目信息,以便应用于各种身份证验证场景。

Description

训练分类器的方法、装置、电子设备和计算机可读存储介质
技术领域
本公开涉及信息处理领域,尤其涉及一种训练分类器的方法、装置、电子设备及计算机可读存储介质。
背景技术
随着网络技术的进步,互联网已经成为服务于各种业务的重要媒介,例如通过互联网处理诸如银行业务等重要业务时,需要获取用户的身份证图像,从而通过身份证图像提取用户的身份项目信息以用于身份证验证,从而开展重要业务。
在上述验证过程中,往往通过分类器从用户上传的身份证图像中提取诸如姓名,住址,有效期,出生,和身份证号码等身份项目信息,这些身份项目信息通过汉字,数字,和/或英文字母来表示,其中由于使用中的汉字的数量是非常巨大的(常用汉字大概在几千字),现有技术中,为了使分类器具有识别身份证图像中的上述身份项目信息的能力,分类器往往针对每一个汉字,数字,和英文字母都要设置相应的输出项目或者分类项目,这使得用于训练该分类器的训练集合中的图像的数量异常庞大,训练过程涉及的运算量也是巨大的,并且大量的输出项目对分类器的准确度也会造成不利影响。
需要指出的是,在大多数涉及身份证的验证过程中,可能关心的仅仅是身份证号码和/或身份证有效期等身份项目信息,而身份证号码和身份证有效期仅涉及数字和少量的汉字以及英文字母,并不涉及数量庞大的汉字,因此训练上述具有上千输出项目的分类器来识别身份证图像中的身份证号码和身份证有效期,不仅处理速度慢,并且识别效果可能并不理想。
发明内容
本公开实施例提供的训练分类器的方法、装置、电子设备和计算机可读存储介质,能够根据身份证图像集合高效训练分类器,从而通过该分类器识别身份证图像对应的字符进而准确确定有效期项目信息,出生项目信息,和/或身份证号码项目信息,以便应用于各种身份证验证场景。
第一方面,本公开实施例提供一种训练分类器的方法,其特征在于,包括:获取身份证图像集合,所述身份证图像集合中的身份证图像与标签信息对应,所述标签信息指示与所述标签信息对应的身份证图像的预设区域所包括的字符;确定分类器的输出项目,所述分类器的输出项目与所述标签信息对应;根据所述身份证图像集合训练所述分类器。
进一步的,所述标签信息包括13个子标签信息,所述13个子标签信息分别指示的所述字符包括数字0-9,字母X,汉字“长”,和汉字“期”。
进一步的,所述分类器的输出项目包括13个子输出项目,所述13个子输出项目分别与所述13个子标签信息对应。
进一步的,在获取身份证图像集合之后,包括:对所述身份证图像集合中的预设数量的身份证图像进行图像预处理,所述图像预处理包括如下处理方式中的一种或多种:缩放处理,拉伸处理,黑白处理,白光处理,和模糊处理。
进一步的,根据所述身份证图像集合训练所述分类器,包括:根据所述身份证图像集合和ResNet18卷积神经网络训练所述分类器。
进一步的,在根据所述身份证图像集合训练所述分类器之后,还包括:从终端设备接收待识别身份证图像;通过所述分类器确定与所述待识别身份证图像对应的所述输出项目的输出值。
进一步的,在通过所述分类器确定与所述待识别身份证图像对应的所述输出项目的输出值之后,还包括:根据所述输出项目的输出值确定所述待识别身份证图像对应的身份项目信息,所述身份项目信息包括如下中的一种或多种:有效期项目信息,出生项目信息,和身份证号码项目信息。
进一步的,在根据所述输出项目的输出值确定所述待识别身份证图像对应的身份项目信息之后,还包括:确定所述公民身份证号码项目信息与所述出生项目信息是否匹配。
第二方面,本公开实施例提供一种训练分类器的装置,其特征在于,包括:身份证图像集合获取模块,用于获取身份证图像集合,所述身份证图像集合中的身份证图像与标签信息对应,所述标签信息指示与所述标签信息对应的身份证图像的预设区域所包括的字符;输出项目确定模块,用于确定分类器的输出项目,所述分类器的输出项目与所述标签信息对应;训练模块,用于根据所述身份证图像集合训练所述分类器。
进一步的,所述标签信息包括13个子标签信息,所述13个子标签信息分别指示的所述字符包括数字0-9,字母X,汉字“长”,和汉字“期”。
进一步的,所述分类器的输出项目包括13个子输出项目,所述13个子输出项目分别与所述13个子标签信息对应。
进一步的,所述训练分类器的装置还包括预处理模块,所述预处理模块用于对所述身份证图像集合中的预设数量的身份证图像进行图像预处理,所述图像预处理包括如下处理方式中的一种或多种:缩放处理,拉伸处理,黑白处理,白光处理,和模糊处理。
进一步的,所述训练模块还用于:根据所述身份证图像集合和ResNet18卷积神经网络训练所述分类器。
进一步的,所述训练分类器的装置还包括接收模块和输出值确定模块,所述接收模块用于:从终端设备接收待识别身份证图像;所述输出值模块用于:通过所述分类器确定与所述待识别身份证图像对应的所述输出项目的输出值。
进一步的,所述训练分类器的装置还包括身份项目信息确定模块,所述身份项目信息确定模块用于:根据所述输出项目的输出值确定所述待识别身份证图像对应的身份项目信息,所述身份项目信息包括如下中的一种或多种:有效期项目信息,出生项目信息,和身份证号码项目信息。
进一步的,所述训练分类器的装置还包括匹配模块,所述匹配模块用于:确定所述公民身份证号码项目信息与所述出生项目信息是否匹配。
第三方面,本公开实施例提供一种电子设备,包括:存储器,用于存储计算机可读指令;以及与所述存储器耦合的一个或多个处理器,用于运行所述计算机可读指令,使得所述处理器运行时实现前述第一方面中的任一所述训练分类器的方法。
第四方面,本公开实施例提供一种非暂态计算机可读存储介质,其特征在于,所述非暂态计算机可读存储介质存储计算机指令,当所述计算机指令被计算机执行时,使得所述计算机执行前述第一方面中的任一所述训练分类器的方法。
本公开公开了一种训练分类器的方法、装置、电子设备和计算机可读存储介质。其中所述训练分类器的方法,其特征在于,包括:包括:获取身份证图像集合,所述身份证图像集合中的身份证图像与标签信息对应,所述标签信息指示与所述标签信息对应的身份证图像的预设区域所包括的字符;确定分类器的输出项目,所述分类器的输出项目与所述标签信息对应;根据所述身份证图像集合训练所述分类器。本公开实施例提供的训练分类器的方法、装置、电子设备和计算机可读存储介质,能够根据身份证图像集合高效训练分类器,从而通过该分类器识别身份证图像对应的字符进而准确确定有效期项目信息,出生项目信息,和/或身份证号码项目信息,以便应用于各种身份证验证场景。
上述说明仅是本公开技术方案的概述,为了能更清楚了解本公开的技术手段,而可依照说明书的内容予以实施,并且为让本公开的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。
附图说明
为了更清楚地说明本公开实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1为本公开实施例提供的训练分类器的方法实施例一的流程图;
图2为本公开提供的一种卷积神经网络模型示意图;
图3为本公开实施例提供的训练分类器的方法实施例二的流程图;
图4为本公开实施例提供的训练分类器的装置实施例的结构示意图;
图5为根据本公开实施例提供的电子设备的结构示意图。
具体实施方式
以下通过特定的具体实例说明本公开的实施方式,本领域技术人员可由本说明书所揭露的内容轻易地了解本公开的其他优点与功效。显然,所描述的实施例仅仅是本公开一部分实施例,而不是全部的实施例。本公开还可以通过另外不同的具体实施方式加以实施或应用,本说明书中的各项细节也可以基于不同观点与应用,在没有背离本公开的精神下进行各种修饰或改变。需说明的是,在不冲突的情况下,以下实施例及实施例中的特征可以相互组合。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
需要说明的是,下文描述在所附权利要求书的范围内的实施例的各种方面。应显而易见,本文中所描述的方面可体现于广泛多种形式中,且本文中所描述的任何特定结构及/或功能仅为说明性的。基于本公开,所属领域的技术人员应了解,本文中所描述的一个方面可与任何其它方面独立地实施,且可以各种方式组合这些方面中的两者或两者以上。举例来说,可使用本文中所阐述的任何数目个方面来实施设备及/或实践方法。另外,可使用除了本文中所阐述的方面中的一或多者之外的其它结构及/或功能性实施此设备及/或实践此方法。
还需要说明的是,以下实施例中所提供的图示仅以示意方式说明本公开的基本构想,图示中仅显示与本公开中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。
另外,在以下描述中,提供具体细节是为了便于透彻理解实例。然而,所属领域的技术人员将理解,可在没有这些特定细节的情况下实践所述方面。
本实施例提供的该训练分类器的方法可以由一个训练分类器的装置来执行,该装置可以实现为软件,可以实现为硬件,还可以实现为软件和硬件的组合,例如所述训练分类器的装置包括计算机设备,从而通过该计算机设备来执行本实施例提供的该训练分类器的方法,如本领域技术人员所理解的,计算机设备可以是台式或便携计算机设备,还可以是移动终端设备等。另外,本公开实施例涉及的分类器为可以为卷积神经网络分类器。
图1为本公开实施例提供的训练分类器的方法实施例一的流程图,如图1所示,本公开实施例的训练分类器的方法包括如下步骤:
步骤S101,获取身份证图像集合,所述身份证图像集合中的身份证图像与标签信息对应,所述标签信息指示与所述标签信息对应的身份证图像的预设区域所包括的字符;
需要通过训练集合训练分类器,因此在步骤S101中获取身份证图像集合作为训练集合以训练分类器。其中,所述身份证图像包括描绘或者显示身份证的图像区域。
由于本公开实施例希望通过训练分类器识别身份证图像中的身份项目信息,例如识别身份证图像中的有效期项目信息,出生项目信息,和身份证号码项目信息等,以便用于各种重要业务,因此对于作为训练集合的身份证图像集合,该身份证图像集合中的身份证图像需要与标签信息对应,所述标签信息用于指示身份证图像的预设区域所包括的字符,从而在训练分类器的过程中,可以将分类器的识别结果与所述标签信息进行比对,从而更新分类器的参数,实现训练目的。
本公开实施例中,所述标签信息用于指示与所述标签信息对应的身份证图像的预设区域所包括的字符,例如用于指示与所述标签信息对应的身份证图像的预设区域所描绘或者显示的字符具体是哪个字符。在一个可选的实施例中,所述标签信息包括13个子标签信息,所述13个子标签信息分别指示的所述字符包括数字0-9,字母X,汉字“长”,和汉字“期”,作为示例,当所述身份证图像集合中的一个身份证图像与指示字母X的子标签信息对应时,意味着所述一个身份证图像的所述预设区域所描绘或者显示的字符为字母X。
本公开实施例中,所述身份证图像集合中的每个身份证图像包括预设区域。作为一个可选的实施例,所述预设区域包括身份证图像的有效期项目区域,出生项目区域,和/或身份证号码项目区域。由于身份证具有标准的大小和标准的项目信息区域,因此所述预设区域的位置也是固定的,对于身份证图像,可以识别其中的描绘或者显示了身份证的图像区域,并根据比例和/或像素坐标等确定所述预设区域。作为示例,所述身份证图像集合中的一个身份证图像的所述预设区域包括身份证号码项目区域,例如包括身份证号码项目区域的预设位的区域,在这个示例中,如果所述预设区域包括身份证号码区域的最后一位的区域,该一个身份证图像可以对应一个标签信息例如是指示数字0的子标签信息,这意味着所述一个身份证图像的身份证号码项目区域的最后一位的区域所描绘或者显示的字符为数字0。值得说明的是,所述身份证图像集合中各身份证图像可以包括相同的预设区域,也可以包括不同的预设区域,本公开对此不做限定,作为示例,所述身份证图像集合中的一个身份证图像的所述预设区域包括身份证号码项目区域的第一位的区域,所述身份证图像集合中的又一个身份证图像的所述预设区域包括出生项目区域的第一位的区域,在这个示例中,如果所述一个身份证图像对应的标签信息例如是指示数字5的子标签信息,这意味着所述一个身份证图像的身份证号码项目区域的第一位的区域所描绘或者显示的字符为数字5,如果所述又一个身份证图像对应的标签信息例如是指示数字1的子标签信息,这意味着所述又一个身份证图像的出生项目区域的第一位的区域所描绘或者显示的字符为数字1。
在一个可选的实施例中,所述身份证图像集合中的身份证图像包括多个预设区域,所述身份证图像集合中的身份证图像与标签信息对应,包括:所述身份证图像集合中的身份证图像的多个预设区域分别与所述标签信息对应。例如所述身份证图像集合中的一个身份证图像的预设区域包括身份证号码项目区域的第一位,第三位,和第五位的区域,其中第一位和第三位的区域对应的标签信息例如是指示数字1的子标签信息,这意味着所述一个身份证图像的身份证号码项目区域的第一位和第三位的区域所描绘或者显示的字符为数字1,其中第五位的区域对应的标签信息例如是指示数字2的子标签信息,这意味着所述一个身份证图像的身份证号码项目区域的第五位的区域所描绘或者显示的字符为数字2。
本领域技术人员能够明确,本公开实施例中的所述身份证图像集合中的身份证图像与所述标签信息对应,意味着所述身份证图像集合中的身份证图像与所述标签信息之间存在对应关系,作为不限制本公开实施例的示例,在计算机程序实现上,可以通过数组、表等数据结构将身份证图像与所述标签信息对应,以便用于训练分类器。并且,本领域技术人员可以理解,应尽量使得身份证图像的预设区域中描绘或者显示的字符与其对应的标签信息相匹配,从而才能在训练分类器的过程中,使得分类器正确地学习对应了不同标签信息的身份证图像中该预设区域中描绘或者显示的字符的图像特征,从而保证分类器具有较高的准确度。
本公开提供的训练分类器的方法,希望依此方法训练出的分类器能够对用户上传的身份证图像进行分类或识别,从而得到该上传的身份证图像对应的字符,进而准确确定有效期项目信息,出生项目信息,和/或身份证号码项目信息,而用户上传的身份证图像可能存在各种形式或状态,例如用户上传的身份证图像由于拍摄角度等存在形变,由于拍摄环境存在反光,或者上传的身份证图像是黑白扫描件等,因此,希望步骤S101中所获取的身份证图像集合能够包括上述形式或状态的身份证图像,从而基于该身份证图像集合训练所述分类器,以期提高分类器对上述各种形式或状态的身份证图像的识别能力。但是通过网络抓取等方式获得上述形式或状态的身份证图像的开销较大,并且不一定能够精确获得满足要求的身份证图像,因此,为了减少获取上述各种形式或状态的身份证图像的开销,提高分类器对各种形式或状态的身份证图像的识别能力,在一个可选的实施例中,在步骤S101获取身份证图像集合之后,包括:对所述身份证图像集合中的预设数量的身份证图像进行图像预处理,所述图像预处理包括如下处理方式中的一种或多种:缩放处理,拉伸处理,黑白处理,白光处理,和模糊处理。其中所述预设数量可以是事先配置的数量,也可以通过实现配置的预设比例来确定,例如从所述身份证图像集合中随机选取10%这一预设比例的身份证图像进行所述图像预处理。所述缩放处理包括调整身份证图像的大小,所述拉伸处理包括调整身份证图像的形变角度,所述黑白处理包括将身份证图像的色彩调整为黑白,所述白光处理包括为身份证图像增加光斑或调整明暗等,所述模糊处理包括为身份证图像增加模糊效果。通过上述预处理,能够将所述身份证图像集合中预设数量的身份证图像处理为或者模拟为前述的各种形式和状态,从而基于预处理后的身份证图像训练分类器,能够提高分类器的识别能力。值得说明的是,本公开实施例中并不限定对身份证图像进行预处理时所采用的图像处理技术,任何现有的,将来的图像处理技术均可以用于本公开实施例,以将身份证图像处理为或者模拟为前述的各种形式和状态。
步骤S102,确定分类器的输出项目,所述分类器的输出项目与所述标签信息对应;
如同本领域技术人员所理解的,作为训练集合的所述身份证图像集合,其中的身份证图像所对应的标签信息指示的身份证图像的预设区域中的字符的数量,与依此训练集合所训练的分类器的分类结果的输出项目具有对应关系,在通常情况下,分类器的分类结果的输出项目的数量等于步骤S101中获取的所述身份证图像集合中的身份证图像对应的标签信息所指示的字符的数量,参照前述实施例,所述身份证图像集合对应的所述标签信息包括13个子标签信息,所述13个子标签信息分别指示的所述字符包括数字0-9,字母X,汉字“长”,和汉字“期”,那么依此图像集合所训练出的卷积神经网络分类器的分类结果包括13个输出项目,所述13个输出项目分别与所述13个字标签信息对应。
步骤S102中的分类器的输出项目用于表示分类器的分类结果,如本领域技术人员所理解的,根据分类器所采用的计算方式的不同,分类器的输出项目可以通过多种形式表示分类结果,作为一个可选的实施例,分类器的各输出项目中某一个输出项目输出的值为A(例如A=1),其他输出项目输出的值为B(例如B=0),则意味着输出的值为A的输出项目指示了分类器对输入图像的分类,作为示例,分类器的输出项目包括N个输出项目,对于输入到卷积神经网络分类器的一个身份证图像,所述N个输出项目中的一个输出项目的输出值为1,所述N个输出项目的其他输出值为0,所述一个输出项目对应的标签信息指示与其对应的身份证图像的预设区域中的字符为汉字“期”,那么根据该分类器的输出项目的输出值可知,该分类器将该一个身份证图像的预设区域中的字符分类或者识别为汉字“期”;作为又一个可选的实施例,所述分类器的输出项目的输出值的和为1,作为示例,例如训练的所述分类器的每个输出项目所输出的值大于或者等于0并且小于或者等于1,所述分类器的各输出项目所输出的值的和为1,即分类器的每个输出项目所输出的值代表所述分类器对输入的身份证图像的分类概率,概率值最大的输出项目指示了分类器对输入的身份证图像的分类。值得说明的是,通过所述分类器可以对输入的身份证图像的多个预设区域中的每一个预设区域进行识别或分类,例如对输入的身份证图像的身份证号码项目区域的十八位数字或字母分别进行识别或分类,从而得到所述输入的身份证图像中的身份证号码项目信息。
步骤S103,根据所述身份证图像集合训练所述分类器。
在步骤S101中确定了训练所述分类器的身份证图像集合,在步骤S102中确定了所述分类器的输出项目,故在步骤S103中可以根据所述身份证图像集合训练所述分类器,所述分类器的输出项目包括在所述步骤S102中所确定的分类器的输出项目。
可选的,步骤S103包括:根据所述身份证图像集合和卷积神经网络训练所述分类器。基于卷积神经网络训练的分类器也可以称为卷积神经网络分类器。可选的,所述卷积神经网络包括但不限于ResNet18,MobileNetV2,AlexNet,googleNet,VGGNet,DenseNet等。
本领域技术人员能够理解,不同的卷积神经网络具有不同的架构,这体现在可能包括不同的层以及不同数量的层。如图2所示,典型的卷积神经网络的框架包括卷积层、非线性层、池化层、以及完全连接层。
卷积层主要用于从输入图像中提取图像特征,可以通过一个或多个过滤器(也称特征探测器)按照预设的步长从输入图像中提取图像特征。如本领域技术人员所理解的,图像由像素构成,可以通过颜色参数和位置参数表征图像中的每一个像素,例如输入图像包括48*48个像素,通过5*5的过滤器按照步长为1提取器图像特征可以得到卷积层所输出的44*44的图像特征矩阵。
卷积层之后可以连接非线性层或池化层,其中非线性层用于对卷积层输出的图像特征进行二次特征提取,池化层可以采用平均池化的方式或者最大池化的方式对卷积层或非线性层的输出结果进行处理,能够降低图像特征的维度,减少运算次数。
卷积神经网络的最后为完全连接层,完全连接层的最后一层为输出层,也可以称为卷积神经网络分类器的输出层,完全连接层接收之前的层的图像特征,并对所述图像特征进行层层处理,最终,经过处理的图像特征输入到输出层,在输出层中通过激活函数对该图像特征进行计算,并将计算结果映射到输出层所包括的多个输出项目,该多个输出项目可以作为卷积神经网络分类器的输出项目。
在基于卷积神经网络训练卷积神经网络分类器的过程中,对于训练集合中的图像,会输入到卷积神经网络,按照卷积神经网络的架构层层计算和处理,最终在完全连接层的输出层输出分类结果,然后根据该分类结果与图像的标签信息进行比对以构造损失函数,在通过梯度下降等算法根据该损失函数更新训练过程中涉及的权重和偏置等参数之后,再根据更新后的参数重新计算分类结果,如此迭代,在得到最优的分类结果后完成对卷积神经网络分类器的训练,从而对于输入的图像,可以通过该卷积神经网络分类器进行分类和/或识别。
因此在步骤S103中,按照上述方式,将身份证图像集合中的身份证图像输入到卷积神经网络,针对各身份证图像的预设区域等,可通过各个层的特征提取和计算以训练卷积神经网络分类器,以期通过该训练完成的卷积神经网络分类器识别输入图像的预设区域中的字符,进而获得相应的身份项目信息。
如图3所示,在本公开的计算机程序保护方法实施例二中,在步骤S103:根据所述身份证图像集合训练所述分类器之后,还包括:
S301,从终端设备接收待识别身份证图像;
S302,通过所述分类器确定与所述待识别身份证图像对应的所述输出项目的输出值。
通过步骤S103训练了所述分类器,因此可以应用所述分类器对接收的待识别身份证图像进行识别或分类,即通过分类器确定与所述待识别身份证图像对应的分类结果,故在步骤S301中从终端设备接收待识别身份证图像,并且在步骤S302中通过所述分类器确定与所述待识别身份证图像对应的输出项目的输出值,关于输出项目的输出值的表现形式,可以参照之前的描述,此处不再赘述。其中,所述终端设备例如是智能手机,台式机,笔记本电脑等。另外,本领域技术人员能够明确,通过步骤S301和S302对输入图像进行分类或者识别的过程,实际上与训练分类器时对训练集合中的身份证图像进行处理的过程相同,但是在步骤S301和S302中对接收的待识别身份证图像进行分类或者识别时,不需要根据分类结果更新训练分类器时所涉及的参数,只需要通过分类器给出分类结果。
如前所述,身份证具有标准的大小和标准的项目信息区域,因此对于从终端设备接收的身份证图像,可以通过分类器对其中的身份证对应的图像区域中的预设位置进行识别,所述预设位置包括有效期项目信息对应的位置,出生项目信息对应的位置,和身份证号码项目信息对应的位置。作为示例,所述预设位置包括身份证号码项目信息对应的位置,从而在步骤S302中将对步骤S301中接收的待识别身份证图像的身份证号码项目信息对应的十八位数字和/或字母的位置进行识别,例如通过所述分类器分别对十八位中的每一个位进行识别。
可选的,在步骤S302:通过所述分类器确定与所述待识别身份证图像对应的所述输出项目的输出值之后,还包括:
S303,根据所述输出项目的输出值确定所述待识别身份证图像对应的身份项目信息,所述身份项目信息包括如下中的一种或多种:有效期项目信息,出生项目信息,和身份证号码项目信息。参见前述实施例,在步骤S302中通过分类器分别对十八位中的每一个位进行识别,也就获得了身份证号码项目信息对应的位置的十八位数字和/或字母中每一个位的分类结果,例如对于其中的第一位,其分类结果中与指示数字1的子标签信息对应的输出项目的输出值为1,其他输出值为0,那么根据其分类结果的各输出项目的输出值可以确定该身份证号码项目信息的第一位为1,类似地,可以确定十八位中的其他位,从而得到所述身份证号码项目信息。
可选的,在步骤S303:根据所述输出项目的输出值确定所述待识别身份证图像对应的身份项目信息之后,还包括:
S304:确定所述公民身份证号码项目信息与所述出生项目信息是否匹配。根据身份证号码项目信息的编码规则,十八位身份证号码中的第7到第14位的数字应当与出生项目信息一致,均表示身份证持有人的出生日期,因此在步骤S304中,可以根据在步骤S303中确定的所述公民身份证号码项目信息与所述出生项目信息确定其是否一致,从而确定在步骤S301中接收的待识别身份证图像是否是真实的身份证图像。
图4所示为本公开实施例提供的训练分类器的装置400实施例的结构示意图,如图4所示,所述训练分类器的装置400包括身份证图像集合获取模块401,输出项目确定模块402,训练模块403。
其中,所述身份证图像集合获取模块401,用于获取身份证图像集合,所述身份证图像集合中的身份证图像与标签信息对应,所述标签信息指示与所述标签信息对应的身份证图像的预设区域所包括的字符;所述输出项目确定模块402,用于确定分类器的输出项目,所述分类器的输出项目与所述标签信息对应;所述训练模块403,用于根据所述身份证图像集合训练所述分类器。
可选的,所述训练分类器的装置400还包括接收模块404,所述接收模块404用于从终端设备接收待识别身份证图像。可选的,所述训练分类器的装置400还包括输出值确定模块,所述输出值确定模块用于通过所述分类器确定与所述待识别身份证图像对应的所述输出项目的输出值。可选的,所述训练分类器的装置400还包括身份项目信息确定模块,所述身份项目信息确定模块用于根据所述输出项目的输出值确定所述待识别身份证图像对应的身份项目信息。可选的,所述训练分类器的装置400还包括匹配模块,所述匹配模块用于确定所述公民身份证号码项目信息与所述出生项目信息是否匹配。
图4所示装置可以执行图1和/或图3所示实施例的方法,本实施例未详细描述的部分,可参考对图1和/或图3所示实施例的相关说明。该技术方案的执行过程和技术效果参见图1和/或图3所示实施例中的描述,在此不再赘述。
下面参考图5,其示出了适于用来实现本公开实施例的电子设备500的结构示意图。本公开实施例中的电子设备可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、PDA(个人数字助理)、PAD(平板电脑)、PMP(便携式多媒体播放器)、车载终端(例如车载导航终端)等等的移动终端以及诸如数字TV、台式计算机等等的固定终端。图5示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
如图5所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(ROM)502中的程序或者从存储装置508加载到随机访问存储器(RAM)503中的程序而执行各种适当的动作和处理。在RAM 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、ROM 502以及RAM 503通过总线或通信线路504彼此相连。输入/输出(I/O)接口505也连接至总线或通信线路504。
通常,以下装置可以连接至I/O接口505:包括例如触摸屏、触摸板、键盘、鼠标、图像传感器、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(LCD)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图5示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以替代地实施或具备更多或更少的装置。
特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从ROM 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如包括但不限于电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(EPROM或闪存)、光纤、便携式紧凑磁盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、RF(射频)等等,或者上述的任意合适的组合。
上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备执行上述实施例中的训练卷积神经网络分类器的方法。
可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括面向对象的程序设计语言-诸如Java、Smalltalk、C++,还包括常规的过程式程序设计语言-诸如“C”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络-包括局域网(LAN)或广域网(WAN)-连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。

Claims (11)

1.一种训练分类器的方法,其特征在于,包括:
获取身份证图像集合,所述身份证图像集合中的身份证图像与标签信息对应,所述标签信息指示与所述标签信息对应的身份证图像的预设区域所包括的字符;
确定分类器的输出项目,所述分类器的输出项目与所述标签信息对应;
根据所述身份证图像集合训练所述分类器。
2.根据权利要求1所述的训练分类器的方法,其特征在于,所述标签信息包括13个子标签信息,所述13个子标签信息分别指示的所述字符包括数字0-9,字母X,汉字“长”,和汉字“期”。
3.根据权利要求2所述的训练分类器的方法,其特征在于,所述分类器的输出项目包括13个子输出项目,所述13个子输出项目分别与所述13个子标签信息对应。
4.根据权利要求1所述的训练分类器的方法,其特征在于,在获取身份证图像集合之后,包括:
对所述身份证图像集合中的预设数量的身份证图像进行图像预处理,所述图像预处理包括如下处理方式中的一种或多种:
缩放处理,拉伸处理,黑白处理,白光处理,和模糊处理。
5.根据权利要求1-4中任一权利要求所述的训练分类器的方法,其特征在于,根据所述身份证图像集合训练所述分类器,包括:
根据所述身份证图像集合和ResNet18卷积神经网络训练所述分类器。
6.根据权利要求5所述的训练分类器的方法,其特征在于,在根据所述身份证图像集合训练所述分类器之后,还包括:
从终端设备接收待识别身份证图像;
通过所述分类器确定与所述待识别身份证图像对应的所述输出项目的输出值。
7.根据权利要求6所述的训练分类器的方法,其特征在于,在通过所述分类器确定与所述待识别身份证图像对应的所述输出项目的输出值之后,还包括:
根据所述输出项目的输出值确定所述待识别身份证图像对应的身份项目信息,所述身份项目信息包括如下中的一种或多种:
有效期项目信息,出生项目信息,和身份证号码项目信息。
8.根据权利要求7所述的训练分类器的方法,其特征在于,在根据所述输出项目的输出值确定所述待识别身份证图像对应的身份项目信息之后,还包括:
确定所述公民身份证号码项目信息与所述出生项目信息是否匹配。
9.一种训练分类器的装置,其特征在于,包括:
身份证图像集合获取模块,用于获取身份证图像集合,所述身份证图像集合中的身份证图像与标签信息对应,所述标签信息指示与所述标签信息对应的身份证图像的预设区域所包括的字符;
输出项目确定模块,用于确定分类器的输出项目,所述分类器的输出项目与所述标签信息对应;
训练模块,用于根据所述身份证图像集合训练所述分类器。
10.一种电子设备,包括:
存储器,用于存储计算机可读指令;以及
处理器,用于运行所述计算机可读指令,使得所述处理器运行时实现根据权利要求1-8中任意一项所述的训练分类器的方法。
11.一种非暂态计算机可读存储介质,用于存储计算机可读指令,当所述计算机可读指令由计算机执行时,使得所述计算机执行权利要求1-8中任意一项所述的训练分类器的方法。
CN201910480429.8A 2019-06-04 2019-06-04 训练分类器的方法、装置、电子设备和计算机可读存储介质 Pending CN110276355A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201910480429.8A CN110276355A (zh) 2019-06-04 2019-06-04 训练分类器的方法、装置、电子设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201910480429.8A CN110276355A (zh) 2019-06-04 2019-06-04 训练分类器的方法、装置、电子设备和计算机可读存储介质

Publications (1)

Publication Number Publication Date
CN110276355A true CN110276355A (zh) 2019-09-24

Family

ID=67960415

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201910480429.8A Pending CN110276355A (zh) 2019-06-04 2019-06-04 训练分类器的方法、装置、电子设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN110276355A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929725A (zh) * 2019-12-06 2020-03-27 深圳市碧海扬帆科技有限公司 证件分类方法、装置及计算机可读存储介质

Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680161A (zh) * 2015-01-09 2015-06-03 安徽清新互联信息科技有限公司 一种身份证数字识别方法
CN106156712A (zh) * 2015-04-23 2016-11-23 信帧电子技术(北京)有限公司 一种基于自然场景下的身份证号码识别方法与装置
CN106874968A (zh) * 2016-12-21 2017-06-20 江苏国光信息产业股份有限公司 一种高效鲁棒的二代身份证真伪鉴别方法
CN108875722A (zh) * 2017-12-27 2018-11-23 北京旷视科技有限公司 字符识别与识别模型训练方法、装置和系统及存储介质
CN108960233A (zh) * 2018-06-13 2018-12-07 北京小米移动软件有限公司 识别身份证有效期的方法及装置
CN109829453A (zh) * 2018-12-29 2019-05-31 天津车之家数据信息技术有限公司 一种卡证中文字的识别方法、装置以及计算设备

Patent Citations (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN104680161A (zh) * 2015-01-09 2015-06-03 安徽清新互联信息科技有限公司 一种身份证数字识别方法
CN106156712A (zh) * 2015-04-23 2016-11-23 信帧电子技术(北京)有限公司 一种基于自然场景下的身份证号码识别方法与装置
CN106874968A (zh) * 2016-12-21 2017-06-20 江苏国光信息产业股份有限公司 一种高效鲁棒的二代身份证真伪鉴别方法
CN108875722A (zh) * 2017-12-27 2018-11-23 北京旷视科技有限公司 字符识别与识别模型训练方法、装置和系统及存储介质
CN108960233A (zh) * 2018-06-13 2018-12-07 北京小米移动软件有限公司 识别身份证有效期的方法及装置
CN109829453A (zh) * 2018-12-29 2019-05-31 天津车之家数据信息技术有限公司 一种卡证中文字的识别方法、装置以及计算设备

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN110929725A (zh) * 2019-12-06 2020-03-27 深圳市碧海扬帆科技有限公司 证件分类方法、装置及计算机可读存储介质
CN110929725B (zh) * 2019-12-06 2023-08-29 深圳市碧海扬帆科技有限公司 证件分类方法、装置及计算机可读存储介质

Similar Documents

Publication Publication Date Title
CN108427939B (zh) 模型生成方法和装置
CN107633218A (zh) 用于生成图像的方法和装置
CN108446387A (zh) 用于更新人脸注册库的方法和装置
CN107644209A (zh) 人脸检测方法和装置
CN109214343A (zh) 用于生成人脸关键点检测模型的方法和装置
CN110458918A (zh) 用于输出信息的方法和装置
CN108898185A (zh) 用于生成图像识别模型的方法和装置
CN110288049A (zh) 用于生成图像识别模型的方法和装置
CN109086719A (zh) 用于输出数据的方法和装置
CN108989882A (zh) 用于输出视频中的音乐片段的方法和装置
CN109829432A (zh) 用于生成信息的方法和装置
CN109815365A (zh) 用于处理视频的方法和装置
CN108491812A (zh) 人脸识别模型的生成方法和装置
CN110210501A (zh) 虚拟对象生成方法、电子设备及计算机可读存储介质
CN110047122A (zh) 渲染图像的方法、装置、电子设备和计算机可读存储介质
CN110532983A (zh) 视频处理方法、装置、介质和设备
CN108509921A (zh) 用于生成信息的方法和装置
CN109889893A (zh) 视频处理方法、装置及设备
CN109241934A (zh) 用于生成信息的方法和装置
CN110263918A (zh) 训练卷积神经网络的方法、装置、电子设备和计算机可读存储介质
CN110516099A (zh) 图像处理方法和装置
CN110381352A (zh) 虚拟礼物的显示方法、装置、电子设备及可读介质
CN109389660A (zh) 图像生成方法和装置
CN109117758A (zh) 用于生成信息的方法和装置
CN110222736A (zh) 训练分类器的方法、装置、电子设备和计算机可读存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
RJ01 Rejection of invention patent application after publication

Application publication date: 20190924

RJ01 Rejection of invention patent application after publication