CN109670480A - 图像判别方法、装置、设备及存储介质 - Google Patents

图像判别方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN109670480A
CN109670480A CN201811645429.0A CN201811645429A CN109670480A CN 109670480 A CN109670480 A CN 109670480A CN 201811645429 A CN201811645429 A CN 201811645429A CN 109670480 A CN109670480 A CN 109670480A
Authority
CN
China
Prior art keywords
character
image
score
discriminated
row
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN201811645429.0A
Other languages
English (en)
Other versions
CN109670480B (zh
Inventor
李力
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Shenzhen Hive Box Technology Co Ltd
Original Assignee
Shenzhen Hive Box Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Shenzhen Hive Box Technology Co Ltd filed Critical Shenzhen Hive Box Technology Co Ltd
Priority to CN201811645429.0A priority Critical patent/CN109670480B/zh
Publication of CN109670480A publication Critical patent/CN109670480A/zh
Application granted granted Critical
Publication of CN109670480B publication Critical patent/CN109670480B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/20Scenes; Scene-specific elements in augmented reality scenes
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V20/00Scenes; Scene-specific elements
    • G06V20/60Type of objects
    • G06V20/62Text, e.g. of license plates, overlay texts or captions on TV images
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V30/00Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
    • G06V30/10Character recognition
    • G06V30/28Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet
    • G06V30/287Character recognition specially adapted to the type of the alphabet, e.g. Latin alphabet of Kanji, Hiragana or Katakana characters

Landscapes

  • Engineering & Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Theoretical Computer Science (AREA)
  • Character Input (AREA)

Abstract

本发明实施例公开了一种图像判别方法、装置、设备及存储介质。该方法包括:获取待判别证件图像,以及与所述待判别证件图像对应的各个字符文本行;根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;根据各个所述归一化字符行得分确定所述待判别证件图像的图像得分;根据所述图像得分以及判别处理策略,生成与所述待判别证件图像对应的判别结果。上述技术方案通过逐层统计得分实现了对待判别证件图像的有效判别,进而可以根据待判别证件图像的判别结果执行匹配的信息解析操作。

Description

图像判别方法、装置、设备及存储介质
技术领域
本发明实施例涉及图像处理技术领域,尤其涉及一种图像判别方法、装置、设备及存储介质。
背景技术
随着网络技术的发展,一些应用程序(APP)在用户进行实名认证时,要求用户上传身份证照片,具体包括身份证正面照片和身份证反面照片。如何对用户上传的身份证照片进行判别,判别出是否对应为身份证正反面,并解析出对应的文字内容,直接影响着应用程序(APP)后处理的逻辑可靠性。
现有技术中,通常是预先构造身份证正面关键字和反面关键字,如果待判别图片经OCR(Optical Character Recognition,光学字符识别)识别后的文字与正面关键字匹配较多,则标定为身份证正面,反之则标定为身份证反面。
但是,上述判别方法过于粗糙,主要存在下述问题:
1、身份证正面的地址栏中通常包括大量字符,这些字符难以被充分利用。
2、在身份证OCR识别效果较差,识别出的字符较少时,难以根据关键字做出恰当的判别。
3、对于包含大量字符的非身份证图片(例如是与身份证大小相同的名片等),上述判别方法也难以有效区分。
发明内容
本发明实施例提供一种图像判别方法、装置、设备及存储介质,以优化现有技术中针对证件图像的图像判别方法,进而实现对证件图像的有效判别。
第一方面,本发明实施例提供了一种图像判别方法,包括:
获取待判别证件图像,以及与所述待判别证件图像对应的各个字符文本行;
根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;
根据各个所述归一化字符行得分确定所述待判别证件图像的图像得分;
根据所述图像得分以及判别处理策略,生成与所述待判别证件图像对应的判别结果。
第二方面,本发明实施例还提供了一种图像判别装置,包括:
获取模块,用于获取待判别证件图像,以及与所述待判别证件图像对应的各个字符文本行;
字符行计分模块,用于根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;
图像计分模块,用于根据各个所述归一化字符行得分确定所述待判别证件图像的图像得分;
图像判别模块,用于根据所述图像得分以及判别处理策略,生成与所述待判别证件图像对应的判别结果。
第三方面,本发明实施例还提供了一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如本发明任意实施例所提供的图像判别方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本发明任意实施例所提供的图像判别方法。
本发明实施例提供的一种图像判别方法、装置、设备及存储介质,通过首先获取待判别证件图像,以及与待判别证件图像对应的各个字符文本行,然后根据至少练个设定字符集合以及计分规则,分别计算各个字符文本含的归一化字符行得分,进而计算待判别证件图像的图像得分,最后根据图像得分和判别处理策略生成与待判别证件图像对应的判别结果的技术方案,也即通过逐层统计得分的技术方案,实现了对待判别证件图像的有效判别,进而可以根据待判别证件图像的判别结果执行匹配的信息解析操作。
附图说明
图1A是本发明实施例一中的一种图像判别方法的流程图;
图1B是本发明实施例一中的身份证正面图像示例图;
图2是本发明实施例二中的一种图像判别方法的流程图;
图3是本发明实施例三中的一种图像判别装置的结构示意图;
图4是本发明实施例四中的一种设备的硬件结构示意图。
具体实施方式
下面结合附图和实施例对本发明作进一步的详细说明。可以理解的是,此处所描述的具体实施例仅仅用于解释本发明,而非对本发明的限定。另外还需要说明的是,为了便于描述,附图中仅示出了与本发明相关的部分而非全部结构。
在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作(或步骤)描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
实施例一
图1A是本发明实施例一提供的一种图像判别方法的流程图,可适用于应用程序后台服务器针对用户上传的证件图像进行有效判别的情况,例如是判别用户上传的证件图像是否符合要求等,该方法可以由本发明实施例提供的图像判别装置来执行,该装置可采用软件和/或硬件的方式实现,并一般可集成在处理器中,例如是与应用程序对应的后台服务器的处理器中。
如图1A所示,本实施例的方法具体包括:
S110、获取待判别证件图像,以及与所述待判别证件图像对应的各个字符文本行。
具体的,待判别证件图像指的是用户在APP中上传的,用于验证用户身份的证件的图像,典型的,待判别证件图像包括下述至少一项:
待判别身份证图像、待判别驾驶证图像和待判别护照图像。
目前,在实际应用场景中,要求用户上传身份证图像(包括身份证正面图像和身份证反面图像)以验证用户身份的APP较为常见,因此,下述以待判别证件图像为待判别身份证图像为示例进行解释说明。类似的,也可以将本实施例提供的技术方案适应性调整后,应用于要求用户上传例如驾驶证图像或护照图像等证件图像以验证用户身份的应用场景中。
用户根据APP的实际要求,在身份证正面图像上传处上传待判别身份证正面图像,在身份证反面图像上传处上传待判别身份证反面图像,进而,获取待判别证件图像,具体指的是获取用户上传的待判别身份证正面图像和待判别身份证反面图像,其中,可以为待判别身份证正面图像添加正标签,为待判别身份证反面图像添加反标签,正标签用于指示该图像为用户针对身份证正面图像上传的,反标签用于指示该图像为用户针对身份证反面图像上传的。
然后,使用OCR识别模型对获取的待判别证件图像进行字符识别,进而可以获取与待判别证件图像对应的各个字符文本行。
以身份证正面图像为例,如图1B所示,获取的各个字符文本行分别为:
TextBox1:{姓名爱XXXX烨}
TextBox2:{性别男民族满}
TextBox3:{出生XXXX年X月X日}
TextBox4:{地址北京市XX区XXX街X号XXXXX宫}
TextBox5:{公民身份证号码00XXXXXXXXXXXXXX42}
值得指出的是,身份证正面图像中地址栏中的信息实际可能为1~3行,进而经OCR识别模型识别出的字符文本行为5~8个,在本实施例中,将与地址栏对应的1~3个字符文本行整合为一个字符文本行,进而获取到如上所述的5个字符文本行。具体的,可以根据识别出的字符文本行中的字符与模板字符进行匹配,例如,如果某个字符文本行与模板字符姓名匹配,则将该字符文本行的序号标记为1,如果某个字符文本行与模板字符地址匹配,则将该字符文本行的序号标记为3,如果某个字符文本行不能与任何模板字符地址匹配,且在图像中的位置位于地址栏区域,则将该字符文本行与地址字符文本行合并后作为序号标记为3的地址字符文本行。此处仅为示例性解释说明,本实施例对此不做具体限定。
类似的,与身份证反面图像对应的字符文本行为4个,如果根据OCR识别模型识别出的字符文本行为4个,则根据各个字符文本行在图像中的坐标位置信息由上向下进行顺序标号即可。
S120、根据至少两个设定字符集合以及计分规则,分别计算各个字符文本行的归一化字符行得分。
其中,至少两个设定字符集合是根据在APP中需要用户上传的证件确定的,每个字符集合分别与证件中的一面图像对应,例如是分别与身份证正反面图像对应,再例如是分别与驾驶证的主页附页图像对应等等。
典型的,与证件中的一面图像对应的设定字符集合中的字符即为该面图像中可能会出现的字符,不仅包括一定会出现的字符,还可以包括极易出现的字符,例如地址栏信息中极易出现的字符“号”、“道”、“路”、“房”、“单”、“元”、“栋”等。
作为本实施例一种具体的实施方式,可以将根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分,具体为:
根据第一证件面关键字符集合和第二证件面关键字符集合,以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;
其中,所述第一证件面关键字符集合与所述第二证件面关键字符集合没有字符交集。
典型的,针对身份证,第一证件面关键字符集合为正面关键字符集合,第二证件面关键字符集合为反面关键字符集合;针对驾驶证,第一证件面关键字符集合为主页关键字符集合,第二证件面关键字符集合为附页关键字符集合。
具体的,以身份证为例,正面关键字符集合P可以为{“姓”,“名”,“性”,“别”,“族”,“男”,“女”,“出”,“生”,“年”,“月”,“日”,“住”,“址”,“号”,“码”,“道”,“路”,“房”,“单”,“元”,“栋”},反面关键字符集合N可以为{“中”,“人”,“共”,“和”,“国”,“居”,“签”,“发”,“机”,“安”,“局”,“有”,“效”,“期”},正面关键字符集合P中的22个汉字仅在身份证正面中出现,反面关键字符集合N中的14个汉字仅在身份证正面中出现,也即这个两个字符集合没有字符交集,例如在身份证正面和反面均会出现的字符“民”既不在正面关键字符集合P,也不在反面关键字符集合N中,也即身份证正面和反面均会出现的字符不对字符行得分做出贡献。
首先可以根据至少两个设定字符集合以及计分规则,分别计算各个字符文本行的字符行得分,进而将各个字符行得分进行归一化,得到归一化字符行得分。
归一化的好处在于,可以消除各个字符行得分之间的量纲影响,将这些字符行得分经过标准化处理后,使各个字符行得分被限定在一定的范围内,进而使各个字符行得分之间具有可比性,从而消除了奇异得分数据导致的不良影响。
典型的,根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分,包括:
根据至少两个设定字符集合以及计分规则,分别计算各个字符文本行中每个字符的字符得分;根据每个字符文本行中每个字符的字符得分,分别计算对应的每个字符文本行的字符行得分;根据至少两个设定字符集合的字符数量,分别计算各个字符文本行的归一化字符行得分。
具体的,计分规则可以为:如果当前字符命中第一证件面关键字符集合,也即正面关键字符集合P,则当前字符的字符得分为1;如果当前字符命中第二证件面关键字符集合,也即正面关键字符集合N,则当前字符的字符得分为-1;如果当前字符没有命中任何一个关键字符集合,则当前字符的字符得分为0,具体公式如下:
其中,word为当前字符,WordScore(word)为当前字符word的得分。
字符行得分,由该字符文本行中命中正面关键字符集合P的字符数量和命中反面关键字符集合N的字符数量决定,例如,TextBox1中命中正面关键字符集合P的字符为“姓”和“名”,那么TextBox1的字符行得分为1+1=2,如果TextBox1中命中正面关键字符集合P的字符为“姓”和“名”,命中面关键字符集合N的字符为“发”,那么TextBox1的字符行得分为1+1+(-1)=1,具体公式如下:
其中,TextBoxn为当前字符文本行,BoxScore(TextBoxn)为当前字符文本行的字符行得分,word为TextBoxn中的字符。
接续前述举例,BoxScore(TextBox1)=2,BoxScore(TextBox2)=4,BoxScore(TextBox3)=5,BoxScore(TextBox4)=3,BoxScore(TextBox5)=0。
然后,根据正面关键字符集合P和反面关键字符集合N中的字符数量,对各个字符行得分进行归一化,以使后续的图像得分权重相同。
具体的,可以将每个字符文本行的字符行得分除以匹配的关键字符集合中的字符数量,例如,如果字符行得分为正值,则使用字符行得分除以正面关键字符集合P中的字符数量22,如果字符行得分为负值,则使用字符行得分除以反面关键字符集合N中的字符数量14,具体公式如下:
其中,BoxFinaScore(TextBoxn)为当前字符文本行的归一化字符行得分,BoxScore(TextBoxn)为当前字符文本行的字符行得分,NP为正面关键字符集合P中的字符数量,NN为反面关键字符集合N中的字符数量。
将上述公式由分段形式整理为连续形式为:
其中,sgn(x)为符号函数,当x>0时,sgn(x)=1;当x<0时,sgn(x)=-1。
接续前例,BoxFinaScore(TextBox1)=2/22,BoxFinaScore(TextBox2)=4/22,
BoxFinaScore(TextBox3)=5/22,BoxFinaScore(TextBox4)=3/22,
BoxFinaScore(TextBox5)=0/22。
S130、根据各个归一化字符行得分确定待判别证件图像的图像得分。
将与待判别证件图像对应的各个字符文本行的归一化字符行得分累加后,作为待判别证件图像的图像得分,公式如下:
其中,
Facen为当前待判别证件图像,FaceScore(Facen)为当前待判别证件图像的图像得分,TextBoxn为与当前待判别证件图像Facen对应的字符文本行。
接续前例,当前待判别证件图像的FaceScore=14/22。
S140、根据图像得分以及判别处理策略,生成与待判别证件图像对应的判别结果。
如果待判别证件图像为待判别身份证图像,则判别结果包括下述至少一项:
待判别证件图像为身份证正面图像,待判别证件图像为身份证反面图像,以及待判别证件图像为无效图像。
也即,在要求用户上传身份证正面图像和身份证反面图像的应用场景下,用户在身份证正面图像上传处上传了待判别身份证图像,根据前述处理得出待判别身份证图像的图像得分,进而根据该图像得分以及判别处理策略生成与待判别证件图像对应的判别结果,例如为“此待判别身份证图像是身份证正面图像”、“此待判别身份证图像不是身份证正面图像”、“此待判别身份证图像是无效图像”等。
典型的,可以将根据图像得分以及判别处理策略,生成与待判别证件图像对应的判别结果,具体为:
如果图像得分位于第一得分区间,则将待判别证件图像标定为第一证件面图像;如果图像得分位于第二得分区间,则将待判别证件图像标定为第二证件面图像;如果图像得分位于设定零值得分区间,则将待判别证件图像标定为无效图像。
例如,如果图像得分位于第一得分区间(0,1),则将待判别证件图像标定为身份证正面图像;如果图像得分位于第二得分区间(-1,0),则将待判别证件图像标定为身份证反面图像;如果图像得分为0,则将待判别证件图像标定为无效图像。
再例如,如果图像得分位于第一得分区间(1/100,1),则将待判别证件图像标定为身份证正面图像;如果图像得分位于第二得分区间(-1,-1/100),则将待判别证件图像标定为身份证反面图像;如果图像得分位于设定零值得分区间(-1/100,1/100),则将待判别证件图像标定为无效图像。此处仅为解释说明,本实施例对此不做具体限定。
进一步的,如果图像得分位于第一得分区间且低于第一设定阈值,或者,图像得分位于第二得分区间且高于第二设定阈值,则将待判别证件图像标定为残缺模糊类图像。
针对一些残缺模糊类图像,使用OCR识别模型对其进行识别的结果中可能仅包括部分有效字符,进而使图像得分较低。因此,设置第一设定阈值和第二设定阈值,用于区别待判别证件图像是否为残缺模糊类图像,具体阈值可以根据具体情况具体设置,本实施例对此不做具体限定。
例如,如果图像得分位于第一得分区间(1/100,1),且图像得分低于第一设定阈值5/22,则将待判别证件图像标定为身份证正面图像,同时也标定为残缺模糊类图像;如果图像得分位于第二得分区间(-1,-1/100),且图像得分高于第二设定阈值-5/14,则将待判别证件图像标定为身份证反面图像,同时也标定为残缺模糊类图像。
在本实施例中,通过OCR Hinge Loss算法重复研究证件各面(例如身份证正反面)中的字符分布及规律后,基于逐层统计分数的技术方案,最终确定待判别证件图像的图像得分,实现了对待判别证件图像的有效判别,例如确定出待判别身份证图像是身份证正面图像,是身份证反面图像还是无效图像,进而可以根据待判别证件图像的判别结果执行匹配的信息解析操作。其中,在逐层统计分数的过程中,对得分进行了归一化处理,使得针对不同待判别证件图像获得的最终图像得分具有可比性,消除了奇异得分数据导致的异常判别结果。
实施例二
图2是本发明实施例二提供的一种图像判别方法的流程图。本实施例以上述实施例为基础,提供了一种具体的实施方式。
具体的,在计算各个字符文本行的归一化字符行得分之前,还需要对各个字符文本字符行的有效性进行判定,进而执行忽略无效字符文本行,只对有效字符文本行的归一化字符行得分进行计算的操作。
进而,将根据所述至少两个设定字符集合的字符数量,分别计算所述各个字符文本行的归一化字符行得分,具体为:
根据各个字符文本行的字符行得分,以及与各个字符文本行分别匹配的字符行有效阈值,确定各个字符文本行中的各个有效字符文本行;
根据至少两个设定字符集合的字符数量,分别计算所述各个有效字符文本行的归一化字符行得分。
进一步的,还包括:如果待判别证件图像被标定为第一证件面图像或第二证件面图像,则将与待判别证件图像对应的各个字符文本行进行有效归类,并提取与对应类别匹配的属性值信息。
具体的,本实施例以待判别身份证图像为例进行解释说明,如图2所示,该图像判别方法具体包括:
S210、获取待判别身份证图像,以及与待判别身份证图像对应的各个字符文本行。
S220、根据正面关键字符集合和反面关键字符集合,以及计分规则,分别计算各个字符文本行中每个字符的字符得分。
S230、根据每个字符文本行中每个字符的字符得分,分别计算对应的每个字符文本行的字符行得分。
S240、根据各个字符文本行的字符行得分,以及与各个字符文本行分别匹配的字符行有效阈值,确定各个字符文本行中的各个有效字符文本行。
对于各个字符文本行的有效性判定,本实施例引入SVM Hinge Loss策略。
具体的,以身份证正面图像为例,预先根据身份证正面内容设置对应的匹配字符,例如,name:{“姓名”},sex:{“性别”},age:{“年龄”}等,而且,与各个匹配字符对应设置有字符行有效阈值,例如,与匹配字符name:{“姓名”}对应设置的姓名字符行有效阈值为1,与匹配字符sex:{“性别”}对应设置的性别字符行有效阈值为2等。
由于获取的与待判别身份证图像对应的字符文本行的顺序是与身份证正面图像或身份证反面图像中的内容顺序是一致的,进而,依次将各个字符文本行中的字符与匹配字符进行匹配,如果匹配成功,则获取对应的字符行有效阈值。
然后,根据字符文本行的字符行得分,以及对应的字符行有效阈值计算字符文本行的命中得分,公式具体为:
HitScore(TextBoxn)=max(0,BoxScore(TextBoxn)-Thrn),
其中,HitScore(TextBoxn)为当前字符文本行TextBoxn的命中得分,Thrn为与当前字符文本行TextBoxn对应的字符行有效阈值。
如果命中得分为0,则表明当前字符文本行TextBoxn没有命中,为无效字符文本行;如果命中得分不为0,则表明当前字符文本行TextBoxn命中,为有效字符文本行。
例如,BoxScore(TextBox1)=2,Thr1=1,
则HitScore(TextBox1)=max(0,2-1)=1,进而字符文本行TextBox1为有效字符文本行。
分别与待判别身份证图像对应的各个字符文本行进行如上判断,进而确定与待判别身份证图像对应的各个有效字符文本行。
S250、根据正面关键字符集合和反面关键字符集合的字符数量,分别计算各个有效字符文本行的归一化字符行得分。
S260、根据各个归一化字符行得分确定待判别身份证图像的图像得分。
将各个有效字符文本行的归一化字符行得分累加,作为待判别身份证图像的图像得分。
S270、对图像得分进行判断,如果图像得分位于第一得分区间且不低于第一设定阈值,则执行S280,如果图像得分位于第二得分区间且不高于第二设定阈值,则执行S290,如果图像得分位于第一得分区间且低于第一设定阈值,或者图像得分位于第二得分区间且高于第二设定阈值,则执行S2100,如果图像得分位于设定零值得分区间,则执行S2110。
S280、将待判别身份证图像标定为身份证正面图像,执行S2120。
S290、将待判别身份证图像标定为身份证反面图像,执行S2120。
S2100、将待判别身份证图像标定为残缺模糊类图像。
S2110、将待判别身份证图像标定为无效图像。
进一步的,还可以根据图像得分具体设置,将与待判别身份证图像对应的判别结果扩展至例如“图片为空”、“识别失败”、“输入图片非身份证”、“图片模糊”等多种状态。
S2120、将与待判别身份证图像对应的各个有效字符文本行进行归类,并提取与对应类别匹配的属性值信息。
如果待判别身份证图像为身份证正面图像或身份证反面图像,则对图像中的信息进行提取。首先,将各个有效字符文本行进行归类,然后再提取与对应类别匹配的属性信息。
具体的,归类公式可以为:
其中,TextBoxnClass为字符文本行TextBoxn的分类值,n为分类值,None为空类值,用于指示字符文本行TextBoxn为无效字符文本行。
预先根据身份证正面图像和身份证反面图像中的信息内容顺序设置分类值,例如身份证正面图像中1分类为姓名,2分类为性别民族,3分类为年龄,4分类为地址,5分类为身份号码。
举例说明,如果字符文本行TextBox1为有效字符文本行,归类值1分类,然后基于1分类中的姓名属性提取字符文本行TextBox1中的姓名属性值“爱XXXX烨”,并进行对应存储。以此类推,将各个有效字符文本行进行归类,并提取对应属性的属性值。
本实施例未尽详细解释之处,请详见前述实施例,在此不再赘述。
在上述技术方案中,基于SVM Hinge Loss策略,通过逐层竞争的思想,对各个字符文本行的有效性进行判定,进而实现对噪声文本有效地过滤,然后基于这些有效字符文本行确定待判别身份证图像的图像得分,进而根据图像分数完成对待判别身份证图像的有效判别。同时,在待判别身份证图像为正面或反面图像时,对这些有效字符文本行的归类,并提取对应类别的属性值信息,使身份证信息解析效果得到了保障。
实施例三
图3是本发明实施例三提供的一种图像判别装置的结构示意图,可适用于应用程序后台服务器针对用户上传的证件图像进行有效判别的情况,例如是判别用户上传的证件图像是否符合要求等,该装置可采用软件和/或硬件的方式实现,并一般可集成在处理器中,例如是与应用程序对应的后台服务器的处理器中。
如图3所示,该图像判别装置具体包括:获取模块310、字符行计分模块320、图像计分模块330和图像判别模块340,其中,
获取模块310,用于获取待判别证件图像,以及与所述待判别证件图像对应的各个字符文本行;
字符行计分模块320,用于根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;
图像计分模块330,用于根据各个所述归一化字符行得分确定所述待判别证件图像的图像得分;
图像判别模块340,用于根据所述图像得分以及判别处理策略,生成与所述待判别证件图像对应的判别结果。
本实施例提供的一种图像判别装置,通过首先获取待判别证件图像,以及与待判别证件图像对应的各个字符文本行,然后根据至少练个设定字符集合以及计分规则,分别计算各个字符文本含的归一化字符行得分,进而计算待判别证件图像的图像得分,最后根据图像得分和判别处理策略生成与待判别证件图像对应的判别结果的技术方案,也即通过逐层统计得分的技术方案,实现了对待判别证件图像的有效判别,进而可以根据待判别证件图像的判别结果执行匹配的信息解析操作。
进一步的,字符行计分模块320具体包括:字符计分单元、字符行计分单元和归一化字符行计分单元,其中,
字符计分单元,用于根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行中每个字符的字符得分;
字符行计分单元,用于根据每个字符文本行中每个字符的字符得分,分别计算对应的每个字符文本行的字符行得分;
归一化字符行计分单元,用于根据所述至少两个设定字符集合的字符数量,分别计算所述各个字符文本行的归一化字符行得分。
进一步的,归一化字符行计分单元包括:有效字符文本行确定子单元和归一化字符行计分子单元,其中,
有效字符文本行确定子单元,用于根据所述各个字符文本行的字符行得分,以及与所述各个字符文本行分别匹配的字符行有效阈值,确定所述各个字符文本行中的各个有效字符文本行;
归一化字符行计分子单元,用于根据所述至少两个设定字符集合的字符数量,分别计算所述各个有效字符文本行的归一化字符行得分。
具体的,字符行计分模块320用于根据第一证件面关键字符集合和第二证件面关键字符集合,以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;
其中,所述第一证件面关键字符集合与所述第二证件面关键字符集合没有字符交集。
进一步的,图像判别模块340包括:第一判别单元、第二判别单元和第三判别单元,其中,
第一判别单元,用于如果所述图像得分位于第一得分区间,则将所述待判别证件图像标定为第一证件面图像;
第二判别单元,用于如果所述图像得分位于第二得分区间,则将所述待判别证件图像标定为第二证件面图像;
第三判别单元,用于如果所述图像得分位于设定零值得分区间,则将所述待判别证件图像标定为无效图像。
进一步的,图像判别模块340还包括:第四判别单元,用于如果所述图像得分位于第一得分区间且低于第一设定阈值,或者,所述图像得分位于第二得分区间且高于第二设定阈值,则将待判别证件图像标定为残缺模糊类图像。
进一步的,该图像判别装置还包括:属性值提取模块,用于如果所述待判别证件图像被标定为所述第一证件面图像或所述第二证件面图像,则将与所述待判别证件图像对应的各个字符文本行进行有效归类,并提取与对应类别匹配的属性值信息。
具体的,所述待判别证件图像包括下述至少一项:
待判别身份证图像、待判别驾驶证图像和待判别护照图像;
如果所述待判别证件图像为所述待判别身份证图像,则所述判别结果包括下述至少一项:
所述待判别证件图像为身份证正面图像,所述待判别证件图像为身份证反面图像,以及所述待判别证件图像为无效图像。
上述图像判别装置可执行本发明任意实施例所提供的图像判别方法,具备执行图像判别方法相应的功能模块和有益效果。
实施例四
图4为本发明实施例四提供的一种设备的硬件结构示意图,如图4所示,该设备包括:
一个或多个处理器410,图4中以一个处理器410为例;
存储器420;
所述设备还可以包括:输入装置430和输出装置440。
所述设备中的处理器410、存储器420、输入装置430和输出装置440可以通过总线或者其他方式连接,图4中以通过总线连接为例。
存储器420作为一种非暂态计算机可读存储介质,可用于存储软件程序、计算机可执行程序以及模块,如本发明实施例中的一种图像判别方法对应的程序指令/模块(例如,附图3所示的获取模块310、字符行计分模块320、图像计分模块330和图像判别模块340,)。处理器310通过运行存储在存储器320中的软件程序、指令以及模块,从而执行计算机设备的各种功能应用以及数据处理,即实现上述方法实施例的一种图像判别方法。
存储器320可以包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需要的应用程序;存储数据区可存储根据计算机设备的使用所创建的数据等。此外,存储器320可以包括高速随机存取存储器,还可以包括非暂态性存储器,例如至少一个磁盘存储器件、闪存器件、或其他非暂态性固态存储器件。在一些实施例中,存储器320可选包括相对于处理器310远程设置的存储器,这些远程存储器可以通过网络连接至终端设备。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。
输入装置330可用于接收输入的数字或字符信息,以及产生与计算机设备的用户设置以及功能控制有关的键信号输入。输出装置340可包括显示屏等显示设备。
实施例五
本发明实施例五还提供一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行一种图像判别方法,该方法包括:
获取待判别证件图像,以及与所述待判别证件图像对应的各个字符文本行;
根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;
根据各个所述归一化字符行得分确定所述待判别证件图像的图像得分;
根据所述图像得分以及判别处理策略,生成与所述待判别证件图像对应的判别结果。
可选的,该计算机可执行指令在由计算机处理器执行时还可以用于执行本发明任意实施例所提供的一种图像判别方法的技术方案。
通过以上关于实施方式的描述,所属领域的技术人员可以清楚地了解到,本发明可借助软件及必需的通用硬件来实现,当然也可以通过硬件实现,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如计算机的软盘、只读存储器(Read-Only Memory,ROM)、随机存取存储器(RandomAccess Memory,RAM)、闪存(FLASH)、硬盘或光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述的方法。
值得注意的是,上述图像判别装置的实施例中,所包括的各个单元和模块只是按照功能逻辑进行划分的,但并不局限于上述的划分,只要能够实现相应的功能即可;另外,各功能单元的具体名称也只是为了便于相互区分,并不用于限制本发明的保护范围。
注意,上述仅为本发明的较佳实施例及所运用技术原理。本领域技术人员会理解,本发明不限于这里所述的特定实施例,对本领域技术人员来说能够进行各种明显的变化、重新调整和替代而不会脱离本发明的保护范围。因此,虽然通过以上实施例对本发明进行了较为详细的说明,但是本发明不仅仅限于以上实施例,在不脱离本发明构思的情况下,还可以包括更多其他等效实施例,而本发明的范围由所附的权利要求范围决定。

Claims (11)

1.一种图像判别方法,其特征在于,包括:
获取待判别证件图像,以及与所述待判别证件图像对应的各个字符文本行;
根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;
根据各个所述归一化字符行得分确定所述待判别证件图像的图像得分;
根据所述图像得分以及判别处理策略,生成与所述待判别证件图像对应的判别结果。
2.根据权利要求1所述的方法,其特征在于,根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分,包括:
根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行中每个字符的字符得分;
根据每个字符文本行中每个字符的字符得分,分别计算对应的每个字符文本行的字符行得分;
根据所述至少两个设定字符集合的字符数量,分别计算所述各个字符文本行的归一化字符行得分。
3.根据权利要求2所述的方法,其特征在于,根据所述至少两个设定字符集合的字符数量,分别计算所述各个字符文本行的归一化字符行得分,包括:
根据所述各个字符文本行的字符行得分,以及与所述各个字符文本行分别匹配的字符行有效阈值,确定所述各个字符文本行中的各个有效字符文本行;
根据所述至少两个设定字符集合的字符数量,分别计算所述各个有效字符文本行的归一化字符行得分。
4.根据权利要求1所述的方法,其特征在于,根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分,包括:
根据第一证件面关键字符集合和第二证件面关键字符集合,以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;
其中,所述第一证件面关键字符集合与所述第二证件面关键字符集合没有字符交集。
5.根据权利要求1所述的方法,其特征在于,根据所述图像得分以及判别处理策略,生成与所述待判别证件图像对应的判别结果,包括:
如果所述图像得分位于第一得分区间,则将所述待判别证件图像标定为第一证件面图像;
如果所述图像得分位于第二得分区间,则将所述待判别证件图像标定为第二证件面图像;
如果所述图像得分位于设定零值得分区间,则将所述待判别证件图像标定为无效图像。
6.根据权利要求5所述的方法,其特征在于,还包括:
如果所述图像得分位于第一得分区间且低于第一设定阈值,或者,所述图像得分位于第二得分区间且高于第二设定阈值,则将待判别证件图像标定为残缺模糊类图像。
7.根据权利要求5所述的方法,其特征在于,还包括:
如果所述待判别证件图像被标定为所述第一证件面图像或所述第二证件面图像,则将与所述待判别证件图像对应的各个字符文本行进行有效归类,并提取与对应类别匹配的属性值信息。
8.根据权利要求1-7任一项所述的方法,其特征在于,所述待判别证件图像包括下述至少一项:
待判别身份证图像、待判别驾驶证图像和待判别护照图像;
如果所述待判别证件图像为所述待判别身份证图像,则所述判别结果包括下述至少一项:
所述待判别证件图像为身份证正面图像,所述待判别证件图像为身份证反面图像,以及所述待判别证件图像为无效图像。
9.一种图像判别装置,其特征在于,包括:
获取模块,用于获取待判别证件图像,以及与所述待判别证件图像对应的各个字符文本行;
字符行计分模块,用于根据至少两个设定字符集合以及计分规则,分别计算所述各个字符文本行的归一化字符行得分;
图像计分模块,用于根据各个所述归一化字符行得分确定所述待判别证件图像的图像得分;
图像判别模块,用于根据所述图像得分以及判别处理策略,生成与所述待判别证件图像对应的判别结果。
10.一种设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1-8中任一所述的方法。
11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-8中任一所述的方法。
CN201811645429.0A 2018-12-29 2018-12-29 图像判别方法、装置、设备及存储介质 Active CN109670480B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN201811645429.0A CN109670480B (zh) 2018-12-29 2018-12-29 图像判别方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN201811645429.0A CN109670480B (zh) 2018-12-29 2018-12-29 图像判别方法、装置、设备及存储介质

Publications (2)

Publication Number Publication Date
CN109670480A true CN109670480A (zh) 2019-04-23
CN109670480B CN109670480B (zh) 2023-01-24

Family

ID=66146743

Family Applications (1)

Application Number Title Priority Date Filing Date
CN201811645429.0A Active CN109670480B (zh) 2018-12-29 2018-12-29 图像判别方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN109670480B (zh)

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN111784498A (zh) * 2020-06-22 2020-10-16 北京海益同展信息科技有限公司 身份认证方法、装置、电子设备及存储介质
WO2020220575A1 (zh) * 2019-04-30 2020-11-05 北京市商汤科技开发有限公司 证件识别方法和装置、电子设备、计算机可读存储介质

Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738518B1 (en) * 2000-05-12 2004-05-18 Xerox Corporation Document image decoding using text line column-based heuristic scoring
CN1737822A (zh) * 2004-05-20 2006-02-22 微软公司 用于照相机获得的文件的低分辨率光学字符识别
CN1834992A (zh) * 2005-03-17 2006-09-20 株式会社理光 检测文档图像中的字符的方向
CN101662581A (zh) * 2009-09-09 2010-03-03 谭洪舟 多功能证件信息采集系统
CN102184186A (zh) * 2011-04-12 2011-09-14 宋金龙 基于多特征自适应融合的图像检索方法
US20120099792A1 (en) * 2010-09-05 2012-04-26 International Business Machines Corporation Adaptive optical character recognition on a document with distorted characters
CN104680161A (zh) * 2015-01-09 2015-06-03 安徽清新互联信息科技有限公司 一种身份证数字识别方法
US20170161580A1 (en) * 2015-12-02 2017-06-08 Abbyy Development Llc Method and system for text-image orientation
CN106874968A (zh) * 2016-12-21 2017-06-20 江苏国光信息产业股份有限公司 一种高效鲁棒的二代身份证真伪鉴别方法
CN107305630A (zh) * 2016-04-25 2017-10-31 腾讯科技(深圳)有限公司 文本序列识别方法和装置
CN107657251A (zh) * 2016-07-26 2018-02-02 阿里巴巴集团控股有限公司 确定身份证件显示表面的设备及方法,图像识别方法
CN107835173A (zh) * 2017-11-07 2018-03-23 上海壹账通金融科技有限公司 一种远程业务办理方法、存储介质和服务器
CN108229566A (zh) * 2018-01-05 2018-06-29 厦门华联电子股份有限公司 一种层次性分类方法及装置

Patent Citations (13)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US6738518B1 (en) * 2000-05-12 2004-05-18 Xerox Corporation Document image decoding using text line column-based heuristic scoring
CN1737822A (zh) * 2004-05-20 2006-02-22 微软公司 用于照相机获得的文件的低分辨率光学字符识别
CN1834992A (zh) * 2005-03-17 2006-09-20 株式会社理光 检测文档图像中的字符的方向
CN101662581A (zh) * 2009-09-09 2010-03-03 谭洪舟 多功能证件信息采集系统
US20120099792A1 (en) * 2010-09-05 2012-04-26 International Business Machines Corporation Adaptive optical character recognition on a document with distorted characters
CN102184186A (zh) * 2011-04-12 2011-09-14 宋金龙 基于多特征自适应融合的图像检索方法
CN104680161A (zh) * 2015-01-09 2015-06-03 安徽清新互联信息科技有限公司 一种身份证数字识别方法
US20170161580A1 (en) * 2015-12-02 2017-06-08 Abbyy Development Llc Method and system for text-image orientation
CN107305630A (zh) * 2016-04-25 2017-10-31 腾讯科技(深圳)有限公司 文本序列识别方法和装置
CN107657251A (zh) * 2016-07-26 2018-02-02 阿里巴巴集团控股有限公司 确定身份证件显示表面的设备及方法,图像识别方法
CN106874968A (zh) * 2016-12-21 2017-06-20 江苏国光信息产业股份有限公司 一种高效鲁棒的二代身份证真伪鉴别方法
CN107835173A (zh) * 2017-11-07 2018-03-23 上海壹账通金融科技有限公司 一种远程业务办理方法、存储介质和服务器
CN108229566A (zh) * 2018-01-05 2018-06-29 厦门华联电子股份有限公司 一种层次性分类方法及装置

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020220575A1 (zh) * 2019-04-30 2020-11-05 北京市商汤科技开发有限公司 证件识别方法和装置、电子设备、计算机可读存储介质
CN111784498A (zh) * 2020-06-22 2020-10-16 北京海益同展信息科技有限公司 身份认证方法、装置、电子设备及存储介质

Also Published As

Publication number Publication date
CN109670480B (zh) 2023-01-24

Similar Documents

Publication Publication Date Title
US11410407B2 (en) Method and device for generating collection of incorrectly-answered questions
CN107818105B (zh) 应用程序的推荐方法及服务器
CN110325986B (zh) 文章处理方法、装置、服务器及存储介质
CN103810274B (zh) 基于WordNet语义相似度的多特征图像标签排序方法
CN103336766B (zh) 短文本垃圾识别以及建模方法和装置
CN106354872B (zh) 文本聚类的方法及系统
US8352405B2 (en) Incorporating lexicon knowledge into SVM learning to improve sentiment classification
CN110263694A (zh) 一种票据识别方法及装置
WO2020252919A1 (zh) 识别简历的方法及装置、计算机设备、存储介质
CN107333071A (zh) 视频处理方法、装置、电子设备及存储介质
US9613296B1 (en) Selecting a set of exemplar images for use in an automated image object recognition system
CN109918560A (zh) 一种基于搜索引擎的问答方法和装置
CN107679070B (zh) 一种智能阅读推荐方法与装置、电子设备
CN108491866B (zh) 色情图片鉴定方法、电子装置及可读存储介质
CN109657673A (zh) 图像识别方法和终端
EP3933636A1 (en) Webpage tampering detection method and related apparatus
CN109992781B (zh) 文本特征的处理方法、装置和存储介质
CN106649849A (zh) 文本信息库建立方法和装置、以及搜索方法、装置和系统
CN110765760B (zh) 一种法律案件分配方法、装置、存储介质和服务器
CN112766255A (zh) 一种光学文字识别方法、装置、设备及存储介质
CN102663435A (zh) 基于半监督的垃圾图片过滤方法
CN111652141B (zh) 基于题号和文本行的题目分割方法、装置、设备和介质
CN109670480A (zh) 图像判别方法、装置、设备及存储介质
CN116152840A (zh) 文件分类方法、装置、设备和计算机存储介质
CN111475651A (zh) 文本分类方法、计算设备及计算机存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant