CN112308070A - 证件信息的识别方法及装置、设备和计算机可读存储介质 - Google Patents

证件信息的识别方法及装置、设备和计算机可读存储介质 Download PDF

Info

Publication number
CN112308070A
CN112308070A CN202011194484.XA CN202011194484A CN112308070A CN 112308070 A CN112308070 A CN 112308070A CN 202011194484 A CN202011194484 A CN 202011194484A CN 112308070 A CN112308070 A CN 112308070A
Authority
CN
China
Prior art keywords
identification
information
certificate
identification information
module
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Granted
Application number
CN202011194484.XA
Other languages
English (en)
Other versions
CN112308070B (zh
Inventor
郑琳耀
金鑫
邹雨晗
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
WeBank Co Ltd
Original Assignee
WeBank Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by WeBank Co Ltd filed Critical WeBank Co Ltd
Priority to CN202011194484.XA priority Critical patent/CN112308070B/zh
Publication of CN112308070A publication Critical patent/CN112308070A/zh
Application granted granted Critical
Publication of CN112308070B publication Critical patent/CN112308070B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/20Image preprocessing
    • G06V10/25Determination of region of interest [ROI] or a volume of interest [VOI]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/74Image or video pattern matching; Proximity measures in feature spaces
    • G06V10/75Organisation of the matching processes, e.g. simultaneous or sequential comparisons of image or video features; Coarse-fine approaches, e.g. multi-scale approaches; using context analysis; Selection of dictionaries
    • G06V10/751Comparing pixel values or logical combinations thereof, or feature values having positional relevance, e.g. template matching

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Multimedia (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Databases & Information Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Management, Administration, Business Operations System, And Electronic Commerce (AREA)

Abstract

本发明涉及金融科技技术领域,公开了一种证件信息的识别方法及装置、设备和计算机可读存储介质。证件信息的识别方法包括:获取证件对应的证件图像;采用各个所述识别模块分别对所述证件图像进行识别得到各个待确定识别信息;在各个所述待确定识别信息不一致时,获取参考信息,所述参考信息包括所述待确定识别信息关联的识别信息以及所述识别模块的参考参数中的至少一个,所述参考参数包括所述识别模块的权重、识别准确率以及置信度中的至少一种;根据所述参考信息以及所述待确定识别信息确定目标识别信息,并根据所述目标识别信息确定证件信息,以将所述证件信息进行输出。本发明证件信息的识别容错率较高。

Description

证件信息的识别方法及装置、设备和计算机可读存储介质
技术领域
本发明涉及金融科技(Fintech)技术领域,尤其涉及一种证件信息的识 别方法及装置、设备和计算机可读存储介质。
背景技术
随着计算机技术的发展,越来越多的技术应用在金融领域,传统金融业 正在逐步向金融科技(Fintech)转变,但由于金融行业的安全性、实时性要 求,也对技术提出了更高的要求。
在新一代互联网银行或其它金融科技场景中,用户通过在远程拍摄、上 传个人证件(证件如身份证、居住证、来往港澳通行证等)进行身份认证。 进行身份认证,则需要对上传的证件进行识别。在进行识别时,需要对证件 图像上的信息进行正确的提取,且需要验证证件图像的合法性。
目前,证件的信息是通过一个识别模块进行识别,若是证件中的信息的 识别存在识别错误,且识别错误如果发生在关键信息(关键信息如姓名、身 份证号码)上,会使得系统无法执行用户请求的业务,证件信息的识别存在 容错率较低的问题。
发明内容
本发明的主要目的在于提供一种证件信息的识别方法及装置、设备和计 算机可读存储介质,旨在解决证件信息的识别存在容错率较低的问题。
为实现上述目的,本发明提供一种证件信息的识别方法,应用于识别装 置,所述识别装置包括多个识别模块,所述证件信息的识别方法包括:
获取证件对应的证件图像;
采用各个所述识别模块分别对所述证件图像进行识别得到各个待确定识 别信息;
在各个所述待确定识别信息不一致时,获取参考信息,所述参考信息包 括所述待确定识别信息关联的识别信息以及所述识别模块的参考参数中的至 少一个,所述参考参数包括所述识别模块的权重、识别准确率以及置信度中 的至少一种;
根据所述参考信息以及所述待确定识别信息确定目标识别信息,并根据 所述目标识别信息确定证件信息,以将所述证件信息进行输出。
在一实施例中,所述参考信息包括参考参数,所述根据所述参考信息以 及所述待确定识别信息中确定目标识别信息的步骤包括:
确定相同的所述待确定识别信息对应的所述参考参数之和,得到中间数 值;
在各个所述中间数值中确定最大中间数值,并将所述最大中间数值对应 的所述待确定识别信息确定为目标识别信息。
在一实施例中,所述参考信息包括参考参数,所述根据所述参考信息以 及所述待确定识别信息中确定目标识别信息的步骤包括:
在相同类型的子信息对应的各个所述参考参数中,确定第一最大参考参 数,其中,所述待确定识别信息包括多类子信息,所述识别模块对每类所述 子信息设置对应的参考参数;
根据每个所述第一最大参考参数对应的所述子信息,确定目标识别信息。
在一实施例中,所述参考信息包括关联的识别信息,所述根据所述参考 信息以及所述待确定识别信息中确定目标识别信息的步骤包括:
根据所述关联的识别信息,对所述待确定识别信息进行修正,得到目标 识别信息。
在一实施例中,所述参考信息包括参考参数,所述参考参数包括权重, 所述获取参考信息的步骤包括:
获取预设证件图像,并采用各个所述识别模块对所述预设证件图像进行 识别,得到每个所述识别模块对应的识别信息;
根据各个所述识别模块对应的识别信息以及所述预设证件图像对应的标 准识别信息,确定各个所述识别模块对应的权重。
在一实施例中,所述参考信息包括参考参数,所述获取参考信息的步骤 包括:
获取所述识别模块的历史识别记录,其中,所述历史识别记录中包括所 述识别模块对证件的识别结果;
根据各个所述识别结果,确定所述识别模块的参考参数。
在一实施例中,所述参考信息包括参考参数,所述获取参考信息的步骤 包括:
获取所述识别信息的类型,并确定所述识别信息对所述类型对应的识别 信息的识别能力值;
根据所述识别能力值确定所述识别模块对应的参考参数。
在一实施例中,所述参考信息包括关联识别信息,所述根据所述目标识 别信息确定证件信息的步骤包括:
根据所述关联的识别信息确定所述目标识别信息对应的标准识别信息;
根据所述标准识别信息修正所述目标识别信息,并将修正后的所述目标 识别信息作为证件信息。
在一实施例中,所述采用各个所述识别模块分别对所述证件图像进行识 别得到各个待确定识别信息的步骤包括:
采用各个所述识别模块对所述证件图像进行识别;
获取预设间隔时长内的所述识别模块输出的识别信息,以确定为待确定 识别信息。
在一实施例中,所述获取证件对应的证件图像的步骤之后,还包括:
获取所述识别装置的识别场景;
在所述识别场景为第一场景,将最先输出的识别信息作为证件信息进场 输出;
在识别场景为第二场景,执行所述采用各个所述识别模块对所述证件图 像进行识别的步骤。
在一实施例中,所述根据所述参考信息以及所述待确定识别信息确定目 标识别信息的步骤之后,还包括:
对所述目标识别信息进行合法性的校验,所述校验包括完整性校验、格 式校验以及清晰度校验中的至少一种;
在所述校验未通过时,输出告警信息。
在一实施例中,所述参考信息包括参考参数,所述将所述证件信息输出 的步骤之后,还包括:
获取相同类型的子信息对应的各个所述参考参数,其中,所述待确定识 别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的参考参 数;
在各个所述参考参数中确定最小参考参数;
在所述最小参考参数与每个其他参考参数之间的差值大于预设差值,输 出提高目标识别模块对第一目标类型的信息识别能力的提示信息,其中,所 述目标识别模块为所述最小参考参数对应的识别模块,所述第一目标类型为 最小参考参数对应的子信息的类型。
在一实施例中,所述参考信息包括参考参数,所述将所述证件信息输出 的步骤之后,还包括:
获取相同类型的子信息对应的各个所述参考参数,其中,所述待确定识 别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的参考参 数;
在各个所述参考参数中确定第二最大参考参数;
根据所述第二最大参考参数对应的识别模块的识别模板,更新其他识别 模块,其中,所述识别模板为所述第二最大参考参数对应的子信息的识别模 板。
在一实施例中,所述参考信息包括参考参数,所述将所述证件信息输出 的步骤之后,还包括:
获取相同类型的每个子信息对应的所述权重,其中,所述待确定识别信 息包括多类子信息,所述识别模块对每类所述子信息设置对应的权重;
根据相同类型的各个所述子信息对应的数值以及所述子信息对应的权重 进行加权计算,得到分值;
在所述分值小于预设分值时,输出提高识别装置对第二目标类型的信息 识别能力的提示信息,其中,所述第二目标类型为所述分值对应的子信息的 类型。
为实现上述目的,本发明还提供一种识别装置,所述识别装置包括多个 识别模块,所述识别装置还包括:
获取模块,用于获取证件对应的证件图像;
各个所述识别模块,用于分别对所述证件图像进行识别得到各个待确定 识别信息;
所述获取模块,还用于在各个所述待确定识别信息不一致时,获取参考 信息,所述参考信息包括所述待确定识别信息关联的识别信息以及所述识别 模块的参考参数中的至少一个,所述参考参数包括所述识别模块的权重、识 别准确率以及置信度中的至少一种;
确定模块,用于根据所述参考信息以及所述待确定识别信息确定目标识 别信息,并根据所述目标识别信息确定证件信息,以将所述证件信息进行输 出。
为实现上述目的,本发明还提供一种识别设备,所述识别设备包括多个 识别模块、存储器、处理器以及存储在所述存储器并可在所述处理器上运行 的识别程序,各个所述识别模块与所述处理器连接,所述识别程序被所述处 理器执行时实现如上所述的证件信息的识别方法。
为实现上述目的,本发明还提供一种计算机可读存储介质,所述计算机 可读存储介质存储有识别程序,所述识别程序被处理器执行时实现如上所述 的证件信息的识别方法。
本发明提供一种证件信息的识别方法及装置、设备和计算机可读存储介 质,识别装置获取证件对应的证件图像,采用各个识别模块分别对证件图像 进行识别得到各个识别信息,在各个识别信息不一致时,并获取识别模块的 权重、置信度、识别准确率以及识别信息关联的其他识别信息中的至少一个 确定目标识别信息,再将目标识别信息确定证件信息,最后将证件信息输出。 本发明识别装置中设置有多个识别模块用于识别证件得到识别信息,在各个 识别信息不一致,再采用识别模块中与识别准确率相关的参考参数或者与识 别信息关联的其他识别信息确定证件信息,也即在证件的识别信息存在识别 错误的情况下,也能够输出识别较为准确的证件信息,避免系统无法执行用 户请求的业务,证件信息的识别容错率较高。
附图说明
图1为本发明实施例方案涉及的硬件运行环境的识别装置的硬件结构示 意图;
图2为本发明证件信息的识别方法第一实施例的流程示意图;
图3为本发明证件信息的识别方法第二实施例的流程示意图;
图4为本发明证件信息的识别方法第三实施例的流程示意图;
图5为本发明证件信息的识别方法第四实施例的流程示意图;
图6为本发明证件信息的识别方法第五实施例的流程示意图;
图7为本发明证件信息的识别方法第六实施例的流程示意图;
图8为本发明识别设备的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步 说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限 定本发明。
参照图1,图1为本发明实施例方案涉及识别装置的硬件运行环境的硬件 结构示意图。
如图1所示,识别装置可以包括:处理器1001,例如CPU,通信总线1002, 用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实 现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输 入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接 口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如 Wi-Fi接口)。存储器1005可以是高速RAM存储器,也可以是稳定的存储器 (non-volatile memory),例如磁盘存储器。存储器1005可选的还可以是独 立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对识别装置的限定, 可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布 置。
如图1所示,作为一种计算机存储介质的存储器1005中可以包括操作系统、 网络通信模块、用户接口模块以及识别程序。
在图1所示的终端中,网络接口1004主要用于连接后台终端,与后台终 端进行数据通信;用户接口1003主要用于连接客户端,与客户端进行数据通 信;而处理器1001可以用于调用存储器1005中存储的识别程序,并执行以 下操作:
获取证件对应的证件图像;
采用各个所述识别模块分别对所述证件图像进行识别得到各个待确定识 别信息;
在各个所述待确定识别信息不一致时,获取参考信息,所述参考信息包 括所述待确定识别信息关联的识别信息以及所述识别模块的参考参数中的至 少一个,所述参考参数包括所述识别模块的权重、识别准确率以及置信度中 的至少一种;
根据所述参考信息以及所述待确定识别信息确定目标识别信息,并根据 所述目标识别信息确定证件信息,以将所述证件信息进行输出。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
确定相同的所述待确定识别信息对应的所述参考参数之和,得到中间数 值;
在各个所述中间数值中确定最大中间数值,并将所述最大中间数值对应 的所述待确定识别信息确定为目标识别信息。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
在相同类型的子信息对应的各个所述参考参数中,确定第一最大参考参 数,其中,所述待确定识别信息包括多类子信息,所述识别模块对每类所述 子信息设置对应的参考参数;
根据每个所述第一最大参考参数对应的所述子信息,确定目标识别信息。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
根据所述关联的识别信息,对所述待确定识别信息进行修正,得到目标 识别信息。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
获取预设证件图像,并采用各个所述识别模块对所述预设证件图像进行 识别,得到每个所述识别模块对应的识别信息;
根据各个所述识别模块对应的识别信息以及所述预设证件图像对应的标 准识别信息,确定各个所述识别模块对应的权重。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
获取所述识别模块的历史识别记录,其中,所述历史识别记录中包括所 述识别模块对证件的识别结果;
根据各个所述识别结果,确定所述识别模块的参考参数。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
获取所述识别信息的类型,并确定所述识别信息对所述类型对应的识别 信息的识别能力值;
根据所述识别能力值确定所述识别模块对应的参考参数。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
根据所述关联的识别信息确定所述目标识别信息对应的标准识别信息;
根据所述标准识别信息修正所述目标识别信息,并将修正后的所述目标 识别信息作为证件信息。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
采用各个所述识别模块对所述证件图像进行识别;
获取预设间隔时长内的所述识别模块输出的识别信息,以确定为待确定 识别信息。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
获取所述识别装置的识别场景;
在所述识别场景为第一场景,将最先输出的识别信息作为证件信息进场 输出;
在识别场景为第二场景,执行所述采用各个所述识别模块对所述证件图 像进行识别的步骤。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
对所述目标识别信息进行合法性的校验,所述校验包括完整性校验、格 式校验以及清晰度校验中的至少一种;
在所述校验未通过时,输出告警信息。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
获取相同类型的子信息对应的各个所述参考参数,其中,所述待确定识 别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的参考参 数;
在各个所述参考参数中确定最小参考参数;
在所述最小参考参数与每个其他参考参数之间的差值大于预设差值,输 出提高目标识别模块对第一目标类型的信息识别能力的提示信息,其中,所 述目标识别模块为所述最小参考参数对应的识别模块,所述第一目标类型为 最小参考参数对应的子信息的类型。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
获取相同类型的子信息对应的各个所述参考参数,其中,所述待确定识 别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的参考参 数;
在各个所述参考参数中确定第二最大参考参数;
根据所述第二最大参考参数对应的识别模块的识别模板,更新其他识别 模块,其中,所述识别模板为所述第二最大参考参数对应的子信息的识别模 板。
在一实施例中,处理器1001可以调用存储器1005中存储的识别程序, 还执行以下操作:
获取相同类型的每个子信息对应的所述权重,其中,所述待确定识别信 息包括多类子信息,所述识别模块对每类所述子信息设置对应的权重;
根据相同类型的各个所述子信息对应的数值以及所述子信息对应的权重 进行加权计算,得到分值;
在所述分值小于预设分值时,输出提高识别装置对第二目标类型的信息 识别能力的提示信息,其中,所述第二目标类型为所述分值对应的子信息的 类型。
基于上述识别装置的硬件结构,提出本发明证件信息的识别方法的各实 施例。
本发明提供一种证件信息的识别方法。
参照图2,图2为本发明证件信息的识别方法第一实施例,所述证件信息 的识别方法包括:
步骤S10,获取证件对应的证件图像;
在本实施例中,执行主体为识别装置,识别装置中设有多个识别模块, 识别模块可以是识别引擎。用户可以在识别装置上上传证件图像,或者用户 通过终端向识别装置传输证件图像。证件图像可以是身份证、驾驶证等证件 的图像。识别装置在接收到证件图像后,先确定证件图像所属的类型,类型 即可以用户上传的证件图像所输入的类型。而识别装置的识别模块是进行类 型分类的,例如,ABC三个识别模块用于识别身份证的识别信息,而DEF三个 识别模块用于识别驾驶证的识别信息。识别装置先确定证件图像所属的类型,在确定识别该类证件图像的识别模块。需要说明的是,识别装置中至少存在 两个的识别模块对每一类证件的识别。识别模块可以为OCR(Optical Character Recognition,光学字符识别)识别引擎。
步骤S20,采用各个所述识别模块分别对所述证件图像进行识别得到各个 待确定识别信息;
在得到证件图像后,识别装置控制各个识别模块分别对证件图像进行识 别,每一个识别模块识别证件图像的信息即为识别信息。识别信息即可理解 为识别模块对证件图像中字符识别后的内容,例如,证件图像为身份证图像, 则识别信息包括身份证号码、名字、籍贯、出生日期、身份证签发机构等。 识别模块对证件图像进行识别得到的识别信息即为待确定识别信息,待确定 识别信息可以理解为初步得到的识别信息,需要进行后续处理。识别信息可 以证件上信息的中的至少一种。
步骤S30,获取参考信息,所述参考信息包括所述待确定识别信息关联的 识别信息以及所述识别模块的参考参数中的至少一个,所述参考参数包括所 述识别模块的权重、识别准确率以及置信度中的至少一种;
在得到各个待确定识别信息后,识别装置对各个待识别信息进行一致性 的校验,也即判断各个待确定识别信息是否一致。若是各个待确定信息不一 致时,即可确定有的识别模块对于证件图像的识别不一致,必然有一个识别 模块出现识别错误。对此,识别装置需要获取参考信息。参考信息包括识别 模块的参考参数以及待确定识别信息关联的识别信息中的至少一个。参考参 数为每个识别模块的参考参数,以根据参考信息以及待确定识别信息中确定 目标识别信息。参考参数可以理解为识别准确率。也即识别装置可以根据参考信息在各个待确定识别信息中确定识别准确率较高的目标识别信息。而在 当各个待确定识别信息一致时,即可确定各个识别模块对于证件图像的识别 达成共识,证件图像的识别不存在识别错误,识别装置随机选取一个待确定 识别信息作为证件信息进行输出。待确定识别信息关联的识别信息指的是, 待确定识别信息与其关联的识别信息为同一个类型,例如,待确定识别信息 为身份证上出生年月日的生日,则其关联的识别信息为身份证号码,也即可 以通过身份证号码可以得到生日。可以理解的是,识别装置可以从关联的识 别信息确定准确的待确定识别信息。
步骤S40,根据所述参考信息以及所述待确定识别信息确定目标识别信息, 并根据所述目标识别信息确定证件信息,以将所述证件信息进行输出。
在本实施例中,参考参数可以为识别准确率,识别准确率为识别模块自 身的属性,识别准确率可以根据识别模块的识别记录确定。例如,识别记录 中记载有识别模块识别了10次证件图像,且10次中有8次是识别正确的(识 别装置最终输出该识别模块识别的信息,即可确定识别模块此次对证件图像 识别是正确),识别准确率即为80%。参考参数还可以是识别模块对某一类信 息的识别准确率,例如,识别模块对身份证中的名字识别的准确率为95%,对 身份证中籍贯的识别准确率为90%。
识别装置可以在各个参考参数中确定最大参考参数,若是最大参考参数 大于预设阈值,即可将最大参考参数对应的待确定识别信息确定为目标识别 信息。例如,参考参数为识别准确率,有四个识别模块,识别准确率分别为 50%,60%、80%以及95%,而预设阈值为90%,则大于90%的95%对应的待确定 识别信息即可确定为目标识别信息。预设阈值可以根据待确定识别信息的类 型进行设置,若是待确定识别信息为关键信息,关键信息例如名字和身份证 号码,则预设阈值较大,若为非关键信息,预设阈值可设置的稍小。
此外,需要说明的是,参考参数可以为置信度、权重以及识别准确率中 的至少一个。置信度以及权重为识别模块的自身的属性,置信度即为识别装 置对于识别信息正确的把握,例如,识别模块A有100%的信息确定自身识别 信息是准确的,识别模块即可视为可自学习的模型。可以理解的是,置信度 是基于识别模块对证件识别信息的统计分析得到。权重根据所有的识别模块 进行确定,例如,识别模块A识别正确的次数为80次,识别模块B识别正确 的次数为20次,识别模块C识别正确的次数为60次,识别模块C识别正确 的次数为40次,则识别模块A的权重为0.4、识别模块B的权重为0.1、识 别模块C的权重为0.3、识别模块D的权重为0.2。
另外,识别装置可以根据关联的识别信息对待确定识别信息进行修正得 到目标识别信息。以待确定识别信息为生日为例。待确定识别信息为xx年xx 月xx日,识别信息获取其关联的识别信息,也即获取身份证号码,从身份证 号码中提取出生日,从而基于身份证号码提取生日对年月日所在位置识别的 待确定识别信息中的生日进行修正,得到最终的生日。识别装置需要根据待 确定识别信息的类型,若是类型为预设类型,即可确定待确定识别信息具有 关联的识别信息,预设类型可为生日等。此处仅仅是以身份证为例进行说明, 其他证件也可采用关联的识别信息对待确定识别信息进行修正。
在本实施例提供的技术方案中,识别装置获取证件对应的证件图像,采 用各个识别模块分别对证件图像进行识别得到各个识别信息,在各个识别信 息不一致时,并获取识别模块的权重、置信度、识别准确率以及识别信息关 联的其他识别信息中的至少一个确定目标识别信息,再将目标识别信息确定 证件信息,最后将证件信息输出。本发明识别装置中设置有多个识别模块用 于识别证件得到识别信息,在各个识别信息不一致,再采用识别模块中与识 别准确率相关的参考参数或者与识别信息关联的其他识别信息确定证件信息, 也即在证件的识别信息存在识别错误的情况下,也能够输出识别较为准确的 证件信息,避免系统无法执行用户请求的业务,证件信息的识别容错率较高。
参照图3,图3为本发明证件信息的识别方法的第二实施例,基于第一实 施例,所述步骤S40包括:
步骤S41,确定相同的所述待确定识别信息对应的所述参考参数之和,得 到中间数值;
步骤S42,在各个所述中间数值中确定最大中间数值,并将所述最大中间 数值对应的所述待确定识别信息确定为目标识别信息。
在本实施例中,参考信息包括参考参数。各个识别模块对于证件图像的 识别会存在分歧,会有相同的识别模块识别的识别信息是一致的。对此,识 别装置先将相同的待确定识别信息进行归类,得到一个集合,识别装置在获 取集合内各个待确定识别信息所对应的参考参数之和,并将参考参数之和定 义为中间数值。
识别装置将各个待确定识别信息进行归类,得到多个集合,每个集合对 应一个中间数值。识别装置再从各个中间数值中确定最大中间数值,最大中 间数值对应的待确定识别信息即为目标识别信息。当然,最大中间数值也需 大于预设阈值,最大中间数值对应的待确定识别信息即可被确定为目标识别 信息。例如,最大中间数值为95%,对应的待确定识别信息为A,识别装置则 有95%的把握认为A是正确的识别信息。
在本实施例提供的技术方案中,识别装置获取相同的待确定识别信息对 应的参考参数之和得到中间数值,在从各个中间数值中确定最大中间数值, 并将最大中间数值对应的待确定识别信息确定为目标识别信息,从而准确的 输出证件信息。
参照图4,图4为本发明证件信息的识别方法的第三实施例,基于第一实 施例,所述步骤S40包括:
步骤S43,在相同类型的子信息对应的各个所述参考参数中,确定最大参 考参数,其中,所述待确定识别信息包括多类子信息,所述识别模块对每类 所述子信息设置对应的参考参数;
步骤S44,根据各个所述最大参考参数对应的所述子信息,确定目标识别 信息。
在本实施例中,待确定识别信息包括多类子信息。例如,子信息可为姓 名、身份证号码、籍贯等。而识别模块对每一类子信息设置对应的参考参数。
每个待确定识别信息所包括的子信息的种类的数量相同,且具有同一种 子信息。识别装置在各个待确定识别信息中获取相同类型的各个子信息,在 获取相同类型的子信息对应的各个参考参数,然后在这一类子信息中确定最 大的参考参数。而待确定识别信息包括多类子信息,因而识别装置可以获取 多个最大参考参数,各个最大参考参数对应的子信息组合即可构成目标识别 信息。
在本实施例提供的技术方案中,识别装置在相同类型的子信息对应的各 个参考参数中,确定最大参考参数,再将各个最大参考参数对应的子信息构 成目标识别信息,从而使得每一类子信息均是较为准确的。
参照图5,图5为本发明证件信息的识别方法的第四实施例,基于第一至 第三中任一实施例,所述步骤S30包括:
步骤S31,获取预设证件图像,并采用各个所述识别模块对所述预设证件 图像进行识别,得到每个所述识别模块对应的识别信息;
步骤S32,根据各个所述识别模块对应的识别信息以及所述预设证件图像 对应的标准识别信息,确定各个所述识别模块对应的权重。
在本实施例中,参考参数包括权重。测试样本库中有预设证件图像以及 预设证件图像对应的标准识别信息。标准识别信息即为对预设证件图像识别 争取的信息,标准识别信息可为人工对预设证件图像标注得到。
识别装置获取预设证件图像,在采用各个识别模块对预设证件图像进行 识别得到每个识别模块输出的识别信息。识别装置再根据各个识别信息以及 标准识别信息确定各个识别模块对应的权重。具体的,识别装置将每个识别 信息与标准识别信息进行比对,从而可以得到每个识别模块对预设证件图像 的识别准确率,例如,标准识别信息有8项信息,而识别模块识别的识别信 息中有4项是正确的,则识别准确率为50%。识别装置再根据各个识别准确率 配置各个识别模块的权重。例如,识别模块A的识别准确率为50%、识别模块 B的识别准确率为30%、识别模块C的识别准确率为20%,则比例为5:3:2, 也即识别模块1的权重为0.5、识别模块B的权重为0.3以及识别模块C的权 重为0.2。
在本实施例中,识别装置获取预设证件图像,并采用各个识别模块对预 设证件图像进行识别得到每个识别模块对应的识别信息,再根据各个识别信 息以及标准识别信息准确的确定各个识别模块的权重。
参照图6,图6为本发明证件信息的识别方法的第五实施例,基于第一至 第三中任一实施例,所述步骤S30包括:
步骤S33,获取所述识别模块的历史识别记录,其中,所述历史识别记录 中包括所述识别模块对证件的识别结果;
步骤S34,根据各个所述识别结果,确定所述识别模块的参考参数。
在本实施例中,参考参数可以根据识别模块的历史识别记录确定。具体 的,历史世界记录中包括有识别模块对证件的识别结果,识别结果包括识别 正确以及识别错误。若是识别装置最终输出的证件信息是识别模块识别的, 则记录为识别正确,若不是识别模块输出而是其他识别模块识别的,则记录 为识别错误。识别装置统计识别正确的次数,再确定次数以及识别结果的总 次数之间的比值,该比值即可确定识别模块的参考参数。
此外,识别模块对于某些类型的信息可以识别的较为准确。对此,可对 识别模块设置每种类型的信息进行识别的识别能力值。某种类型的信息对应 的识别能力值越高,则对于该类型的信息的识别准确率越高。识别能力值可 以由用户进行设置,也即用户人为识别模块识别姓名准确,则将姓名的识别 能力值设置的较高。当然,识别能力值可以由识别模块自学习得到,也即识 别模块自认为擅长或者不擅长识别某项信息。识别能力值可以直接作为参考 参数。当然,识别装置可以配置识别能力值的权重以及上述次数以及识别结果的总次数之间的比值的权重,在进行加权计算得到最终的参考参数,也即 结合识别装置历史识别正确的次数以及识别能力值确定参考参数。
另外,识别模块可以根据参考信息确定参考参数。例如,待确定识别信 息为xx年xx月xx日,也即待确定识别信息为生日,识别模块可以从身份证 号码中直接得到生日,从身份证号码中得到的生日即为参考信息,装置可以 对参考信息以及待确定识别信息进行比对,从而确定参考参数。
在本实施例提供的技术方案中,识别装置获取识别模块的历史识别记录, 从而根据历史识别记录中识别结果准确的确定识别模块的参考参数。
在一实施例中,将所述目标识别信息作为证件信息进行输出的步骤包括:
获取所述目标识别信息对应的关联识别信息,并根据所述关联的识别信 息确定所述目标识别信息对应的标准识别信息;
根据所述标准识别信息修正所述目标识别信息,并将修正后的所述目标 识别信息作为证件信息进行输出。
在本实施例中,在得到目标识别信息后,确定目标识别信息是否有对应 的关联识别信息,关联识别信息即为上述的参考信息,若含有,则根据关联 识别信息确定目标识别信息对应的标准识别信息,再根据标准识别信息对目 标识别信息进行修正,从而将修正后的目标识别信息作为证件信息进行输出。
仍以生日为例,目标识别信息为出生年月日中的生日,生日具有关联识 别信息,关联识别信息即为身份证号码。识别装置从身份证号码中获取生日, 从身份证号码中获取的生日即可视为标准识别信息,识别装置以身份证号码 中的生日为准,将出生年月日中的日期改为生日对应的日期。
参照图7,图7为本发明证件信息的识别方法的第七实施例,基于第一至 第六中任一实施例,所述步骤S20包括:
步骤S21,采用各个所述识别模块对所述证件图像进行识别;
步骤S22,获取预设间隔时长内的所述识别模块输出的识别信息,以确定 为待确定识别信息。
在本实施例中,识别装置设有多个识别场景,识别场景包括时效性敏感 的场景,该场景下要求识别装置在有限的时间内输出证件信息,而在该时间 内,允许识别模块的数量进行下降。例如,要求识别装置10s内输出证件信 息,而识别装置中设有5个识别模块,但只有3个识别模块在10s内识别出 的识别信息,识别装置原本为5引擎识别模式(5个识别模块分别对证件图像 进行识别为5引擎识别模式),此时,自动降为3引擎识别模式,也即通过三 个识别信息确定证件信息。
对此,装置采用各个识别模块对证件图像进行识别,在获取第一预设间 隔时长内识别模块输出的识别信息,预设间隔时长内输出的识别信息即确定 为待确定识别信息。第一预设间隔时长即为识别场景所要求的时限。
在本实施中识别场景包括三种场景。
A、多引擎实施抢占机制
在时效性的敏感场景下,多引擎方案可提供抢占式调用,即在单一引擎 返回识别结果后即可使用该结果返回。此场景下可有效的整合各引擎在特定 图片上的识别性能优势,达到识别的最小化耗时,该模式的使用限制:各独 立识别引擎须保证满足需求的单体识别准确率,且推荐在实时拍照上传的场 景下,用户关心的是上传后快速反馈。
B、多引擎等待机制
在离线识别的场景下,耗时可忽略,准确率和成功率是首要目标,在多 引擎模式下,等所有引擎识别返回后,并通过多引擎规则,返回最优化结果 (目标识别信息)。
C、有条件的多引等待机制
在兼具时效性和准确率的通用场景下,需要实施一个有效的多引擎策略, 在限制耗时上限的前提下,尽可能的收集更多的多引擎识别结果,并实施多 引擎规则,返回优化结果。
在本实施例中,将A对应的识别场景对应为第一场景,将B对应的识别 场景定义为第二场景,将C对应的识别场景定义为第三场景。
识别装置在获取证件对应的证件图像后,获取识别装置的识别场景。若 是识别场景为第一场景,则将最先输出的识别信息作为证件信息进行输出, 保证最快的完成证件信息的输出。若是识别场景为第一场景,则执行步骤S21、 步骤S22、步骤S30以及步骤S40,从而采用多引擎的降级的方式较快且准确 率较高的情况下输出证件新型。若是识别场景为第三场景,则等待所有的识 别模块输出识别信息以作为待确定识别信息,从而在所有的识别信息中确定 目标识别信息,以最大限度保证证件信息的识别准确性高。
进一步的,设置第二预设间隔时长,第二预设间隔时长大于或等于第一 预设间隔时长,识别装置确定第二预设间隔时长内未输出识别信息的目标识 别模块,从而输出目标识别模块异常的提示信息,进而使得维修人员对目标 识别模块进行维护。
本实施例中,多引擎时效上的控制,多重识别难免带来识别时效上的增 长,通过并发请求,让多引擎在同时间内处理识别图像,并且设立有效的耗 时上限保护,当某个引擎在一定时间内未处理完该请求时,主动降级引擎的 数量,以使用已有的识别信息完成证件信息的输出,以保证证件新型的输出 在一个合理的时间内进行输出。
在一实施例中,步骤S40中根据所述参考参数以及所述待确定识别信息 确定目标识别信息的步骤之后,还包括:
C1、对所述目标识别信息进行合法性的校验,所述校验包括完整性校验、 格式校验以及清晰度校验中的至少一种;
C2、在所述校验未通过时,输出证件信息不合法的告警信息。
在本实施例,在确定目标识别信息后,识别装置需要对目标识别信息进 行合法性的校验。合法性的校验包括完整性校验、格式检验、以及清晰度校 验中的至少一种。例如,识别装置会对目标识别信息进行关键信息匹配、位 置信息分析、缺失信息分析、头像信息分析、复印件信息分析、图像完整性 分析、字体及方向分析、清晰度分析等。其中,关键信息匹配指的是不可缺 少的信息的确定,例如,名字、身份证号码。位置信息分析即为对子信息在 证件上的位置的确定,例如,子信息为身份证号码,身份证号码位于身份证 正面的下方。缺失信息分析具体为分析目标识别信息中是否有缺失的信息未 包括。头像信息分析可以是头像是否完整。复印件信息分析,指的是证件图 像是否为复印件的图像,图像完整性分析指的是证件图像是否完整的分析。 字体及方向分析,指的是字体大小颜色以及方向的分析,清晰度指的是头像 是否清晰等。
而关键信息匹配、缺失信息分析、头像信息分析、图像完整性分析均为 完整性校验。位置信息分析、复印件信息分析、字体及方向分析即为格式校 验。头像信息分析、清晰度分析即为清晰度校验。
在校验未通过时,则输出告警信息。告警信息可以以代码进行输出,例 如,身份证缺角,则告警信息的代码为1;证件为复印件,则告警信息的代码 为;头像存疑,则告警信息的代码为3。
需要说明的是,若是各个待确定识别信息一致时,所得到的目标识别信 息也需要进行合法性的校验。
在一实施例中,步骤S40之后,还包括:
C3、获取相同类型的子信息对应的各个所述参考参数,其中,所述待确 定识别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的参 考参数;
C4、在各个所述参考参数中确定最小参考参数;
C5、在所述最小参考参数与每个其他参考参数之间的差值大于预设差值, 输出提高目标识别模块对第一目标类型的信息识别能力的提示信息,其中, 所述目标识别为所述最小参考参数对应的识别模块,所述第一目标类型为最 小参考参数对应的子信息的类型。
在本实施例中,识别装置在完成对证件信息的输出后,需要确定是否有 识别模块需要修正。对此,识别装置在输出证件信息后,获取相同类型的子 信息对应的各个参考参数,也即识别模块对每类子信息设置参考参数。识别 装置在这一类的子信息对应的参考参数中确定最小参考参数,进而计算最小 参考参数与每个其他参考参数之间的差值,其他参考参数为这一类参考参数 中除了最小参考参数的参考参数。若是各个差值均大于预设差值,即可确定 最小参考参数对应的识别模块对于该类信息的识别能力较差,需要提高识别模块箱对该类信息的识别能力。故而,识别装置输出提高目标识别模块对第 一目标类型的信息识别能力的提示信息,目标识别为最小参考参数对应的识 别模块,第一目标类型为最小参考参数对应的子信息的类型。
此外,识别装置可以通过所有识别模块对某类子信息的识别分值,若是 识别分值较小,则所有识别模块对于该类的信息的信息识别能力均比较差。 具体的,识别装置获取相同类型的子信息对应的权重,每一个子信息对应的 一个数值,该数值子信息的实际识别准确率,通过正确的子信息以及识别的 子信息即可确定实际识别准确率。装置对这一类的各个子信息对应的数值以 及子信息对应的权重进行加权计算,从而得到这类子信息对应的分值。若是 分值小于预设分值,则输出提高识别装置对第二目标类型的信息识别能力的提示信息。第二目标类型即为分值对应的子信息的类型。
在一实施例中,识别模块对于证件图像进行识别得到识别信息后,会识 别信息进行合法性校验。若是识别信息的每一个合法性校验通过时,即可确 定为正常图像,此时,对识别信息对应的识别模块设置为识别通过。若是有 绝对多数或者全部的合法性校验未通过时,则证件图像为翻拍图像,对识别 信息对应的识别模块设置为识别未通过。若是仅有少数几个的合法性校验未 通过时,则证件图像为疑似翻拍图像,则进一步确定最重要的几个合法性校 验是否通过,例如,头像信息分析、完整性分析;若是最重要的合法性通过, 则对识别模块设置为识别通过,反之则设置为识别不通过。
此外,疑似翻拍,可选择策略:当在配置的疑似阈值内。通过各个项目 的多引擎整合及汇总分级,可以有效的压缩图像存疑的区间范围。并依次为 依据,大量减少人工对疑似图像的介入程度。同时该分级机制需满足以下两 个条件:
1、该阈值的配置范围可以随着各引擎的迭代优化进行调整。
2、可依据各引擎的能力合理分配权重。
在一实施例中,步骤S40之后,还包括:
S1、获取相同类型的子信息对应的各个所述参考参数,其中,所述待确 定识别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的参 考参数;
S2、在各个所述参考参数中确定第二最大参考参数;
S3、根据所述第二最大参考参数对应的识别模块的识别模板,更新其他 识别模块,其中,所述识别模块为所述第二最大参考参数对应的子信息的识 别模板。
在本实施例中,某些识别模块可能具有识别特殊信息的识别能力,或者 对于某类信息的识别准确率较高,则其他识别模块可以根据其识别模板进行 更新。例如,识别模块A可以识别少数名族的字体,但其他识别模块并不具 备此项能力,因而需要将识别模块A识别少数名字的字体的识别模板发送至 其他识别模块进行更新。
对此,识别装置获取相同类型的子信息对应的各个参考参数,并在各个 参考参数中获取第二最大参考参数,若是的第二最大参考参数大于预设阈值, 即可确定识别装置对于该类信息的识别准确率极高。识别装置即可获取第二 最大参考参数对应的识别模块对于该类信息的识别模板,从而将识别模板发 送至其他识别模块加载识别模板。其他识别模块为除第二最大参考参数对应 的识别模块之外的识别模块。
本发明还提供一种终端。
参照图8,图8为本发明识别设备的功能模块示意图。
如图8所示,所述识别设备包括:
获取模块10,用于获取证件对应的证件图像;
识别模块20,用于采用各个所述识别模块分别对所述证件图像进行识别得到各个待确定识别信息;
所述获取模块10,还用于在各个所述待确定识别信息不一致时,获取参考信息,所述参考信息包括所述待确定识别信息关联的识别信息以及所述识别模块的参考参数中的至少一个,所述参考参数包括所述识别模块的权重、识别准确率以及置信度中的至少一种;
确定模块30,用于根据所述参考信息以及所述待确定识别信息确定目标识别信息,并根据所述目标识别信息确定证件信息,以将所述证件信息进行输出。
获取模块10,用于获取证件对应的证件图像;
识别模块20,用于采用各个所述识别模块分别对所述证件图像进行识别 得到各个待确定识别信息;
所述获取模块10,还用于在各个所述待确定识别信息不一致时,获取参 考信息,所述参考信息包括所述待确定识别信息关联的识别信息以及所述识 别模块的参考参数中的至少一个,所述参考参数包括所述识别模块的权重、 识别准确率以及置信度中的至少一种;
确定模块30,用于根据所述参考信息以及所述待确定识别信息确定目标 识别信息,并根据所述目标识别信息确定证件信息,以将所述证件信息进行 输出。
在一实施例中,所述识别设备还包括:
确定模块30,用于确定相同的所述待确定识别信息对应的所述参考参数 之和,得到中间数值;
确定模块30,用于在各个所述中间数值中确定最大中间数值,并将所述 最大中间数值对应的所述待确定识别信息确定为目标识别信息。
在一实施例中,所述识别设备还包括:
确定模块30,用于在相同类型的子信息对应的各个所述参考参数中,确 定第一最大参考参数,其中,所述待确定识别信息包括多类子信息,所述识 别模块对每类所述子信息设置对应的参考参数;
确定模块30,用于根据每个所述第一最大参考参数对应的所述子信息, 确定目标识别信息。
在一实施例中,所述识别设备还包括:
获取模块10,用于获取预设证件图像,并采用各个所述识别模块对所述 预设证件图像进行识别,得到每个所述识别模块对应的识别信息;
确定模块30,用于根据各个所述识别模块对应的识别信息以及所述预设 证件图像对应的标准识别信息,确定各个所述识别模块对应的权重。
在一实施例中,所述识别设备还包括:
获取模块10,用于获取所述识别模块的历史识别记录,其中,所述历史 识别记录中包括所述识别模块对证件的识别结果;
确定模块30,用于根据各个所述识别结果,确定所述识别模块的参考参 数。
在一实施例中,所述识别设备还包括:
修正模块,用于根据所述关联的识别信息,对所述待确定识别信息进行 修正,得到目标识别信息。
在一实施例中,所述识别设备还包括:
获取模块10,用于获取所述识别信息的类型,并确定所述识别信息对所 述类型对应的识别信息的识别能力值;
确定模块30,用于根据所述识别能力值确定所述识别模块对应的参考参 数。
在一实施例中,所述识别设备还包括:
获取模块10,用于获取所述目标识别信息对应的关联识别信息,并根据 所述关联的识别信息确定所述目标识别信息对应的标准识别信息;
确定模块30,用于根据所述标准识别信息修正所述目标识别信息,并将 修正后的所述目标识别信息作为证件信息进行输出。
在一实施例中,所述识别设备还包括:
识别模块20,用于采用各个所述识别模块对所述证件图像进行识别;
获取模块10,用于获取预设间隔时长内的所述识别模块输出的识别信息, 以确定为待确定识别信息。
在一实施例中,所述识别设备还包括:
获取模块10,用于获取所述识别装置的识别场景;
确定模块30,用于在所述识别场景为第一场景,将最先输出的识别信息 作为证件信息进场输出;
执行模块,用于在识别场景为第二场景,执行所述采用各个所述识别模 块对所述证件图像进行识别的步骤。
在一实施例中,所述识别设备还包括:
校验模块,用于对所述目标识别信息进行合法性的校验,所述校验包括 完整性校验、格式校验以及清晰度校验中的至少一种;
输出模块,用于在所述校验未通过时,输出告警信息。
在一实施例中,所述识别设备还包括:
获取模块10,用于获取相同类型的子信息对应的各个所述参考参数,其 中,所述待确定识别信息包括多类子信息,所述识别模块对每类所述子信息 设置对应的参考参数;
确定模块30,用于在各个所述参考参数中确定最小参考参数;
输出模块,用于在所述最小参考参数与每个其他参考参数之间的差值大 于预设差值,输出提高目标识别模块对第一目标类型的信息识别能力的提示 信息,其中,所述目标识别模块为所述最小参考参数对应的识别模块,所述 第一目标类型为最小参考参数对应的子信息的类型。
在一实施例中,所述识别设备还包括:
获取模块10,用于获取相同类型的子信息对应的各个所述参考参数,其 中,所述待确定识别信息包括多类子信息,所述识别模块对每类所述子信息 设置对应的参考参数;
确定模块30,用于在各个所述参考参数中确定第二最大参考参数;
更新模块,用于根据所述第二最大参考参数对应的识别模块的识别模板, 更新其他识别模块,其中,所述识别模板为所述第二最大参考参数对应的子 信息的识别模板。
在一实施例中,所述识别设备还包括:
获取模块10,用于获取相同类型的每个子信息对应的所述权重,其中, 所述待确定识别信息包括多类子信息,所述识别模块对每类所述子信息设置 对应的权重;
计算模块,用于根据相同类型的各个所述子信息对应的数值以及所述子 信息对应的权重进行加权计算,得到分值;
输出模块,用于在所述分值小于预设分值时,输出提高识别装置对第二 目标类型的信息识别能力的提示信息,其中,所述第二目标类型为所述分值 对应的子信息的类型。
其中,上述识别设备中各个模块的功能实现与上述证件信息的识别方法 实施例中各步骤相对应,其功能和实现过程在此处不再一一赘述。
本发明还提供一种计算机可读存储介质,该计算机可读存储介质上存储 有识别程序,所述识别程序被处理器执行时实现如以上任一项实施例所述的 证件信息的识别方法的步骤。
本发明计算机可读存储介质的具体实施例与上述证件信息的识别方法各 实施例基本相同,在此不作赘述。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变 体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品 或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是 还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的 情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过 程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述 实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通 过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的 技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体 现出来,该计算机软件产品存储在如上所述的一个存储介质(如ROM/RAM、磁 碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机, 服务器,空调器,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是 利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间 接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。

Claims (17)

1.一种证件信息的识别方法,其特征在于,应用于识别装置,所述识别装置包括多个识别模块,所述证件信息的识别方法包括:
获取证件对应的证件图像;
采用各个所述识别模块分别对所述证件图像进行识别得到各个待确定识别信息;
在各个所述待确定识别信息不一致时,获取参考信息,所述参考信息包括所述待确定识别信息关联的识别信息以及所述识别模块的参考参数中的至少一个,所述参考参数包括所述识别模块的权重、识别准确率以及置信度中的至少一种;
根据所述参考信息以及所述待确定识别信息确定目标识别信息,并根据所述目标识别信息确定证件信息,以将所述证件信息进行输出。
2.如权利要求1所述的证件信息的识别方法,其特征在于,所述参考信息包括参考参数,所述根据所述参考信息以及所述待确定识别信息中确定目标识别信息的步骤包括:
确定相同的所述待确定识别信息对应的所述参考参数之和,得到中间数值;
在各个所述中间数值中确定最大中间数值,并将所述最大中间数值对应的所述待确定识别信息确定为目标识别信息。
3.如权利要求1所述的证件信息的识别方法,其特征在于,所述参考信息包括参考参数,所述根据所述参考信息以及所述待确定识别信息中确定目标识别信息的步骤包括:
在相同类型的子信息对应的各个所述参考参数中,确定第一最大参考参数,其中,所述待确定识别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的参考参数;
根据每个所述第一最大参考参数对应的所述子信息,确定目标识别信息。
4.如权利要求1所述的证件信息的识别方法,其特征在于,所述参考信息包括关联的识别信息,所述根据所述参考信息以及所述待确定识别信息中确定目标识别信息的步骤包括:
根据所述关联的识别信息,对所述待确定识别信息进行修正,得到目标识别信息。
5.如权利要求1所述的证件信息的识别方法,其特征在于,所述参考信息包括参考参数,所述参考参数包括权重,所述获取参考信息的步骤包括:
获取预设证件图像,并采用各个所述识别模块对所述预设证件图像进行识别,得到每个所述识别模块对应的识别信息;
根据各个所述识别模块对应的识别信息以及所述预设证件图像对应的标准识别信息,确定各个所述识别模块对应的权重。
6.如权利要求1所述的证件信息的识别方法,其特征在于,所述参考信息包括参考参数,所述获取参考信息的步骤包括:
获取所述识别模块的历史识别记录,其中,所述历史识别记录中包括所述识别模块对证件的识别结果;
根据各个所述识别结果,确定所述识别模块的参考参数。
7.如权利要求1所述的证件信息的识别方法,其特征在于,所述参考信息包括参考参数,所述获取参考信息的步骤包括:
获取所述识别信息的类型,并确定所述识别信息对所述类型对应的识别信息的识别能力值;
根据所述识别能力值确定所述识别模块对应的参考参数。
8.如权利要求1所述的证件信息的识别方法,其特征在于,所述参考信息包括关联识别信息,所述根据所述目标识别信息确定证件信息的步骤包括:
根据所述关联的识别信息确定所述目标识别信息对应的标准识别信息;
根据所述标准识别信息修正所述目标识别信息,并将修正后的所述目标识别信息作为证件信息。
9.如权利要求1所述的证件信息的识别方法,其特征在于,所述采用各个所述识别模块分别对所述证件图像进行识别得到各个待确定识别信息的步骤包括:
采用各个所述识别模块对所述证件图像进行识别;
获取预设间隔时长内的所述识别模块输出的识别信息,以确定为待确定识别信息。
10.如权利要求9所述的证件信息的识别方法,其特征在于,所述获取证件对应的证件图像的步骤之后,还包括:
获取所述识别装置的识别场景;
在所述识别场景为第一场景,将最先输出的识别信息作为证件信息进场输出;
在识别场景为第二场景,执行所述采用各个所述识别模块对所述证件图像进行识别的步骤。
11.如权利要求1所述的证件信息的识别方法,其特征在于,所述根据所述参考信息以及所述待确定识别信息确定目标识别信息的步骤之后,还包括:
对所述目标识别信息进行合法性的校验,所述校验包括完整性校验、格式校验以及清晰度校验中的至少一种;
在所述校验未通过时,输出告警信息。
12.如权利要求1-11中任一项所述的证件信息的识别方法,其特征在于,所述参考信息包括参考参数,所述将所述证件信息输出的步骤之后,还包括:
获取相同类型的子信息对应的各个所述参考参数,其中,所述待确定识别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的参考参数;
在各个所述参考参数中确定最小参考参数;
在所述最小参考参数与每个其他参考参数之间的差值大于预设差值,输出提高目标识别模块对第一目标类型的信息识别能力的提示信息,其中,所述目标识别模块为所述最小参考参数对应的识别模块,所述第一目标类型为最小参考参数对应的子信息的类型。
13.如权利要求1-11中任一项所述的证件信息的识别方法,其特征在于,所述参考信息包括参考参数,所述将所述证件信息输出的步骤之后,还包括:
获取相同类型的子信息对应的各个所述参考参数,其中,所述待确定识别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的参考参数;
在各个所述参考参数中确定第二最大参考参数;
根据所述第二最大参考参数对应的识别模块的识别模板,更新其他识别模块,其中,所述识别模板为所述第二最大参考参数对应的子信息的识别模板。
14.如权利要求1-11中任一项所述的证件信息的识别方法,其特征在于,所述参考信息包括参考参数,所述将所述证件信息输出的步骤之后,还包括:
获取相同类型的每个子信息对应的所述权重,其中,所述待确定识别信息包括多类子信息,所述识别模块对每类所述子信息设置对应的权重;
根据相同类型的各个所述子信息对应的数值以及所述子信息对应的权重进行加权计算,得到分值;
在所述分值小于预设分值时,输出提高识别装置对第二目标类型的信息识别能力的提示信息,其中,所述第二目标类型为所述分值对应的子信息的类型。
15.一种识别装置,其特征在于,所述识别装置包括多个识别模块,所述识别装置还包括:
获取模块,用于获取证件对应的证件图像;
各个所述识别模块,用于分别对所述证件图像进行识别得到各个待确定识别信息;
所述获取模块,还用于在各个所述待确定识别信息不一致时,获取参考信息,所述参考信息包括所述待确定识别信息关联的识别信息以及所述识别模块的参考参数中的至少一个,所述参考参数包括所述识别模块的权重、识别准确率以及置信度中的至少一种;
确定模块,用于根据所述参考信息以及所述待确定识别信息确定目标识别信息,并根据所述目标识别信息确定证件信息,以将所述证件信息进行输出。
16.一种识别设备,其特征在于,所述识别设备包括多个识别模块、存储器、处理器以及存储在所述存储器并可在所述处理器上运行的识别程序,各个所述识别模块与所述处理器连接,所述识别程序被所述处理器执行时实现如权利要求1-14中任一项所述的证件信息的识别方法。
17.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有识别程序,所述识别程序被处理器执行时实现如权利要求1-14中任一项所述的证件信息的识别方法。
CN202011194484.XA 2020-10-30 2020-10-30 证件信息的识别方法及装置、设备和计算机可读存储介质 Active CN112308070B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011194484.XA CN112308070B (zh) 2020-10-30 2020-10-30 证件信息的识别方法及装置、设备和计算机可读存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011194484.XA CN112308070B (zh) 2020-10-30 2020-10-30 证件信息的识别方法及装置、设备和计算机可读存储介质

Publications (2)

Publication Number Publication Date
CN112308070A true CN112308070A (zh) 2021-02-02
CN112308070B CN112308070B (zh) 2024-04-26

Family

ID=74334169

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011194484.XA Active CN112308070B (zh) 2020-10-30 2020-10-30 证件信息的识别方法及装置、设备和计算机可读存储介质

Country Status (1)

Country Link
CN (1) CN112308070B (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379713A (zh) * 2021-06-23 2021-09-10 京东数科海益信息科技有限公司 证件图像的检测方法及其装置

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070147710A1 (en) * 2005-12-28 2007-06-28 Fujitsu Limited Medium processing apparatus, medium processing method, medium processing system and computer readable recording medium with medium processing program recorded thereon
CN103425975A (zh) * 2013-07-17 2013-12-04 中国中医科学院 一种临床病例数据采集系统及采集方法
US20150294139A1 (en) * 2014-04-11 2015-10-15 Idscan Biometrics Limited Method, system and computer program for validating a facial image-bearing identity document
CN106250858A (zh) * 2016-08-05 2016-12-21 重庆中科云丛科技有限公司 一种融合多种人脸识别算法的识别方法及系统
CN110287356A (zh) * 2019-05-16 2019-09-27 罗普特科技集团股份有限公司 一种用于人脸识别算法引擎的评测、调用方法和系统
CN110490185A (zh) * 2019-08-23 2019-11-22 北京工业大学 一种基于多次对比矫正ocr名片信息识别改进方法
CN111340035A (zh) * 2020-03-24 2020-06-26 山东浪潮通软信息科技有限公司 一种火车票识别方法、系统、设备以及介质
CN111639648A (zh) * 2020-05-26 2020-09-08 浙江大华技术股份有限公司 证件识别方法、装置、计算设备和存储介质
CN111813399A (zh) * 2020-07-23 2020-10-23 平安医疗健康管理股份有限公司 基于机器学习的审核规则处理方法、装置及计算机设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
US20070147710A1 (en) * 2005-12-28 2007-06-28 Fujitsu Limited Medium processing apparatus, medium processing method, medium processing system and computer readable recording medium with medium processing program recorded thereon
CN103425975A (zh) * 2013-07-17 2013-12-04 中国中医科学院 一种临床病例数据采集系统及采集方法
US20150294139A1 (en) * 2014-04-11 2015-10-15 Idscan Biometrics Limited Method, system and computer program for validating a facial image-bearing identity document
CN106250858A (zh) * 2016-08-05 2016-12-21 重庆中科云丛科技有限公司 一种融合多种人脸识别算法的识别方法及系统
CN110287356A (zh) * 2019-05-16 2019-09-27 罗普特科技集团股份有限公司 一种用于人脸识别算法引擎的评测、调用方法和系统
CN110490185A (zh) * 2019-08-23 2019-11-22 北京工业大学 一种基于多次对比矫正ocr名片信息识别改进方法
CN111340035A (zh) * 2020-03-24 2020-06-26 山东浪潮通软信息科技有限公司 一种火车票识别方法、系统、设备以及介质
CN111639648A (zh) * 2020-05-26 2020-09-08 浙江大华技术股份有限公司 证件识别方法、装置、计算设备和存储介质
CN111813399A (zh) * 2020-07-23 2020-10-23 平安医疗健康管理股份有限公司 基于机器学习的审核规则处理方法、装置及计算机设备

Non-Patent Citations (2)

* Cited by examiner, † Cited by third party
Title
ZHANG, HF ET AL.: "EXPRESSION-IDENTITY FUSION NETWORK FOR FACIAL EXPRESSION RECOGNITION", IEEE, pages 133 - 141 *
李颖;刘菊华;易尧华;: "自然场景图像的字符识别方法", 包装工程, no. 05 *

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113379713A (zh) * 2021-06-23 2021-09-10 京东数科海益信息科技有限公司 证件图像的检测方法及其装置
CN113379713B (zh) * 2021-06-23 2024-02-09 京东科技信息技术有限公司 证件图像的检测方法及其装置

Also Published As

Publication number Publication date
CN112308070B (zh) 2024-04-26

Similar Documents

Publication Publication Date Title
WO2018166116A1 (zh) 车损识别方法、电子装置及计算机可读存储介质
AU2013379776B2 (en) Presentation of image of source of tax data through tax preparation application
AU2013379774B2 (en) Tax document imaging and processing
US8064703B2 (en) Property record document data validation systems and methods
US20140010466A1 (en) Property record document data verification systems and methods
CN109035041A (zh) 电子装置、车险智能理赔方法及存储介质
CN101925904A (zh) 使用动态文档识别框架的文档验证
WO2021143088A1 (zh) 多证件类型同步检测方法、装置、计算机设备及存储介质
CN108090747A (zh) 车险核保的自助验车方法、装置、设备和计算机存储介质
CN110288755A (zh) 基于文本识别的发票检验方法、服务器及存储介质
CN112396054A (zh) 文本提取方法、装置、电子设备及存储介质
CN112308070A (zh) 证件信息的识别方法及装置、设备和计算机可读存储介质
CN110728680A (zh) 行车记录仪检测方法、装置、计算机设备和存储介质
CN110599319A (zh) 自动审计方法、装置、终端及存储介质
CN109670497A (zh) 图片上传方法、装置、设备及可读存储介质
US20070217691A1 (en) Property record document title determination systems and methods
CN111368709A (zh) 图片文本的识别方法、装置、设备及可读存储介质
CN115658525A (zh) 用户界面的校验方法、装置、存储介质及计算机设备
CN113837170A (zh) 车辆保险理赔申请的自动审核处理方法、装置及设备
WO2021174869A1 (zh) 用户图片数据的处理方法、装置、计算机设备及存储介质
JP4300051B2 (ja) 帳票画像処理装置および課金方法
US11210509B2 (en) Systems and methods for enrollment and identity management using mobile imaging
KR101429929B1 (ko) 생체 인식 및 인구통계학적 데이터의 전송 및 관리 시스템 그리고 장치
CN113642586A (zh) 一种车牌类型的识别方法及装置
CN113869419A (zh) 一种伪造图像识别方法、装置、设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant