CN113627551A - 基于多模型的证件分类方法、装置、设备和存储介质 - Google Patents

基于多模型的证件分类方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN113627551A
CN113627551A CN202110943047.1A CN202110943047A CN113627551A CN 113627551 A CN113627551 A CN 113627551A CN 202110943047 A CN202110943047 A CN 202110943047A CN 113627551 A CN113627551 A CN 113627551A
Authority
CN
China
Prior art keywords
certificate
classification
target
model
probability
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202110943047.1A
Other languages
English (en)
Inventor
李书涵
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Ping An Puhui Enterprise Management Co Ltd
Original Assignee
Ping An Puhui Enterprise Management Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Ping An Puhui Enterprise Management Co Ltd filed Critical Ping An Puhui Enterprise Management Co Ltd
Priority to CN202110943047.1A priority Critical patent/CN113627551A/zh
Publication of CN113627551A publication Critical patent/CN113627551A/zh
Pending legal-status Critical Current

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/24Classification techniques
    • G06F18/241Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches
    • G06F18/2415Classification techniques relating to the classification model, e.g. parametric or non-parametric approaches based on parametric or probabilistic models, e.g. based on likelihood ratio or false acceptance rate versus a false rejection rate
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting

Landscapes

  • Engineering & Computer Science (AREA)
  • Data Mining & Analysis (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • Artificial Intelligence (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Evolutionary Biology (AREA)
  • Evolutionary Computation (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Probability & Statistics with Applications (AREA)
  • Information Retrieval, Db Structures And Fs Structures Therefor (AREA)

Abstract

本申请涉及人工智能技术领域,提供一种基于多模型的证件分类方法、装置、设备和存储介质,方法包括:获取待处理的证件图像;调用预先训练好的预设数量的证件分类模型,并获取各证件分类模型的分类精确度;根据分类精确度,从所有证件分类模型中筛选出满足预设条件的目标证件分类模型;将证件图像输入至各目标证件分类模型中,获取各目标证件分类模型分别输出的与证件图像对应的多种证件类型的概率数值;基于所有概率数值,确定出与证件图像对应的目标证件类型。本申请能够有效提高对待处理的证件图像的识别准确率。本申请还可以应用于区块链领域,上述目标证件类型等数据可以存储于区块链上。

Description

基于多模型的证件分类方法、装置、设备和存储介质
技术领域
本申请涉及人工智能技术领域,具体涉及一种基于多模型的证件分类方法、装置、设备和存储介质。
背景技术
随着移动互联网的发展和普及,网上办理业务已经越来越普遍,越来越多的业务,如互联网金融,电信和电商行业等都需要对用户的证件信息进行采集和登记,以实行实名制管理,需要用户上传各种证件在多种业务场景中早已经成为一种屡见不鲜的现象。在对证件进行识别认证时,首先需要对证件进行分类,但证件种类逐渐增多,对证件进行分类显得更加困难。现有技术中通常是使用传统机器学习的证件检测分类模型对证件进行分类,而在面临日益增多的证件类型,这种基于传统机器学习的证件检测分类模型存在分类的准确率较低的技术问题,已经不能较好的满足市场的需求。因此,如何提供一种准确性更高的证件分类方法,成为了当前亟需解决的问题。
发明内容
本申请的主要目的为提供一种基于多模型的证件分类方法、装置、设备和存储介质,旨在解决现有的使用传统机器学习的证件检测分类方式存在分类的准确率较低的技术问题。
本申请提出一种基于多模型的证件分类方法,所述方法包括步骤:
获取待处理的证件图像;
调用预先训练好的预设数量的证件分类模型,并获取各所述证件分类模型的分类精确度;其中,每一个所述证件分类模型是基于各自不同的训练数据集对预设的卷积神经网络模型进行训练生成的,所述训练数据集的数量等于所述预设数量;
根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型;其中,所述目标证件分类模型的数量为多个;
将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值;其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型;
基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型。
可选地,所述根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型的步骤,包括:
获取各所述证件分类模型的分类精确度,以及获取预设的精确度阈值;
从所有所述证件分类模型中筛选出分类精确度大于所述精确度阈值的第一证件分类模型;
获取内存信息;
基于预设的内存-模型数量映射表查询出与所述内存信息对应的目标数量;
判断所述第一证件分类模型的数量是否大于所述目标数量;
若是,则将所有所述第一证件分类模型按照分类精确度的数值从大到小的顺序进行排序,得到对应的排序结果;
从所述排序结果排在首位的第一证件分类模型开始,依次从所有所述第一证件分类模型中筛选出与所述目标数量相同的多个第二证件分类模型;
将所述第二证件分类模型作为所述目标证件分类模型。
可选地,所述基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型的步骤,包括:
判断所述目标证件分类模型的数量是否为奇数;
若所述目标证件分类模型的数量为奇数,则从所有所述概率数值中提取出各所述目标证件分类模型输出的数值最大的第一概率数值;
分别获取各所述第一概率数值对应的第一证件类型;
对各所述第一证件类型进行分析处理,从所有所述第一证件类型中筛选出现次数最多的第二证件类型;
判断所述第二证件类型的出现次数是否大于1;
若所述第二证件类型的出现次数大于1,将所述第二证件类型作为所述目标证件类型。
可选地,所述基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型的步骤,包括:
判断所述目标证件分类模型的数量是否为偶数;
若所述目标证件分类模型的数量为偶数,则获取与各所述概率数值一一对应的第三证件类型;
对所有所述第三证件类型进行去重处理,得到对应的第四证件类型;
从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值;
从所有所述分类数值中获取数值最大的目标分类数值,并从所有所述第四证件类型中查找出与所述目标分类数值对应的第五证件类型;
将所述第五证件类型作为所述目标证件类型。
可选地,所述从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值的步骤,包括:
从所有所述概率数值中获取与第一指定证件类型对应的所有第三概率数值;其中,所述第一指定证件类型为所有所述第四证件类型中的任意一种证件类型;
计算所有所述第三概率数值的第一和值;
将所述第一和值作为所述第一指定证件类型的分类数值。
可选地,所述从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值的步骤,包括:
从所有所述概率数值中获取与第二指定证件类型对应的所有第四概率数值;其中,所述第二指定证件类型为所有所述第四证件类型中的任意一种证件类型;
获取与各所述目标证件分类模型分别对应的模型权重;
基于所述模型权重,获取与各所述第四概率数值分别对应的目标证件分类模型的目标模型权重;
基于所述目标模型权重,对所有所述第四概率数值进行加权求和处理,得到对应的第二和值;
将所述第二和值作为所述第二指定证件类型的分类数值。
可选地,所述获取各所述证件分类模型的分类精确度的步骤之前,包括:
获取预设的测试数据集;其中,所述测试数据集包括多个测试数据,以及与各所述测试数据分别对应的分类标签信息;
分别将各所述测试数据输入至指定证件分类模型中,获取所述指定证件分类模型输出的与各所述测试数据分别对应的指定分类结果;其中,所述指定证件分类模型为所有所述证件分类模型中的任意一个模型,所述指定分类结果为所述指定证件分类模型基于所述测试数据输出的最大的概率数值所对应的分类结果;
基于所述分类标签信息与所述指定分类结果,计算各所述测试数据中指定分类结果命中相应的分类标签信息的比例数值;
将所述比例数值作为所述指定证件分类模型的分类精确度。
本申请还提供一种基于多模型的证件分类装置,包括:
第一获取模块,用于获取待处理的证件图像;
调用模块,用于调用预先训练好的预设数量的证件分类模型,并获取各所述证件分类模型的分类精确度;其中,每一个所述证件分类模型是基于各自不同的训练数据集对预设的卷积神经网络模型进行训练生成的,所述训练数据集的数量等于所述预设数量;
筛选模块,用于根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型;其中,所述目标证件分类模型的数量为多个;
第二获取模块,用于将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值;其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型;
第一确定模块,用于基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型。
本申请还提供一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。
本申请还提供一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现上述方法的步骤。
本申请中提供的基于多模型的证件分类方法、装置、计算机设备和存储介质,具有以下有益效果:
本申请中提供的基于多模型的证件分类方法、装置、计算机设备和存储介质,在获取到待处理的证件图像后,会先调用出预先训练好的预设数量的证件分类模型,并会基于各所述证件分类模型的分类精确度智能地从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型,进而将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值,最后基于所述概率数值确定出与所述证件图像对应的目标证件类型。本申请通过结合使用多个目标证件分类模型来对待处理的证件图像进行识别分类处理以生成最终的与所述证件图像对应的目标证件类型,可以避免仅利用一个证件分类模型来对待处理的证件图像进行处理而导致识别误差过大,有效地提高了对于待处理的证件图像的识别准确率。另外,同时也不需要使用训练生成的所有证件分类模型进行处理而导致数据处理量过大,保证了模型识别的速度的流畅性,提高了生成目标证件类型的处理速率与智能性。
附图说明
图1是本申请一实施例的基于多模型的证件分类方法的流程示意图;
图2是本申请一实施例的基于多模型的证件分类装置的结构示意图;
图3是本申请一实施例的计算机设备的结构示意图。
本申请目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅仅用于解释本申请,并不用于限定本申请。
本技术领域技术人员可以理解,除非另外定义,这里使用的所有术语(包括技术术语和科学术语),具有与本发明所属领域中的普通技术人员的一般理解相同的意义。还应该理解的是,诸如通用字典中定义的那些术语,应该被理解为具有与现有技术的上下文中的意义一致的意义,并且除非像这里一样被特定定义,否则不会用理想化或过于正式的含义来解释。
本申请实施例可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(Artificial Intelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
参照图1,本申请一实施例的基于多模型的证件分类方法,包括:
S1:获取待处理的证件图像;
S2:调用预先训练好的预设数量的证件分类模型,并获取各所述证件分类模型的分类精确度;其中,每一个所述证件分类模型是基于各自不同的训练数据集对预设的卷积神经网络模型进行训练生成的,所述训练数据集的数量等于所述预设数量;
S3:根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型;其中,所述目标证件分类模型的数量为多个;
S4:将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值;其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型;
S5:基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型。
如上述步骤S1至S5所述,本方法实施例的执行主体为一种基于多模型的证件分类装置。在实际应用中,上述基于多模型的证件分类装置可以通过虚拟装置,例如软件代码实现,也可以通过写入或集成有相关执行代码的实体装置实现,且可以与用户通过键盘、鼠标、遥控器、触摸板或声控设备等方式进行人机交互。本实施例中的基于多模型的证件分类装置,能够有效提高对于待处理的证件图像的识别准确率,以及提高了生成目标证件类型的处理速率与智能性。具体地,首先获取待处理的证件图像。其中,证件可以指用来证明用户身份、经历等证书和文件,比如:各个国家的居民身份证、银行卡、房产证、车辆行驶证、护照、学生证、社保卡等证件。另外,待处理的证件图像是指待识别证件的证件图像,可以是通过装置扫描或对该待识别证件进行拍摄得到,待处理的证件图像可以是证件的正面图像,当然,也可以根据实际需求将输入证件的反面图像作为证件图像,对此不作具体限定。
然后调用预先训练好的预设数量的证件分类模型,并获取各所述证件分类模型的分类精确度。其中,每一个所述证件分类模型是基于各自不同的训练数据集对预设的卷积神经网络模型进行训练生成的,所述训练数据集的数量等于所述预设数量。其中,可基于预先采集的训练数据集对已有的卷积神经网络(Convolutional Neural Networks,可简称为CNN)进行训练得到证件分类模型。训练数据集包括若干样本证件图像,以及与样本证件图像对应的分类标签信息,分类标签信息也即样本证件图像对应的证件类型信息。在使用证件分类模型对输入的待处理的证件图像进行识别分类时,通过将待处理的证件图像输入训练完成的证件分类模型中,可以得到对应的分类结果。距离地:采用证件分类模型可以将与待处理的证件图像对应的证件识别为身份证、护照以及学生证等证件类型,且每一种证件类型对应一个概率数值。具体的,生成证件分类模型的过程可包括:获取预设数量的训练数据集;其中,各所述训练数据集为从预设的样本数据集中筛选出的预设比例的样本数据集,每一个训练数据集包括若干样本证件图像,以及与样本证件图像对应的分类标签信息;获取指定训练数据集,将所述指定训练数据集中的样本证件图像作为预设的卷积神经网络模型的输入,将样本证件图像对应的分类标签信息作为所述卷积神经网络模型的输出对所述卷积神经网络模型进行训练,得到训练完成的卷积神经网络模型;获取预设的验证数据集,使用所述验证数据集对所述训练完成的卷积神经网络模型进行验证,并判断是否验证通过;若验证通过,则将所述训练完成的卷积神经网络模型作为与所述指定训练数据集对应的证件分类模型。另外,分类标签信息也即样本证件图像对应的证件类型信息。所获取的训练数据集的数量与上述证件分类模型的数量相同,也即是训练数据集与证件分类模型之间为一一对应的关系。此外,由于从样本数据集中挑选出的训练数据集不同,因此生成的各个证件分类模型的模型识别的准确性与稳定性会有所不同,从而后续步骤可以对各个证件分类模型的模型识别的准确性与稳定性进行分析,进而从所有所述证件分类模型筛选出用于对所述待处理的证件图像进行识别分类处理的多个目标证件分类模型,以起到有效提高最终生成的与所述证件图像对应的目标证件类型的准确性。并且,对于上述预设数量的具体数值不做限定,可根据实际需求进行设置,例如可设为6。所述预设数量是指用户期望训练生成的证件分类模型的数量,通过基于用户输入的预设数量来生成对应数量的多个分类模型,有利于提高用户的使用体验。
之后根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型。其中,所述目标证件分类模型的数量为多个。另外,所述预设条件可指目标证件分类模型的分类精确度大于所述精确度阈值,且目标证件分类模型的数量会根据装置的内存信息来适配预设的内存-模型数量映射表中的数量需求。后续将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值。其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型。最后基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型。其中,对于基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型的确定方式不作具体限定。具体的,装置会智能的根据目标证件分类模型的数量来对应采取不同的处理方式来确定出与所述证件图像对应的目标证件类型。当目标证件分类模型的数量为奇数时,会将各所述目标证件分类模型分别输出的数值最大的第一概率数值所对应的出现次数最多的第二证件类型作为待处理的证件图像的目标证件类型。而目标证件分类模型的数量为偶数时,会基于所有目标证件分类模型输出的每一种证件类型对应的概率数值来准确地计算出每一种证件类型的分类数值,再将与所述分类数值最大的目标分类数值对应的第五证件类型作为待处理的证件图像的目标证件类型。
本实施例在获取到待处理的证件图像后,会先调用出预先训练好的预设数量的证件分类模型,并会基于各所述证件分类模型的分类精确度智能地从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型,进而将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值,最后基于所述概率数值确定出与所述证件图像对应的目标证件类型。本实施例通过结合使用多个目标证件分类模型来对待处理的证件图像进行识别分类处理以生成最终的与所述证件图像对应的目标证件类型,可以避免仅利用一个证件分类模型来对待处理的证件图像进行处理而导致识别误差过大,有效地提高了对于待处理的证件图像的识别准确率。另外,同时也不需要使用训练生成的所有证件分类模型进行处理而导致数据处理量过大,保证了模型识别的速度的流畅性,提高了生成目标证件类型的处理速率与智能性。
进一步地,训练完成的证件分类模型的训练过程可包括:将指定训练数据集的指定样本证件图像输入至待训练的卷积神经网络模型的特征提取层,以得到图像特征。该特征提取层可以包括卷积层、池化层等。上述图像特征可以包括用于指示所呈现的证件图像的关键区域(如文字区域、标志区域)的特征,标志区域可为固定不变的,如包含人像的区域或包含环境图像的区域。举例地;中国居民身份证上在性别项目的位置,有定向光变色的“长城”图案,以及背面的国徽等,都可以认为是证件中的标志区域。然后将所得到的图像特征输入至上述卷积神经网络模型的全连接层,从而输出该指定样本证件图像属于多种证件类型的概率数值。最后从得到的与指定样本证件图像对应的多个概率数值筛选出与分类标签信息对应的目标概率数值,并基于该目标概率数值确定预设损失函数是否收敛。如果预设损失函数收敛,则确定该卷积神经网络模型训练完成。上述预设损失函数可以为softmax损失函数,可以将所得到的目标概率数值代入softmax损失函数来确定该softmax损失函数是否收敛。上述收敛是指预设损失函数达到预设损失值。而如果预设损失函数未收敛,则调整待训练的卷积神经网络模型的参数,利用反向传播算法继续执行上述训练步骤,直至该损失函数收敛,进而完成训练过程。之后获取预设的验证数据集,使用上述验证数据集对上述训练完成的卷积神经网络模型进行验证,并判断是否验证通过。其中,上述验证数据集可为预先收集的与上述训练数据集不同的数据样本集。如果验证通过,则将上述训练完成的卷积神经网络模型作为与上述指定训练数据集对应的证件分类模型。其中,在生成了上述证件分类模型后,还可将该证件分类模型存储至区块链网络,通过使用区块链来对上述证件分类模型进行存储和管理,能够有效地保证上述证件分类模型的安全性与不可篡改性。
进一步地,本申请一实施例中,上述步骤S3,包括:
S300:获取各所述证件分类模型的分类精确度,以及获取预设的精确度阈值;
S301:从所有所述证件分类模型中筛选出分类精确度大于所述精确度阈值的第一证件分类模型;
S302:获取内存信息;
S303:基于预设的内存-模型数量映射表查询出与所述内存信息对应的目标数量;
S304:判断所述第一证件分类模型的数量是否大于所述目标数量;
S305:若是,则将所有所述第一证件分类模型按照分类精确度的数值从大到小的顺序进行排序,得到对应的排序结果;
S306:从所述排序结果排在首位的第一证件分类模型开始,依次从所有所述第一证件分类模型中筛选出与所述目标数量相同的多个第二证件分类模型;
S307:将所述第二证件分类模型作为所述目标证件分类模型。
如上述步骤S300至S307所述,所述根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型的步骤,具体可包括:首先获取各所述证件分类模型的分类精确度,以及获取预设的精确度阈值。其中,对于精确度阈值的具体取值不作限定,可根据实际需求进行设置。然后从所有所述证件分类模型中筛选出分类精确度大于所述精确度阈值的第一证件分类模型。之后获取内存信息,并基于预设的内存-模型数量映射表查询出与所述内存信息对应的目标数量。其中,所述内存信息具体可指装置的CPU内核数量,所述内存-模型数量映射表可基于实际测试结果、线上问题分析以及专家经验生成,该内存-模型数量映射表为记录有内存信息与模型运作数量的映射关系的数据表。另外,基于内存信息从所述内存-模型数量映射表中选择对应的模型数量,能够保证装置内部模型的数据计算处理过程的损耗代价较少,并保证数据计算处理处于正常速率且装置不会出现卡顿情况。在得到了目标数量后,判断所述第一证件分类模型的数量是否大于所述目标数量。若所述第一证件分类模型的数量大于所述目标数量,则将所有所述第一证件分类模型按照分类精确度的数值从大到小的顺序进行排序,得到对应的排序结果。后续从所述排序结果排在首位的第一证件分类模型开始,依次从所有所述第一证件分类模型中筛选出与所述目标数量相同的多个第二证件分类模型。最后将所述第二证件分类模型作为所述目标证件分类模型。本实施例在获得了预先训练好的预设数量的证件分类模型后,还会进一步基于每一个证件分类模型的分类精度值与预设的内存-模型数量映射表对所有证件分类模型进行筛选处理,以得到符合使用条件的目标证件分类模型,由于筛选出的该多个目标证件分类模型的准确性与稳定性较高,从而使用该多个目标证件分类模型来对待处理的证件图像进行识别分类处理能够保证后续生成的目标证件类型的全面性。既避免了仅利用一个证件分类模型来对证件图像进行分类处理而导致分类误差过大,同时也不需要使用训练生成的所有证件分类模型进行处理而导致数据处理量过大,有效地提高了对于待处理的证件图像的证件分类的准确率,保证了模型识别的速度的流畅性,提高了生成与所述证件图像对应的目标证件类型的处理速率与智能性。
进一步地,本申请一实施例中,上述步骤S5,包括:
S500:判断所述目标证件分类模型的数量是否为奇数;
S501:若所述目标证件分类模型的数量为奇数,则从所有所述概率数值中提取出各所述目标证件分类模型输出的数值最大的第一概率数值;
S502:分别获取各所述第一概率数值对应的第一证件类型;
S503:对各所述第一证件类型进行分析处理,从所有所述第一证件类型中筛选出现次数最多的第二证件类型;
S504:判断所述第二证件类型的出现次数是否大于1;
S505:若所述第二证件类型的出现次数大于1,将所述第二证件类型作为所述目标证件类型。
如上述步骤S500至S505所述,所述基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型的步骤,具体可包括:首先判断所述目标证件分类模型的数量是否为奇数。其中,所述目标证件分类模型的数量可以为奇数,也可以为偶数,装置会智能的根据目标证件分类模型的数量来对应采取不同的处理方式来确定出与所述证件图像对应的目标证件类型。若所述目标证件分类模型的数量为奇数,则从所有所述概率数值中提取出各所述目标证件分类模型输出的数值最大的第一概率数值。其中,对于相同的待处理的证件图像,不同的证件分类模型对其进行识别分类处理后得到的识别分类结果可能并不完全相同。故当只使用一个证件分类模型对待处理的证件图像进行识别时,得到只有单一的识别分类结果,准确性较低,缺乏全面性。另外,当目标证件分类模型的数量大于1且为奇数时,可以避免出现当采用偶数个例如4个时每两个目标证件分类模型识别出的识别分类结果相同,而与其余两个目标证件分类模型识别出的识别分类结果不同的情况,使得出现了两种识别分类结果而导致无法准确地确定出与待处理的证件图像对应的证件类型的情况。然后分别获取各所述第一概率数值对应的第一证件类型。之后对各所述第一证件类型进行分析处理,从所有所述第一证件类型中筛选出现次数最多的第二证件类型。最后判断所述第二证件类型的出现次数是否大于1。若所述第二证件类型的出现次数大于1,将所述第二证件类型作为所述目标证件类型。其中,只有当所述第二证件类型的出现次数大于1时,才表明该第二证件类型为出现了多次的证件类型,后续才会将该第二证件类型作为最终的目标证件类型。而如果所述第二证件类型的出现次数等于1,则可表明第二证件类型的数量为多个,使得无法基于该第二证件类型来确定出最终的目标证件类型,此时装置会重新进行对于待处理的证件图像的识别处理流程,直至确定出与该待处理的证件图像对应的目标证件分类模型。本实施例当判别出目标证件分类模型的数量为奇数时,会智能的通过基于分类精确度从所有证件分类模型中挑选出满足预设条件的目标证件分类模型来分别对待处理的证件图像进行分类识别处理,并将各所述目标证件分类模型分别输出的数值最大的第一概率数值所对应的出现次数最多的第二证件类型作为待处理的证件图像的目标证件类型,从而可以避免仅利用一个证件分类模型来对待处理的证件图像进行处理而导致识别误差过大,从而有效地提高了对于待处理的证件图像的识别准确率。另外,同时也不需要使用训练生成的所有证件分类模型进行处理而导致数据处理量过大,保证了模型识别的速度的流畅性,提高了生成与所述证件图像对应的目标证件类型的处理速率与智能性。
进一步地,本申请一实施例中,上述步骤S5,包括:
S510:判断所述目标证件分类模型的数量是否为偶数;
S511:若所述目标证件分类模型的数量为偶数,则获取与各所述概率数值一一对应的第三证件类型;
S512:对所有所述第三证件类型进行去重处理,得到对应的第四证件类型;
S513:从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值;
S514:从所有所述分类数值中获取数值最大的目标分类数值,并从所有所述第四证件类型中查找出与所述目标分类数值对应的第五证件类型;
S515:将所述第五证件类型作为所述目标证件类型。
如上述步骤S510至S515所述,所述基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型的步骤,具体可包括:首先判断所述目标证件分类模型的数量是否为偶数。其中,所述目标证件分类模型的数量可以为奇数,也可以为偶数,装置会智能的根据目标证件分类模型的数量来对应采取不同的处理方式来确定出与所述证件图像对应的目标证件类型。若所述目标证件分类模型的数量为偶数,则获取与各所述概率数值一一对应的第三证件类型。其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型。然后对所有所述第三证件类型进行去重处理,得到对应的第四证件类型。其中,获取得到的所有所述第三证件类型中可能会存在具有相同的第三证件类型。之后从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值。其中,对所述预设规则不做具体限定。优选地,所述按照预设规则计算出与各所述第四证件类型分别对应的分类数值的过程可包括:先从所有所述概率数值中获取与第一指定证件类型对应的所有第三概率数值;其中,所述第一指定证件类型为所有所述第四证件类型中的任意一种证件类型;再计算所有所述第三概率数值的第一和值;进而将所述第一和值作为所述第一指定证件类型的分类数值。另外,还可包括其他计算与各所述第四证件类型分别对应的分类数值的方式,在此暂不做具体阐述。后续从所有所述分类数值中获取数值最大的目标分类数值,并从所有所述第四证件类型中查找出与所述目标分类数值对应的第五证件类型。最后将所述第五证件类型作为所述目标证件类型。本实施例当判别出目标证件分类模型的数量为偶数时,会智能的通过基于分类精确度从所有证件分类模型中挑选出满足预设条件的目标证件分类模型来分别对待处理的证件图像进行分类识别处理,并基于所有目标证件分类模型输出的每一种证件类型对应的概率数值来准确地计算出每一种证件类型的分类数值,进而将与所述分类数值最大的目标分类数值对应的第五证件类型作为待处理的证件图像的目标证件类型,可以避免仅利用一个证件分类模型来对待处理的证件图像进行处理而导致识别误差过大,从而有效地提高了对于待处理的证件图像的识别准确率。另外,同时也不需要使用训练生成的所有证件分类模型进行处理而导致数据处理量过大,保证了模型识别的速度的流畅性,提高了生成与所述证件图像对应的目标证件类型的处理速率与智能性。
进一步地,本申请一实施例中,上述步骤S513,包括:
S5130:从所有所述概率数值中获取与第一指定证件类型对应的所有第三概率数值;其中,所述第一指定证件类型为所有所述第四证件类型中的任意一种证件类型;
S5131:计算所有所述第三概率数值的第一和值;
S5132:将所述第一和值作为所述第一指定证件类型的分类数值。
如上述步骤S5130至S5132所述,所述从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值的步骤,具体可包括:首先从所有所述概率数值中获取与第一指定证件类型对应的所有第三概率数值。其中,所述第一指定证件类型为所有所述第四证件类型中的任意一种证件类型。然后计算所有所述第三概率数值的第一和值。最后将所述第一和值作为所述第一指定证件类型的分类数值。本实施例中,对于与各目标证件分类模型输出的概率数值所对应的所有证件类型中每一种证件类型,会通过从所有所述概率数值中获取与该证件类型对应的所有概率数值,再计算得到的所有概率数值的和值,进而将得到的和值作为该证件类型的分类数值。由于生成的证件类型的分类数值为结合了每一个目标证件分类模型所输出的概率数值来得到的,有效的保证了生成的证件类型的分类数值的准确性。并且,在计算生成分类数值后,有利于后续能够基于得到的分类数值来快速准确地获取到分类数值最大的目标分类数值,进而将最大的目标分类数值对应的证件类型作为所述证件图像对应的目标证件类型,以实现对于待处理的证件图像的准确快速识别。
进一步地,本申请一实施例中,上述步骤S513,包括:
S5133:从所有所述概率数值中获取与第二指定证件类型对应的所有第四概率数值;其中,所述第二指定证件类型为所有所述第四证件类型中的任意一种证件类型;
S5134:获取与各所述目标证件分类模型分别对应的模型权重;
S5135:基于所述模型权重,获取与各所述第四概率数值分别对应的目标证件分类模型的目标模型权重;
S5136:基于所述目标模型权重,对所有所述第四概率数值进行加权求和处理,得到对应的第二和值;
S5137:将所述第二和值作为所述第二指定证件类型的分类数值。
如上述步骤S5133至S5137所述,所述从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值的步骤,具体可包括:首先从所有所述概率数值中获取与第二指定证件类型对应的所有第四概率数值。其中,所述第二指定证件类型为所有所述第四证件类型中的任意一种证件类型。然后获取与各所述目标证件分类模型分别对应的模型权重。其中,计算与各所述目标证件分类模型分别对应的模型权重的过程可包括:获取特定证件分类模型的分类精确度;其中,所述特定证件分类模型为所有所述目标证件分类模型的任意一个模型;计算所有所述目标证件分类模型的分类精确度的第三和值;计算所述特定证件分类模型的分类精确度与所述第三和值的商值;将所述商值作为所述特定证件分类模型的模型权重。之后基于所述模型权重,获取与各所述第四概率数值分别对应的目标证件分类模型的目标模型权重。后续基于所述目标模型权重,对所有所述第四概率数值进行加权求和处理,得到对应的第二和值。其中,可基于第四概率数值与目标证件分类模型之间的对应关系,以及目标证件分类模型与目标模型权重之间的对应关系,来生成目标模型权重与第四概率数值之间的目标对应关系,进而可基于该目标对应关系使用所述目标模型权重,对所有所述第四概率数值进行加权求和处理以生成第二和值。最后将所述第二和值作为所述第二指定证件类型的分类数值。本实施例中,对于与各目标证件分类模型输出的概率数值所对应的所有证件类型中的每一种证件类型,会通过从所有所述概率数值中获取与该证件类型对应的所有第四概率数值,以及获取与所述第四概率数值对应的目标证件分类模型的目标模型权重,进而基于所述目标模型权重,对所有所述第四概率数值进行加权求和处理以得到对应的第二和值,并将得到的第二和值作为该证件类型的分类数值。由于生成的证件类型的分类数值为结合了每一个目标证件分类模型所输出的概率数值以及每一个目标证件分类模型的模型权重来得到的,有效的保证了生成的证件类型的分类数值的准确性。并且,在计算生成分类数值后,有利于后续能够基于得到的分类数值来快速准确地获取到分类数值最大的目标分类数值,进而将最大的目标分类数值对应的证件类型作为所述证件图像对应的目标证件类型,以实现对于待处理的证件图像的准确快速识别。
进一步地,本申请一实施例中,上述步骤S2之前,包括:
S200:获取预设的测试数据集;其中,所述测试数据集包括多个测试数据,以及与各所述测试数据分别对应的分类标签信息;
S201:分别将各所述测试数据输入至指定证件分类模型中,获取所述指定证件分类模型输出的与各所述测试数据分别对应的指定分类结果;其中,所述指定证件分类模型为所有所述证件分类模型中的任意一个模型,所述指定分类结果为所述指定证件分类模型基于所述测试数据输出的最大的概率数值所对应的分类结果;
S202:基于所述分类标签信息与所述指定分类结果,计算各所述测试数据中指定分类结果命中相应的分类标签信息的比例数值;
S203:将所述比例数值作为所述指定证件分类模型的分类精确度。
如上述步骤S200至S203所述,在执行所述获取各所述证件分类模型的分类精确度的步骤之前,还可包括生成各所述证件分类模型的分类精确度的步骤。具体地,首先获取预设的测试数据集。其中,所述测试数据集包括多个测试数据,以及与各所述测试数据分别对应的分类标签信息。另外,上述测试数据集可基于预设的样本数据集生成,如可从该样本数据集中随机获取预设的数值比例的数据集作为该测试数据集,所述数值比例可根据实际需求进行设置。然后分别将各所述测试数据输入至指定证件分类模型中,获取所述指定证件分类模型输出的与各所述测试数据分别对应的指定分类结果。其中,所述指定证件分类模型为所有所述证件分类模型中的任意一个模型,所述指定分类结果为所述指定证件分类模型基于所述测试数据输出的最大的概率数值所对应的分类结果。之后基于所述分类标签信息与所述指定分类结果,计算各所述测试数据中指定分类结果命中相应的分类标签信息的比例数值。其中,指定分类结果命中相应的分类标签信息是指同一个测试数据的指定分类结果与分类标签信息相同。另外,可先获取所有指定分类结果中分类正确的分类结果,并计算该分类正确的分类结果的第一数量,再计算所有所述指定分类结果的第二数量,进而计算所述第一数量与所述第二数量的商值,并将该商值作为上述概率值。最后将所述比例数值作为所述指定证件分类模型的分类精确度。本实施例中,通过基于测试数据集来快速地计算出每一个证件分类模型的分类精确度,有利于后续基于所有所述分类精确度从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型,进而可基于所述目标证件分类模型对所述待处理的证件图像进行识别分类处理以准确快速的生成与所述待处理的证件图像对应的目标证件类型。
本申请实施例中的基于多模型的证件分类方法还可以应用于区块链领域,如将上述目标证件类型等数据存储于区块链上。通过使用区块链来对上述目标证件类型进行存储和管理,能够有效地保证上述目标证件类型的安全性与不可篡改性。
上述区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(Blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
区块链底层平台可以包括用户管理、基础服务、智能合约以及运营监控等处理模块。其中,用户管理模块负责所有区块链参与者的身份信息管理,包括维护公私钥生成(账户管理)、密钥管理以及用户真实身份和区块链地址对应关系维护(权限管理)等,并且在授权的情况下,监管和审计某些真实身份的交易情况,提供风险控制的规则配置(风控审计);基础服务模块部署在所有区块链节点设备上,用来验证业务请求的有效性,并对有效请求完成共识后记录到存储上,对于一个新的业务请求,基础服务先对接口适配解析和鉴权处理(接口适配),然后通过共识算法将业务信息加密(共识管理),在加密之后完整一致的传输至共享账本上(网络通信),并进行记录存储;智能合约模块负责合约的注册发行以及合约触发和合约执行,开发人员可以通过某种编程语言定义合约逻辑,发布到区块链上(合约注册),根据合约条款的逻辑,调用密钥或者其它的事件触发执行,完成合约逻辑,同时还提供对合约升级注销的功能;运营监控模块主要负责产品发布过程中的部署、配置的修改、合约设置、云适配以及产品运行中的实时状态的可视化输出,例如:告警、监控网络情况、监控节点设备健康状态等。
参照图2,本申请一实施例中还提供了一种基于多模型的证件分类装置,包括:
第一获取模块1,用于获取待处理的证件图像;
调用模块2,用于调用预先训练好的预设数量的证件分类模型,并获取各所述证件分类模型的分类精确度;其中,每一个所述证件分类模型是基于各自不同的训练数据集对预设的卷积神经网络模型进行训练生成的,所述训练数据集的数量等于所述预设数量;
筛选模块3,用于根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型;其中,所述目标证件分类模型的数量为多个;
第二获取模块4,用于将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值;其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型;
第一确定模块5,用于基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的基于多模型的证件分类方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述筛选模块3,包括:
第一获取单元,用于获取各所述证件分类模型的分类精确度,以及获取预设的精确度阈值;
第一筛选单元,用于从所有所述证件分类模型中筛选出分类精确度大于所述精确度阈值的第一证件分类模型;
第二获取单元,用于获取内存信息;
查询单元,用于基于预设的内存-模型数量映射表查询出与所述内存信息对应的目标数量;
第一判断单元,用于判断所述第一证件分类模型的数量是否大于所述目标数量;
排序单元,用于若是,则将所有所述第一证件分类模型按照分类精确度的数值从大到小的顺序进行排序,得到对应的排序结果;
第二筛选单元,用于从所述排序结果排在首位的第一证件分类模型开始,依次从所有所述第一证件分类模型中筛选出与所述目标数量相同的多个第二证件分类模型;
第一确定单元,用于将所述第二证件分类模型作为所述目标证件分类模型。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的基于多模型的证件分类方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述第一确定模块5,包括:
第二判断单元,用于判断所述目标证件分类模型的数量是否为奇数;
提取单元,用于若所述目标证件分类模型的数量为奇数,则从所有所述概率数值中提取出各所述目标证件分类模型输出的数值最大的第一概率数值;
第三获取单元,用于分别获取各所述第一概率数值对应的第一证件类型;
第三筛选单元,用于对各所述第一证件类型进行分析处理,从所有所述第一证件类型中筛选出现次数最多的第二证件类型;
第三判断单元,用于判断所述第二证件类型的出现次数是否大于1;
第二确定单元,用于若所述第二证件类型的出现次数大于1,将所述第二证件类型作为所述目标证件类型。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的基于多模型的证件分类方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述第一确定模块5,包括:
第四判断单元,用于判断所述目标证件分类模型的数量是否为偶数;
第四获取单元,用于若所述目标证件分类模型的数量为偶数,则获取与各所述概率数值一一对应的第三证件类型;
处理单元,用于对所有所述第三证件类型进行去重处理,得到对应的第四证件类型;
计算单元,用于从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值;
查找单元,用于从所有所述分类数值中获取数值最大的目标分类数值,并从所有所述第四证件类型中查找出与所述目标分类数值对应的第五证件类型;
第三确定单元,用于将所述第五证件类型作为所述目标证件类型。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的基于多模型的证件分类方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述计算单元,包括:
第一获取子单元,用于从所有所述概率数值中获取与第一指定证件类型对应的所有第三概率数值;其中,所述第一指定证件类型为所有所述第四证件类型中的任意一种证件类型;
第一计算子单元,用于计算所有所述第三概率数值的第一和值;
第一确定子单元,用于将所述第一和值作为所述第一指定证件类型的分类数值。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的基于多模型的证件分类方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述计算单元,包括:
第二获取子单元,用于从所有所述概率数值中获取与第二指定证件类型对应的所有第四概率数值;其中,所述第二指定证件类型为所有所述第四证件类型中的任意一种证件类型;
第三获取子单元,用于获取与各所述目标证件分类模型分别对应的模型权重;
第四获取子单元,用于基于所述模型权重,获取与各所述第四概率数值分别对应的目标证件分类模型的目标模型权重;
第二计算子单元,用于基于所述目标模型权重,对所有所述第四概率数值进行加权求和处理,得到对应的第二和值;
第二确定子单元,用于将所述第二和值作为所述第二指定证件类型的分类数值。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的基于多模型的证件分类方法的步骤一一对应,在此不再赘述。
进一步地,本申请一实施例中,上述基于多模型的证件分类装置,包括:
第三获取模块,用于获取预设的测试数据集;其中,所述测试数据集包括多个测试数据,以及与各所述测试数据分别对应的分类标签信息;
第四获取模块,用于分别将各所述测试数据输入至指定证件分类模型中,获取所述指定证件分类模型输出的与各所述测试数据分别对应的指定分类结果;其中,所述指定证件分类模型为所有所述证件分类模型中的任意一个模型,所述指定分类结果为所述指定证件分类模型基于所述测试数据输出的最大的概率数值所对应的分类结果;
计算模块,用于基于所述分类标签信息与所述指定分类结果,计算各所述测试数据中指定分类结果命中相应的分类标签信息的比例数值;
第二确定模块,用于将所述比例数值作为所述指定证件分类模型的分类精确度。
本实施例中,上述模块或单元分别用于执行的操作与前述实施方式的基于多模型的证件分类方法的步骤一一对应,在此不再赘述。
参照图3,本申请实施例中还提供一种计算机设备,该计算机设备可以是服务器,其内部结构可以如图3所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口、显示屏、输入装置和数据库。其中,该计算机设备设计的处理器用于提供计算和控制能力。该计算机设备的存储器包括存储介质、内存储器。该存储介质存储有操作系统、计算机程序和数据库。该内存储器为存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储待处理的证件图像、证件分类模型、分类精确度、训练数据集、证件类型、概率数值以及目标证件类型。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机设备的显示屏是计算机中必不可少的一种图文输出设备,用于将数字信号转换为光信号,使文字与图形在显示屏的屏幕上显示出来。该计算机设备的输入装置是计算机与用户或其他设备之间进行信息交换的主要装置,用于把数据、指令及某些标志信息等输送到计算机中去。该计算机程序被处理器执行时以实现一种基于多模型的证件分类方法。
上述处理器执行上述基于多模型的证件分类方法的步骤:
获取待处理的证件图像;
调用预先训练好的预设数量的证件分类模型,并获取各所述证件分类模型的分类精确度;其中,每一个所述证件分类模型是基于各自不同的训练数据集对预设的卷积神经网络模型进行训练生成的,所述训练数据集的数量等于所述预设数量;
根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型;其中,所述目标证件分类模型的数量为多个;
将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值;其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型;
基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型。
本领域技术人员可以理解,图3中示出的结构,仅仅是与本申请方案相关的部分结构的框图,并不构成对本申请方案所应用于其上的装置、计算机设备的限定。
本申请一实施例还提供一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现一种基于多模型的证件分类方法,具体为:
获取待处理的证件图像;
调用预先训练好的预设数量的证件分类模型,并获取各所述证件分类模型的分类精确度;其中,每一个所述证件分类模型是基于各自不同的训练数据集对预设的卷积神经网络模型进行训练生成的,所述训练数据集的数量等于所述预设数量;
根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型;其中,所述目标证件分类模型的数量为多个;
将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值;其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型;
基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型。
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本申请所提供的和实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可以包括只读存储器(ROM)、可编程ROM(PROM)、电可编程ROM(EPROM)、电可擦除可编程ROM(EEPROM)或闪存。易失性存储器可包括随机存取存储器(RAM)或者外部高速缓冲存储器。作为说明而非局限,RAM通过多种形式可得,诸如静态RAM(SRAM)、动态RAM(DRAM)、同步DRAM(SDRAM)、双速据率SDRAM(SSRSDRAM)、增强型SDRAM(ESDRAM)、同步链路(Synchlink)DRAM(SLDRAM)、存储器总线(Rambus)直接RAM(RDRAM)、直接存储器总线动态RAM(DRDRAM)、以及存储器总线动态RAM(RDRAM)等。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、装置、物品或者方法不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、装置、物品或者方法所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、装置、物品或者方法中还存在另外的相同要素。
以上所述仅为本申请的优选实施例,并非因此限制本申请的专利范围,凡是利用本申请说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本申请的专利保护范围内。

Claims (10)

1.一种基于多模型的证件分类方法,其特征在于,包括:
获取待处理的证件图像;
调用预先训练好的预设数量的证件分类模型,并获取各所述证件分类模型的分类精确度;其中,每一个所述证件分类模型是基于各自不同的训练数据集对预设的卷积神经网络模型进行训练生成的,所述训练数据集的数量等于所述预设数量;
根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型;其中,所述目标证件分类模型的数量为多个;
将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值;其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型;
基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型。
2.根据权利要求1所述的基于多模型的证件分类方法,其特征在于,所述根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型的步骤,包括:
获取各所述证件分类模型的分类精确度,以及获取预设的精确度阈值;
从所有所述证件分类模型中筛选出分类精确度大于所述精确度阈值的第一证件分类模型;
获取内存信息;
基于预设的内存-模型数量映射表查询出与所述内存信息对应的目标数量;
判断所述第一证件分类模型的数量是否大于所述目标数量;
若是,则将所有所述第一证件分类模型按照分类精确度的数值从大到小的顺序进行排序,得到对应的排序结果;
从所述排序结果排在首位的第一证件分类模型开始,依次从所有所述第一证件分类模型中筛选出与所述目标数量相同的多个第二证件分类模型;
将所述第二证件分类模型作为所述目标证件分类模型。
3.根据权利要求1所述的基于多模型的证件分类方法,其特征在于,所述基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型的步骤,包括:
判断所述目标证件分类模型的数量是否为奇数;
若所述目标证件分类模型的数量为奇数,则从所有所述概率数值中提取出各所述目标证件分类模型输出的数值最大的第一概率数值;
分别获取各所述第一概率数值对应的第一证件类型;
对各所述第一证件类型进行分析处理,从所有所述第一证件类型中筛选出现次数最多的第二证件类型;
判断所述第二证件类型的出现次数是否大于1;
若所述第二证件类型的出现次数大于1,将所述第二证件类型作为所述目标证件类型。
4.根据权利要求1所述的基于多模型的证件分类方法,其特征在于,所述基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型的步骤,包括:
判断所述目标证件分类模型的数量是否为偶数;
若所述目标证件分类模型的数量为偶数,则获取与各所述概率数值一一对应的第三证件类型;
对所有所述第三证件类型进行去重处理,得到对应的第四证件类型;
从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值;
从所有所述分类数值中获取数值最大的目标分类数值,并从所有所述第四证件类型中查找出与所述目标分类数值对应的第五证件类型;
将所述第五证件类型作为所述目标证件类型。
5.根据权利要求4所述的基于多模型的证件分类方法,其特征在于,所述从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值的步骤,包括:
从所有所述概率数值中获取与第一指定证件类型对应的所有第三概率数值;其中,所述第一指定证件类型为所有所述第四证件类型中的任意一种证件类型;
计算所有所述第三概率数值的第一和值;
将所述第一和值作为所述第一指定证件类型的分类数值。
6.根据权利要求4所述的基于多模型的证件分类方法,其特征在于,所述从所有所述概率数值中,分别获取与各所述第四证件类型分别对应的所有第二概率数值,并基于所述第二概率数值,按照预设规则计算出与各所述第四证件类型分别对应的分类数值的步骤,包括:
从所有所述概率数值中获取与第二指定证件类型对应的所有第四概率数值;其中,所述第二指定证件类型为所有所述第四证件类型中的任意一种证件类型;
获取与各所述目标证件分类模型分别对应的模型权重;
基于所述模型权重,获取与各所述第四概率数值分别对应的目标证件分类模型的目标模型权重;
基于所述目标模型权重,对所有所述第四概率数值进行加权求和处理,得到对应的第二和值;
将所述第二和值作为所述第二指定证件类型的分类数值。
7.根据权利要求1所述的基于多模型的证件分类方法,其特征在于,所述获取各所述证件分类模型的分类精确度的步骤之前,包括:
获取预设的测试数据集;其中,所述测试数据集包括多个测试数据,以及与各所述测试数据分别对应的分类标签信息;
分别将各所述测试数据输入至指定证件分类模型中,获取所述指定证件分类模型输出的与各所述测试数据分别对应的指定分类结果;其中,所述指定证件分类模型为所有所述证件分类模型中的任意一个模型,所述指定分类结果为所述指定证件分类模型基于所述测试数据输出的最大的概率数值所对应的分类结果;
基于所述分类标签信息与所述指定分类结果,计算各所述测试数据中指定分类结果命中相应的分类标签信息的比例数值;
将所述比例数值作为所述指定证件分类模型的分类精确度。
8.一种基于多模型的证件分类装置,其特征在于,包括:
第一获取模块,用于获取待处理的证件图像;
调用模块,用于调用预先训练好的预设数量的证件分类模型,并获取各所述证件分类模型的分类精确度;其中,每一个所述证件分类模型是基于各自不同的训练数据集对预设的卷积神经网络模型进行训练生成的,所述训练数据集的数量等于所述预设数量;
筛选模块,用于根据所述分类精确度,从所有所述证件分类模型中筛选出满足预设条件的目标证件分类模型;其中,所述目标证件分类模型的数量为多个;
第二获取模块,用于将所述证件图像输入至各所述目标证件分类模型中,获取各所述目标证件分类模型分别输出的与所述证件图像对应的多种证件类型的概率数值;其中,对于每一个所述目标证件分类模型,该目标证件分类模型输出的一个概率数值对应于一种证件类型;
第一确定模块,用于基于所有所述概率数值,确定出与所述证件图像对应的目标证件类型。
9.一种计算机设备,包括存储器和处理器,所述存储器中存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至7中任一项所述方法的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7中任一项所述的方法的步骤。
CN202110943047.1A 2021-08-17 2021-08-17 基于多模型的证件分类方法、装置、设备和存储介质 Pending CN113627551A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110943047.1A CN113627551A (zh) 2021-08-17 2021-08-17 基于多模型的证件分类方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110943047.1A CN113627551A (zh) 2021-08-17 2021-08-17 基于多模型的证件分类方法、装置、设备和存储介质

Publications (1)

Publication Number Publication Date
CN113627551A true CN113627551A (zh) 2021-11-09

Family

ID=78386020

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110943047.1A Pending CN113627551A (zh) 2021-08-17 2021-08-17 基于多模型的证件分类方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN113627551A (zh)

Cited By (1)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112699945A (zh) * 2020-12-31 2021-04-23 青岛海尔科技有限公司 数据标注方法及装置、存储介质及电子装置

Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020258657A1 (zh) * 2019-06-28 2020-12-30 平安科技(深圳)有限公司 异常检测方法、装置、计算机设备及存储介质
US20210081899A1 (en) * 2019-09-13 2021-03-18 Oracle International Corporation Machine learning model for predicting litigation risk on construction and engineering projects
CN113033707A (zh) * 2021-04-25 2021-06-25 北京有竹居网络技术有限公司 视频分类方法、装置、可读介质及电子设备
CN113222043A (zh) * 2021-05-25 2021-08-06 北京有竹居网络技术有限公司 一种图像分类方法、装置、设备及存储介质

Patent Citations (4)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2020258657A1 (zh) * 2019-06-28 2020-12-30 平安科技(深圳)有限公司 异常检测方法、装置、计算机设备及存储介质
US20210081899A1 (en) * 2019-09-13 2021-03-18 Oracle International Corporation Machine learning model for predicting litigation risk on construction and engineering projects
CN113033707A (zh) * 2021-04-25 2021-06-25 北京有竹居网络技术有限公司 视频分类方法、装置、可读介质及电子设备
CN113222043A (zh) * 2021-05-25 2021-08-06 北京有竹居网络技术有限公司 一种图像分类方法、装置、设备及存储介质

Cited By (2)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN112699945A (zh) * 2020-12-31 2021-04-23 青岛海尔科技有限公司 数据标注方法及装置、存储介质及电子装置
CN112699945B (zh) * 2020-12-31 2023-10-27 青岛海尔科技有限公司 数据标注方法及装置、存储介质及电子装置

Similar Documents

Publication Publication Date Title
CN112528259B (zh) 身份验证方法、装置、计算机设备和存储介质
CN112464117A (zh) 请求处理方法、装置、计算机设备和存储介质
CN112347310A (zh) 事件处理信息的查询方法、装置、计算机设备和存储介质
CN113688221B (zh) 基于模型的话术推荐方法、装置、计算机设备和存储介质
CN113014566B (zh) 恶意注册的检测方法、装置、计算机可读介质及电子设备
CN112949468A (zh) 人脸识别方法、装置、计算机设备和存储介质
CN111506710B (zh) 基于谣言预测模型的信息发送方法、装置和计算机设备
CN112329629A (zh) 在线培训的评价方法、装置、计算机设备和存储介质
CN113742776A (zh) 基于生物识别技术的数据校验方法、装置和计算机设备
CN113889262A (zh) 基于模型的数据预测方法、装置、计算机设备和存储介质
CN114840387A (zh) 微服务监控方法、装置、计算机设备和存储介质
CN112036749A (zh) 基于医疗数据识别风险用户的方法、装置和计算机设备
CN113672654B (zh) 数据查询方法、装置、计算机设备和存储介质
CN114817055A (zh) 基于接口的回归测试方法、装置、计算机设备和存储介质
CN113435990B (zh) 基于规则引擎的凭证生成方法、装置和计算机设备
CN113627551A (zh) 基于多模型的证件分类方法、装置、设备和存储介质
CN114004639A (zh) 优惠信息的推荐方法、装置、计算机设备和存储介质
CN113918609A (zh) 试卷创建方法、装置、计算机设备和存储介质
CN113327037A (zh) 基于模型的风险识别方法、装置、计算机设备和存储介质
CN113656588A (zh) 基于知识图谱的数据对码方法、装置、设备和存储介质
CN116151965B (zh) 一种风险特征提取方法、装置、电子设备及存储介质
CN113177396B (zh) 报表生成方法、装置、计算机设备和存储介质
CN113535260B (zh) 基于模拟器的数据处理方法、装置、设备及存储介质
CN112966787B (zh) 相似患者的识别方法、装置、计算机设备和存储介质
CN113946579A (zh) 基于模型的数据生成方法、装置、计算机设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
AD01 Patent right deemed abandoned

Effective date of abandoning: 20240524