CN114202673A - 证件分类模型的训练方法、证件分类方法、装置和介质 - Google Patents
证件分类模型的训练方法、证件分类方法、装置和介质 Download PDFInfo
- Publication number
- CN114202673A CN114202673A CN202111521244.0A CN202111521244A CN114202673A CN 114202673 A CN114202673 A CN 114202673A CN 202111521244 A CN202111521244 A CN 202111521244A CN 114202673 A CN114202673 A CN 114202673A
- Authority
- CN
- China
- Prior art keywords
- certificate
- data enhancement
- sample
- classification
- value
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000013145 classification model Methods 0.000 title claims abstract description 74
- 238000000034 method Methods 0.000 title claims abstract description 65
- 238000012549 training Methods 0.000 title claims abstract description 51
- 238000004422 calculation algorithm Methods 0.000 claims abstract description 118
- 238000012545 processing Methods 0.000 claims abstract description 83
- 239000013598 vector Substances 0.000 claims description 88
- 238000012216 screening Methods 0.000 claims description 16
- 238000013527 convolutional neural network Methods 0.000 claims description 10
- 238000004590 computer program Methods 0.000 claims description 6
- 238000000605 extraction Methods 0.000 claims description 4
- 238000013473 artificial intelligence Methods 0.000 abstract description 2
- 238000010586 diagram Methods 0.000 description 6
- 230000008569 process Effects 0.000 description 6
- 230000004927 fusion Effects 0.000 description 4
- 230000008901 benefit Effects 0.000 description 3
- 238000004364 calculation method Methods 0.000 description 3
- 238000004891 communication Methods 0.000 description 3
- 230000000694 effects Effects 0.000 description 3
- 230000006870 function Effects 0.000 description 3
- 238000010801 machine learning Methods 0.000 description 3
- 230000005484 gravity Effects 0.000 description 2
- 230000003287 optical effect Effects 0.000 description 2
- 230000003068 static effect Effects 0.000 description 2
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000005540 biological transmission Effects 0.000 description 1
- 238000003066 decision tree Methods 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000010295 mobile communication Methods 0.000 description 1
- 238000012986 modification Methods 0.000 description 1
- 230000004048 modification Effects 0.000 description 1
- 238000007637 random forest analysis Methods 0.000 description 1
- 238000011160 research Methods 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/24—Classification techniques
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06F—ELECTRIC DIGITAL DATA PROCESSING
- G06F18/00—Pattern recognition
- G06F18/20—Analysing
- G06F18/21—Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
- G06F18/214—Generating training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Data Mining & Analysis (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Bioinformatics & Cheminformatics (AREA)
- Bioinformatics & Computational Biology (AREA)
- Artificial Intelligence (AREA)
- Evolutionary Biology (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- General Engineering & Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Life Sciences & Earth Sciences (AREA)
- Information Retrieval, Db Structures And Fs Structures Therefor (AREA)
Abstract
本发明涉及人工智能技术领域,具体公开了一种证件分类模型的训练方法,所述方法包括:获取证件样本集,并从所述证件样本集中提取一证件样本;获取预设的N种数据增强算法集和所述N种数据增强算法集的使用顺序;按照所述使用顺序从所述N种数据增强算法集中确定出用于对所述证件样本进行数据增强处理的数据增强算法集,并根据确定出的数据增强算法集对所述证件样本进行数据增强处理,获得目标证件样本;根据多个目标证件样本训练出用于进行证件分类的证件分类模型。
Description
技术领域
本发明涉及人工智能技术领域,具体涉及一种证件分类模型的训练方法、证件分类方法、装置和计算机可读存储介质。
背景技术
随着用户证件种类越来越多,政府或企业对电子证件分类的需求也越来越大。在电子证件分类场景中,一些相关技术会采用机器学习模型进行分类,但是发明人研究发现:在利用电子证件样本训练机器学习模型之前,需要先对电子证件样本进行数据增强处理,但是现有的数据增强处理方式只适用于电子证件样本数据量较大的场景;然而在一些特殊场景中电子证件样本的数据量较小,或者根本无法获取大数据量的电子证件样本,若继续使用现有的数据增强处理方式对这些小数据量的电子证件样本进行数据增强处理,会导致最终的机器学习模型分类准确性较差。
发明内容
本发明的目的在于提供了一种证件分类模型的训练方法、证件分类方法、装置和计算机可读存储介质,能够解决上述技术问题。
本发明的一个方面提供了一种证件分类模型的训练方法,所述方法包括:获取证件样本集,并从所述证件样本集中提取一证件样本;获取预设的N种数据增强算法集和所述N种数据增强算法集的使用顺序;按照所述使用顺序从所述N种数据增强算法集中确定出用于对所述证件样本进行数据增强处理的数据增强算法集,并根据确定出的数据增强算法集对所述证件样本进行数据增强处理,获得目标证件样本;根据多个目标证件样本训练出用于进行证件分类的证件分类模型。
可选地,每种数据增强算法集均关联一标签范围,所述按照所述使用顺序从所述N种数据增强算法集中确定出用于对所述证件样本进行数据增强处理的数据增强算法集,并根据确定出的数据增强算法集对所述证件样本进行数据增强处理,获得目标证件样本,包括:步骤A1,生成所述证件样本的标签值,判断该标签值是否在第1个数据增强算法集关联的标签范围内,若是则执行步骤A2,若否则执行步骤A3;步骤A2,根据第1个数据增强算法集对所述证件样本进行数据增强处理,并执行步骤A3;步骤A3,再次生成所述证件样本的标签值,判断该标签值是否在第i+1个数据增强算法集关联的标签范围内,若是则执行步骤A4,若否则执行步骤A5,其中,i是初始值为1的正整数;步骤A4,若前i个数据增强算法集对所述证件样本进行了数据增强处理,则根据第i+1个数据增强算法集对上一次数据增强处理后的证件样本继续进行数据增强处理,并执行步骤A5;若前i个数据增强算法集未对所述证件样本进行数据增强处理,则根据第i+1个数据增强算法集对所述证件样本进行数据增强处理,并执行步骤A5;步骤A5,判断i+1是否等于N,若是则将最后一次数据增强处理后的证件样本记为所述目标证件样本,若否将i赋值为i+1并返回执行步骤A3。
可选地,所述生成所述证件样本的标签值,包括:从所有标签范围中确定出一最大标签边界值;随机生成[0,所述最大标签边界值]范围内的一数值,作为所述证件样本的标签值。
可选地,所述根据多个目标证件样本训练出用于进行证件分类的证件分类模型,包括:通过卷积神经网络的m个卷积层提取所述目标证件样本的特征,获得m个第一特征向量,其中,m为大于等于2的正整数;通过所述卷积神经网络的Attention层对第m个卷积层输出的第一特征向量中的特征元素设置权重,获得第m’个第一特征向量;根据第m’个第一特征向量计算所述目标证件样本的分类值;从所述证件样本集中提取所述多个目标证件样本的分类值,并根据所述证件样本集中所述多个目标证件样本的分类值和计算出的对应目标证件样本的分类值训练出所述证件分类模型。
可选地,所述根据第m’个第一特征向量计算所述目标证件样本的分类值,包括:从前m-1个卷积层输出的第一特征向量中筛选出p个第一特征向量;根据所述p个第一特征向量和所述第m’个第一特征向量计算所述目标证件样本的分类值;其中,p为大于等于1且小于等于m的正整数。
本发明的另一个方面提供了一种证件分类方法,所述方法包括:获取待分类证件;通过证件分类模型的m个卷积层提取所述待分类证件的特征,获得m个第二特征向量,其中,m为大于等于2的正整数,所述证件分类模型通过上述任一实施例所述的证件分类模型的训练方法获得;通过所述证件分类模型的Attention层对第m个卷积层输出的第二特征向量中的特征元素设置权重,获得第m’个第二特征向量;根据第m’个第二特征向量计算所述待分类证件的分类值;从计算出的所有分类值中筛选出最大的分类值,并将该最大的分类值指向的证件类别作为所述待分类证件所属的证件类别。
可选地,所述根据第m’个第二特征向量计算所述待分类证件的分类值,包括:从前m-1个卷积层输出的第二特征向量中筛选出p个第二特征向量;根据所述p个第二特征向量和所述第m’个第二特征向量计算所述待分类证件样本的分类值;其中,p为大于等于1且小于等于m的正整数。
本发明的再一个方面提供了一种证件分类模型的训练装置,所述装置包括:获取样本模块,用于获取证件样本集,并从所述证件样本集中提取一证件样本;获取数据集模块,用于获取预设的N种数据增强算法集和所述N种数据增强算法集的使用顺序;增强处理模块,用于按照所述使用顺序从所述N种数据增强算法集中确定出用于对所述证件样本进行数据增强处理的数据增强算法集,并根据确定出的数据增强算法集对所述证件样本进行数据增强处理,获得目标证件样本;模型训练模块,用于根据多个目标证件样本训练出用于进行证件分类的证件分类模型。
本发明的又一个方面提供了一种证件分类装置,所述装置包括:获取证件模块,用于获取待分类证件;特征提取模块,用于通过证件分类模型的m个卷积层提取所述待分类证件的特征,获得m个第二特征向量,其中,m为大于等于2的正整数,所述证件分类模型通过权利要求1至5任一项所述的方法获得;权重设置模块,用于通过所述证件分类模型的Attention层对第m个卷积层输出的第二特征向量中的特征元素设置权重,获得第m’个第二特征向量;分类值计算模块,用于根据第m’个第二特征向量计算所述待分类证件的分类值;证件分类模块,用于从计算出的所有分类值中筛选出最大的分类值,并将该最大的分类值指向的证件类别作为所述待分类证件所属的证件类别。
本发明的再一个方面提供了一种计算机设备,所述计算机设备包括:存储器、处理器以及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述任一实施例所述的证件分类模型的训练方法和/或上述任一实施例所述的证件分类方法。
本发明的又一个方面提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述任一实施例所述的证件分类模型的训练方法和/或上述任一实施例所述的证件分类方法。进一步地,所述计算机可读存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
本发明提供了一种证件分类模型的训练方法,预先划分了N种数据增强算法集并设置了这些数据增强算法集的使用顺序,然后按照使用顺序从N种数据增强算法集中确定出用于对该证件样本进行数据增强处理的数据增强算法集,并根据确定出的各个数据增强算法集对该证件样本进行数据增强处理,获得目标证件样本,通过多个证件样本均执行上述数据增强操作使得最终获得目标证件样本具有复杂多样的特征,从而根据这些目标证件样本训练证件分类模型时,能够根据少量的数据获得不同类别的特征,使得证件分类模型能够高效准确的区分不同的证件。
附图说明
通过阅读下文优选实施方式的详细描述,各种其他的优点和益处对于本领域普通技术人员将变得清楚明了。附图仅用于示出优选实施方式的目的,而并不认为是对本发明的限制。而且在整个附图中,用相同的参考符号表示相同的部件。在附图中:
图1示出了本发明实施例一提供的证件分类模型的训练方法的流程图;
图2示出了本发明实施例二提供的证件分类方法的流程图;
图3示出了本发明实施例三提供的证件分类模型的训练装置的框图;
图4示出了本发明实施例四提供的证件分类装置的框图;
图5示出了本发明实施例五提供的适于实现证件分类模型的训练方法和/或证件分类方法的的计算机设备的框图;
具体实施方式
为了使本发明的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本发明进行进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者装置中还存在另外的相同要素。
实施例一
本发明提供了一种证件分类模型的训练方法,预先划分了N种数据增强算法集并设置了这些数据增强算法集的使用顺序,然后按照使用顺序从N种数据增强算法集中确定出用于对该证件样本进行数据增强处理的数据增强算法集,并根据确定出的各个数据增强算法集对该证件样本进行数据增强处理,获得目标证件样本,通过多个证件样本均执行上述数据增强操作使得最终获得目标证件样本具有复杂多样的特征,从而根据这些目标证件样本训练证件分类模型时,能够根据少量的数据获得不同类别的特征,使得证件分类模型能够高效准确的区分不同的证件。具体地,如图1所示,图1示出了本发明实施例一提供的证件分类模型的训练方法的流程图,该方法包括步骤S1~步骤S4,其中:
步骤S1,获取证件样本集,并从所述证件样本集中提取一证件样本。
证件样本集中包括多个证件样本和每个证件样本的分类值,其中,这多个证件样本分别属于多个类别(如驾驶证类别、身份证类别、社保卡类别、工卡类别等),每个证件样本的分类值用于表征该证件样本所属的类别。本实施例在对证件样本集中的证件样本进行数据增强处理时,每个证件样本的数据增强处理逻辑均可通过步骤S1~步骤S3实现。
作为一种可选地实施例,数据库中包含多个候选证件样本,这些候选证件样本分别属于不同的类别,且有些场景下各个类别的候选证件样本数据量相差较大,当从该数据库中获取证件样本集时,优选从每种类别的候选证件样本中获取数量相同或相近的候选证件样本,从而将获取的这些候选证件样本作为证件样本集,且获取的每一个候选证件样本均可记为证件样本集中的一个证件样本。具体地,当部分或所有类别的候选证件样本数量差距较大时,可以先统计每个类别的候选证件样本占据所有候选证件样本的比重,然后根据比重为对应类别设置权重,以便根据权重从各个类别的候选证件样本中进行采样时,可以尽量让每个类别的采样数是一致的,使得最终的证件分类模型不过分偏向于某一类的特征。
步骤S2,获取预设的N种数据增强算法集和所述N种数据增强算法集的使用顺序。
按照使用顺序排列,这N种数据增强算法集可以包括:色调类型的数据增强算法集、角度类型的数据增强算法集和噪声类型的数据增强算法集,其中,色调类型的数据增强算法集包括亮度、色度、对比度、锐度等数据增强算法,角度类型的数据增强算法集可以包括90度旋转、180度旋转、360旋转、水平旋转、垂直旋转等数据增强算法,噪声类型的数据增强算法集可以包括高斯模糊、运动模糊、高斯噪声、阴影噪声、污点噪声、光圈噪声等数据增强算法。
步骤S3,按照所述使用顺序从所述N种数据增强算法集中确定出用于对所述证件样本进行数据增强处理的数据增强算法集,并根据确定出的数据增强算法集对所述证件样本进行数据增强处理,获得目标证件样本。
对于每个证件样本,可以选择所有的数据增强算法集均对该证件样本进行数据增强处理,还可以选择部分数据增强算法集对该证件样本进行数据增强处理,无论是哪种方式,均需要按照使用顺序将相应的数据增强算法集作用于该证件样本,并将最后一次执行完数据增强处理的证件样本记为目标证件样本。
例如,用于对该证件样本进行数据增强处理的数据增强算法集为:色调类型和角度类型的数据增强算法集,则需要先使用色调类型的数据增强算法集对证件样本进行数据增强处理,然后再采用角度类型的数据增强算法集继续对该证件样本进行数据增强处理,则获得的目标证件样本为:采用色调类型和角度类型的数据增强算法集对该证件样本进行数据增强处理后获得的结果。
作为一种可选地实施例,步骤S3包括步骤A1~步骤A5,其中:
步骤A1,生成所述证件样本的标签值,判断该标签值是否在第1个数据增强算法集关联的标签范围内,若是则执行步骤A2,若否则执行步骤A3;
步骤A2,根据第1个数据增强算法集对所述证件样本进行数据增强处理,并执行步骤A3;
步骤A3,再次生成所述证件样本的标签值,判断该标签值是否在第i+1个数据增强算法集关联的标签范围内,若是则执行步骤A4,若否则执行步骤A5,其中,i是初始值为1的正整数;
步骤A4,若前i个数据增强算法集对所述证件样本进行了数据增强处理,则根据第i+1个数据增强算法集对上一次数据增强处理后的证件样本继续进行数据增强处理,并执行步骤A5;若前i个数据增强算法集未对所述证件样本进行数据增强处理,则根据第i+1个数据增强算法集对所述证件样本进行数据增强处理,并执行步骤A5;
步骤A5,判断i+1是否等于N,若是则将最后一次数据增强处理后的证件样本记为所述目标证件样本,若否将i赋值为i+1并返回执行步骤A3。
例如,第1个数据增强算法集(如色调类型的数据增强算法集)关联的标签范围为[0,0.3],第2个数据增强算法集(如角度类型的数据增强算法集)关联的标签范围为[0,0.2],第3个数据增强算法集(如噪声类型的数据增强算法集)关联的标签范围为[0,0.1],生成一标签值,若该标签值为0.1,则使用第1个数据增强算法集对证件样本进行数据增强处理;再次生成一标签值,若该标签值为0.25,则不使用第2个数据增强算法集对证件样本进行数据增强处理;再次生成一标签值,若该标签值为0.05,则使用第3个数据增强算法集对上一次数据增强处理后的证件样本继续进行数据增强处理,也即获取使用第1个数据增强算法集对该证件样本进行数据增强处理所产生的结果,并再次使用第3个数据增强算法集对该结果进行数据增强处理,再次获得一结果,将本次的结果作为目标证件样本。
通过本实施例的数据增强处理逻辑可以有效增加目标证件样本的多样性,对于证件分类模型的训练集特别是数量较少的训练集有增加其多样性和复杂性的效果,从而使得最终训练出的证件分类模型能够准确识别出各种证件。
作为一种可选地实施例,步骤A1和步骤A3中所述生成所述证件样本的标签值,包括:
从所有标签范围中确定出一最大标签边界值;
随机生成[0,所述最大标签边界值]范围内的一数值,作为所述证件样本的标签值。
每次生证件样本的标签值时,均可通过随机函数生成一个位于[0,所述最大标签边界值]范围内的数值,然后将该数值作为标签值。例如,结合上述示例,可知最大标签边界值为0.3,则可采用随机函数生成一个[0,0.3]之间的随机数作为证件样本的标签值。
作为一种可选地实施例:
步骤A2包括:从所述第1个数据增强算法集中随机筛选出一数据增强算法,根据该数据增强算法对所述证件样本进行数据增强处理,并执行步骤A3;
步骤A4包括:若前i个数据增强算法集对所述证件样本进行了数据增强处理,则从所述第i+1个数据增强算法集中随机筛选出一数据增强算法,根据该数据增强算法对上一次数据增强处理后的证件样本继续进行数据增强处理,并执行步骤A5;若前i个数据增强算法集未对所述证件样本进行数据增强处理,则从所述第i+1个数据增强算法集中随机筛选出一数据增强算法,根据该数据增强算法对所述证件样本进行数据增强处理,并执行步骤A5。
步骤S4,根据多个目标证件样本训练出用于进行证件分类的证件分类模型。
本实施例中,可以对证件样本集中的多个证件样本均执行步骤S1~步骤S4,从而获得这多个证件样本中每个证件样本对应的目标证件样本,进而根据获得这些目标证件样本对学习模型进行训练以训练出证件分类模型。其中,该学习模型可以为卷积神经网络、决策树或者随机森林等等。
作为一种可选地实施例:
步骤S4包括步骤B1~步骤B4,其中:
步骤B1,通过卷积神经网络的m个卷积层提取所述目标证件样本的特征,获得m个第一特征向量,其中,m为大于等于2的正整数;
步骤B2,通过所述卷积神经网络的Attention层对第m个卷积层输出的第一特征向量中的特征元素设置权重,获得第m’个第一特征向量;
步骤B3,根据第m’个第一特征向量计算所述目标证件样本的分类值;
步骤B4,从所述证件样本集中提取所述多个目标证件样本的分类值,并根据所述证件样本集中所述多个目标证件样本的分类值和计算出的对应目标证件样本的分类值训练出所述证件分类模型。
其中,在训练模型过程,将每一个卷积层输出的特征向量都称为第一特征向量。本实施例在现有卷积神经网络的基础上新增加了Attention层,该Attention层用于对最后一层卷积层输出的第一特征向量进行权重赋值,具体赋值大小可通过学习获得。新增加的Attention层使得训练出的证件分类模型更加关注不同背景特征的区别,Attention层和最后一层卷积层输出的特征向量进行学习融合,对不同的特征有不同的权重分配,使得最后证件分类模型的置信度得分更高。
作为一种可选地实施例,步骤B3包括:
从前m-1个卷积层输出的第一特征向量中筛选出p个第一特征向量;
根据所述p个第一特征向量和所述第m’个第一特征向量计算所述目标证件样本的分类值;
其中,p为大于等于1且小于等于m的正整数。
根据所述p个第一特征向量和所述第m’个第一特征向量计算所述目标证件样本的分类值具体为:通过双线性插值的方式,使得所述p个第一特征向量和所述第m’个第一特征向量进行相同特征的融合,然后根据融合结果计算分类值。
相比于现有技术只使用最后一层特征向量计算分类值,本实施例还考虑到了特征融合,通过把浅层的特征向量(也即p个第一特征向量)和最后一层的深层特征向量(也即第m’个第一特征向量)进行融合后再计算分类值,使得证件分类模型不仅关注大区域的特征,也能关注到小细节的不同之处,从而证件分类模型推理时,对不同的类别证件区分度更好。
实施例二
图2示出了本发明实施例二提供的证件分类方法的流程图,如图2所示,该方法包括步骤M1~步骤M5,其中:
步骤M1,获取待分类证件。
待分类证件可以是直接拍照获得的电子证件,也可以将拍照获得的电子证件作为证件样本然后执行是通过步骤S1~步骤S3获得的目标证件样本,还可以是通过现有的数据增强方式对拍照获得的电子证件执行数据增强处理后获得。
步骤M2,通过证件分类模型的m个卷积层提取所述待分类证件的特征,获得m个第二特征向量,其中,m为大于等于2的正整数,所述证件分类模型通过实施例一所述的方法获得。
其中,在对证件分类的过程中,将每一个卷积层输出的特征向量都称为第二特征向量。
步骤M3,通过所述证件分类模型的Attention层对第m个卷积层输出的第二特征向量中的特征元素设置权重,获得第m’个第二特征向量。
本实施例在现有卷积神经网络的基础上新增加了Attention层,该Attention层用于对最后一层卷积层输出的第一特征向量进行权重赋值,具体赋值大小可通过学习获得。新增加的Attention层使得训练出的证件分类模型更加关注不同背景特征的区别,Attention层和最后一层卷积层输出的特征向量进行学习融合,对不同的特征有不同的权重分配,使得最后证件分类模型的置信度得分更高。
步骤M4,根据第m’个第二特征向量计算所述待分类证件的分类值。
方案一,直接通过第m’个第二特征向量计算所述待分类证件的分类值。
方案二,步骤M4包括:
从前m-1个卷积层输出的第二特征向量中筛选出p个第二特征向量;
根据所述p个第二特征向量和所述第m’个第二特征向量计算所述待分类证件样本的分类值;
其中,p为大于等于1且小于等于m的正整数。
根据所述p个第二特征向量和所述第m’个第二特征向量计算所述待分类证件样本的分类值具体为:通过双线性插值的方式,使得所述p个第二特征向量和所述第m’个第二特征向量进行相同特征的融合,然后根据融合结果计算分类值。
相比于现有技术只使用最后一层特征向量计算分类值,本实施例还考虑到了特征融合,通过把浅层的特征向量(也即p个第二特征向量)和最后一层的深层特征向量(也即第m’个第二特征向量)进行融合后再计算分类值,使得证件分类模型不仅关注大区域的特征,也能关注到小细节的不同之处,从而证件分类模型推理时,对不同的类别证件区分度更好。
步骤M5,从计算出的所有分类值中筛选出最大的分类值,并将该最大的分类值指向的证件类别作为所述待分类证件所属的证件类别。
计算出的分类值的数量与预先设置的证件类别的数量相同,计算出的分类值越大表征待分类证件属于该分类值关联的证件类别的概率越大。
实施例三
本发明的实施例三还提供了一种证件分类模型的训练装置,该证件分类模型的训练装置与上述实施例一提供的证件分类模型的训练方法相对应,相应的技术特征和技术效果在本实施例中不再详述,相关之处可参考上述实施例一。具体地,图3示出了本发明实施例三提供的证件分类模型的训练装置的框图。如图3所示,该证件分类模型的训练装置300包括获取样本模块301、获取数据集模块302、增强处理模块303和模型训练模块304,其中:
获取样本模块301,用于获取证件样本集,并从所述证件样本集中提取一证件样本;
获取数据集模块302,用于获取预设的N种数据增强算法集和所述N种数据增强算法集的使用顺序;
增强处理模块303,用于按照所述使用顺序从所述N种数据增强算法集中确定出用于对所述证件样本进行数据增强处理的数据增强算法集,并根据确定出的数据增强算法集对所述证件样本进行数据增强处理,获得目标证件样本;
模型训练模块304,用于根据多个目标证件样本训练出用于进行证件分类的证件分类模型。
可选地,每种数据增强算法集均关联一标签范围,所述增强处理模块具体用于:步骤A1,生成所述证件样本的标签值,判断该标签值是否在第1个数据增强算法集关联的标签范围内,若是则执行步骤A2,若否则执行步骤A3;步骤A2,根据第1个数据增强算法集对所述证件样本进行数据增强处理,并执行步骤A3;步骤A3,再次生成所述证件样本的标签值,判断该标签值是否在第i+1个数据增强算法集关联的标签范围内,若是则执行步骤A4,若否则执行步骤A5,其中,i是初始值为1的正整数;步骤A4,若前i个数据增强算法集对所述证件样本进行了数据增强处理,则根据第i+1个数据增强算法集对上一次数据增强处理后的证件样本继续进行数据增强处理,并执行步骤A5;若前i个数据增强算法集未对所述证件样本进行数据增强处理,则根据第i+1个数据增强算法集对所述证件样本进行数据增强处理,并执行步骤A5;步骤A5,判断i+1是否等于N,若是则将最后一次数据增强处理后的证件样本记为所述目标证件样本,若否将i赋值为i+1并返回执行步骤A3。
可选地,所述增强处理模块在执行所述生成所述证件样本的标签值时,具体用于:从所有标签范围中确定出一最大标签边界值;随机生成[0,所述最大标签边界值]范围内的一数值,作为所述证件样本的标签值。
可选地,所述模型训练模块具体用于:通过卷积神经网络的m个卷积层提取所述目标证件样本的特征,获得m个第一特征向量,其中,m为大于等于2的正整数;通过所述卷积神经网络的Attention层对第m个卷积层输出的第一特征向量中的特征元素设置权重,获得第m’个第一特征向量;根据第m’个第一特征向量计算所述目标证件样本的分类值;从所述证件样本集中提取所述多个目标证件样本的分类值,并根据所述证件样本集中所述多个目标证件样本的分类值和计算出的对应目标证件样本的分类值训练出所述证件分类模型。
可选地,所述模型训练模块在执行所述根据第m’个第一特征向量计算所述目标证件样本的分类值时,具体用于:从前m-1个卷积层输出的第一特征向量中筛选出p个第一特征向量;根据所述p个第一特征向量和所述第m’个第一特征向量计算所述目标证件样本的分类值;其中,p为大于等于1且小于等于m的正整数。
实施例四
本发明的实施例四还提供了一种证件分类装置,该证件分类装置与上述实施例一提供的证件分类方法相对应,相应的技术特征和技术效果在本实施例中不再详述,相关之处可参考上述实施例二。具体地,图4示出了本发明实施例四提供的证件分类装置的框图。如图4所示,该证件分类装置400包括获取证件模块401、特征提取模块402、权重设置模块403、分类值计算模块404和证件分类模块405,其中:
获取证件模块401,用于获取待分类证件;
特征提取模块402,用于通过证件分类模型的m个卷积层提取所述待分类证件的特征,获得m个第二特征向量,其中,m为大于等于2的正整数,所述证件分类模型通过权利要求1至5任一项所述的方法获得;
权重设置模块403,用于通过所述证件分类模型的Attention层对第m个卷积层输出的第二特征向量中的特征元素设置权重,获得第m’个第二特征向量;
分类值计算模块404,用于根据第m’个第二特征向量计算所述待分类证件的分类值;
证件分类模块405,用于从计算出的所有分类值中筛选出最大的分类值,并将该最大的分类值指向的证件类别作为所述待分类证件所属的证件类别。
可选地,所述分类值计算模块具体用于:从前m-1个卷积层输出的第二特征向量中筛选出p个第二特征向量;根据所述p个第二特征向量和所述第m’个第二特征向量计算所述待分类证件样本的分类值;其中,p为大于等于1且小于等于m的正整数。
实施例五
图5示出了本发明实施例五提供的适于实现证件分类模型的训练方法和/或证件分类方法的的计算机设备的框图。本实施例中,计算机设备500可以是执行程序的智能手机、平板电脑、笔记本电脑、台式计算机、机架式服务器、刀片式服务器、塔式服务器或机柜式服务器(包括独立的服务器,或者多个服务器所组成的服务器集群)等。如图5所示,本实施例的计算机设备500至少包括但不限于:可通过系统总线相互通信连接的存储器501、处理器502、网络接口505。需要指出的是,图5仅示出了具有组件501-505的计算机设备500,但是应理解的是,并不要求实施所有示出的组件,可以替代的实施更多或者更少的组件。
本实施例中,存储器505至少包括一种类型的计算机可读存储介质,可读存储介质包括包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘等。在一些实施例中,存储器501可以是计算机设备500的内部存储单元,例如该计算机设备500的硬盘或内存。在另一些实施例中,存储器501也可以是计算机设备500的外部存储设备,例如该计算机设备500上配备的插接式硬盘,智能存储卡(Smart Media Card,SMC),安全数字(Secure Digital,SD)卡,闪存卡(Flash Card)等。当然,存储器501还可以既包括计算机设备500的内部存储单元也包括其外部存储设备。在本实施例中,存储器501通常用于存储安装于计算机设备500的操作系统和各类应用软件,例如证件分类模型的训练方法和/或证件分类方法的程序代码等。
处理器502在一些实施例中可以是中央处理器(Central Processing Unit,CPU)、控制器、微控制器、微处理器、或其他数据处理芯片。该处理器502通常用于控制计算机设备500的总体操作。例如执行与计算机设备500进行数据交互或者通信相关的控制和处理等。本实施例中,处理器502用于运行存储器501中存储的证件分类模型的训练方法和/或证件分类方法的步骤的程序代码。
在本实施例中,存储于存储器501中的证件分类模型的训练方法和/或证件分类方法还可以被分割为一个或者多个程序模块,并由一个或多个处理器(本实施例为处理器502)所执行,以完成本发明。
网络接口505可包括无线网络接口或有线网络接口,该网络接口505通常用于在计算机设备500与其他计算机设备之间建立通信链接。例如,网络接口505用于通过网络将计算机设备500与外部终端相连,在计算机设备500与外部终端之间的建立数据传输通道和通信链接等。网络可以是企业内部网(Intranet)、互联网(Internet)、全球移动通讯系统(Global System of Mobile communication,简称为GSM)、宽带码分多址(Wideband CodeDivision Multiple Access,简称为WCDMA)、4G网络、5G网络、蓝牙(Bluetooth)、Wi-Fi等无线或有线网络。
实施例六
本实施例四还提供一种计算机可读存储介质,包括闪存、硬盘、多媒体卡、卡型存储器(例如,SD或DX存储器等)、随机访问存储器(RAM)、静态随机访问存储器(SRAM)、只读存储器(ROM)、电可擦除可编程只读存储器(EEPROM)、可编程只读存储器(PROM)、磁性存储器、磁盘、光盘、服务器、App应用商城等,其上存储有计算机程序,所述计算机程序被处理器执行时实现证件分类模型的训练方法和/或证件分类方法的步骤。
显然,本领域的技术人员应该明白,上述的本发明实施例的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,可选地,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明实施例不限制于任何特定的硬件和软件结合。
需要说明的是,本发明实施例序号仅仅为了描述,并不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种证件分类模型的训练方法,其特征在于,所述方法包括:
获取证件样本集,并从所述证件样本集中提取一证件样本;
获取预设的N种数据增强算法集和所述N种数据增强算法集的使用顺序;
按照所述使用顺序从所述N种数据增强算法集中确定出用于对所述证件样本进行数据增强处理的数据增强算法集,并根据确定出的数据增强算法集对所述证件样本进行数据增强处理,获得目标证件样本;
根据多个目标证件样本训练出用于进行证件分类的证件分类模型。
2.根据权利要求1所述的方法,其特征在于,每种数据增强算法集均关联一标签范围,所述按照所述使用顺序从所述N种数据增强算法集中确定出用于对所述证件样本进行数据增强处理的数据增强算法集,并根据确定出的数据增强算法集对所述证件样本进行数据增强处理,获得目标证件样本,包括:
步骤A1,生成所述证件样本的标签值,判断该标签值是否在第1个数据增强算法集关联的标签范围内,若是则执行步骤A2,若否则执行步骤A3;
步骤A2,根据第1个数据增强算法集对所述证件样本进行数据增强处理,并执行步骤A3;
步骤A3,再次生成所述证件样本的标签值,判断该标签值是否在第i+1个数据增强算法集关联的标签范围内,若是则执行步骤A4,若否则执行步骤A5,其中,i是初始值为1的正整数;
步骤A4,若前i个数据增强算法集对所述证件样本进行了数据增强处理,则根据第i+1个数据增强算法集对上一次数据增强处理后的证件样本继续进行数据增强处理,并执行步骤A5;若前i个数据增强算法集未对所述证件样本进行数据增强处理,则根据第i+1个数据增强算法集对所述证件样本进行数据增强处理,并执行步骤A5;
步骤A5,判断i+1是否等于N,若是则将最后一次数据增强处理后的证件样本记为所述目标证件样本,若否将i赋值为i+1并返回执行步骤A3。
3.根据权利要求2所述的方法,其特征在于,所述生成所述证件样本的标签值,包括:
从所有标签范围中确定出一最大标签边界值;
随机生成[0,所述最大标签边界值]范围内的一数值,作为所述证件样本的标签值。
4.根据权利要求1所述的方法,其特征在于,所述根据多个目标证件样本训练出用于进行证件分类的证件分类模型,包括:
通过卷积神经网络的m个卷积层提取所述目标证件样本的特征,获得m个第一特征向量,其中,m为大于等于2的正整数;
通过所述卷积神经网络的Attention层对第m个卷积层输出的第一特征向量中的特征元素设置权重,获得第m’个第一特征向量;
根据第m’个第一特征向量计算所述目标证件样本的分类值;
从所述证件样本集中提取所述多个目标证件样本的分类值,并根据所述证件样本集中所述多个目标证件样本的分类值和计算出的对应目标证件样本的分类值训练出所述证件分类模型。
5.根据权利要求4所述的方法,其特征在于,所述根据第m’个第一特征向量计算所述目标证件样本的分类值,包括:
从前m-1个卷积层输出的第一特征向量中筛选出p个第一特征向量;
根据所述p个第一特征向量和所述第m’个第一特征向量计算所述目标证件样本的分类值;
其中,p为大于等于1且小于等于m的正整数。
6.一种证件分类方法,其特征在于,所述方法包括:
获取待分类证件;
通过证件分类模型的m个卷积层提取所述待分类证件的特征,获得m个第二特征向量,其中,m为大于等于2的正整数,所述证件分类模型通过权利要求1至5任一项所述的方法获得;
通过所述证件分类模型的Attention层对第m个卷积层输出的第二特征向量中的特征元素设置权重,获得第m’个第二特征向量;
根据第m’个第二特征向量计算所述待分类证件的分类值;
从计算出的所有分类值中筛选出最大的分类值,并将该最大的分类值指向的证件类别作为所述待分类证件所属的证件类别。
7.根据权利要求6所述的方法,其特征在于,所述根据第m’个第二特征向量计算所述待分类证件的分类值,包括:
从前m-1个卷积层输出的第二特征向量中筛选出p个第二特征向量;
根据所述p个第二特征向量和所述第m’个第二特征向量计算所述待分类证件样本的分类值;
其中,p为大于等于1且小于等于m的正整数。
8.一种证件分类模型的训练装置,其特征在于,所述装置包括:
获取样本模块,用于获取证件样本集,并从所述证件样本集中提取一证件样本;
获取数据集模块,用于获取预设的N种数据增强算法集和所述N种数据增强算法集的使用顺序;
增强处理模块,用于按照所述使用顺序从所述N种数据增强算法集中确定出用于对所述证件样本进行数据增强处理的数据增强算法集,并根据确定出的数据增强算法集对所述证件样本进行数据增强处理,获得目标证件样本;
模型训练模块,用于根据多个目标证件样本训练出用于进行证件分类的证件分类模型。
9.一种证件分类装置,其特征在于,所述装置包括:
获取证件模块,用于获取待分类证件;
特征提取模块,用于通过证件分类模型的m个卷积层提取所述待分类证件的特征,获得m个第二特征向量,其中,m为大于等于2的正整数,所述证件分类模型通过权利要求1至5任一项所述的方法获得;
权重设置模块,用于通过所述证件分类模型的Attention层对第m个卷积层输出的第二特征向量中的特征元素设置权重,获得第m’个第二特征向量;
分类值计算模块,用于根据第m’个第二特征向量计算所述待分类证件的分类值;
证件分类模块,用于从计算出的所有分类值中筛选出最大的分类值,并将该最大的分类值指向的证件类别作为所述待分类证件所属的证件类别。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5任一项所述的方法和/或权利要求6至7任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111521244.0A CN114202673A (zh) | 2021-12-13 | 2021-12-13 | 证件分类模型的训练方法、证件分类方法、装置和介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202111521244.0A CN114202673A (zh) | 2021-12-13 | 2021-12-13 | 证件分类模型的训练方法、证件分类方法、装置和介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN114202673A true CN114202673A (zh) | 2022-03-18 |
Family
ID=80653233
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202111521244.0A Pending CN114202673A (zh) | 2021-12-13 | 2021-12-13 | 证件分类模型的训练方法、证件分类方法、装置和介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN114202673A (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN110321946A (zh) * | 2019-06-27 | 2019-10-11 | 郑州大学第一附属医院 | 一种基于深度学习的多模态医学影像识别方法及装置 |
US20200143080A1 (en) * | 2017-07-07 | 2020-05-07 | Advanced New Technologies Co., Ltd. | Privacy protection based training sample generation method and device |
CN111951207A (zh) * | 2020-08-25 | 2020-11-17 | 福州大学 | 基于深度增强学习和语义损失的图像质量增强方法 |
CN112329885A (zh) * | 2020-11-25 | 2021-02-05 | 江苏云从曦和人工智能有限公司 | 模型训练方法、装置以及计算机可读存储介质 |
CN112613543A (zh) * | 2020-12-15 | 2021-04-06 | 重庆紫光华山智安科技有限公司 | 增强策略验证方法、装置、电子设备及存储介质 |
CN112949738A (zh) * | 2021-03-17 | 2021-06-11 | 西安电子科技大学 | 基于eecnn算法的多类不平衡高光谱图像分类方法 |
CN113539262A (zh) * | 2021-07-09 | 2021-10-22 | 广东金鸿星智能科技有限公司 | 一种用于电动门语音控制的声音增强及收录方法和系统 |
-
2021
- 2021-12-13 CN CN202111521244.0A patent/CN114202673A/zh active Pending
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
US20200143080A1 (en) * | 2017-07-07 | 2020-05-07 | Advanced New Technologies Co., Ltd. | Privacy protection based training sample generation method and device |
CN110321946A (zh) * | 2019-06-27 | 2019-10-11 | 郑州大学第一附属医院 | 一种基于深度学习的多模态医学影像识别方法及装置 |
CN111951207A (zh) * | 2020-08-25 | 2020-11-17 | 福州大学 | 基于深度增强学习和语义损失的图像质量增强方法 |
CN112329885A (zh) * | 2020-11-25 | 2021-02-05 | 江苏云从曦和人工智能有限公司 | 模型训练方法、装置以及计算机可读存储介质 |
CN112613543A (zh) * | 2020-12-15 | 2021-04-06 | 重庆紫光华山智安科技有限公司 | 增强策略验证方法、装置、电子设备及存储介质 |
CN112949738A (zh) * | 2021-03-17 | 2021-06-11 | 西安电子科技大学 | 基于eecnn算法的多类不平衡高光谱图像分类方法 |
CN113539262A (zh) * | 2021-07-09 | 2021-10-22 | 广东金鸿星智能科技有限公司 | 一种用于电动门语音控制的声音增强及收录方法和系统 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN105468742B (zh) | 恶意订单识别方法及装置 | |
CN107204956B (zh) | 网站识别方法及装置 | |
CN112560964A (zh) | 基于半监督学习训练中草药病虫害识别模型的方法与系统 | |
CN110378249B (zh) | 文本图像倾斜角度识别方法、装置及设备 | |
CN110135889A (zh) | 智能推荐书单的方法、服务器及存储介质 | |
CN110874574B (zh) | 行人重识别方法、装置、计算机设备及可读存储介质 | |
CN111275102A (zh) | 多证件类型同步检测方法、装置、计算机设备及存储介质 | |
CN114419363A (zh) | 基于无标注样本数据的目标分类模型训练方法及装置 | |
CN104156467B (zh) | Api推荐方法及api推荐装置 | |
CN112613543A (zh) | 增强策略验证方法、装置、电子设备及存储介质 | |
CN111324883A (zh) | 基于互联网的电商平台入侵检测方法及计算机设备 | |
CN110674488A (zh) | 基于神经网络的验证码识别方法、系统及计算机设备 | |
CN112835682A (zh) | 一种数据处理方法、装置、计算机设备和可读存储介质 | |
CN117095019A (zh) | 一种图像分割方法及相关装置 | |
CN112733652A (zh) | 图像目标识别方法、装置、计算机设备及可读存储介质 | |
CN112597997A (zh) | 感兴趣区域确定方法、图像内容识别方法及装置 | |
CN110162957B (zh) | 智能设备的鉴权方法和装置、存储介质、电子装置 | |
CN111814917A (zh) | 一种存在模糊态的字轮图像数字识别方法 | |
CN114202673A (zh) | 证件分类模型的训练方法、证件分类方法、装置和介质 | |
CN108304838B (zh) | 一种图片信息识别方法及终端 | |
CN115660817A (zh) | 一种分类模型训练方法及装置 | |
CN112801045B (zh) | 一种文本区域检测方法、电子设备及计算机存储介质 | |
CN109886865A (zh) | 自动屏蔽不良信息的方法、装置、计算机设备以及存储介质 | |
CN111414922B (zh) | 特征提取方法、图像处理方法、模型训练方法及装置 | |
CN113674152A (zh) | 图像处理方法、装置、电子设备和计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |