CN116091400A - 一种证件检测方法、装置、电子设备和存储介质 - Google Patents
一种证件检测方法、装置、电子设备和存储介质 Download PDFInfo
- Publication number
- CN116091400A CN116091400A CN202211444948.7A CN202211444948A CN116091400A CN 116091400 A CN116091400 A CN 116091400A CN 202211444948 A CN202211444948 A CN 202211444948A CN 116091400 A CN116091400 A CN 116091400A
- Authority
- CN
- China
- Prior art keywords
- image
- detection
- detected
- certificate
- target model
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
- G06T7/0004—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/766—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using regression, e.g. by projecting features on hyperplanes
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V30/00—Character recognition; Recognising digital ink; Document-oriented image-based pattern recognition
- G06V30/40—Document-oriented image-based pattern recognition
- G06V30/42—Document-oriented image-based pattern recognition based on the type of document
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30108—Industrial image inspection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V2201/00—Indexing scheme relating to image or video recognition or understanding
- G06V2201/06—Recognition of objects for industrial automation
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Evolutionary Computation (AREA)
- Artificial Intelligence (AREA)
- Multimedia (AREA)
- Health & Medical Sciences (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Quality & Reliability (AREA)
- Image Analysis (AREA)
Abstract
本发明提供了一种证件检测方法、装置、电子设备和存储介质,证件检测方法包括:获取待检测证件的图像;通过预训练模型对待检测证件的图像进行处理,获得第一检测图像;通过至少一个目标模型对待检测证件的图像进行处理,获得各目标模型输出的第二检测图像;根据第一检测图像和第二检测图像,对待检测证件进行异常检测,并获得异常检测结果;根据异常检测结果,对待检测证件进行分流。本申请通过预训练模型和至少一个目标模型对待检测证件的图像进行处理,能够代替人工对异常证件进行挑选,并且通过模型进行检测的方式能够提高证件异常检测的准确率。同时,通过设置预训练模型和至少一个目标模型,能够提高异常检测的效率。
Description
技术领域
本申请实施例涉及深度学习技术领域,尤其涉及一种证件检测方法、装置、电子设备和存储介质。
背景技术
证件是指用来证明身份、经历等的证书和文件。比较常见的证件类型有:身份证,社保卡,居住证,护照,户口簿等卡式证件、本式证件、票据等。同时,由于证件有较高的重要性,因此,在证件生产的过程中,需要尽可能地对生产出现瑕疵或异常的证件进行处理。
目前,为了对生产出的证件进行异常检测,往往是通过人工对成品证件进行检测,将产生异常的证件挑选出来,以保证成品证件的合格率。
然而,由于证件种类的多样性,且证件在生产过程中可能产生的异常情况也多种多样,通过人工挑选的方式不可避免地会产生较多的错误,导致异常证件被发放,造成了安全性的问题。
发明内容
本发明实施例提供一种证件检测方法、装置、电子设备和存储介质,以解决或者缓解现有技术中的技术问题。
本发明采用的技术方案为:
第一方面,本申请实施例提供了一种证件检测方法,其包括:
获取待检测证件的图像;通过预训练模型对所述待检测证件的图像进行处理,获得第一检测图像;通过至少一个目标模型对所述待检测证件的图像进行处理,获得各所述目标模型输出的第二检测图像;根据所述第一检测图像和所述第二检测图像,对所述待检测证件进行异常检测,并获得异常检测结果;根据所述异常检测结果,对所述待检测证件进行分流。
可选地,在一种实施例中,所述通过预训练模型对所述待检测证件的图像进行处理,获得第一检测图像,包括:根据预设的至少两个图像缩放比例,分别对所述待检测证件的图像进行缩放;分别将缩放后的所述待检测证件的图像输入所述预训练模型,获得至少两张第一检测特征图像;将所述至少两张第一检测特征图像进行图像相乘,获得所述第一检测图像,其中,所述图像相乘的操作是将图像对应的灰度值或彩色分量进行相乘;所述通过至少一个目标模型对所述待检测证件的图像进行处理,获得各所述目标模型输出的第二检测图像,包括:根据预设的至少两个图像缩放比例,分别对所述待检测证件的图像进行缩放;针对每个所述目标模型,分别将缩放后的所述待检测证件的图像输入各所述目标模型,并获得对应于各所述目标模型的第二检测特征图像;针对每个所述目标模型输出的第二检测特征图像,分别进行所述图像相乘,获得对应于各所述目标模型的所述第二检测图像。
可选地,在一种实施例中,所述证件检测方法还包括:根据预先选取的第一数据集,对骨干网络进行训练,获得所述预训练模型,其中,所述第一数据集包含正常证件的图像与异常证件的图像;根据预先选取的第二数据集,及所述预训练模型,对骨干网络进行训练,获得至少一个所述目标模型,其中,所述第二数据集不包括异常证件的图像,所述预训练模型与所述目标模型的架构相同。
可选地,在一种实施例中,所述根据预先选取的第二数据集,及所述预训练模型,对骨干网络进行训练,获得至少一个所述目标模型,包括:根据预先选取的第二数据集,对骨干网络进行训练,获得至少一个第一目标模型;将预先选取的第三数据集输入所述预训练模型,获得第一描述结果,其中,所述第三数据集不包括异常证件的图像,所述第一描述结果表示了所述预训练模型对第三数据集中图像的坐标的描述;通过所述至少一个第一目标模型对所述第三数据集进行处理,分别获得各所述第一目标模型输出的第一预测结果,其中,所述第一预测结果表示所述第一目标模型对所述第一描述结果对应的图像的坐标的预测;针对每个所述第一目标模型,将所述第一描述结果、各所述第一目标模型输出的第一预测结果、所述第三数据集中图片的宽度和高度、所述第三数据集中图片的坐标以及预先定义的损失函数,调整各第一目标模型内的参数,直至满足停止条件,获得所述至少一个目标模型。
可选地,在一种实施例中,所述证件检测方法还包括:将所述第一描述结果、所述第一预测结果、所述第三数据集中图片的坐标及所述目标模型的个数输入预先定义的回归误差函数中,获得第一回归误差结果;通过所述至少一个目标模型对所述第三数据集进行处理,分别获得各所述第一目标模型输出的特征均值,其中,所述特征均值指示了所述目标模型与所述第三数据集的相关性;将所述第一预测结果、所述各所述第一目标模型输出的特征均值及所述目标模型的个数输入预先定义的预测误差函数中,获得第一预测误差结果;分别计算所述第一回归误差结果和所述第一预测误差结果的平均值和标准差,其中,所述第一回归误差结果和所述第一预测误差结果的平均值和标准差用于待检测证件的异常检测。
可选地,在一种实施例中,所述根据所述第一检测图像和所述第二检测图像,判断所述待检测证件的图像是否存在异常,并获得异常检测结果,包括:分别将所述待检测图像的坐标输入所述回归误差函数和所述预测误差函数,获得第二回归误差结果和第二预测误差结果;根据所述第一回归误差结果的平均值和标准差及所述第一预测误差结果的平均值和标准差、所述第二回归误差结果、所述第二预测误差结果,归一化获得异常评分;当所述异常评分大于预设的评分值时,确定所述待检测证件的图像的坐标对应的图像区域存在异常,并确定所述待检测证件为异常证件;当所述异常评分小于或等于所述预设的评分值时,确定所述待检测证件为正常证件。
第二方面,本申请实施例提供了一种证件检测装置,其包括:获取模块,用于获取待检测证件的图像;第一处理模块,用于通过预训练模型对所述待检测证件的图像进行处理,获得第一检测图像;第二处理模块,用于通过至少一个目标模型对所述待检测证件的图像进行处理,获得各所述目标模型输出的第二检测图像;检测模块,用于根据所述第一检测图像和所述第二检测图像,对所述待检测证件进行异常检查,并获得异常检测结果;分流模块,用于根据所述异常检测结果,对所述待检测证件进行分流。
第三方面,本申请实施例提供了一种电子设备,其上存储有计算机程序,该程序被处理器执行时实现如实施例第一方面中任一项所述的证件检测方法。
处理器、通信接口、存储器和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;存储器用于存放至少一可执行指令,可执行指令使处理器执行如实施例第一方面中任一项所述的证件检测方法对应的操作。
第四方面,本申请实施例提供了一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如实施例第一方面中任一项所述的证件检测方法。
第五方面,本申请实施例提供了一种计算机程序产品,其包括计算机指令,所述计算机指令指示计算设备执行如实施例第一方面中任一项所述的证件检测方法对应的操作。
由上述方案可知,通过预训练模型和至少一个目标模型对待检测证件的图像进行处理,能够代替人工对异常证件进行挑选,并且通过模型的方式能够提高证件异常检测的准确率。同时,通过设置预训练模型和目标模型,能够提高异常检测的效率。
附图说明
图1为本申请一个实施例的证件检测方法的流程图;
图2为本申请一个实施例的目标模型训练方法的流程图;
图3为本申请一个实施例的异常检测方法的流程图;
图4为本申请一个实施例的证件检测装置的示意图;
图5为本申请一个实施例的电子设备的示意图。
具体实施方式
为使本发明要解决的技术问题、技术方案和优点更加清楚,下面将结合附图及具体实施例进行详细描述。
证件检测方法
图1为本申请一个实施例的证件检测方法的流程图,如图1所示,该证件检测方法包括如下步骤:
步骤101、获取待检测证件的图像。
在对证件进行检测的过程中首先获取待检测证件的图像。
例如,待检测证件可以是由生产线生产出的证件,获取待检测证件的方式可以是在待检测证件被运输到待检测区域后,由预先设置在待检测区域内的摄像头对待检测证件进行拍照获得。需要说明的是,对于待检测证件的来源及待检测证件的图像的获取方式,在此处不作限定。
步骤102、通过预训练模型对待检测证件的图像进行处理,获得第一检测图像。
在获得待检测证件的图像后,通过预训练模型对该待检测证件进行处理,获得预训练模型输出的第一检测图像。
步骤103、通过至少一个目标模型对待检测证件的图像进行处理,获得各目标模型输出的第二检测图像。
在获得待检测证件的图像后,同时通过至少一个目标模型对待检测证件的图像进行处理,并分别获得每个目标模型输出的第二检测图像。
例如,目标模型可以有3个,通过这3个目标模型分别对待检测证件的图像进行处理,获得这三个目标模型分别输出第二检测图像。
步骤104、根据第一检测图像和第二检测图像,对待检测证件进行异常检测,并获得异常检测结果。
在获得第一检测图像和第二检测图像后,对待检测证件进行异常检测,并获得异常检测完成之后的异常检测结果。
例如异常检测结果可以是异常和正常两种。
步骤105、根据异常检测结果,对待检测证件进行分流。
在获得异常检测结果后,将不同异常检测结果对应的待检测证件分流到不同的区域。
例如,可以将异常检测结果为异常的待检测证件分流至异常证件区域,将异常检测结果为正常的待检测证件分流至正常证件区域。
在本申请实施例中,通过预训练模型和至少一个目标模型对待检测证件的图像进行处理,能够代替人工对异常证件进行挑选,并且通过模型进行检测的方式能够提高证件异常检测的准确率。同时,通过设置预训练模型和至少一个目标模型,能够提高异常检测的效率。
在一种可能实现的方式中,获得第一检测图像的过程还可以包括:根据预设的至少两个图像缩放比例,分别对待检测证件的图像进行缩放,在缩放完成后,分别将缩放后的待检测证件的图像输入预训练模型,获得至少两张第一检测特征图像,并将至少两张第一检测特征图像进行图像相乘,获得第一检测图像。
为了提高检测的准确率,通过预设的至少两个图像缩放比例,分别对待检测证件的图像进行缩放,得到至少两张缩放后的待检测证件的图像。将缩放后的待检测证件的图像输入预训练模型,获得至少两张第一检测特征图像。之后将至少两张第一检测特征图像进行图像相乘,获得第一检测图像。其中,图像相乘的操作是将图像对应的灰度值或彩色分量进行相乘。
例如可以设置三个缩放比例,分别为1/4、1/8和1/16。根据缩放比例获得三张缩放后的待检测证件的图像,并输入预训练模型,获得三张第一检测特征图像,之后进行图像相乘,获得第一检测图像。同时,在进行图像相乘前,可以将缩放后的第一检测特征图像上采样与原始待检测图像相同的大小,再进行图像相乘,其中,进行采样的方法可以是双线性插值方法,也可以是其他能够实现的方法。
获得第二检测图像的过程还可以包括:根据预设的至少两个图像缩放比例,分别对待检测证件的图像进行缩放,在缩放完成后,针对每个目标模型,分别将缩放后的待检测证件的图像输入各目标模型,并获得对应于各目标模型的第二检测特征图像。之后针对每个目标模型输出的第二检测特征图像,分别进行图像相乘,获得对应于各目标模型的第二检测图像。
与上述获得第一检测图像的方式类似,可以设置两个缩放比例,分别为1/3和1/6,根据缩放比例获得两张缩放后的待检测证件的图像,并分别输入目标模型。目标模型可以有三个,因此分别获得每个目标模型输出的两张第二检测特征图像,在进行图像相乘前,可以将缩放后的第二检测特征图像上采样与原始待检测图像相同的大小,再进行图像相乘,其中,进行采样的方法可以是双线性插值方法,也可以是其他能够实现的方法,最终得到三张第二检测图像。
在本申请实施例中,通过设置缩放比例对待检测证件的图像进行缩放,能够增加待检测图像的样本数量,同时在缩放过程中,顶层网络产生低分辨率的特征,这些特征包含上下文信息。底层网络产生较高的分辨率特征,编码低层次的信息,如纹理、边缘和颜色,能够分别对不同的特征信息进行检测,提高了异常检测的准确率。
图2为本申请一个实施例的目标模型训练方法的流程图。如图2所示,根据预训练模型获得目标模型的目标模型训练方法包括如下步骤:
步骤201、根据预先选取的第一数据集,对骨干网络进行训练,获得预训练模型。
第一数据集包含正常证件的图像与异常证件的图像,通过第一数据集对骨干网络训练,获得预训练模型。
例如,第一数据集可以包含正常证件的图像与异常证件的图像,以及ImageNet数据集,骨干网络可以是Wide-ResNet-50,通过ImageNet数据集、正常证件的图像与异常证件的图像对Wide-ResNet-50进行训练,获得预训练模型。
步骤202、根据预先选取的第二数据集,及预训练模型,对骨干网络进行训练,获得至少一个目标模型。
第二数据集不包括异常证件的图像,通过第二数据集和预训练模型对骨干网络进行训练,获得至少一个目标模型,训练出的目标模型与预训练模型的架构相同。
例如,骨干网络可以是Wide-ResNet-50,第二数据集可以包含正常证件的图像和ImageNet数据集,通过正常证件的图像和ImageNet数据集对Wide-ResNet-50进行训练。将预训练模型作为教师模型,将通过第二数据集训练出的模型作为学生模型,进行知识蒸馏。预训练模型通过神经网络模型之间迁移知识的学习方式,可以联结跨模态或跨域的学习任务,最终获得至少一个目标模型。
在本申请实施例中,通过不同的数据集训练相同架构的骨干网络,能够使目标模型与预训练模型的架构相同,可以减少预训练模型与目标模型间的信息损失。训练学生的数据集中不包含异常证件的图像,能够使训练出的目标模型对异常证件的图像处理后,输出的结果与经过异常证件的图像训练出的预训练模型的输出结果产生较大偏差,能够提高异常检测的准确率。此外,通过预训练模型迁移知识的方式训练目标模型,能够提升目标模型训练的效率。
在一种可能实现的方式中,训练目标模型的过程还可以包括:首先根据预先选取的第二数据集,对骨干网络进行训练,获得至少一个第一目标模型。之后将预先选取的第三数据集输入预训练模型,获得第一描述结果。同时通过至少一个第一目标模型对第三数据集进行处理,分别获得各第一目标模型输出的第一预测结果。在获得第一描述结果和第一预测结果后,针对每个第一目标模型,将第一描述结果、各第一目标模型输出的第一预测结果、第三数据集中图片的宽度和高度、第三数据集中图片的坐标以及预先定义的损失函数,调整各第一目标模型内的参数,直至满足停止条件,获得至少一个目标模型。
首先选取不包含异常证件的图像的第二数据集,对骨干网络训练,获得至少一个第一目标模型。在获得第一目标模型后,将不包含异常证件的第三数据集分别输入预训练模型和至少一个目标模型,以验证第一目标模型的训练结果。在输入第三数据集后,获取预训练模型输出的第一描述结果,和第一目标模型输入的第一预测结果,第一描述结果表示了预训练模型对第三数据集中图像的坐标的描述,第一预测结果表示第一目标模型对第一描述结果对应的图像的坐标的预测。将第一描述结果、各第一目标模型输出的第一预测结果、第三数据集中图片的宽度和高度、第三数据集中图片的坐标以及预先定义的损失函数,对第一目标模型进行参数调整,直至满足停止条件后,获得训练完成的目标模型。
例如,FT(x,y)表示在教师网络对第三数据集中图像x,y坐标上的描述,PS(x,y)表示学生网络在该点做的预测,正常图像定义为:
Ik∈Rw×h×c
其中h是高度,w是宽度,c是通道数量,损失函数为特征空间中的12距离的平方:
其中,和为教师和学生网络中的特征归一化的结果:
l代表特征图的分辨率,(i,j)代表位置坐标。和代表教师和学生网络中的特征图。
同样可以对第三数据集设置缩放比例,以增加样本数量,最终的损失函数为:
M为学生网络的个数,Si表示第i个学生网络,1≦i≦M,w为图像的宽,h为图像的高。第一目标模型表示为:
停止条件可以是第一目标模型收敛或执行预定数量次数的学习后停止。
在本申请实施例中,通过第三数据集和预训练模型,对第二数据集训练出的第一目标模型进行参数调整,能够使最终训练出的目标模型对正常证件的图像进行处理的结果与教师网络尽可能地接近,进一步提高了异常检测的效率。
在一种可能实现的方式中,在对第一目标模型调整完成,获得目标模型后,将第一描述结果、第一预测结果、第三数据集中图片的坐标及目标模型的个数输入预先定义的回归误差函数中,获得第一回归误差结果。同时,通过至少一个目标模型对第三数据集进行处理,分别获得各第一目标模型输出的特征均值。在获得第一回归误差结果和第一目标模型输出的特征均值后,将第一预测结果、各第一目标模型输出的特征均值及目标模型的个数输入预先定义的预测误差函数中,获得第一预测误差结果。最后,分别计算第一回归误差结果和第一预测误差结果的平均值和标准差。
在获得目标模型后,进一步获得第一回归误差结果和各第一目标模型输出的特征均值,并分别计算第一回归误差结果和第一预测误差结果的平均值和标准差,通过获取上述参数,能够进一步根据上述参数对异常评分进行计算。
例如,M为学生网络的个数,FT(x,y)表示在教师网络对第三数据集中图像x,y坐标上的描述,PS(x,y)表示学生网络在该点做的预测,Si表示第i个学生网络,1≦i≦M,回归误差函数为:
学生网络之间的预测误差为:
P(x,y)为各个学生网络在x,y点处的特征均值。
在本申请实施例中,通过计算第一回归误差结果和第一预测误差结果的平均值和标准差,能够为异常检测的过程中提供必要的参数,降低因不可避免的目标模型之间的误差值导致异常检测错误的可能性。
在一种可能实现的方式中,引入注意力机制,注意力机制接收来自预训练模型的第一检测图像,将第一检测图像聚集到一个通道中,再通过注意力机制训练第一目标模型,能够使目标模型中正常证件图片中的正常区域的特征与教师网络中正常证件图片中的正常区域的特征接近。
例如,用于训练预训练模型的网络架构可以如表1所示。
表1
根据上表,注意力机制接收来自预训练模型的特征图,使用5×5卷积层,然后进行批量归一化,再使用3×3卷积层,然后进行批量归一化,再使用1×1卷积层,然后使用sigmoid激活层,将这些特征图聚集到一个通道中。
在本申请实施例中,通过注意力机制,在对第一目标模型进行进一步训练的过程中,能够使最终训练出的目标模型与预训练模型的架构相同,能够降低模型之间进行运算的复杂度。
在一种可能实现的方式中,在训练预训练模型与训练目标模型的过程中,对第二数据集进行数据增强处理,获得超参数,通过超参数对预训练模型与目标模型进行训练。在训练完成后,通过评估指标分别对预训练模型与目标模型进行评估,根据评估结果,判断预训练模型与目标模型是否需要进行再优化。
例如,通过数据增强处理获得的超参数可以如表2所示。
表2
评估指标可以是接收者操作特征曲线下的面积(AUCROC)或是每个区域重叠(PRO)曲线指标。
在本申请实施例中,通过对第二数据集进行数据增强,能够提升对预训练模型与目标模型进行训练的精确度,并且通过评估指标分别对预训练模型与目标模型进行评估的方式,能够进一步降低模型的误差。
图3为本申请一个实施例的异常检测方法的流程图。如图3所示,该异常检测方法包括如下步骤:
步骤301、分别将待检测图像的坐标输入回归误差函数和预测误差函数,获得第二回归误差结果和第二预测误差结果。
将待检测图像的坐标输入回归误差函数和预测误差函数后,能够获得第二回归误差结果和第二预测误差结果E1(x,y)和V1(x,y)。
步骤302、根据第一回归误差结果的平均值和标准差及第一预测误差结果的平均值和标准差、第二回归误差结果、第二预测误差结果,归一化获得异常评分。
异常得分的计算方式如下:
通过上述计算方式,能够获得对应于待检测图片的异常得分。
步骤303、判断异常评分是否大于预设的评分值,若是,执行步骤304,若否,执行步骤305。
在计算出异常得分后,判断异常评分是否大于预设的评分值,并根据不同结果执行相应的步骤。
步骤304、确定待检测证件的图像的坐标对应的图像区域存在异常,并确定待检测证件为异常证件。并结束当前流程。
预设的评分值可以是10,当异常得分大于10时,确定待检测证件的图像的坐标对应的图像区域存在异常,并确定待检测证件为异常证件。
步骤305、确定待检测证件为正常证件。
预设的评分值可以是5,当异常得分小于或等于5时,确定待检测证件为正常证件。
在本申请实施例中,通过计算异常得分,能够对待检测证件进行异常检测,并根据异常检测的结果对待检测证件分别进行处理,提高了证件检测的效率。
证件检测装置
图4为本申请一个实施例的证件检测装置的示意图,如图4所示,该证件检测装置400包括:获取模块401、第一处理模块402、第二处理模块403、检测模块404和分流模块405。
获取模块401,用于获取待检测证件的图像。
在对证件进行检测的过程中首先通过获取模块401获取待检测证件的图像。
例如,待检测证件可以是由生产线生产出的证件,获取模块401获取待检测证件的方式可以是在待检测证件被运输到待检测区域后,由预先设置在待检测区域内的摄像头对待检测证件进行拍照获得。需要说明的是,对于待检测证件的来源及获取模块401对待检测证件的图像的获取方式,在此处不作限定
第一处理模块402,用于通过预训练模型对待检测证件的图像进行处理,获得第一检测图像。
在获取模块401获得待检测证件的图像后,第一处理模块402通过预训练模型对该待检测证件进行处理,获得预训练模型输出的第一检测图像。
第二处理模块403,用于通过至少一个目标模型对待检测证件的图像进行处理,获得各目标模型输出的第二检测图像。
在获取模块401获得待检测证件的图像后,第二处理模块403通过至少一个目标模型对待检测证件的图像进行处理,并分别获得每个目标模型输出的第二检测图像。
例如,目标模型可以有2个,第二处理模块403通过这2个目标模型分别对待检测证件的图像进行处理,获得这两个目标模型分别输出第二检测图像
检测模块404,用于根据第一检测图像和第二检测图像,对待检测证件进行异常检查,并获得异常检测结果。
在获得第一处理模块402输出的第一检测图像和第二处理模块403输出的第二检测图像后,检测模块404对待检测证件进行异常检测,并获得异常检测完成之后的异常检测结果。
例如异常检测结果可以是正确和错误两种。
分流模块405,用于根据异常检测结果,对待检测证件进行分流。
在获得检测模块404输出的异常检测结果后,分流模块405将不同异常检测结果对应的待检测证件分流到不同的区域。
例如,可以将异常检测结果为错误的待检测证件分流至回收区域,将异常检测结果为正确的待检测证件分流至成品区域。
在本申请实施例中,利用第一处理模块402通过预训练模型和第二处理模块403通过至少一个目标模型对待检测证件的图像进行处理的方式,能够代替人工对异常证件进行挑选,并且通过模型进行检测的方式能够提高证件异常检测的准确率。同时,通过设置预训练模型和至少一个目标模型,能够提高异常检测的效率。
电子设备
图5为本申请一个实施例的电子设备的示意图,本申请具体实施例并不对电子设备的具体实现做限定。如图5所示,该电子设备500可以包括:处理器(processor)501、通信接口(Communications Interface)502、存储器(memory)503、以及通信总线504。其中:
处理器501、通信接口502、以及存储器503通过通信总线504完成相互间的通信。
通信接口502,用于与其他电子设备或服务器进行通信。
处理器501,用于执行程序505,具体可以执行前述多个方法实施例中的任一方法实施例中的相关步骤。
具体地,程序505可以包括程序代码,该程序代码包括计算机操作指令。
处理器501可能是CPU,或者是特定集成电路ASIC(Application SpecificIntegrated Circuit),或者是被配置成实施本申请实施例的一个或多个集成电路。智能设备包括的一个或多个处理器,可以是同一类型的处理器,如一个或多个CPU;也可以是不同类型的处理器,如一个或多个CPU以及一个或多个ASIC。
存储器503,用于存放程序505。存储器503可能包含高速RAM存储器,也可能还包括非易失性存储器(non-volatile memory),例如至少一个磁盘存储器。
程序505具体可以用于使得处理器501执行前述实施例中多个方法实施例中的任一方法。
程序505中各步骤的具体实现可以参见前述证件检测方法实施例中的相应步骤和单元中对应的描述,在此不赘述。所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的设备和模块的具体工作过程,可以参考前述方法实施例中的对应过程描述,在此不再赘述。
通过本申请实施例的电子设备,通过预训练模型和至少一个目标模型对待检测证件的图像进行处理,能够代替人工对异常证件进行挑选,并且通过模型进行检测的方式能够提高证件异常检测的准确率。同时,通过设置预训练模型和至少一个目标模型,能够提高异常检测的效率。
计算机存储介质
本申请还提供了一种计算机可读存储介质,存储用于使一机器执行如本文所述的多个方法实施例中的任一方法的指令。具体地,可以提供配有存储介质的系统或者装置,在该存储介质上存储着实现上述实施例中任一实施例的功能的软件程序代码,且使该系统或者装置的计算机(或CPU或MPU)读出并执行存储在存储介质中的程序代码。
在这种情况下,从存储介质读取的程序代码本身可实现上述实施例中任何一项实施例的功能,因此程序代码和存储程序代码的存储介质构成了本申请的一部分。
用于提供程序代码的存储介质实施例包括软盘、硬盘、磁光盘、光盘(如CD-ROM、CD-R、CD-RW、DVD-ROM、DVD-RAM、DVD-RW、DVD+RW)、磁带、非易失性存储卡和ROM。可选择地,可以由通信网络从服务器计算机上下载程序代码。
计算机程序产品
本申请实施例还提供了一种计算机程序产品,包括计算机指令,该计算机指令指示计算设备执行上述多个方法实施例中的任一对应的操作。
需要指出,根据实施的需要,可将本申请实施例中描述的各个部件/步骤拆分为更多部件/步骤,也可将两个或多个部件/步骤或者部件/步骤的部分操作组合成新的部件/步骤,以实现本申请实施例的目的。
上述根据本申请实施例的方法可在硬件、固件中实现,或者被实现为可存储在记录介质(诸如CD ROM、RAM、软盘、硬盘或磁光盘)中的软件或计算机代码,或者被实现通过网络下载的原始存储在远程记录介质或非暂时机器可读介质中并将被存储在本地记录介质中的计算机代码,从而在此描述的方法可被存储在使用通用计算机、专用处理器或者可编程或专用硬件(诸如ASIC或FPGA)的记录介质上的这样的软件处理。可以理解,计算机、处理器、微处理器控制器或可编程硬件包括可存储或接收软件或计算机代码的存储组件(例如,RAM、ROM、闪存等),当所述软件或计算机代码被计算机、处理器或硬件访问且执行时,实现在此描述的方法。此外,当通用计算机访问用于实现在此示出的方法的代码时,代码的执行将通用计算机转换为用于执行在此示出的方法的专用计算机。
需要说明的是,上述各流程和各系统结构图中不是所有的步骤和模块都是必需的,可以根据实际的需要忽略某些步骤或模块。各步骤的执行顺序不是固定的,可以根据需要进行调整。上述各实施例中描述的系统结构可以是物理结构,也可以是逻辑结构,即,有些模块可能由同一物理实体实现,或者,有些模块可能分由多个物理实体实现,或者,可以由多个独立设备中的某些部件共同实现。
以上各实施例中,硬件模块可以通过机械方式或电气方式实现。例如,一个硬件模块可以包括永久性专用的电路或逻辑(如专门的处理器,FPGA或ASIC)来完成相应操作。硬件模块还可以包括可编程逻辑或电路(如通用处理器或其他可编程处理器),可以由软件进行临时的设置以完成相应操作。具体的实现方式(机械方式、或专用的永久性电路、或者临时设置的电路)可以基于成本和时间上的考虑来确定。
上文通过附图和优选实施例对本申请进行了详细展示和说明,然而本申请不限于这些已揭示的实施例,基于上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的代码审核手段得到本申请更多的实施例,这些实施例也在本申请的保护范围之内。
Claims (10)
1.一种证件检测方法,其特征在于,包括:
获取待检测证件的图像;
通过预训练模型对所述待检测证件的图像进行处理,获得第一检测图像;
通过至少一个目标模型对所述待检测证件的图像进行处理,获得各所述目标模型输出的第二检测图像,其中,所述目标模型根据所述预训练模型获得;
根据所述第一检测图像和所述第二检测图像,对所述待检测证件进行异常检测,并获得异常检测结果;
根据所述异常检测结果,对所述待检测证件进行分流。
2.根据权利要求1所述的方法,其特征在于,
所述通过预训练模型对所述待检测证件的图像进行处理,获得第一检测图像,包括:
根据预设的至少两个图像缩放比例,分别对所述待检测证件的图像进行缩放;
分别将缩放后的所述待检测证件的图像输入所述预训练模型,获得至少两张第一检测特征图像;
将所述至少两张第一检测特征图像进行图像相乘,获得所述第一检测图像,其中,所述图像相乘的操作是将图像对应的灰度值或彩色分量进行相乘;
所述通过至少一个目标模型对所述待检测证件的图像进行处理,获得各所述目标模型输出的第二检测图像,包括:
根据预设的至少两个图像缩放比例,分别对所述待检测证件的图像进行缩放;
针对每个所述目标模型,分别将缩放后的所述待检测证件的图像输入各所述目标模型,并获得对应于各所述目标模型的第二检测特征图像;
针对每个所述目标模型输出的第二检测特征图像,分别进行所述图像相乘,获得对应于各所述目标模型的所述第二检测图像。
3.根据权利要求1所述的方法,其特征在于,所述方法还包括:
根据预先选取的第一数据集,对骨干网络进行训练,获得所述预训练模型,其中,所述第一数据集包含正常证件的图像与异常证件的图像;
根据预先选取的第二数据集,及所述预训练模型,对骨干网络进行训练,获得至少一个所述目标模型,其中,所述第二数据集不包括异常证件的图像,所述预训练模型与所述目标模型的架构相同。
4.根据权利要求3所述的方法,其特征在于,所述根据预先选取的第二数据集,及所述预训练模型,对骨干网络进行训练,获得至少一个所述目标模型,包括:
根据预先选取的第二数据集,对骨干网络进行训练,获得至少一个第一目标模型;
将预先选取的第三数据集输入所述预训练模型,获得第一描述结果,其中,所述第三数据集不包括异常证件的图像,所述第一描述结果表示了所述预训练模型对第三数据集中图像的坐标的描述;
通过所述至少一个第一目标模型对所述第三数据集进行处理,分别获得各所述第一目标模型输出的第一预测结果,其中,所述第一预测结果表示所述第一目标模型对所述第一描述结果对应的图像的坐标的预测;
针对每个所述第一目标模型,将所述第一描述结果、各所述第一目标模型输出的第一预测结果、所述第三数据集中图片的宽度和高度、所述第三数据集中图片的坐标以及预先定义的损失函数,调整各第一目标模型内的参数,直至满足停止条件,获得所述至少一个目标模型。
5.根据权利要求4所述的方法,其特征在于,所述方法还包括:
将所述第一描述结果、所述第一预测结果、所述第三数据集中图片的坐标及所述目标模型的个数输入预先定义的回归误差函数中,获得第一回归误差结果;
通过所述至少一个目标模型对所述第三数据集进行处理,分别获得各所述第一目标模型输出的特征均值,其中,所述特征均值指示了所述目标模型与所述第三数据集的相关性;
将所述第一预测结果、所述各所述第一目标模型输出的特征均值及所述目标模型的个数输入预先定义的预测误差函数中,获得第一预测误差结果;
分别计算所述第一回归误差结果和所述第一预测误差结果的平均值和标准差,其中,所述第一回归误差结果和所述第一预测误差结果的平均值和标准差用于待检测证件的异常检测。
6.根据权利要求5所述的方法,其特征在于,所述根据所述第一检测图像和所述第二检测图像,判断所述待检测证件的图像是否存在异常,并获得异常检测结果,包括:
分别将所述待检测图像的坐标输入所述回归误差函数和所述预测误差函数,获得第二回归误差结果和第二预测误差结果;
根据所述第一回归误差结果的平均值和标准差及所述第一预测误差结果的平均值和标准差、所述第二回归误差结果、所述第二预测误差结果,归一化获得异常评分;
当所述异常评分大于预设的评分值时,确定所述待检测证件的图像的坐标对应的图像区域存在异常,并确定所述待检测证件为异常证件;
当所述异常评分小于或等于所述预设的评分值时,确定所述待检测证件为正常证件。
7.一种证件检测装置,其特征在于,包括:
获取模块,用于获取待检测证件的图像;
第一处理模块,用于通过预训练模型对所述待检测证件的图像进行处理,获得第一检测图像;
第二处理模块,用于通过至少一个目标模型对所述待检测证件的图像进行处理,获得各所述目标模型输出的第二检测图像;
检测模块,用于根据所述第一检测图像和所述第二检测图像,对所述待检测证件进行异常检查,并获得异常检测结果;
分流模块,用于根据所述异常检测结果,对所述待检测证件进行分流。
8.一种电子设备,包括:处理器、通信接口、存储器和通信总线,处理器、存储器和通信接口通过通信总线完成相互间的通信;
存储器用于存放至少一可执行指令,可执行指令使处理器执行如权利要求1-6中任一项所述的证件检测方法对应的操作。
9.一种计算机存储介质,其上存储有计算机程序,该程序被处理器执行时实现如权利要求1-6中任一项所述的证件检测方法。
10.一种计算机程序产品,包括计算机指令,所述计算机指令指示计算设备执行如权利要求1-6中任一项所述的证件检测方法对应的操作。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211444948.7A CN116091400A (zh) | 2022-11-18 | 2022-11-18 | 一种证件检测方法、装置、电子设备和存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211444948.7A CN116091400A (zh) | 2022-11-18 | 2022-11-18 | 一种证件检测方法、装置、电子设备和存储介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116091400A true CN116091400A (zh) | 2023-05-09 |
Family
ID=86209043
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211444948.7A Pending CN116091400A (zh) | 2022-11-18 | 2022-11-18 | 一种证件检测方法、装置、电子设备和存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116091400A (zh) |
Cited By (1)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7343646B1 (ja) | 2022-03-30 | 2023-09-12 | 本田技研工業株式会社 | 教師データの収集方法 |
-
2022
- 2022-11-18 CN CN202211444948.7A patent/CN116091400A/zh active Pending
Cited By (2)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
JP7343646B1 (ja) | 2022-03-30 | 2023-09-12 | 本田技研工業株式会社 | 教師データの収集方法 |
JP2023149186A (ja) * | 2022-03-30 | 2023-10-13 | 本田技研工業株式会社 | 教師データの収集方法 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
EP3968280A1 (en) | Target tracking method and apparatus, storage medium and electronic device | |
CN106683048B (zh) | 一种图像超分辨率方法及设备 | |
CN109583483B (zh) | 一种基于卷积神经网络的目标检测方法和系统 | |
CN109272016B (zh) | 目标检测方法、装置、终端设备和计算机可读存储介质 | |
CN108701234A (zh) | 车牌识别方法及云系统 | |
JP2023545565A (ja) | 画像検出方法、モデルトレーニング方法、画像検出装置、トレーニング装置、機器及びプログラム | |
CN110046622B (zh) | 一种有目标的攻击样本生成方法、装置、设备及存储介质 | |
CN111507909A (zh) | 一种有雾图像清晰化的方法、装置及存储介质 | |
CN110135446B (zh) | 文本检测方法及计算机存储介质 | |
CN113570508A (zh) | 图像修复方法及装置、存储介质、终端 | |
CN104867225A (zh) | 一种纸币的面向识别方法及装置 | |
JP2021531571A (ja) | 証明書画像抽出方法及び端末機器 | |
CN112581462A (zh) | 工业产品的外观缺陷检测方法、装置及存储介质 | |
CN113850238B (zh) | 文档检测方法、装置、电子设备及存储介质 | |
CN110263616A (zh) | 一种文字识别方法、装置、电子设备及存储介质 | |
WO2021189856A1 (zh) | 证件校验方法、装置、电子设备及介质 | |
CN111310746A (zh) | 文本行检测方法、模型训练方法、装置、服务器及介质 | |
CN116091400A (zh) | 一种证件检测方法、装置、电子设备和存储介质 | |
CN112232336A (zh) | 一种证件识别方法、装置、设备及存储介质 | |
CN111784665A (zh) | 基于傅里叶变换的oct图像质量评估方法、系统及装置 | |
CN112419275A (zh) | 图像质量确定方法、装置及系统 | |
CN115393868B (zh) | 文本检测方法、装置、电子设备和存储介质 | |
CN113850239B (zh) | 多文档检测方法、装置、电子设备及存储介质 | |
CN113298098B (zh) | 基础矩阵估计方法及相关产品 | |
CN113011468B (zh) | 图像特征提取方法及装置 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |