CN112801298B - 异常样本检测方法、装置、设备和存储介质 - Google Patents

异常样本检测方法、装置、设备和存储介质 Download PDF

Info

Publication number
CN112801298B
CN112801298B CN202110077488.8A CN202110077488A CN112801298B CN 112801298 B CN112801298 B CN 112801298B CN 202110077488 A CN202110077488 A CN 202110077488A CN 112801298 B CN112801298 B CN 112801298B
Authority
CN
China
Prior art keywords
teacher
feature
student
network
sample
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202110077488.8A
Other languages
English (en)
Other versions
CN112801298A (zh
Inventor
张滨
苑鹏程
辛颖
冯原
王晓迪
龙翔
彭岩
郑弘晖
韩树民
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Beijing Baidu Netcom Science and Technology Co Ltd
Original Assignee
Beijing Baidu Netcom Science and Technology Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Beijing Baidu Netcom Science and Technology Co Ltd filed Critical Beijing Baidu Netcom Science and Technology Co Ltd
Priority to CN202110077488.8A priority Critical patent/CN112801298B/zh
Publication of CN112801298A publication Critical patent/CN112801298A/zh
Application granted granted Critical
Publication of CN112801298B publication Critical patent/CN112801298B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06NCOMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
    • G06N20/00Machine learning
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F18/00Pattern recognition
    • G06F18/20Analysing
    • G06F18/21Design or setup of recognition systems or techniques; Extraction of features in feature space; Blind source separation
    • G06F18/214Generating training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/44Local feature extraction by analysis of parts of the pattern, e.g. by detecting edges, contours, loops, corners, strokes or intersections; Connectivity analysis, e.g. of connected components
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/46Descriptors for shape, contour or point-related descriptors, e.g. scale invariant feature transform [SIFT] or bags of words [BoW]; Salient regional features
    • G06V10/462Salient features, e.g. scale invariant feature transforms [SIFT]
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/40Extraction of image or video features
    • G06V10/56Extraction of image or video features relating to colour

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Physics & Mathematics (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Multimedia (AREA)
  • Data Mining & Analysis (AREA)
  • Evolutionary Computation (AREA)
  • General Engineering & Computer Science (AREA)
  • Software Systems (AREA)
  • Artificial Intelligence (AREA)
  • Computing Systems (AREA)
  • Mathematical Physics (AREA)
  • Medical Informatics (AREA)
  • Life Sciences & Earth Sciences (AREA)
  • Bioinformatics & Cheminformatics (AREA)
  • Bioinformatics & Computational Biology (AREA)
  • Evolutionary Biology (AREA)
  • Image Analysis (AREA)

Abstract

本申请公开了一种异常样本检测方法、装置、设备和存储介质,涉及数据处理技术领域,尤其涉及深度学习、计算机视觉等人工智能技术。具体实现方式为:分别采用教师网络和学生网络对待检测样本进行处理,得到教师特征和与所述教师特征相关联的学生特征;根据所述教师特征和所述学生特征,确定所述待检测样本是否为异常样本。本申请采用教师网络和学生网络进行异常样本检测,在提高检测效率的同时,兼顾了检测结果准确度。

Description

异常样本检测方法、装置、设备和存储介质
技术领域
本申请涉及数据处理技术领域,尤其涉及深度学习、计算机视觉等人工智能技术。
背景技术
在样本数据集中,有部分样本数据与其他大部分样本数据之间存在显著差异,通常我们将这部分样本数据称为异常样本或奇异样本。为了保证样本数据集中的数据质量,通常需要对样本数据集中的各样本进行异常检测。
现有技术的异常样本检测方式,存在无法兼顾检测效率和检测结果准确度的缺陷。
发明内容
本申请提供了一种异常样本检测方法、装置、设备和存储介质。
根据本申请的一方面,提供了一种异常样本检测方法,包括:
分别采用教师网络和学生网络对待检测样本进行处理,得到教师特征和与所述教师特征相关联的学生特征;
根据所述教师特征和所述学生特征,确定所述待检测样本是否为异常样本。
根据本申请的另一方面,还提供了一种异常样本检测装置,包括:
特征得到模块,用于分别采用教师网络和学生网络对待检测样本进行处理,得到教师特征和与所述教师特征相关联的学生特征;
异常样本确定模块,用于根据所述教师特征和所述学生特征,确定所述待检测样本是否为异常样本。
根据本申请的另一方面,还提供了一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行本申请实施例提供的任意一种异常样本检测方法。
根据本申请的另一方面,还提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行本申请实施例提供的任意一种异常样本检测方法。
根据本申请的另一方面,还提供了一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现本申请实施例提供的任意一种异常样本检测方法。
应当理解,本部分所描述的内容并非旨在标识本申请的实施例的关键或重要特征,也不用于限制本申请的范围。本申请的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本申请的限定。其中:
图1是本申请实施例提供的一种异常样本检测方法流程图;
图2A是本申请实施例提供的一种教师网络和学生网络结构示意图;
图2B是本申请实施例提供的另一种异常样本检测方法流程图;
图3是本申请实施例提供的另一种异常样本检测方法流程图;
图4A是本申请实施例提供的一种教师网络和学生网络训练和使用过程示意图;
图4B是本申请实施例提供的另一种异常图像检测方法流程图;
图5是本申请实施例提供的一种异常样本检测装置结构图;
图6是用来实现本申请实施例的异常样本检测方法的电子设备的框图。
具体实施方式
以下结合附图对本申请的示范性实施例做出说明,其中包括本申请实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本申请的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本申请实施例提供的各异常样本检测方法和异常样本检测装置,适用于对样本数据集中的异常样本进行检测的情况。其中,样本数据集可以是网络抓取数据、声音数据、或图片数据等。本申请中的各异常样本检测方法可以由异常样本检测装置执行,各异常样本检测装置可以采用软件和/或硬件实现,并具体配置于电子设备中。该电子设备可以是具备一定数据运算能力的计算设备,如服务器。
参见图1所示的一种异常样本检测方法,包括:
S101、分别采用教师网络和学生网络对待检测样本进行处理,得到教师特征和与教师特征相关联的学生特征。
其中,教师网络可以理解为具备一定特征提取能力的深度学习网络;学生网络为较教师网格更为轻量级的深度学习网络,且具备有与教师网络相同或相似特征提取能力。其中,学生网络通过对教师网络知识蒸馏得以训练。
其中,待检测样本可以是声音数据、图片数据、日志数据或用户行为数据等。当然待检测样本还可以是其他类型数据,仅需保证待检测样本所属样本数据中正常样本之间特征相同或近似,正常样本与异常样本之间特征存在显著差异即可。
示例性地,将待检测样本输入至教师网络,得到教师特征;相应的,将待检测样本输入至学生网络,得到学生特征。
在一个具体实现方式中,教师特征和学生特征之间的关联性可以通过数据大小或所属频段等加以约束。例如,若待检测样本的数据大小为L*W*H,经教师网络处理后,得到教师特征的数据大小为L1*W1*H1;相应的,经学生网络处理后,得到学生特征的数据大小同样为L1*W1*H1。又如,若待检测样本的频段范围为0-1000Hz,经教师网络处理后,得到的教师特征的频段范围为0.25-35Hz;相应的,待检测样本经学生网络处理后,得到的学生特征的频段范围同样为0.25-35Hz。
在另一具体实现方式中,教师特征和学生特征之间的关联性,还可以通过教师网络和学生网络自身的网络结构以及特征输出位置加以确定。例如,直接将教师网络的末尾结构输出的特征作为教师特征;将学生网络的末尾结构输出的特征作为与教师特征关联的学生特征。
需要说明的是,本申请中所涉及的教师网络和学生网络能够对正常样本(又称正样本)具备相同或相近的特征提取能力,并且对异常样本(又称负样本)具备差异化的特征提取能力,从而为异常样本的有效检测奠定了基础。
在一个具体实现方式中,可以基于多个训练正样本对预先构建的教师初始网络进行无监督训练,将训练好的教师初始网络作为教师网络;相应的,基于训练正样本和教师网络,对预先构建的学生初始网络进行知识蒸馏,将训练好的学生初始网络作为学生网络。
由于教师网络和学生网络训练过程均属于无监督训练,因此无需进行多样化的异常样本的生成或收集,减少了网络训练所付诸的人力成本和时间成本。同时,通过训练正样本进行教师网络和学生网络的训练,使得教师网络和学生网络能够捕获正常样本的数据流形,从而保证教师网络和学生网络对正常样本的特征提取具备通用性,而对异常样本的特征提取具备差异性,为异常样本的有效检测奠定了基础。
S102、根据教师特征和学生特征,确定待检测样本是否为异常样本。
示例性地,确定教师特征和学生特征之间差异性;根据差异性确定结果,识别待检测样本是否为异常样本。
示例性地,若教师特征和学生特征之间存在差异,则确定待检测样本为异常样本;若教师特征和学生特征之间不存在差异,则确定待检测样本为正常样本。
由于知识蒸馏过程也仅能保证学生网络与教师网络具备相似的性能,但是由于学生网络属于教师网络轻量化结果,也即学生网络的模型复杂度明显低于教师网络的模型复杂度,因此,学生网络和教师网络对相同待检测样本的特征提取能力必然存在一定差异。因此,通过教师特征和学生特征之间差异存在性进行异常样本检测,将会存在大量正常样本误识别的情况,影响异常样本检测结果的准确度。
为了提高异常样本检测结果的准确度,还可以将教师特征和学生特征之间的差异性进行量化,从而根据量化结果,确定待检测样本是否为异常样本。一般的,差异性越大,待检测样本为异常样本的概率越大;差异性越小,待检测样本为异常样本的概率越小。
在一个可选实施例中,确定教师特征和学生特征之前的特征差异度;根据特征差异度,确定待检测样本是否为异常样本。具体的,若特征差异度大于第一特征差异度阈值,则确定该待检测样本为异常样本;若特征差异度小于第二特征差异度阈值,则确定该待检测样本为正常样本。其中,第一特征差异度阈值不小于第二特征差异度阈值,各阈值大小可以由技术人员根据需要或经验值进行确定。
可选的,特征差异度可以基于教师特征和学生特征之间的特征距离确定;其中,特征距离可以是欧氏距离或马氏距离等,本申请对此不做任何限定。或者可选的,特征差异度还可以根据教师特征和学生特征之间的相似度确定;其中,相似度可以是余弦相似度等,本申请对此不做任何限定。
由于现有技术在进行异常样本检测时,通常需要基于待检测样本进行数据重构,得到重构样本;根据重构样本和待检测样本之间的差异进行异常样本检测。而不同数据重构方式对应的检测过程,通常存在检测结果准确度较差或检测效率较低的情况,无法实现两者兼顾。
本申请通过引入教师网络和学生网络对待检测样本处理得到的教师特征和学生特征,进行异常样本检测,通过对待检测样本进行一次关联特征提取,无需依赖数据重构方式,即可得到异常检测结果,提高了检测效率;同时,异常检测过程无需依赖数据重构,因此也不会因为重构方法泛化能力或重构能力的影响,而影响异常检测结果的准确度,所以本申请还提高了检测结果准确度,从而达到了兼顾检测效率和检测结果准确度的效果。
为了实现对待检测样本进行多尺度的特征提取,一般的,教师网络和学生网络中通常会分别设置至少一个特征提取模块。相应的,教师特征和学生特征的数量也会分别为至少一个。以下将在教师网络和学生网络的网络结构的基础上,对异常样本检测过程进行详细说明。
参见图2A所示的一种教师网络和学生网络的结构示意图。其中,教师网络中包括至少一个特征提取模块Nti(i=1,2,…,n;n≥1),各特征提取模块Nti的输出数据即为特征数据Ti。相应的,学生网络中包括至少一个特征提取模块Nsi,各特征提取模块Nsi的输出数据即为特征数据Si。其中,教师网络和学生网络中所包含的特征提取网络数量相同(均为n)。教师网络和学生网络中,相同层级(也即i相同)的特征提取模块功能相同,也即所提取的特征表征含义相同。例如,在教师网络和学生网络中,某一个层级的特征提取模块均对纹理、边缘或颜色等高分辨率特征进行提取;又如,在教师网络和学生网络中,另一个层级的特征提取模块对上下文等低分辨率特征进行提取。其中,同一网络中不同层级的特征提取模块所提取特征的尺度不同。其中n的数值大小可以由技术人员根据需要或经验值进行确定,或通过大量试验进行调整。
其中,相关联的教师特征和学生特征,分别为教师网络和学生网络中相同层级的特征提取模块的输出数据。也即教师特征Ti与学生特征Si相关联。为了便于描述,将相关联的教师特征和学生特征记为关联特征(Ti-Si)。
可以理解的是,通过教师网络和学生网络的网络结构特性,构建教师特征和学生特征之间的关联关系,相较于根据教师特征和学生特征数据大小或所属频段等方式,保证了教师特征和学生特征所携带语义信息的一致性,从而避免了由于语义信息不同导致教师特征和学生特征存在差异,导致异常样本检测结果准确度差的情况出现,为异常样本检测结果的准确度提供了保障。
本申请基于图2A所示的教师网络和学生网络,还提供了实现异常样本检测方法的一个可选实施例。
参见图2B所示的一种异常样本检测方法,包括:
S201、分别采用教师网络和学生网络对待检测样本进行处理,得到至少一组关联特征;其中,关联特征为教师特征和与教师特征相关联的学生特征。
具体的,参见图2A,分别采用教师网络和学生网络对待检测样本进行处理,得到的关联特征(Ti-Si)。其中,i=1,2,…,n。其中,n为正整数。
S202、根据至少一组关联特征,确定待检测样本是否为异常样本。
在一个可选实施例中,根据至少一组关联特征,确定待检测样本是否为异常样本,可以是:选取任意一组关联特征;确定该组关联特征中教师特征和学生特征之间的特征差异度;根据特征差异度,确定待检测样本是否为异常样本。具体的,若特征差异度大于第一设定差异阈值,则确定该待检测样本为异常样本;若特征差异度小于第二设定差异阈值,则确定该待检测样本为正常样本。其中,第一设定差异阈值不小于第二设定差异度阈值,各差异阈值由技术人员根据需要或经验值进行确定。
当关联特征存在至少两组时,在另一可选实施例中,根据至少一组关联特征,确定待检测样本是否为异常样本,还可以是:选取至少两组关联特征;将各组关联特征中的教师特征进行特征融合,得到教师融合特征;将各组关联特征中的学生特征进行特征融合,得到学生融合特征;确定教师融合特征与学生融合特征之间的特征差异度;根据特征差异度,确定待检测样本是否为异常样本。具体的,若特征差异度大于第一设定差异度阈值,则确定该待检测样本为异常样本;若特征差异度小于第二设定差异度阈值,则确定该待检测样本为正常样本。其中,第一设定差异度阈值不小于第二设定差异度阈值,各差异阈值由技术人员根据需要或经验值进行确定。
可以理解的是,由于正常样本的样本特征具备一致性,而异常样本的异常特征存在多样性,通过至少两组关联特征的联合使用,能够更好地适配异常样本的多样化需求,进而提高异常样本检测结果的准确度。
然而,上述方式需要对不同层级的特征提取模块输出的教师特征和学生特征分别进行特征融合,将会带来计算量的增加,给异常检测效率带来一定影响。为了在提高异常样本检测结果准确度的同时,兼顾异常检测效率,当关联特征存至少两组时,在又一可选实施例中,根据至少一组关联特征,确定待检测样本是否为异常样本,还可以是:分别确定各组关联特征的特征差异度;确定各特征差异度的加权均值;根据均值确定结果,确定待检测样本是否为异常样本。其中,各特征差异度的权重可以根据特征差异度对应特征提取模块所属层级确定。
示例性地,可以预先确定不同层级的特征提取模块对应的权重数值,后续根据层级数值进行权重数值的查找获取。各权重的数值大小可以由技术人员根据需要或经验值进行确定,还可以通过大量试验反复调整确定。
具体的,若均值确定结果大于第一设定差异度阈值,则确定该待检测样本为异常样本;若均值确定结果小于第二设定差异度阈值,则确定该待检测样本为正常样本。其中,第一设定差异度阈值不小于第二设定差异度阈值,各差异阈值由技术人员根据需要或经验值进行确定。
本申请实施例通过将异常样本检测过程,细化为根据至少一组关联特征,确定待检测样本是否为异常样本,从而充分利用教师网络和学生网络的特征提取结果,从而更好地适配异常样本的多样化需求,为异常样本检测结果的准确度的提高奠定了基础。
需要说明的是,在工业应用场景中,通常会对批量生成产品进行合格检测,从而挑选出残次品。而在工业场景进行残次品检测时,通常会将各产品图像作为待检测图像,通过对待检测图像进行异常检测,达到残次品筛查的目的。为了便于理解,以下将对待检测图像的异常检测过程进行详细说明。
在一个可选实施例中,可以分别采用教师网络和学生网络,直接对待检测图像整体进行处理,得到教师特征和与教师特征关联的学生特征;根据教师特征和学生特征,确定待检测样本是否为异常样本。
然而,对待检测图像整体进行处理时,由于教师网络和学生网络网络结构间固有差异的存在,导致异常样本识别精度略低。为了进一步提高异常样本识别结果的准确度,在另一可选实施例中,还可以对待检测图像进行局部异常检测。
参见图3所示的一种异常样本检测方法,包括:
S301、根据待检测图像,生成至少两个原始图像块。
可选的,可以通过随机划分的方式,将待检测图像划分为至少两个原始图像块。
或者可选的,还可以通过滑窗法按照设定方向依次移动设动步长,根据待检测图像中的窗口位置,生成至少两个原始图像块。其中,窗口大小和移动步长可以由技术人员根据需要或经验值进行确定或调整。
可以理解的是,由于原始图像块为待检测图像中的局部图像,后续针对原始图像块替代待检测图像进行处理,实现了更细粒度的特征提取操作,从而提高了特征提取结果的准确度,进而为异常检测结果准确度的提高奠定了基础。
S302、分别采用教师网络和学生网络对各原始图像块进行处理,得到各原始图像块对应的教师特征和与教师特征相关联的学生特征。
针对每个原始图像块,将该原始图像块输入至教师网络,得到该原始图像块的教师特征;将该原始图像块输入至学生网络,得到该原始图像块的学生特征。也即,在上述各实施例的基础上,采用各原始图像块替代待检测图像块,分别输入至教师网络和学生网络中,针对每个原始图像块输出至少一组关联特征。其中,关联特征包括教师网络输出的教师特征以及学生网络输出的与教师特征关联的学生特征。
S303、根据教师特征和学生特征,确定待检测图像是否为异常图像。
在一个可选实施方式中,若各原始图像块对应的教师特征和学生特征的数量分别为一个,则根据教师特征和学生特征,确定待检测图像是否为异常图像,可以是:将各原始图像块的教师特征,根据原始图像块在待检测图像中的位置依次拼接,并将相同像素点区域的不同特征值进行特征融合,得到教师融合特征。相应的,将各原始图像块的学生特征,根据原始图像块在待检测图像中的位置依次拼接,并将相同像素点区域的不同特征值进行特征融合,得到学生融合特征。确定教师融合特征和学生融合特征之间的特征差异度;根据特征差异度,确定待检测图像是否为异常样本。
可选的,可以基于教师融合特征和学生融合特征之间的特征距离或相似度,确定特征差异度;若特征差异度大于第一特征差异度阈值,则确定该待检测图像为异常图像;若特征差异度小于第二特征差异度阈值,则确定该待检测图像为正常图像。其中,第一特征差异度阈值不小于第二特征差异度阈值,各阈值大小可以由技术人员根据需要或经验值进行确定。
在另一可选实施方式中,若各原始图像块对应的教师特征和学生特征的数量分别为至少两个,则根据教师特征和学生特征,确定待检测图像是否为异常图像,可以是:针对每个原始图像块,将该原始图像块的各教师特征进行初级特征融合,得到初级教师特征融合结果;将各原始图像块的初级教师特征融合结果,根据原始图像块在待检测图像中的位置依次拼接,并将相同像素点区域的不同特征值进行特征融合,得到教师融合特征。相应的,针对每个原始图像块,将该原始图像块的各学生特征进行初级特征融合,得到初级学生特征融合结果;将各原始图像块的初级学生特征融合结果,根据原始图像块在待检测图像中的位置依次拼接,并将相同像素点区域的不同特征值进行特征融合,得到学生融合特征。确定教师融合特征和学生融合特征之间的特征差异度;根据特征差异度,确定待检测图像是否为异常样本。
当原始特征块块的数量较多时,直接对特征进行融合处理,将会带来计算量的增加,从而对异常检测效率带来一定影响。为了避免异常检测效率的降低,在又一可选实施方式中,根据教师特征和学生特征,确定待检测图像是否为异常图像,还可以是:针对各原始图像块对应的教师特征和与教师特征相关联的学生特征,分别确定各原始图像块的块特征差异度;根据各块特征差异度,确定待检测图像是否为异常图像。
其中,针对每个原始图像块,确定该原始图像块的块特征差异度的过程,可参见前述待检测样本的特征差异度的确定过程,仅需将前述示例中的待检测样本替换为原始图像块即可,将特征差异度确定结果作为原始图像块的块特征差异度,本申请对原始图像块的块特征差异度的确定过程不再赘述。
示例性地,根据各块特征差异度,确定待检测图像是否为异常图像,可以是:将各块特征差异度分别与第一特征差异度阈值进行比较;若大于第一特征差异度阈值的块特征差异度的数量大于设定数量阈值,或者大于第一特征差异度阈值的块特征差异度的占比大于设定占比阈值,则确定待检测图像为异常图像。其中,第一设定差异度阈值可以由技术人员根据需要或经验值进行确定。
示例性地,根据各块特征差异度,确定待检测图像是否为异常图像,可以是:确定各块特征差异度的加权均值;若均值确定结果大于第一特征差异度阈值,则确定该待检测图像为异常图像;若均值确定结果小于第二设定差异度阈值,则确定该待检测图像为正常图像。其中,第一设定差异度阈值不小于第二设定差异度阈值,各差异阈值可以由技术人员根据需要或经验值进行确定。
可以理解的是,通过分别确定各原始图像块的块特征差异度,并根据块特征差异度进行异常图像检测,能够避免对原始图像块的特征数据的融合操作,减少了异常检测过程的数据运算量,为检测效率的提高提供了保障。进一步地,由于各原始图像块的块特征差异度的确定操作之间互不影响,因此还可以通过并行计算的方式,进一步提高块特征差异度的确定效率,进而为异常图像检测效率的进一步提高奠定了基础。
本申请实施例通过在异常图像检测过程中,将教师特征和学生特征的确定过程,细化为根据待检测图像,生成至少两个原始图像块;分别采用教师网络和学生网络对各原始图像块进行处理,得到各原始图像块对应的教师特征和与教师特征相关联的图像特征,从而基于原始图像块的教师特征和学生特征,进行待检测图像的异常图像检测。上述技术方案采用分而治之的方式,实现了对待检测图像更细粒度的特征提取,从而使得所提取的教师特征和学生特征所携带语义信息更加丰富全面,提高了特征提取结果的准确度,从而为异常检测结果准确度的提高奠定了基础。
在上述各技术方案的基础上,在引入块特征差异度的过程中,还可以引入异常图像块的概念,从而实现对待检测图像异常定位。
示例性地,根据各块特征差异度,确定原始图像块中的异常图像块;根据异常图像块,对待检测图像进行异常定位。
具体的,将各块特征差异度分别与第一设定差异度阈值进行比较,若某一块特征差异度大于第一设定差异度阈值,则将该块特征差异度对应的原始图像块作为异常图像块;将待检测图像中异常图像块所属位置进行标记,从而实现对待检测图像的异常定位。其中,第一设定差异度阈值可以由技术人员根据需要或经验值进行确定。
可以理解的是,通过块特征差异度实现异常图像块的筛选,并通过对待检测图像中的异常图像块进行定位,实现待检测图像的异常位置定位,进一步丰富了异常检测功能。同时,在异常样本检测之后,若还存在人工复核环节,通过异常定位的方式能够帮助复核人员有针对性的进行检测,从而提高了异常样本复核效率。
在上述各技术方案的基础上,当待检测图像中样本特征和背景特征差异较小时,将会影响教师网络和学生网络对原始图像块的处理结果准确度,也即所得到的教师特征和学生特征,将没有办法很好的表征原始图像块,从而给待检测图像的异常检测结果的准确度带来一定影响。
为了避免上述情况的发生,在一个可选实施例中,在生成原始图像块之后,还可以对原始图像块进行特征提取,得到目标图像块;根据目标图像块,更新原始图像块。
示例性地,对原始图像块进行特征提取,可以是:通过滤波算法或边缘检测对原始图像块进行处理,得到目标图像块。当然,还可以采用现有技术中的其他方式或至少两种方式的组合,实现目标图像块的生成,本申请仅以滤波算法和边缘检测技术为例进行示例性说明,不应理解为对目标图像块生成方式的限定。
示例性地,根据目标图像块,更新原始图像块,可以是将目标图像块和原始图像块进行特征融合,将融合后的特征作为更新后的原始图像块。其中,特征融合可以是像素点叠加融合。当然,特征融合还可以采用其他方式加以实现,本申请实施例对此不做任何限定,仅需保证更新后的原始图像块中携带有目标图像块信息即可。
可以理解的是,通过对原始图像进行特征提取,得到目标图像块这一先验知识,根据先验知识对原始图像块进行更新,达到特征增强的目的,从而能够突出原始图像块中的有效特征(包括正常样本特征和异常样本特征),进而提高教师网络和学生网络的特征提取结果(教师特征和学生特征)的准确度,为异常检测结果准确度的提高提供保障。
在上述各技术方案的基础上,本申请提供了一个实现异常样本检测方法的优选实施例。并结合图4A所示的教师网络和学生网络的训练和使用过程示意图和图4B所示的一种异常图像检测方法的流程图,进行详细说明。
参见图4B所示的一种异常图像检测方法,包括:
S410、模型训练阶段;以及,
S420、模型使用阶段。
示例性地,模型训练阶段,包括:
S411、将大量训练正样本进行关键点检测。
S412、根据关键点检测结果,在至少一个尺度下生成包括关键点的至少一个训练样本块。
其中,S411-S412对应图4A中的第一图像预处理模块。
S413、对各训练样本块进行扰动处理,以对训练样本块数据集进行数据增强。
其中,S413对应图4A中的第一图像变换模块。
示例性地,扰动处理可以采用随机扰动叠加方式加以实现。
S414、采用训练样本块数据集对教师初始网络进行训练,得到教师网络。
S415、采用训练样本块数据集和教师网络对学生初始网络进行知识蒸馏,得到学生网络。
其中,对学生网络进行训练过程中,可以根据学生网络和教师网络相同层级的特征提取模块所输出特征提取结果之间的差异,确定初始损失;根据各特征提取模块对应的权重(对应图中的α,ρ,…,θ。其中,权重大小可以由技术人员根据需要或经验值确定,或通过大量试验确定),对初始损失进行加权,生成目标损失;根据目标损失调整学生网络中的网络参数。其中,初始损失可基于现有技术的至少一个损失函数确定,本申请对损失函数的具体形式不做任何限定。
示例性地,模型使用阶段,包括:
S421、选用固定滑窗,按照设定步长间隔选取待检测图像中的局部图像,生成至少一个原始图像块。
其中,S421对应图4A中的第二图像预处理模块。
其中,滑窗大小和设定步长大小可以由技术人员根据需要或经验值进行确定,或通过大量试验反复确定。
S422、对原始图像块进行边缘计算,得到目标图像块。
其中,S422对应图4A中的第二图像变换模块。
S423、将目标图像块与原始图像块进行像素叠加融合,以更新原始图像块。
S424、将原始图像块分别输入至教师网络和学生网络中,得到该原始图像块的各组关联特征。
其中,关联特征包括教师网络中各特征提取模块生成的教师特征,以及学生网络中相同层级的特征提取模块生成的学生特征。
参见图4A,其中,教师网络中的特征提取模块为Nti(i=1,2,…,n;n≥1),得到的各教师特征为Ti;学生网络中的特征提取模块为Nsi,得到的各教师特征为Si。关联特征即为(Ti-Si)。
S425、根据关联特征中教师特征和学生特征之间的特征距离,生成原始图像块的块特征差异度。
S426、采用各块特征差异度所属特征提取模块的权重,对各块特征差异度进行加权,得到原始图像块的特征差异度。
其中,各特征提取模块的权重为α,ρ,…,θ。
S427、将各原始图像块的特征差异度进行归一化,得到待检测图像的特征差异度。
其中,归一化可以是加权均值。其中,权重可以是经验值。
S428、若待检测图像特征差异度大于第一阈值,则确定待检测图像为异常图像。
其中,第一阈值可以由技术人员根据需要或经验值进行确定。
S429、若原始图像块的特征差异度大于第二阈值,则确定原始图像块为异常图像块,并对待检测图像中的异常图像块进行标记。
其中,第二阈值可以与第一阈值相同或不同,其数值可以由技术人员根据需要或经验值进行确定。
作为上述各异常样本检测方法的实现,本申请还提供了一种实施异常样本检测方法的虚拟装置的可选实施例。
进一步参见图5所示的一种异常样本检测装置500,包括:特征得到模块501和异常样本确定模块502。其中,
特征得到模块501,用于分别采用教师网络和学生网络对待检测样本进行处理,得到教师特征和与所述教师特征相关联的学生特征;
异常样本确定模块502,用于根据所述教师特征和所述学生特征,确定所述待检测样本是否为异常样本。
本申请通过引入教师网络和学生网络对待检测样本处理得到的教师特征和学生特征,进行异常样本检测,通过对待检测样本进行一次关联特征提取,无需依赖数据重构方式,即可得到异常检测结果,提高了检测效率;同时,异常检测过程无需依赖数据重构,因此也不会因为重构方法泛化能力或重构能力的影响,而影响异常检测结果的准确度,所以本申请还提高了检测结果准确度,从而达到了兼顾检测效率和检测结果准确度的效果。
在一个可选实施例中,所述教师网络和所述学生网络分别包括相同数量的至少一个特征提取模块;所述教师网络和所述学生网络中相同层级的特征提取模块功能相同;
相关联的所述教师特征和所述学生特征,分别为所述教师网络和所述学生网络中相同层级的特征提取模块的输出数据。
在一个可选实施例中,所述异常样本确定模块502,包括:
异常样本确定单元,用于根据至少一组关联特征,确定所述待检测样本是否为异常样本;
其中,所述关联特征为相关联的所述教师特征和所述学生特征。
在一个可选实施例中,若所述关联特征为至少两组,所述异常样本确定单元,包括:
特征差异度确定子单元,用于分别确定各组关联特征的特征差异度;
异常样本确定子单元,用于根据各所述特征差异度和各所述特征差异度对应特征提取模块的权重,确定所述待检测样本是否为异常样本。
在一个可选实施例中,所述待检测样本为待检测图像。
在一个可选实施例中,所述特征得到模块501,包括:
原始图像块生成单元,用于根据所述待检测图像,生成至少两个原始图像块;
特征得到子单元,用于分别采用所述教师网络和所述学生网络对各所述原始图像块进行处理,得到各所述原始图像块对应的所述教师特征和与所述教师特征相关联的学生特征。
在一个可选实施例中,所述异常样本确定模块502,包括:
块特征差异度确定单元,用于针对各所述原始图像块对应的所述教师特征和与所述教师特征相关联的学生特征,分别确定各所述原始图像块的块特征差异度;
异常样本确定单元,用于根据各所述块特征差异度,确定所述待检测图像是否为异常图像。
在一个可选实施例中,所述异常样本确定模块502,还包括:
异常图像块确定单元,用于根据各所述块特征差异度,确定所述原始图像块中的异常图像块;
异常定位单元,用于根据所述异常图像块,对所述待检测图像进行异常定位。
在一个可选实施例中,所述异常样本确定模块502,还包括:
目标图像块得到单元,用于对所述原始图像块进行特征提取,得到目标图像块;
原始图像块更新单元,用于根据所述目标图像块,更新所述原始图像块。
在一个可选实施例中,所述教师网络基于多个训练正样本对预先构建的教师初始网络进行无监督训练得到;
所述学生网络基于所述训练正样本和所述教师网络对预先构建的学生初始网络进行知识蒸馏得到。
上述异常样本检测装置可执行本申请任意实施例所提供的异常样本检测方法,具备执行异常样本检测方法相应的功能模块和有益效果。
根据本申请的实施例,本申请还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图6示出了可以用来实施本申请的实施例的示例电子设备600的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本申请的实现。
如图6所示,设备600包括计算单元601,其可以根据存储在只读存储器(ROM)602中的计算机程序或者从存储单元608加载到随机访问存储器(RAM)603中的计算机程序,来执行各种适当的动作和处理。在RAM 603中,还可存储设备600操作所需的各种程序和数据。计算单元601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(I/O)接口605也连接至总线604。
设备600中的多个部件连接至I/O接口605,包括:输入单元606,例如键盘、鼠标等;输出单元607,例如各种类型的显示器、扬声器等;存储单元608,例如磁盘、光盘等;以及通信单元609,例如网卡、调制解调器、无线通信收发机等。通信单元609允许设备600通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元601可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元601的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元601执行上文所描述的各个方法和处理,例如异常样本检测方法。例如,在一些实施例中,异常样本检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元608。在一些实施例中,计算机程序的部分或者全部可以经由ROM 602和/或通信单元609而被载入和/或安装到设备600上。当计算机程序加载到RAM 603并由计算单元601执行时,可以执行上文描述的异常样本检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元601可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行异常样本检测方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本申请的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本申请的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)、区块链网络和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,又称为云计算服务器或云主机,是云计算服务体系中的一项主机产品,以解决了传统物理主机与VPS服务中,存在的管理难度大,业务扩展性弱的缺陷。服务器也可以为分布式系统的服务器,或者是结合了区块链的服务器。
人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科,既有硬件层面的技术也有软件层面的技术。人工智能硬件技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理等技术;人工智能软件技术主要包括计算机视觉技术、语音识别技术、自然语言处理技术及机器学习/深度学习技术、大数据处理技术、知识图谱技术等几大方向。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本申请中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本申请公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本申请保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本申请的精神和原则之内所作的修改、等同替换和改进等,均应包含在本申请保护范围之内。

Claims (16)

1.一种异常样本检测方法,包括:
分别采用教师网络和学生网络对待检测样本进行处理,得到教师特征和与所述教师特征相关联的学生特征;
根据所述教师特征和所述学生特征,确定所述待检测样本是否为异常样本;
其中,所述根据所述教师特征和所述学生特征,确定所述待检测样本是否为异常样本,包括:
分别确定各组关联特征的特征差异度;
根据各所述特征差异度和各所述特征差异度对应特征提取模块的权重,确定所述待检测样本是否为异常样本;
其中,所述教师网络和所述学生网络分别包括相同数量的至少一个特征提取模块;所述教师网络和所述学生网络中相同层级的特征提取模块功能相同;所述关联特征为相关联的所述教师特征和所述学生特征;
相关联的所述教师特征和所述学生特征,分别为所述教师网络和所述学生网络中相同层级的特征提取模块的输出数据。
2.根据权利要求1所述的方法,其中,所述待检测样本为待检测图像。
3.根据权利要求2所述的方法,其中,所述分别采用教师网络和学生网络对待检测样本进行处理,得到教师特征和与所述教师特征相关联的学生特征,包括:
根据所述待检测图像,生成至少两个原始图像块;
分别采用所述教师网络和所述学生网络对各所述原始图像块进行处理,得到各所述原始图像块对应的所述教师特征和与所述教师特征相关联的学生特征。
4.根据权利要求3所述的方法,其中,所述根据所述教师特征和所述学生特征,确定所述待检测样本是否为异常样本,包括:
针对各所述原始图像块对应的所述教师特征和与所述教师特征相关联的学生特征,分别确定各所述原始图像块的块特征差异度;
根据各所述块特征差异度,确定所述待检测图像是否为异常图像。
5.根据权利要求4所述的方法,还包括:
根据各所述块特征差异度,确定所述原始图像块中的异常图像块;
根据所述异常图像块,对所述待检测图像进行异常定位。
6.根据权利要求3所述的方法,还包括:
对所述原始图像块进行特征提取,得到目标图像块;
根据所述目标图像块,更新所述原始图像块。
7.根据权利要求1所述的方法,其中,所述教师网络基于多个训练正样本对预先构建的教师初始网络进行无监督训练得到;
所述学生网络基于所述训练正样本和所述教师网络对预先构建的学生初始网络进行知识蒸馏得到。
8.一种异常样本检测装置,包括:
特征得到模块,用于分别采用教师网络和学生网络对待检测样本进行处理,得到教师特征和与所述教师特征相关联的学生特征;
异常样本确定模块,用于根据所述教师特征和所述学生特征,确定所述待检测样本是否为异常样本;
其中,所述异常样本确定模块包括:
特征差异度确定单元,用于分别确定各组关联特征的特征差异度;
异常样本确定单元,用于根据各所述特征差异度和各所述特征差异度对应特征提取模块的权重,确定所述待检测样本是否为异常样本;
其中,所述教师网络和所述学生网络分别包括相同数量的至少一个特征提取模块;所述教师网络和所述学生网络中相同层级的特征提取模块功能相同;所述关联特征为相关联的所述教师特征和所述学生特征;
相关联的所述教师特征和所述学生特征,分别为所述教师网络和所述学生网络中相同层级的特征提取模块的输出数据。
9.根据权利要求8所述的装置,其中,所述待检测样本为待检测图像。
10.根据权利要求9所述的装置,其中,所述特征得到模块,包括:
原始图像块生成单元,用于根据所述待检测图像,生成至少两个原始图像块;
特征得到子单元,用于分别采用所述教师网络和所述学生网络对各所述原始图像块进行处理,得到各所述原始图像块对应的所述教师特征和与所述教师特征相关联的学生特征。
11.根据权利要求10所述的装置,其中,所述异常样本确定模块,包括:
块特征差异度确定单元,用于针对各所述原始图像块对应的所述教师特征和与所述教师特征相关联的学生特征,分别确定各所述原始图像块的块特征差异度;
异常样本确定单元,用于根据各所述块特征差异度,确定所述待检测图像是否为异常图像。
12.根据权利要求11所述的装置,所述异常样本确定模块,还包括:
异常图像块确定单元,用于根据各所述块特征差异度,确定所述原始图像块中的异常图像块;
异常定位单元,用于根据所述异常图像块,对所述待检测图像进行异常定位。
13.根据权利要求10所述的装置,所述异常样本确定模块,还包括:
目标图像块得到单元,用于对所述原始图像块进行特征提取,得到目标图像块;
原始图像块更新单元,用于根据所述目标图像块,更新所述原始图像块。
14.根据权利要求8所述的装置,其中,所述教师网络基于多个训练正样本对预先构建的教师初始网络进行无监督训练得到;
所述学生网络基于所述训练正样本和所述教师网络对预先构建的学生初始网络进行知识蒸馏得到。
15. 一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-7中任一项所述的一种异常样本检测方法。
16.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-7中任一项所述的一种异常样本检测方法。
CN202110077488.8A 2021-01-20 2021-01-20 异常样本检测方法、装置、设备和存储介质 Active CN112801298B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202110077488.8A CN112801298B (zh) 2021-01-20 2021-01-20 异常样本检测方法、装置、设备和存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202110077488.8A CN112801298B (zh) 2021-01-20 2021-01-20 异常样本检测方法、装置、设备和存储介质

Publications (2)

Publication Number Publication Date
CN112801298A CN112801298A (zh) 2021-05-14
CN112801298B true CN112801298B (zh) 2023-09-01

Family

ID=75810866

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202110077488.8A Active CN112801298B (zh) 2021-01-20 2021-01-20 异常样本检测方法、装置、设备和存储介质

Country Status (1)

Country Link
CN (1) CN112801298B (zh)

Families Citing this family (11)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113326764B (zh) * 2021-05-27 2022-06-07 北京百度网讯科技有限公司 训练图像识别模型和图像识别的方法和装置
CN113378712B (zh) * 2021-06-10 2023-07-04 北京百度网讯科技有限公司 物体检测模型的训练方法、图像检测方法及其装置
CN113688760A (zh) * 2021-08-31 2021-11-23 广州文远知行科技有限公司 自动驾驶的数据识别方法、装置、计算机设备和存储介质
CN113902710A (zh) * 2021-10-12 2022-01-07 菲特(天津)检测技术有限公司 基于异常检测算法进行工业零件表面缺陷检测方法及系统
EP4224379A4 (en) * 2021-12-03 2024-02-14 Contemporary Amperex Technology Co., Limited METHOD AND SYSTEM FOR RAPID ANOMALY DETECTION BASED ON CONTRASTIVE IMAGE DISTILLATION
CN114285966B (zh) * 2021-12-07 2024-03-29 浙江东隆教育科技有限公司 一种劳动教育相关的监测数据处理方法及系统
CN114782888B (zh) * 2022-04-01 2023-06-23 中国铁路兰州局集团有限公司 轨道咽喉区异常检测的方法及系统
WO2024000372A1 (zh) * 2022-06-30 2024-01-04 宁德时代新能源科技股份有限公司 一种缺陷检测的方法和装置
CN116594838B (zh) * 2023-05-18 2023-12-22 上海好芯好翼智能科技有限公司 多模态数据预训练方法及系统
CN117313900B (zh) * 2023-11-23 2024-03-08 全芯智造技术有限公司 用于数据处理的方法、设备和介质
CN118332258A (zh) * 2024-04-17 2024-07-12 淄博市数字农业农村发展中心 一种异常数据处理方法、装置、电子设备及存储介质

Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019205604A1 (zh) * 2018-04-25 2019-10-31 北京市商汤科技开发有限公司 图像处理方法、训练方法、装置、设备、介质及程序
CN110674880A (zh) * 2019-09-27 2020-01-10 北京迈格威科技有限公司 用于知识蒸馏的网络训练方法、装置、介质与电子设备
CN111091177A (zh) * 2019-11-12 2020-05-01 腾讯科技(深圳)有限公司 一种模型压缩方法、装置、电子设备和存储介质
CN111126573A (zh) * 2019-12-27 2020-05-08 深圳力维智联技术有限公司 基于个体学习的模型蒸馏改进方法、设备及存储介质
CN111242188A (zh) * 2020-01-06 2020-06-05 中国科学院计算机网络信息中心 入侵检测方法、装置及存储介质
CN111784663A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 零部件的检测方法、装置、电子设备及存储介质
CN111967573A (zh) * 2020-07-15 2020-11-20 中国科学院深圳先进技术研究院 数据处理方法、装置、设备及计算机可读存储介质
CN112001364A (zh) * 2020-09-22 2020-11-27 上海商汤临港智能科技有限公司 图像识别方法及装置、电子设备和存储介质
CN112183577A (zh) * 2020-08-31 2021-01-05 华为技术有限公司 一种半监督学习模型的训练方法、图像处理方法及设备

Patent Citations (9)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
WO2019205604A1 (zh) * 2018-04-25 2019-10-31 北京市商汤科技开发有限公司 图像处理方法、训练方法、装置、设备、介质及程序
CN110674880A (zh) * 2019-09-27 2020-01-10 北京迈格威科技有限公司 用于知识蒸馏的网络训练方法、装置、介质与电子设备
CN111091177A (zh) * 2019-11-12 2020-05-01 腾讯科技(深圳)有限公司 一种模型压缩方法、装置、电子设备和存储介质
CN111126573A (zh) * 2019-12-27 2020-05-08 深圳力维智联技术有限公司 基于个体学习的模型蒸馏改进方法、设备及存储介质
CN111242188A (zh) * 2020-01-06 2020-06-05 中国科学院计算机网络信息中心 入侵检测方法、装置及存储介质
CN111784663A (zh) * 2020-06-30 2020-10-16 北京百度网讯科技有限公司 零部件的检测方法、装置、电子设备及存储介质
CN111967573A (zh) * 2020-07-15 2020-11-20 中国科学院深圳先进技术研究院 数据处理方法、装置、设备及计算机可读存储介质
CN112183577A (zh) * 2020-08-31 2021-01-05 华为技术有限公司 一种半监督学习模型的训练方法、图像处理方法及设备
CN112001364A (zh) * 2020-09-22 2020-11-27 上海商汤临港智能科技有限公司 图像识别方法及装置、电子设备和存储介质

Non-Patent Citations (1)

* Cited by examiner, † Cited by third party
Title
白金.导航电子地图质量检测样本库建设方法探讨.测绘与空间地理信息.2019,180-182. *

Also Published As

Publication number Publication date
CN112801298A (zh) 2021-05-14

Similar Documents

Publication Publication Date Title
CN112801298B (zh) 异常样本检测方法、装置、设备和存储介质
EP3859604A2 (en) Image recognition method and apparatus, device, and computer storage medium
KR20220013298A (ko) 문자 인식 방법 및 장치
CN112949710A (zh) 一种图像的聚类方法和装置
CN115063875B (zh) 模型训练方法、图像处理方法、装置和电子设备
CN112508126B (zh) 深度学习模型训练方法、装置、电子设备及可读存储介质
CN113361572B (zh) 图像处理模型的训练方法、装置、电子设备以及存储介质
CN113361363A (zh) 人脸图像识别模型的训练方法、装置、设备及存储介质
CN114092759A (zh) 图像识别模型的训练方法、装置、电子设备及存储介质
CN113705361A (zh) 活体检测模型的方法、装置及电子设备
CN113591918A (zh) 图像处理模型的训练方法、图像处理方法、装置和设备
CN112508004A (zh) 一种文字识别方法、装置、电子设备及存储介质
CN111862030A (zh) 一种人脸合成图检测方法、装置、电子设备及存储介质
US20230139994A1 (en) Method for recognizing dynamic gesture, device, and storage medium
CN113947140A (zh) 人脸特征提取模型的训练方法和人脸特征提取方法
CN111862031A (zh) 一种人脸合成图检测方法、装置、电子设备及存储介质
CN112016523B (zh) 跨模态人脸识别的方法、装置、设备和存储介质
CN114067099A (zh) 学生图像识别网络的训练方法及图像识别方法
CN113869317A (zh) 车牌识别方法、装置、电子设备和存储介质
CN115937993B (zh) 活体检测模型训练方法、活体检测方法、装置和电子设备
CN113657248A (zh) 人脸识别模型的训练方法、装置及计算机程序产品
CN116052288A (zh) 活体检测模型训练方法、活体检测方法、装置和电子设备
CN116894242A (zh) 轨迹验证码的识别方法、装置、电子设备及存储介质
CN115273148B (zh) 行人重识别模型训练方法、装置、电子设备及存储介质
CN115170919A (zh) 图像处理模型训练及图像处理方法、装置、设备和存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant