CN116977767A - 图像数据处理方法、装置、设备及存储介质 - Google Patents

图像数据处理方法、装置、设备及存储介质 Download PDF

Info

Publication number
CN116977767A
CN116977767A CN202310125206.6A CN202310125206A CN116977767A CN 116977767 A CN116977767 A CN 116977767A CN 202310125206 A CN202310125206 A CN 202310125206A CN 116977767 A CN116977767 A CN 116977767A
Authority
CN
China
Prior art keywords
defect
recognition model
label
data set
candidate
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Pending
Application number
CN202310125206.6A
Other languages
English (en)
Inventor
张博深
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Tencent Technology Shenzhen Co Ltd
Original Assignee
Tencent Technology Shenzhen Co Ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Tencent Technology Shenzhen Co Ltd filed Critical Tencent Technology Shenzhen Co Ltd
Priority to CN202310125206.6A priority Critical patent/CN116977767A/zh
Publication of CN116977767A publication Critical patent/CN116977767A/zh
Pending legal-status Critical Current

Links

Classifications

    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/77Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
    • G06V10/774Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T7/00Image analysis
    • G06T7/0002Inspection of images, e.g. flaw detection
    • G06T7/0004Industrial image inspection
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06VIMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
    • G06V10/00Arrangements for image or video recognition or understanding
    • G06V10/70Arrangements for image or video recognition or understanding using pattern recognition or machine learning
    • G06V10/764Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
    • GPHYSICS
    • G06COMPUTING; CALCULATING OR COUNTING
    • G06TIMAGE DATA PROCESSING OR GENERATION, IN GENERAL
    • G06T2207/00Indexing scheme for image analysis or image enhancement
    • G06T2207/20Special algorithmic details
    • G06T2207/20081Training; Learning

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Computer Vision & Pattern Recognition (AREA)
  • Physics & Mathematics (AREA)
  • Computing Systems (AREA)
  • Evolutionary Computation (AREA)
  • General Health & Medical Sciences (AREA)
  • Medical Informatics (AREA)
  • Software Systems (AREA)
  • Databases & Information Systems (AREA)
  • Health & Medical Sciences (AREA)
  • Artificial Intelligence (AREA)
  • Multimedia (AREA)
  • Quality & Reliability (AREA)
  • Image Analysis (AREA)

Abstract

本申请实施例公开了一种图像数据处理方法、装置、设备及存储介质,应用于人工智能技术领域,该方法包括:获取训练数据集合;通过候选缺陷识别模型对该样本图像中的样本产品进行缺陷识别,得到该样本图像中的样本产品的识别缺陷标签,以及该识别缺陷标签的识别不确定度;根据该识别缺陷标签和该识别不确定度,从该训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;根据该噪声样本图像更新该训练数据集合,得到更新后的训练数据集合,根据该更新后的训练数据集合对该候选缺陷识别模型进行优化训练。通过本申请能够减少训练数据集合中的具有噪声的标注缺陷标签,提高缺陷识别模型的泛化性能和质检准确度。

Description

图像数据处理方法、装置、设备及存储介质
技术领域
本申请涉及人工智能技术等领域,尤其涉及一种图像数据处理方法、装置、设备及存储介质。
背景技术
工业缺陷质检是指对生产制造过程中的工业产品进行质量检测,传统的工业缺陷质检一般是由质检工人进行人工目检。近年来随着人工智能(Artificial Intelligence,AI)技术的兴起,基于机器视觉的AI质检可以大幅提升质检的准确率,并可节省人力成本。
现有技术中,通过预先训练的缺陷识别模型对工业产品图像进行质检,缺陷识别模型的输入为工业产品图像,输出为指示工业产品图像中的工业产品是否存在缺陷的标签。缺陷识别模型根据多个样本数据训练得到的,每个样本数据包括样本图像和该样本图像的标注缺陷标签,标注缺陷标签用于指示该样本图像中的工业产品是否存在缺陷,样本图像的标注缺陷标签为人工标注得到的。由于人工标注样本图像的标签的过程中带有较多主观性,导致样本图像的标注缺陷标签中带有噪声,如果采用带有噪声的标注缺陷标签对缺陷识别模型进行训练,缺陷识别模型会拟合到这些噪声标签上,进而降低缺陷识别模型的泛化性能,使得训练出的缺陷识别模型质检的准确度不高。
发明内容
本申请实施例提供一种图像数据处理方法、装置、设备及存储介质,减少训练数据集合中的具有噪声的标注缺陷标签,提高缺陷识别模型的泛化性能和质检准确度。
本申请实施例一方面提供一种图像数据处理方法,包括:
获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签;
通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别,得到所述样本图像中的样本产品的识别缺陷标签,以及所述识别缺陷标签的识别不确定度;所述候选缺陷识别模型是通过所述训练数据集合进行优化训练得到的;
根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;
根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。
本申请实施例一方面提供一种图像数据处理装置,包括:
获取模块,用于获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签;
识别模块,用于通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别,得到所述样本图像中的样本产品的识别缺陷标签,以及所述识别缺陷标签的识别不确定度;所述候选缺陷识别模型是通过所述训练数据集合进行优化训练得到的;
筛选模块,用于根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中识别出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;
训练模块,用于根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。
可选的,所述筛选模块根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像,包括:
根据所述识别缺陷标签和所述识别不确定度,确定所述样本图像中的样本产品的缺陷得分;
将所述训练数据集合中缺陷得分小于得分阈值的样本图像,确定为标注缺陷标签具有噪声的样本图像;
将标注缺陷标签具有噪声的样本图像,作为噪声样本图像。
训练模块包括移除单元和更新单元;
移除单元,用于从所述训练数据集合中移除所述噪声样本图像以及所述噪声样本图像的标注缺陷标签,得到更新后的训练数据集合;或者,
更新单元,用于对所述训练数据集合中的所述噪声样本图像的标注缺陷标签进行更新,得到更新后的训练数据集合。
该装置还包括预测模块和优化模块;
预测模块,用于通过初始缺陷识别模型对所述样本图像中的样本产品进行缺陷预测,得到所述样本图像中的样本产品的预测缺陷标签,以及所述预测缺陷标签的预测不确定度;
优化模块,用于根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
可选的,所述优化模块包括第一生成单元、第二生成单元和优化单元;
第一生成单元,用于根据所述标注缺陷标签和所述预测缺陷标签,生成所述初始缺陷识别模型的缺陷预测损失;
第二生成单元,用于根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失;
优化单元,用于根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
可选的,第二生成单元根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失,包括:
确定所述训练数据集合中的样本图像对应的预测缺陷标签的均值;
根据所述均值和所述预测不确定度,生成所述预测不确定度应的分布函数,根据所述标注缺陷标签获取所述预测不确定度对应的监督函数;
根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失。
可选的,第二生成单元根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失,包括:
计算所述预测不确定度对应的分布函数和所述监督函数之间的散度,得到候选输出分布损失;
对所述候选输出分布损失进行近似处理,得到所述初始缺陷识别模型的输出分布损失。
可选的,优化单元根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
对所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失进行加权求和处理,得到所述初始缺陷识别模型的预测总损失;
根据所述初始缺陷识别模型的预测总损失,确定所述初始缺陷识别模型的收敛状态;
若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
可选的,优化单元若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型的模型参数进行调整;
获取所述初始缺失识别模型的第一优化训练次数;
若所述第一优化训练次数大于第一次数阈值,或调整后的初始缺陷识别模型的收敛状态为已收敛状态,则将所述调整后的初始缺陷识别模型,确定为候选缺陷识别模型。
训练模块还包括识别单元、第三生成单元和训练单元;
识别单元,用于通过所述候选缺陷识别模型对所述更新后的训练数据集合中的样本图像中的样本产品进行缺陷识别,得到更新缺陷标签,以及所述更新缺陷标签的更新不确定度;
第三生成单元,用于根据所述更新后的训练数据集合中的样本图像中的样本产品的标注缺陷标签和所述更新缺陷标签,生成所述候选缺陷识别模型的缺陷预测损失;根据所述更新缺陷标签、所述标注缺陷标签和所述更新不确定度,生成所述候选缺陷识别模型的输出分布损失;
训练单元,用于根据所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。
可选的,训练单元根据所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型,包括:
对所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失进行加权求和处理,得到所述候选缺陷识别模型的识别总损失;
根据所述候选识别模型的识别总损失,确定所述候选缺陷识别模型的收敛状态;
若所述候选缺陷识别模型的收敛状态为未收敛状态,则根据所述识别总损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。
本申请实施例一方面提供了一种计算机设备,包括存储器和处理器,上述存储器存储有计算机程序,上述处理器执行上述计算机程序时实现上述的方法的步骤。
本申请实施例一方面提供了一种计算机可读存储介质,其上存储有计算机程序,上述计算机程序被处理器执行时实现上述的方法的步骤。
本申请实施例一方面提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现上述的方法的步骤。
本申请中,通过改进候选缺陷识别模型的模型结构(即候选缺陷识别模型在原始缺陷识别模型的基础上增加了一个输出层),显式输出候选缺陷识别模型对输出结果(即识别缺陷标签)的识别不确定度,该识别不确定度用于反映候选缺陷识别模型输出的识别缺陷标签的可信度。由于该候选缺陷识别模型是通过该训练数据集合进行优化训练得到的,即该候选缺陷识别模型输出的识别不确定度是由训练数据集合中的标注缺陷具有噪声造成的。因此,计算机设备可以结合候选识别模型原本输出的识别缺陷标签和显式输出的识别不确定度,筛选出训练数据集合中标注缺陷标签具有噪声的样本图像,作为噪声样本图像,通过噪声样本图像对训练数据集合进行更新,得到更新后的训练数据集合,降低更新后的训练数据集合中的噪声样本图像的数量,提升训练数据的质量;进一步,通过基于更新后的训练数据集合对候选缺陷识别模型进行优化训练,避免候选缺陷识别模型拟合至噪声样本图像的标注缺陷标签上,提升候选缺陷识别模型的泛化性能和质检准确度,提升候选缺陷识别模型的鲁棒性。
附图说明
为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
图1是本申请提供的一种图像数据处理系统示意图;
图2是本申请提供的一种图像数据处理方法的流程示意图;
图3是本申请提供的一种候选缺陷识别模型输出识别缺陷标签和识别不确定度的场景示意图;
图4是本申请提供的一种候选缺陷识别模型输出样本图像的样本产品的缺陷得分的场景示意图;
图5是本申请提供的一种图像数据处理方法的流程示意图;
图6是本申请提供的一种确定初始缺陷识别模型的缺陷预测损失和输出分布损失的场景示意图;
图7是本申请提供的一种预测不确定度对应的分布函数的曲线和监督函数的曲线的示意图;
图8是本申请实施例提供的一种图像数据处理装置的结构示意图;
图9是本申请实施例提供的一种计算机设备的结构示意图。
具体实施方式
下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
本申请主要涉及人工智能中的计算机视觉技术,所谓人工智能(ArtificialIntelligence,AI)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
其中,计算机视觉技术(Computer Vision,CV)计算机视觉是一门研究如何使机器“看”的科学,更进一步的说,就是指用摄影机和电脑代替人眼对目标进行识别、测量等机器视觉,并进一步做图形处理,使电脑处理成为更适合人眼观察或传送给仪器检测的图像。作为一个科学学科,计算机视觉研究相关的理论和技术,试图建立能够从图像或者多维数据中获取信息的人工智能系统。计算机视觉技术通常包括图像处理、图像识别、图像语义理解、图像检索、OCR、视频处理、视频语义理解、视频内容/行为识别、三维物体重建、3D技术、虚拟现实、增强现实、同步定位与地图构建等技术,还包括常见的人脸识别、指纹识别等生物特征识别技术。
例如,本申请中,利用计算机视觉技术中的图像识别技术对样本图像中的样本产品进行缺陷识别,得到样本图像中的样本产品的识别缺陷标签,以及该识别缺陷标签的识别不确定度,该识别缺陷标签用于反映样本图像中的样本产品是否具有缺陷,或者,该识别缺陷标签用于反映样本图像中的样本产品的缺陷的严重程度等等,该识别不确定度用于识别缺陷标签的可信度。通过该识别缺陷标签和识别不确定度,筛选出训练数据集合中标注缺陷标签具有噪声的样本图像,作为噪声样本图,通过噪声样本图像对训练数据集合进行更新,得到更新后的训练数据集合,降低更新后的训练数据集合中的噪声样本图像的数量,提升训练数据的质量。进一步,通过基于更新后的训练数据集合对候选缺陷识别模型进行优化训练,提升候选缺陷识别模型的泛化性能和质检准确度,提升候选缺陷识别模型的鲁棒性。
为了便于更清楚理解本申请,首先介绍实现本申请的图像数据处理系统,如图1所示,该图像数据处理系统中包括服务器10和终端集群,终端集群可以包括一个或者多个终端,这里将不对终端的数量进行限制。如图1所示,终端集群具体可以包括终端1、终端2、…、终端n;可以理解的是,终端1、终端2、终端3、…、终端n均可以与服务器10进行网络连接,以便于每个终端均可以通过网络连接与服务器10之间进行数据交互。
终端中安装有一个或多个目标应用程序,此处的目标应用程序可以是指具有图像处理功能的应用,如目标应用程序包括独立的应用程序、网页应用、宿主应用中的小程序等。如,终端可以通过目标应用程序对待检测的产品进行拍摄,得到样本图像,获取该样本图像的标注缺陷标签,将样本图像以及样本图像的标注缺陷标签作为训练数据集合,将该训练数据集合发送至服务器10。
服务器10是指为终端中的目标应用程序提供后端服务的设备,在一个实施例中,服务器10可以用于根据训练数据集合对候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。进一步,服务器10可以将该目标缺陷识别模型发送至终端,终端可以通过目标缺陷识别模型对目标图像中的目标产品进行缺陷识别,得到目标图像中的目标产品的目标缺陷标签。此处的目标缺陷标签用于反映目标图像中的目标产品是否具有缺陷,或者,目标缺陷标签用于反映目标图像中的目标产品的缺陷严重程度。
可理解的是,根据训练数据集合对候选缺陷识别模型进行优化训练,得到目标缺陷识别模型可以由终端来执行,也可以由服务器10来执行,还可以由终端和服务器10共同执行。其中,终端根据训练数据集合对候选缺陷识别模型进行优化训练,得到目标缺陷识别模型的实现过程,或者,终端和服务器10根据训练数据集合对候选缺陷识别模型进行优化训练,得到目标缺陷识别模型的实现过程,可以参考上述服务器10根据训练数据集合对候选缺陷识别模型进行优化训练,得到目标缺陷识别模型的实现过程,重复之处,不再赘述。
可理解的是,服务器可以是独立的一个物理服务器,也可以是至少两个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、中容分发网络(ContentDelivery NetworK,CDN)、以及大数据和人工智能平台等基础云计算服务的云服务器。终端具体可以是指车载终端、智能手机、平板电脑、笔记本电脑、桌上型电脑、智能音箱、有屏音箱、智能手表等等,但并不局限于此。各个终端以及服务器可以通过有线或无线通信方式进行直接或间接地连接,同时,终端以及服务器的数量可以为一个或至少两个,本申请在此不做限制。
进一步地,请参见图2,是本申请实施例提供的一种图像数据处理方法的流程示意图。如图2所示,该方法可由图1中的终端集群中的任一终端来执行,也可以由图1中的服务器来执行,本申请中用于执行该图像数据处理方法的设备可以统称为计算机设备。其中,该方法可以包括如下步骤:
S101、获取训练数据集合;该训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签。
本申请中,计算机设备可以对样本产品进行拍摄,得到样本图像,或者,计算机设备可以从互联网中获取样本图像,样本图像中包括样本产品,样本产品可以是指待检测的产品,如样本产品可以是指机械零部件或者由机械零部件组装得到的产品;不同样本图像中的样本产品可以相同,也可以不相同。计算机设备可以获取人工对样本图像进行标注得到标注缺陷标签,将样本图像和样本图像的标注缺陷标签,确定为训练数据集合,该训练数据集合包括大量样本图像以及每个样本图像的标注缺陷标签。由于人工标注样本图像中的标签的过程中具有一定的主观性,因此,训练数据集合中包括标注缺陷标签具有噪声的样本图像,即训练数据集合中存在部分样本图像中的标注缺陷标签存在错误。训练数据集合中存在部分样本图像中的标注缺陷标签存在错误具有如下两种情况:第一、对样本图像中的样本产品的标签标注错误,例如,假设训练数据集合中的样本图像A中的样本产品不具有缺陷,而误将标注缺陷标签1确定为样本图像A中的样本产品的标签,标注缺陷标签1用于反映样本图像A中的样本产品具有缺陷;或者,假设训练数据集合中的样本图像B中的样本产品具有缺陷,而误将标注缺陷标签2确定为样本图像B中的样本产品的标签,标注缺陷标签2用于反映样本图像B中的样本产品不具有缺陷。第二、为一个样本图像中的样本产品标注多个缺陷标签,例如,针对训练数据集合中的样本图像a的样本产品进行标注,得到标注缺陷标签1和标注缺陷标签2,标注缺陷标签1用于反映样本图像A中的样本产品具有缺陷,标注缺陷标签2用于反映样本图像A中的样本产品不具有缺陷。
需要说明的是,为了提高样本图像中的样本产品的标注缺陷标签的准确度,训练数据集合中的样本图像的标注缺陷标签可以是根据多个用户对样本图像进行标注得到的,即每个样本图像的标注缺陷标签均是综合多个用户对样本图像的初始缺陷标签得到的。具体的,计算机设备可以获取K个用户对每个样本图像的初始缺陷标签,得到每个样本图像的K个初始缺陷标签,将每个样本图像的K个初始缺陷标签中出现次数最多的初始缺陷标签,确定为对应样本图像的标注缺陷标签,K为大于1的正整数。通常训练数据集合中的具有噪声的标注缺陷标签的样本图像的数量远小于训练数据集合中不具有噪声的标注缺陷标签的样本图像的数量(即具有正确标注缺陷标签的样本图像的数量),例如,训练数据集合中包括1000个样本图像的标注缺陷标签不具有噪声,10个样本图像的标注缺陷标签具有噪声。
其中,该标注缺陷标签用于反映样本图像中的样本产品是否存在缺陷,例如,如果样本图像中的样本产品的标注缺陷标签为1,表示样本图像中的样本产品具有缺陷;如果样本图像的样本产品的标注缺陷标签为0,表示该样本图像中的样本产品不具有缺陷。或者,该标注缺陷标签用于反映样本图像中的样本产品的缺陷程度,例如,如果该样本图像的样本产品的标注缺陷标签的取值属于(0.5,1]内,表示样本图像中的样本产品具有严重缺陷;如果该样本图像的样本产品的标注缺陷标签的取值为(0,0.5]内,表示该样本图像中的样本产品具有轻度缺陷;如果标注缺陷标签的取值为0,表示该样本图像中的样本产品不具有缺陷。
S102、通过候选缺陷识别模型对该样本图像中的样本产品进行缺陷识别,得到该样本图像中的样本产品的识别缺陷标签,以及该识别缺陷标签的识别不确定度。该候选缺陷识别模型是基于训练数据集合进行优化训练得到的。
本申请中,计算机设备可以通过候选缺陷识别模型提取样本图像的图像特征,图像特征包括纹理特征、颜色特征等等,根据该图像特征进行缺陷识别,得到样本图像中的样本产品的识别缺陷标签,以及识别缺陷标签的识别不确定度。此处的识别缺陷标签用于反映样本图像中的样本产品具有缺陷的概率(即置信度);识别不确定度用于反映候选缺陷识别模型输出的识别缺陷标签的可信度,即识别不确定度越高,表明候选缺陷识别模型输出的识别缺陷标签的可信度越低;识别不确定度越低,表明候选缺陷识别模型输出的识别缺陷标签的可信度越高。
例如,候选缺陷识别模型在目前的缺陷识别模型的模型结构进行改进得到的,即该候选缺陷识别模型在目前的缺陷识别模型的基础上增加了一个输出层,该输出层用于输出识别缺陷标签的识别不确定度。如图3所示,该候选缺陷识别模型31a包括特征提取层32a、第一输出层33a和第二输出层33a,特征提取层32a用于提取训练数据集合30a中的样本图像的图像特征,第一输出层33a用于基于样本图像的图像特征输出样本图像中的样本产品的识别缺陷标签,第二输出层32a用于基于样本图像的图像特征输出识别缺陷标签对应的识别不确定度。第一输出层33a和第二输出层34a均可以为全连接层,分别标记为全连接层FC1、全连接层FC2。假设将样本图像a输入至候选缺陷识别模型31a,通过候选识别模型31a的特征提取层32a对样本图像进行特征提前,得到样本图像x的图像特征,样本图像a的图像特征可以采用如下公式(1)表示:
feat=f(a;θ) (1)
其中,θ是候选缺陷识别模型的特征提取层的模型参数,feat表示样本图像a的图像特征,然后,通过第一输出层33a对样本图像a的图像特征进行缺陷识别,得到样本图像a中的样本产品的识别缺陷标签p,通过第二输出层34a对样本图像a的图像特征进行识别,得到识别缺陷标签p对应的识别不确定度δ,样本图像a中的样本产品的识别缺陷标签p可以采用如下公式(2)表示,识别缺陷标签p对应的识别不确定度δ可以采用如下公式(3)表示:
p=FC1(feat;W1) (2)
δ=FC2(feat;W2) (3)
其中,公式(2)中的W1表示第一输出层的模型参数,公式(3)中的W2表示第二输出层的模型参数。
可理解的是,该识别缺陷标签的识别不确定度的来源主要包括:1、偶然不确定性(Aleatoric Uncertainty,AU)又称为数据不确定性,是由于训练数据集合中的样本图像的标注缺陷标签本身的噪声产生的;2、认知不确定性(Epistemic Uncertainty,EU)又称为模型不确定性,是由于候选缺陷识别模型的模型参数的不确定性、模型结构的不确定性产生的,即候选缺陷识别模型未被训练达到最优。
在一个实施例中,识别缺陷标签的识别不确定度可以是指识别缺陷标签对应的方差,例如,训练数据集合中包括N个样本图像,以及N个样本图像分别对应的标注缺陷标签,计算机设备可以将N个样本图像分别输入至候选缺陷识别模型中,通过候选缺陷识别模型对N个样本图像中的样本产品进行缺陷识别,得到N个样本图像分别对应的识别缺陷标签。进一步,对N个样本图像分别对应的识别缺陷标签进行平均化处理,得到均值1,根据N个样本图像分别对应的识别缺陷标签分别与均值1之间的差值,确定N个识别缺陷标签分别对应的方差,将N个识别缺陷标签分别对应的方差,确定为对应识别缺陷标签对应的识别不确定度。如将样本图像1的识别缺陷标签与均值2之间的差值的平方,确定为样本图像1的预测缺陷标签对应方差,将样本图像1的预测缺陷标签对应方差,确定为样本图像1的预测缺陷标签的识别不确定度。
S103、根据该识别缺陷标签和该识别不确定度,从该训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像。
本申请中,由于此处的候选缺陷识别模型是由训练数据集合对初始缺陷识别模型进行优化训练得到的,因此,训练数据集合中的标注缺陷标签的正确度会影响候选缺陷识别模型输出的识别缺陷标签的可信度(即识别不确定度)。例如,训练数据集合中的标注缺陷标签的正确度越高,候选缺陷识别模型输出的识别缺陷标签的可信度也越高;相反,训练数据集合中的标注缺陷标签的正确度越低,候选缺陷识别模型输出的识别缺陷标签的可信度也越低。基于此,计算机设备可以根据该识别缺陷标签和识别不确定度,从该训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像,即噪声样本图像为训练数据集合中标注缺陷标签有误的样本图像。
可理解的是,上述步骤S103包括:如图4所示,以训练数据集合中包括N个样本图像为例,N为大于1的正整数,计算机设备可以根据样本图像像1对应的识别缺陷标签和识别不确定度,确定样本图像1中的样本产品的缺陷得分。如可以将样本图像1对应的识别缺陷标签与识别不确定度的倒数之间的乘积,确定为样本图像1中的样本产品的缺陷得分;或者,可以将样本图像1对应的识别缺陷标签与第一差值之间的乘积,确定为样本图像1中的样本产品的缺陷得分,第一差值为1与样本图像1对应识别不确定度之间的差值,即第一差值为1-δ。样本图像1对应的缺陷得分用于反映样本图像1中的样本产品是否具有缺陷的得分;如果该样本图像1对应的缺陷得分比较低,表明该样本图像像1对应的识别不确定度比较高,样本图像1对应的标注缺陷标签的准确度比较低;如果该样本图像1对应的缺陷得分比较高,表明该样本图像像1对应的识别不确定度比较低,样本图像1对应的标注缺陷标签的准确度比较高。
同理,如图4中,计算机设备可以根据样本图像像2对应的识别缺陷标签和识别不确定度,确定样本图像2中的样本产品的缺陷得分。如可以将样本图像2对应的识别缺陷标签与识别不确定度的倒数之间的乘积,确定为样本图像2中的样本产品的缺陷得分;或者,可以将样本图像2对应的识别缺陷标签与第二差值之间的乘积,确定为样本图像2中的样本产品的缺陷得分,第二差值为1与样本图像2对应识别不确定度之间的差值。样本图像2对应的缺陷得分用于反映样本图像2中的样本产品是否具有缺陷的得分;如果该样本图像2对应的缺陷得分比较低,表明该样本图像像2对应的识别不确定度比较高,样本图像2对应的标注缺陷标签的准确度比较低;如果该样本图像2对应的缺陷得分比较高,表明该样本图像像2对应的识别不确定度比较低,样本图像2对应的标注缺陷标签的准确度比较高。以此类推,直到获取到N个样本图像分别对应的缺陷得分,计算机设备可以将该训练数据集合中缺陷得分小于得分阈值的样本图像,确定为标注缺陷标签具有噪声的样本图像,此处的得分阈值可以是预先设置的,可以为经验值;然后,可以将标注缺陷标签具有噪声的样本图像,作为噪声样本图像。通过识别出训练数据集合中的噪声样本图像,有利于后续根据噪声样本图像对训练数据集合进行更新,提高训练数据(即更新后的训练数据集合)的质量。
例如,当计算机设备根据样本图像对应的识别缺陷标签,以及1与识别不确定度之间的差值,确定样本图像中的样本产品的缺陷得分时,可以通过如下公式(4)计算训练数据集合中的样本图像对应缺陷得分:
score=p*(1-δ) (4)
其中,公式(4)中p表示样本图像中的样本图像的识别缺陷标签(即样本图像中的样本产品具有缺陷的概率),δ表示样本图像中的样本图像的识别缺陷标签的识别不确定度,score为样本图像中的样本产品的缺陷得分。
S104、根据该噪声样本图像更新该训练数据集合,得到更新后的训练数据集合,根据该更新后的训练数据集合对该候选缺陷识别模型进行优化训练。
本申请中,计算机设备可以根据该噪声样本图像更新该训练数据集合,得到更新后的训练数据集合,减少更新后的训练数据集合中具有噪声的标注缺陷标签的样本图像的数量,即减少训练数据集合中具有噪声的标注缺陷标签的数量,提高更新后的训练数据集合中的数据质量。进一步,通过基于更新后的训练数据集合对候选缺陷识别模型进行优化训练,得到目标缺陷识别模型,避免目标缺陷识别模型拟合到具有噪声的标注缺陷标签,提升候选缺陷识别模型的泛化性能和质检准确度,提升候选缺陷识别模型的鲁棒性。
可理解的是,计算机设备识别出噪声样本图像后,可以通过如下两种方式中的任一种方式对训练数据集合进行更新:方式一:计算机设备可以从该训练数据集合中移除该噪声样本图像以及该噪声样本图像的标注缺陷标签,得到更新后的训练数据集合。例如,训练数据集合中的样本图像1的标注缺陷标签具有噪声,即样本图像1的标注缺陷标签存在错误,计算机设备可以从训练数据集合中将样本图像1和样本图像1的标注缺陷标签移除,得到更新后的训练数据集合。方式二,计算机设备可以对该训练数据集合中的该噪声样本图像的标注缺陷标签进行更新,得到更新后的训练数据集合。例如,训练数据集合中的样本图像1的标注缺陷标签具有噪声,样本图像1的标注缺陷标签为标注缺陷标签1,该标注缺陷标签1反映样本图像1中的样本产品具有缺陷,计算机设备可以将样本图像1的标注缺陷标签1更新为标注缺陷标签2,得到更新后的训练数据集合,标注缺陷标签2用于反映样本图像1中的样本产品不具有缺陷。通过根据噪声样本图像对训练数据集合进行更新,减少更新后的训练数据集合中具有噪声的标注缺陷标签的样本图像的数量,提高更新后的训练数据集合中的数据质量。
特别地,当噪声样本图像具有至少两个标注缺陷标签时,计算机设备可以从训练数据集合的噪声样本图像的至少两个标注缺陷标签中,移除与识别缺陷标签匹配的标注缺陷标签,得到更新后的训练数据集合。例如,假设训练数据集合中的样本图像1的标注缺陷标签具有噪声,训练数据集合中的样本图像1具有标注缺陷标签1和标注缺陷标签2,标注缺陷标签1为1,反映样本图像1中的样本产品具有缺陷;标注缺陷标签2为0,反映样本图像1中的样本产品不具有缺陷。样本图像1的识别缺陷标签为0.05,识别缺陷标签反映样本图像1中的样本产品具有缺陷的概率为0.05,由于识别缺陷标签小于0.5,因此,识别缺陷标签反映样本产品不具有缺陷。识别缺陷标签与标注缺陷标签2均反映样本图像1中的样本图像不具有缺陷,因此,计算机设备可以确定识别缺陷标签与标注缺陷标签2匹配,从训练数据集合中移除样本图像1的标注缺陷标签2,得到更新后的训练数据集合。
其中,根据该更新后的训练数据集合对该候选缺陷识别模型进行优化训练的实现过程可以参见如下图5中的实施例。
本申请中,通过改进候选缺陷识别模型的模型结构(即候选缺陷识别模型在原始缺陷识别模型的基础上增加了一个输出层),显式输出候选缺陷识别模型对输出结果(即识别缺陷标签)的识别不确定度,该识别不确定度用于反映候选缺陷识别模型输出的识别缺陷标签的可信度。由于该候选缺陷识别模型是通过该训练数据集合进行优化训练得到的,即该候选缺陷识别模型输出的识别不确定度是由训练数据集合中的标注缺陷具有噪声造成的。因此,计算机设备可以结合候选识别模型原本输出的识别缺陷标签和显式输出的识别不确定度,筛选出训练数据集合中标注缺陷标签具有噪声的样本图像,作为噪声样本图像,通过噪声样本图像对训练数据集合进行更新,得到更新后的训练数据集合,降低更新后的训练数据集合中的噪声样本图像的数量,提升训练数据的质量;进一步,通过基于更新后的训练数据集合对候选缺陷识别模型进行优化训练,避免候选缺陷识别模型拟合至噪声样本图像的标注缺陷标签上,提升候选缺陷识别模型的泛化性能和质检准确度,提升候选缺陷识别模型的鲁棒性。
进一步地,请参见图5,是本申请实施例提供的一种图像数据处理方法的流程示意图。如图5所示,该方法可由图1中的终端集群中的任一终端来执行,也可以由图1中的服务器来执行,本申请中用于执行该图像数据处理方法的设备可以统称为计算机设备。其中,该方法可以包括如下步骤:
S201、获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签。
S202、通过初始缺陷识别模型对所述样本图像中的样本产品进行缺陷预测,得到所述样本图像中的样本产品的预测缺陷标签,以及所述预测缺陷标签的预测不确定度。
本申请中,计算机设备可以通过初始缺陷识别模型提取样本图像的图像特征,图像特征包括纹理特征、颜色特征等等,根据该图像特征进行缺陷预测,得到样本图像中的样本产品的预测缺陷标签,以及预测缺陷标签的预测不确定度。此处的预测缺陷标签用于反映样本图像中的样本产品是否具有缺陷,或者,预测缺陷标签用于反映样本图像中的样本产品的缺陷程度。预测不确定度用于反映初始缺陷识别模型输出的预测缺陷标签的可信度,即预测不确定度越高,表明初始缺陷识别模型输出的预测缺陷标签的可信度越低;预测不确定度越低,表明候初始陷识别模型输出的预测缺陷标签的可信度越高。
可理解的是,该预测缺陷标签的识别不确定度的来源主要包括:1、偶然不确定性(Aleatoric Uncertainty,AU)又称为数据不确定性,是由于训练数据集合中的样本图像的标注缺陷标签本身的噪声产生的;2、认知不确定性(Epistemic Uncertainty,EU)又称为模型不确定性,是由于初始缺陷识别模型的模型参数的不确定性、模型结构的不确定性产生的,即初始缺陷识别模型未被训练达到最优。
在一个实施例中,预测缺陷标签的识别不确定度可以是指预测缺陷标签对应的方差,例如,训练数据集合中包括N个样本图像,以及N个样本图像分别对应的标注缺陷标签,计算机设备可以将N个样本图像分别输入至初始缺陷识别模型中,通过初始缺陷识别模型对N个样本图像中的样本产品进行缺陷识别,得到N个样本图像分别对应的预测缺陷标签。进一步,对N个样本图像分别对应的预测缺陷标签进行平均化处理,得到N个预测缺陷标签对应的均值2,根据N个样本图像分别对应的预测缺陷标签与均值2之间的差值,确定N个预测缺陷标签分别对应的方差,将N个预测缺陷标签分别对应的方差,确定为对应预测缺陷标签对应的识别不确定度。如将样本图像1的预测缺陷标签与均值2之间的差值的平方,确定为样本图像1的预测缺陷标签对应方差,将样本图像1的预测缺陷标签对应方差,确定为样本图像1的预测缺陷标签的识别不确定度。
S203、根据该标注缺陷标签、该预测缺陷标签以及该预测不确定度,对该初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
本申请中,计算机设备可以根据该标注缺陷标签、预测缺陷标签以及预测不确定度对初始缺陷识别模型进行迭代训练(即优化训练),直到初始缺陷识别模型满足停止优化训练条件,得到候选缺陷识别模型。此处的停止优化训练条件可以是指初始缺陷识别模型的优化训练次数达到规定的次数,或者,停止优化训练条件可以是指初始缺陷识别模型的预测总损失达到最小值。通过对初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,提高候选缺陷识别模型的缺陷识别准确度。
可选的,上述根据该标注缺陷标签、该预测缺陷标签以及该预测不确定度,对该初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:如图6所示,计算机设备可以根据该标注缺陷标签和该预测缺陷标签,生成该初始缺陷识别模型的缺陷预测损失,该初始缺陷识别模型的缺陷预测损失用于反映初始缺陷识别模型针对缺陷标签的预测准确度,如初始缺陷识别模型的缺陷预测损失越小,表明预测缺陷标签与标注缺陷标签之间的差异比较小,初始缺陷识别模型针对缺陷标签的预测准确度比较高;反之,初始缺陷识别模型的缺陷预测损失越大,表明预测缺陷标签与标注缺陷标签之间的差异比较大,初始缺陷识别模型针对缺陷标签的预测准确度比较低。由于该预测不确定度可以是指初始缺陷识别模型输出的预测缺陷标签的方差,换言之,预测不确定度还可以用于反映初始缺陷识别模型输出的预测缺陷标签的离散程度(即分布特征),如果预测不确定度越高,初始缺陷识别模型输出的预测缺陷标签的离散程度越高;相反,如果预测不确定度越低,初始缺陷识别模型输出的预测缺陷标签的离散程度越低。同时,初始缺陷识别模型输出的预测缺陷标签的离散程度越低,即初始缺陷识别模型输出的预测缺陷标签比较集中,这时表明初始缺陷识别模型的缺陷标签的预测准确度也越高;相反,初始缺陷识别模型输出的预测缺陷标签的离散程度越高,即初始缺陷识别模型输出的预测缺陷标签比较离散,这时初始缺陷识别模型的缺陷标签的预测准确度也越低。也就是说,该预测不确定度在一定程度上还可用于反映初始缺陷识别模型的缺陷标签的预测准确度,因此,计算机设备可以根据该预测缺陷标签、标注缺陷标签和该预测不确定度,生成该初始缺陷识别模型的输出分布损失,该输出分布损失用于反映初始缺陷识别模型输出的预测缺陷标签的分布(即离散程度)的准确度。进一步,计算机设备可以根据该初始缺陷识别模型的该缺陷预测损失和该输出分布损失,对该初始缺陷识别模型进行优化训练,得到候选缺陷识别模型;通过综合考虑初始缺陷识别模型的多维度损失(即缺陷预测损失和输出分布损失),提高优化训练后的初始缺陷识别模型的缺陷预测准确度(即质检准确度)。
可选的,计算机设备根据该标注缺陷标签和该预测缺陷标签,生成该初始缺陷识别模型的缺陷预测损失,包括:将预测缺陷标签和标注缺陷标签代入至初始缺陷识别模型的损失函数中,得到初始缺陷识别模型的缺陷预测损失,该初始缺陷识别模型的损失函数可以为交叉熵损失函数、指数损失函数以及铰链损失函数等等。以该初始缺陷识别模型的损失函数为交叉熵损失函数为例,初始缺陷识别模型的缺陷预测损失可以采用如下公式(5)表示:
Lcls=-[y*logp+(1-y)*log(1-p)(5)
其中,公式(5)中,y表示样本图像中的样本产品的标注缺陷标签,p为样本图像中的样本产品的预测缺陷标签,Lcls表示初始缺陷识别模型的缺陷预测损失。
可选的,上述根据该预测缺陷标签、标注缺陷标签和该预测不确定度,生成该初始缺陷识别模型的输出分布损失,包括:计算机设备可以对该训练数据集合中的样本图像对应的预测缺陷标签进行平均化处理,得到该训练数据集合中的样本图像对应的预测缺陷标签的均值,获取与该预测缺陷标签的分布特征匹配初始分布函数,由于该预测缺陷标签具有连续分布特征,因此,该初始分布函数可以为高斯分布函数。计算机设备可以将该均值和该预测不确定度代入值初始分布函数中,得到该预测不确定度应的分布函数。进一步,根据标注缺陷标签的均值获取该预测不确定度对应的监督函数,该预测不确定度对应的监督函数用于约束预测不确定度,和预测缺陷标签与标注缺陷标签均值的差值之间具有正相关关系,即预测缺陷标签与标志缺陷标签的均值的差值越大,则预测不确定度越大;相反,预测缺陷标签与均值的差值越小,则预测不确定度越小。然后,计算机设备可以根据该预测不确定度对应的分布函数和该监督函数,生成该初始缺陷识别模型的输出分布损失。
例如,计算机设备可以采用如下公式(6)表示预测不确定度对应的分布函数:
其中,公式(6)中的δ(x)表示预测不确定度对应的分布函数(即概率密度函数),σ2为训练数据集合中的样本图像的预测缺陷标签的方差,xe为训练数据集合中的样本图像的预测缺陷标签的均值。x可以是指训练数据集合中的样本图像的预测缺陷标签对应的预测不确定度。可以将迪利克雷函数来表示预测不确定度对应的监督函数,该监督函数可以如下公式(7)所示:
PD(x)=Dirac(x-xg) (7)
其中,xg表示训练数据集合中的样本图像的标注缺陷标签的均值,当xg为0,表示PD(x)仅在x=0处有响应值,其余位置响应值为0。
例如,预测不确定度对应的监督函数的曲线和分布函数的曲线关系如图7所示,曲线71a为预测不确定度对应的监督函数的曲线,曲线70a为预测不确定度对应的分布函数1,曲线72a为预测不确定度对应的分布函数2。从曲线71可知,监督函数在预先不确定为训练数据集合中的样本图像的标注缺陷标签的均值xg时,具有响应值,在其余位置响应值为0。曲线70a为训练数据数据集合中的样本图像的预测缺陷标签的均值为xe1,方差为σ12时,预测不确定度的分布函数1,曲线71a分别为训练数据数据集合中的样本图像的预测缺陷标签的均值为xe2,方差为σ22时,预测不确定度的分布函数2。其中,xe1<xe2,σ12<σ22,预测缺陷标签的均值为xe1与标注缺陷标签的均值xg之间的距离更近,预测缺陷标签的均值为xe2与标注缺陷标签的均值xg之间的距离更远。可由可知,当预测缺陷标签的均值xe(即xe2)远离标注缺陷标签的均值xg时,初始缺陷识别模型的输出的预测缺陷标签的预测不确定度(即σ22)比较大;反之,当预测缺陷标签的均值xe(xe1)靠近标注缺陷标签的均值xg时,初始缺陷识别模型的输出的预测缺陷标签的预测不确定度(即σ12)比较小。
在计算机设备获取预测不确定度对应的分布函数和监督函数之后,可以计算该预测不确定度对应的分布函数和该监督函数之间的散度,得到候选输出分布损失,对该候选输出分布损失进行近似处理,得到该初始缺陷识别模型的输出分布损失,如移除候选输出分布损失的常数项,得到初始缺陷识别模型的输出分布损失。
例如,计算机设备可以获取该预测不确定度对应的分布函数和该监督函数之间的散度,散度可以包括KL(Kullback-Leibler divergence)散度或、JS(Jensen–Shannondivergence)散度等,以KL散度为例,这时该预测不确定度对应的分布函数和该监督函数之间的散度(即候选输出分布损失)可以采用如下公式(8)表示:
L1=KL(δ(x)||PD(x)) (8)
其中,L1为候选输出分布损失,进一步推导,公式(8)可以采用如下公式(9)表示:
其中,公式(9)中的为常数项,忽略公式(9)中的常数项可以得到初始缺陷识别模型的输出分布损失,该初始缺陷识别模型的输出分布损失可以采用如下公式(10)表示:
其中,公式(10)中的Ldis表示初始缺陷识别模型的输出分布损失。根据公式(10)可知,当预测缺陷标签的均值xe远离标注缺陷标签的均值xg时,希望初始缺陷识别模型的输出的预测缺陷标签的预测不确定度尽可能大;反之,当预测缺陷标签的均值xe靠近标注缺陷标签的均值xg时,希望初始缺陷识别模型的输出的预测缺陷标签的预测不确定度尽可能小。
可选的,上述根据该初始缺陷识别模型的该缺陷预测损失和该输出分布损失,对该初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:对该初始缺陷识别模型的该缺陷预测损失和该输出分布损失进行加权求和处理,得到该初始缺陷识别模型的预测总损失,根据该初始缺陷识别模型的预测总损失,确定该初始缺陷识别模型的收敛状态。初始缺陷识别模型的收敛状态包括已收敛状态或未收敛状态,初始缺陷识别模型的收敛状态为已收敛状态是指初始缺陷识别的预测总损失小于第一损失阈值,初始缺陷识别模型的收敛状态为未收敛状态是指初始缺陷识别的预测总损失大于或等于第一损失阈值,第一损失阈值可以是指初始缺陷识别模型的最小损失值或该第一损失阈值可以为指定值。若该初始缺陷识别模型的收敛状态为未收敛状态,表明初始缺陷识别模型的缺陷预测准确度比较低,则计算机设备可以根据该预测总损失,对该初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。通过根据预测总损失对初始缺陷识别模型进行优化训练,提高优化训练后的初始缺陷识别模型的缺陷预测准确度。例如,假设该初始缺陷识别模型的该缺陷预测损失对应的权重为1,初始缺陷识别模型的输出分布损失对应的权重为β,这时初始缺陷识别模型的预测总损失可以采用如下公式(11)表示:
L=Lcls+β*Ldis (11)
其中,公式(11)中L表示初始缺陷识别模型的预测总损失,初始缺陷识别模型的输出分布损失对应的权重β可以为预先设置的,用于反映初始缺陷识别模型的缺陷预测损失和输出分布损失之间的占比。
可选的,上述若该初始缺陷识别模型的收敛状态为未收敛状态,则根据该预测总损失,对该初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:若该初始缺陷识别模型的收敛状态为未收敛状态,表明初始缺陷识别模型的缺陷预测准确度比较低,则计算机设备可以根据该预测总损失,对该初始缺陷识别模型的模型参数进行调整,该预测总损失与初始缺陷识别模型的模型参数的调整程度(调整力度)具有正相关关系,即该预测总损失越大,初始缺陷识别模型的模型参数的调整程度(调整力度)越大;相反,即该预测总损失越小,初始缺陷识别模型的模型参数的调整程度(调整力度)越小。进一步,计算机设备可以获取该初始缺失识别模型的第一优化训练次数,若该第一优化训练次数大于第一次数阈值,或调整后的初始缺陷识别模型的收敛状态为已收敛状态,则将该调整后的初始缺陷识别模型,确定为候选缺陷识别模型。通过根据初始缺陷识别模型的优化训练次数,或者,调整后的初始缺陷识别模型的收敛状态,确定调整后的初始缺陷识别模型的停止优化训练条件,提高初始缺陷识别模型的训练灵活性和训练准确度。
需要说明的是,该第一次数阈值可以为预先设置的,或者,该第一次数阈值可以是指根据缺陷识别场景确定的,例如,缺陷识别场景的缺陷识别精度要求比较高,则将第一次数确定为第一次数阈值;缺陷识别场景的缺陷识别精度要求比较低,则可以将第二次数确定为第一次数阈值,第一次数大于第二次数,如第一次数为100次,第二次数为80次。当训练数据集合中的所有样本图像均通过上述步骤对初始缺陷识别模型进行优化训练,称为初始缺陷识别模型的一次优化训练。
S204、通过候选缺陷识别模型对该样本图像中的样本产品进行缺陷识别,得到该样本图像中的样本产品的识别缺陷标签,以及该识别缺陷标签的识别不确定度。
S205、根据该识别缺陷标签和该识别不确定度,从该训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像。
S206、根据该噪声样本图像更新该训练数据集合,得到更新后的训练数据集合,根据该更新后的训练数据集合对该候选缺陷识别模型进行优化训练。
可理解的是,上述步骤S206包括:计算机设备可以通过候选缺陷识别模型提取更新后的训练数据集合中的样本图像的图像特征,图像特征包括纹理特征、颜色特征等等,根据该图像特征进行缺陷识别,得到更新后的训练数据集合中的样本图像中的样本产品的更新缺陷标签,以及更新缺陷标签的更新不确定度。此处的更新缺陷标签用于反映更新后的训练数据集合中的样本图像中的样本产品具有缺陷的概率(即置信度)。更新不确定度用于反映候选缺陷识别模型输出的更新缺陷标签的可信度,即更新不确定度越高,表明候选缺陷识别模型输出的更新缺陷标签的可信度越低;更新不确定度越低,表明候选缺陷识别模型输出的更新缺陷标签的可信度越高。
进一步,根据该更新后的训练数据集合中的样本图像中的样本产品的标注缺陷标签和该更新缺陷标签,生成该候选缺陷识别模型的缺陷预测损失;该候选缺陷识别模型的缺陷预测损失用于反映候选缺陷识别模型针对缺陷标签的预测准确度,如候选缺陷识别模型的缺陷预测损失越小,表明预测缺陷标签与标注缺陷标签之间的差异比较小,候选缺陷识别模型针对缺陷标签的预测准确度比较高;反之,候选缺陷识别模型的缺陷预测损失越大,表明预测缺陷标签与标注缺陷标签之间的差异比较大,候选缺陷识别模型针对缺陷标签的预测准确度比较低。然后,计算机设备可以根据该更新缺陷标签、标注缺陷标签和该更新不确定度,生成该候选缺陷识别模型的输出分布损失,该候选缺陷识别模型的输出分布损失反映候选缺陷识别模型输出的更新缺陷识别标签的分布准确度,即该候选缺陷识别模型的输出分布损失越大,表明候选缺陷识别模型输出的更新缺陷识别标签的分布准确度越低,相反,该候选缺陷识别模型的输出分布损失越小,表明候选缺陷识别模型输出的更新缺陷识别标签的分布准确度越高。然后,计算设备可以根据该候选缺陷识别模型的该缺陷预测损失和该输出分布损失,对该候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。通过综合考虑候选缺陷识别模型的多维度损失(即缺陷预测损失和输出分布损失),提高优化训练后的候选缺陷识别模型的缺陷预测准确度(即质检准确度)。
可选的,计算机设备根据该标注缺陷标签和该更新缺陷标签,生成该候选缺陷识别模型的缺陷预测损失,包括:计算机设备可以将更新缺陷标签和标注缺陷标签代入至候选缺陷识别模型的损失函数中,得到候选缺陷识别模型的缺陷预测损失;该候选缺陷识别模型的损失函数与上述初始缺陷识别模型的损失函数相同,可以为交叉熵损失函数、指数损失函数以及铰链损失函数等等。
可选的,上述根据该更新缺陷标签、标注缺陷标签和该更新不确定度,生成该候选缺陷识别模型的输出分布损失,包括:计算机设备可以对该训练数据集合中的样本图像对应的更新缺陷标签进行平均化处理,得到该训练数据集合中的样本图像对应的更新缺陷标签的均值,获取与该更新缺陷标签的分布特征匹配初始分布函数,更新缺陷标签具有连续分布特征,因此,该初始分布函数可以为高斯分布函数。计算机设备可以将该训练数据集合中的样本图像对应的更新缺陷标签的均值和该更新不确定度代入值初始分布函数中,得到该预测不确定度应的分布函数。进一步,根据标注缺陷标签的均值获取该更新不确定度对应的监督函数,该更新不确定度对应的监督函数用于约束更新不确定度,和更新缺陷标签与标注缺陷标签均值的差值之间具有正相关关系,即更新缺陷标签与标志缺陷标签的均值的差值越大,则更新不确定度越大;相反,更新缺陷标签与均值的差值越小,则更新不确定度越小。然后,计算机设备可以根据该更新不确定度对应的分布函数和该监督函数,生成该候选缺陷识别模型的输出分布损失。例如,计算机设备可以计算该更新不确定度对应的分布函数和该监督函数之间的散度,得到待选输出分布损失,对该待选输出分布损失进行近似处理,得到该候选缺陷识别模型的输出分布损失,如移除待选输出分布损失的常数项,得到候选缺陷识别模型的输出分布损失。
可选的,上述根据该候选缺陷识别模型的该缺陷预测损失和该输出分布损失,对该候选缺陷识别模型进行优化训练,得到目标缺陷识别模型,包括:计算机设备可以对该候选缺陷识别模型的该缺陷预测损失和该输出分布损失进行加权求和处理,得到该候选缺陷识别模型的识别总损失;根据所述候选识别模型的识别总损失,确定所述候选缺陷识别模型的收敛状态。然后,根据该候选缺陷识别模型的识别总损失,确定该候选缺陷识别模型的收敛状态。候选缺陷识别模型的收敛状态包括已收敛状态或未收敛状态,候选缺陷识别模型的收敛状态为已收敛状态是指候选缺陷识别的识别总损失小于第二损失阈值,候选缺陷识别模型的收敛状态为未收敛状态是指候选缺陷识别的识别总损失大于或等于第二损失阈值,第二损失阈值小于上述初始缺陷识别模型对应的第一损失阈值。若该候选缺陷识别模型的收敛状态为未收敛状态,表明候选缺陷识别模型的缺陷预测准确度比较低,则计算机设备可以根据该识别总损失,对该候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。通过根据识别总损失对候选缺陷识别模型进行优化训练,提高优化训练后的候选缺陷识别模型的缺陷预测准确度。
可选的,上述若该候选缺陷识别模型的收敛状态为未收敛状态,则根据该识别总损失,对该候选缺陷识别模型进行优化训练,得到目标缺陷识别模型,包括:若该候选缺陷识别模型的收敛状态为未收敛状态,表明候选缺陷识别模型的缺陷预测准确度比较低,则计算机设备可以根据该识别总损失,对该候选缺陷识别模型的模型参数进行调整。该识别总损失与候选缺陷识别模型的模型参数的调整程度(调整力度)具有正相关关系,即该识别总损失越大,候选缺陷识别模型的模型参数的调整程度(调整力度)越大;相反,即该识别总损失越小,候选缺陷识别模型的模型参数的调整程度(调整力度)越小。进一步,计算机设备可以获取该候选缺失识别模型的第二优化训练次数,若该第二优化训练次数大于第二次数阈值,或调整后的候选缺陷识别模型的收敛状态为已收敛状态,则将该调整后的候选缺陷识别模型,确定为目标缺陷识别模型。通过根据候选缺陷识别模型的优化训练次数,或者,调整后的候选缺陷识别模型的收敛状态,确定调整后的候选缺陷识别模型的停止优化训练条件,提高候选缺陷识别模型的训练灵活性和训练准确度。
需要说明的是,此处的第二次数阈值可以与上述初始缺陷识别模型对应的第一次数阈值相同,也可以不相同,同理,该第二次数阈值可以为预先设置的,或者,该第二次数阈值可以是指根据缺陷识别场景确定的,例如,缺陷识别场景的缺陷识别精度要求比较高,则将第三次数确定为第一次数阈值;缺陷识别场景的缺陷识别精度要求比较低,则可以将第四次数确定为第一次数阈值,第三次数大于第四次数,如第三次数为120次,第四次数为60次。
可选的,当计算机设备获取到目标缺陷识别模型后,该目标缺陷识别模型可以用于检测目标产品是否存在缺陷,实现对目标产品的质量检测。具体的,计算机设备可以接收针对目标图像中的目标产品的缺陷预测请求,该缺陷预测请求携带目标图像,可以将该缺陷预测请求中携带的目标图像输入至目标缺陷识别模型,通过目标缺陷识别模型对该目标图像进行特征提取,得到该目标图像的图像特征,通过该目标缺陷识别模型根据该目标图像的图像特征进行缺陷识别,得到该目标图像中的目标产品的目标缺陷标签。该目标缺陷标签用于反映目标图像中的目标产品是否具有缺陷,或者,该目标缺陷标签用于反映目标图像中的目标产品的缺陷程度。当该目标缺陷标签反映目标图像中的目标产品具有缺陷时,或者,该目标缺陷标签反映该目标图像中的目标产品的缺陷程度比较高时,计算机设备可以输出警示信息,该警示信息用于提示目标产品具有缺陷,或提示该目标产品的缺陷程度,这样有利于目标产品的质检人员对目标产品的生产过程进行调整,以改善目标产品的质量。
本申请中,通过改进候选缺陷识别模型的模型结构(即候选缺陷识别模型在原始缺陷识别模型的基础上增加了一个输出层),显式输出候选缺陷识别模型对输出结果(即识别缺陷标签)的识别不确定度,该识别不确定度用于反映候选缺陷识别模型输出的识别缺陷标签的可信度。由于该候选缺陷识别模型是通过该训练数据集合进行优化训练得到的,即该候选缺陷识别模型输出的识别不确定度是由训练数据集合中的标注缺陷具有噪声造成的。因此,计算机设备可以结合候选识别模型原本输出的识别缺陷标签和显式输出的识别不确定度,筛选出训练数据集合中标注缺陷标签具有噪声的样本图像,作为噪声样本图像,通过噪声样本图像对训练数据集合进行更新,得到更新后的训练数据集合,降低更新后的训练数据集合中的噪声样本图像的数量,提升训练数据的质量;进一步,通过基于更新后的训练数据集合对候选缺陷识别模型进行优化训练,避免候选缺陷识别模型拟合至噪声样本图像的标注缺陷标签上,提升候选缺陷识别模型的泛化性能和质检准确度,提升候选缺陷识别模型的鲁棒性。
请参见图8,是本申请实施例提供的一种图像数据处理装置的结构示意图。上述图像数据处理装置可以是运行于网络设备中的一个计算机程序(包括程序代码),例如该图像数据处理装置为一个应用软件;该装置可以用于执行本申请实施例提供的方法中的相应步骤。如图8所示,该图像数据处理装置可以包括:
获取模块801,用于获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签;
识别模块802,用于通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别,得到所述样本图像中的样本产品的识别缺陷标签,以及所述识别缺陷标签的识别不确定度;该候选缺陷识别模型是基于训练数据集合进行优化训练得到的;
筛选模块803,用于根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中识别出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;
训练模块804,用于根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。
可选的,所述筛选模块801根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像,包括:
根据所述识别缺陷标签和所述识别不确定度,确定所述样本图像中的样本产品的缺陷得分;
将所述训练数据集合中缺陷得分小于得分阈值的样本图像,确定为标注缺陷标签具有噪声的样本图像;
将标注缺陷标签具有噪声的样本图像,作为噪声样本图像。
训练模块804包括移除单元81a和更新单元82a;
移除单元81a,用于从所述训练数据集合中移除所述噪声样本图像以及所述噪声样本图像的标注缺陷标签,得到更新后的训练数据集合;或者,
更新单元82a,用于对所述训练数据集合中的所述噪声样本图像的标注缺陷标签进行更新,得到更新后的训练数据集合。
该装置还包括预测模块805和优化模块806;
预测模块805,用于通过初始缺陷识别模型对所述样本图像中的样本产品进行缺陷预测,得到所述样本图像中的样本产品的预测缺陷标签,以及所述预测缺陷标签的预测不确定度;
优化模块806,用于根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
可选的,所述优化模块806包括第一生成单元83a、第二生成单元84a和优化单元85a;
第一生成单元83a,用于根据所述标注缺陷标签和所述预测缺陷标签,生成所述初始缺陷识别模型的缺陷预测损失;
第二生成单元84a,用于根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失;
优化单元85a,用于根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
可选的,第二生成单元84a根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失,包括:
确定所述训练数据集合中的样本图像对应的预测缺陷标签的均值;
根据所述均值和所述预测不确定度,生成所述预测不确定度应的分布函数,根据所述标注缺陷标签获取所述预测不确定度对应的监督函数;
根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失。
可选的,第二生成单元84a根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失,包括:
计算所述预测不确定度对应的分布函数和所述监督函数之间的散度,得到候选输出分布损失;
对所述候选输出分布损失进行近似处理,得到所述初始缺陷识别模型的输出分布损失。
可选的,优化单元85a根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
对所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失进行加权求和处理,得到所述初始缺陷识别模型的预测总损失;
根据所述初始缺陷识别模型的预测总损失,确定所述初始缺陷识别模型的收敛状态;
若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
可选的,优化单元85a若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型的模型参数进行调整;
获取所述初始缺失识别模型的第一优化训练次数;
若所述第一优化训练次数大于第一次数阈值,或调整后的初始缺陷识别模型的收敛状态为已收敛状态,则将所述调整后的初始缺陷识别模型,确定为候选缺陷识别模型。
训练模块804还包括识别单元86a、第三生成单元87a和训练单元88a;
识别单元86a,用于通过所述候选缺陷识别模型对所述更新后的训练数据集合中的样本图像中的样本产品进行缺陷识别,得到更新缺陷标签,以及所述更新缺陷标签的更新不确定度;
第三生成单元87a,用于根据所述更新后的训练数据集合中的样本图像中的样本产品的标注缺陷标签和所述更新缺陷标签,生成所述候选缺陷识别模型的缺陷预测损失;根据所述更新缺陷标签、所述标注缺陷标签和所述更新不确定度,生成所述候选缺陷识别模型的输出分布损失;
训练单元88a,用于根据所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。
可选的,训练单元88a根据所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型,包括:
对所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失进行加权求和处理,得到所述候选缺陷识别模型的识别总损失;
根据所述候选识别模型的识别总损失,确定所述候选缺陷识别模型的收敛状态;
若所述候选缺陷识别模型的收敛状态为未收敛状态,则根据所述识别总损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。
根据本申请的一个实施例,前文所示的图像数据处理方法所涉及的步骤可由图8所示的图像数据处理装置中的各个模块来执行。例如,图2中所示的步骤S101可由图8中的获取模块801来执行,图2中所示的步骤S102可由图8中的识别模块802来执行;图2中所示的步骤S103可由图8中的筛选模块803来执行;图2中所示的步骤S104可由图8中的训练模块804来执行。
根据本申请的一个实施例,图8所示的图像数据处理装置中的各个模块可以分别或全部合并为一个或若干个单元来构成,或者其中的某个(些)单元还可以再拆分为功能上更小的至少两个子单元,可以实现同样的操作,而不影响本申请的实施例的技术效果的实现。上述模块是基于逻辑功能划分的,在实际应用中,一个模块的功能也可以由至少两个单元来实现,或者至少两个模块的功能由一个单元实现。在本申请的其它实施例中,图像数据处理装置也可以包括其它单元,在实际应用中,这些功能也可以由其它单元协助实现,并且可以由至少两个单元协作实现。
根据本申请的一个实施例,可以通过在包括中央处理单元(CPU)、随机存取存储介质(RAM)、只读存储介质(ROM)等处理组件和存储组件的例如计算机的通用计算机设备上运行能够执行如前文所示的相应方法所涉及的各步骤的计算机程序(包括程序代码),来构造如图8中所示的图像数据处理装置,以及来实现本申请实施例的图像数据处理方法。上述计算机程序可以记载于例如计算机可读记录介质上,并通过计算机可读记录介质装载于上述计算设备中,并在其中运行。
本申请中,通过改进候选缺陷识别模型的模型结构(即候选缺陷识别模型在原始缺陷识别模型的基础上增加了一个输出层),显式输出候选缺陷识别模型对输出结果(即识别缺陷标签)的识别不确定度,该识别不确定度用于反映候选缺陷识别模型输出的识别缺陷标签的可信度。由于该候选缺陷识别模型是通过该训练数据集合进行优化训练得到的,即该候选缺陷识别模型输出的识别不确定度是由训练数据集合中的标注缺陷具有噪声造成的。因此,计算机设备可以结合候选识别模型原本输出的识别缺陷标签和显式输出的识别不确定度,筛选出训练数据集合中标注缺陷标签具有噪声的样本图像,作为噪声样本图像,通过噪声样本图像对训练数据集合进行更新,得到更新后的训练数据集合,降低更新后的训练数据集合中的噪声样本图像的数量,提升训练数据的质量;进一步,通过基于更新后的训练数据集合对候选缺陷识别模型进行优化训练,避免候选缺陷识别模型拟合至噪声样本图像的标注缺陷标签上,提升候选缺陷识别模型的泛化性能和质检准确度,提升候选缺陷识别模型的鲁棒性。
请参见图9,是本申请实施例提供的一种计算机设备的结构示意图。如图9所示,上述计算机设备1000可以为上述方法中的第一设备,具体可以是指终端或服务器,包括:处理器1001,网络接口1004和存储器1005,此外,上述计算机设备1000还可以包括:用户接口1003,和至少一条通信总线1002。其中,通信总线1002用于实现这些组件之间的连接通信。其中,在一些实施例中,用户接口1003可以包括显示屏(DiSPlay)、键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如WI-FI接口)。存储器1005可以是高速RAM存储器,也可以是非易失性的存储器(non-volatile MeMory),例如至少一个磁盘存储器。存储器1005可选的还可以是至少一个在远离前述处理器1001的存储装置。如图9所示,作为一种计算机可读存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及计算机应用程序。
在图9所示的计算机设备1000中,网络接口1004可提供网络通讯功能;而用户接口1003主要用于提供输入的接口;而处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现:
获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签;
通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别,得到所述样本图像中的样本产品的识别缺陷标签,以及所述识别缺陷标签的识别不确定度;
根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;
根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像,包括:
根据所述识别缺陷标签和所述识别不确定度,确定所述样本图像中的样本产品的缺陷得分;
将所述训练数据集合中缺陷得分小于得分阈值的样本图像,确定为标注缺陷标签具有噪声的样本图像;
将标注缺陷标签具有噪声的样本图像,作为噪声样本图像。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,包括:
从所述训练数据集合中移除所述噪声样本图像以及所述噪声样本图像的标注缺陷标签,得到更新后的训练数据集合;或者,
对所述训练数据集合中的所述噪声样本图像的标注缺陷标签进行更新,得到更新后的训练数据集合。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现:
通过初始缺陷识别模型对所述样本图像中的样本产品进行缺陷预测,得到所述样本图像中的样本产品的预测缺陷标签,以及所述预测缺陷标签的预测不确定度;
根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
根据所述标注缺陷标签和所述预测缺陷标签,生成所述初始缺陷识别模型的缺陷预测损失;
根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失;
根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失,包括:
确定所述训练数据集合中的样本图像对应的预测缺陷标签的均值;
根据所述均值和所述预测不确定度,生成所述预测不确定度应的分布函数,根据所述标注缺陷标签获取所述预测不确定度对应的监督函数;
根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失,包括:
计算所述预测不确定度对应的分布函数和所述监督函数之间的散度,得到候选输出分布损失;
对所述候选输出分布损失进行近似处理,得到所述初始缺陷识别模型的输出分布损失。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
对所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失进行加权求和处理,得到所述初始缺陷识别模型的预测总损失;
根据所述初始缺陷识别模型的预测总损失,确定所述初始缺陷识别模型的收敛状态;
若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型的模型参数进行调整;
获取所述初始缺失识别模型的第一优化训练次数;
若所述第一优化训练次数大于第一次数阈值,或调整后的初始缺陷识别模型的收敛状态为已收敛状态,则将所述调整后的初始缺陷识别模型,确定为候选缺陷识别模型。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练,包括:
通过所述候选缺陷识别模型对所述更新后的训练数据集合中的样本图像中的样本产品进行缺陷识别,得到更新缺陷标签,以及所述更新缺陷标签的更新不确定度;
根据所述更新后的训练数据集合中的样本图像中的样本产品的标注缺陷标签和所述更新缺陷标签,生成所述候选缺陷识别模型的缺陷预测损失;
根据所述更新缺陷标签、所述标注缺陷标签和所述更新不确定度,生成所述候选缺陷识别模型的输出分布损失;
根据所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。
可选的,处理器1001可以用于调用存储器1005中存储的计算机应用程序,以实现根据所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型,包括:
对所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失进行加权求和处理,得到所述候选缺陷识别模型的识别总损失;
根据所述候选识别模型的识别总损失,确定所述候选缺陷识别模型的收敛状态;
若所述候选缺陷识别模型的收敛状态为未收敛状态,则根据所述识别总损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。
本申请中,通过改进候选缺陷识别模型的模型结构(即候选缺陷识别模型在原始缺陷识别模型的基础上增加了一个输出层),显式输出候选缺陷识别模型对输出结果(即识别缺陷标签)的识别不确定度,该识别不确定度用于反映候选缺陷识别模型输出的识别缺陷标签的可信度。由于该候选缺陷识别模型是通过该训练数据集合进行优化训练得到的,即该候选缺陷识别模型输出的识别不确定度是由训练数据集合中的标注缺陷具有噪声造成的。因此,计算机设备可以结合候选识别模型原本输出的识别缺陷标签和显式输出的识别不确定度,筛选出训练数据集合中标注缺陷标签具有噪声的样本图像,作为噪声样本图像,通过噪声样本图像对训练数据集合进行更新,得到更新后的训练数据集合,降低更新后的训练数据集合中的噪声样本图像的数量,提升训练数据的质量;进一步,通过基于更新后的训练数据集合对候选缺陷识别模型进行优化训练,避免候选缺陷识别模型拟合至噪声样本图像的标注缺陷标签上,提升候选缺陷识别模型的泛化性能和质检准确度,提升候选缺陷识别模型的鲁棒性。
应当理解,本申请实施例中所描述的计算机设备可执行前文所对应实施例中对上述图像数据处理方法的描述,也可执行前文所对应实施例中对上述图像数据处理装置的描述,在此不再赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。
此外,这里需要指出的是:本申请实施例还提供了一种计算机可读存储介质,且上述计算机可读存储介质中存储有前文提及的图像数据处理装置所执行的计算机程序,且上述计算机程序包括程序指令,当上述处理器执行上述程序指令时,能够执行前文对应实施例中对上述图像数据处理方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机可读存储介质实施例中未披露的技术细节,请参照本申请方法实施例的描述。
作为示例,上述程序指令可被部署在一个计算机设备上执行,或者被部署在一个地点的至少两个计算机设备上执行,又或者,在分布在至少两个地点且通过通信网络互连的至少两个计算机设备上执行,分布在至少两个地点且通过通信网络互连的至少两个计算机设备可以组成区块链网络。
上述计算机可读存储介质可以是前述任一实施例提供的图像数据处理装置或者上述计算机设备的中部存储单元,例如计算机设备的硬盘或中存。该计算机可读存储介质也可以是该计算机设备的外部存储设备,例如该计算机设备上配备的插接式硬盘,智能存储卡(SMart Media card,SMC),安全数字(Secure digital,SD)卡,闪存卡(flaSh card)等。进一步地,该计算机可读存储介质还可以既包括该计算机设备的中部存储单元也包括外部存储设备。该计算机可读存储介质用于存储该计算机程序以及该计算机设备所需的其他程序和数据。该计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
本申请实施例的说明书和权利要求书及附图中的术语“第一”、“第二”等是用于区别不同媒体中容,而非用于描述特定顺序。此外,术语“包括”以及它们任何变形,意图在于覆盖不排他的包含。例如包含了一系列步骤或单元的过程、方法、装置、产品或设备没有限定于已列出的步骤或模块,而是可选地还包括没有列出的步骤或模块,或可选地还包括对于这些过程、方法、装置、产品或设备固有的其他步骤单元。
可理解的是,本申请以上实施例如果需要用到用户信息等,需要获得用户许可或者同意,需要遵守相关国家和地区的相关法律法规。
本申请实施例还提供了一种计算机程序产品,包括计算机程序/指令,上述计算机程序/指令被处理器执行时实现前文对应实施例中对上述图像数据处理方法、解码方法的描述,因此,这里将不再进行赘述。另外,对采用相同方法的有益效果描述,也不再进行赘述。对于本申请所涉及的计算机程序产品的实施例中未披露的技术细节,请参照本申请方法实施例的描述。
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本申请的范围。
本申请实施例提供的方法及相关装置是参照本申请实施例提供的方法流程图和/或结构示意图来描述的,具体可由计算机程序指令实现方法流程图和/或结构示意图的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。这些计算机程序指令可提供到通用计算机、专用计算机、嵌入式处理机或其他可编程网络连接设备的处理器以产生一个机器,使得通过计算机或其他可编程网络连接设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能的装置。这些计算机程序指令也可存储在能引导计算机或其他可编程网络连接设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或结构示意图一个方框或多个方框中指定的功能。这些计算机程序指令也可装载到计算机或其他可编程网络连接设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或结构示意一个方框或多个方框中指定的功能的步骤。
以上所揭露的仅为本申请较佳实施例而已,当然不能以此来限定本申请之权利范围,因此依本申请权利要求所作的等同变化,仍属本申请所涵盖的范围。

Claims (15)

1.一种图像数据处理方法,其特征在于,包括:
获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签;
通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别,得到所述样本图像中的样本产品的识别缺陷标签,以及所述识别缺陷标签的识别不确定度;所述候选缺陷识别模型是通过所述训练数据集合进行优化训练得到的;
根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;
根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。
2.如权利要求1所述的方法,其特征在于,所述根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中筛选出标注缺陷标签具有噪声的样本图像,作为噪声样本图像,包括:
根据所述识别缺陷标签和所述识别不确定度,确定所述样本图像中的样本产品的缺陷得分;
将所述训练数据集合中缺陷得分小于得分阈值的样本图像,确定为标注缺陷标签具有噪声的样本图像;
将标注缺陷标签具有噪声的样本图像,作为噪声样本图像。
3.如权利要求1所述的方法,其特征在于,所述根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,包括:
从所述训练数据集合中移除所述噪声样本图像以及所述噪声样本图像的标注缺陷标签,得到更新后的训练数据集合;或者,
对所述训练数据集合中的所述噪声样本图像的标注缺陷标签进行更新,得到更新后的训练数据集合。
4.如权利要求1所述的方法,其特征在于,所述方法还包括:
通过初始缺陷识别模型对所述样本图像中的样本产品进行缺陷预测,得到所述样本图像中的样本产品的预测缺陷标签,以及所述预测缺陷标签的预测不确定度;
根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
5.如权利要求4所述的方法,其特征在于,所述根据所述标注缺陷标签、所述预测缺陷标签以及所述预测不确定度,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
根据所述标注缺陷标签和所述预测缺陷标签,生成所述初始缺陷识别模型的缺陷预测损失;
根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失;
根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
6.如权利要求5述的方法,其特征在于,所述根据所述预测缺陷标签、所述标注缺陷标签和所述预测不确定度,生成所述初始缺陷识别模型的输出分布损失,包括:
确定所述训练数据集合中的样本图像对应的预测缺陷标签的均值;
根据所述均值和所述预测不确定度,生成所述预测不确定度应的分布函数,根据所述标注缺陷标签获取所述预测不确定度对应的监督函数;
根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失。
7.如权利要求6述的方法,其特征在于,所述根据所述预测不确定度对应的分布函数和所述监督函数,生成所述初始缺陷识别模型的输出分布损失,包括:
计算所述预测不确定度对应的分布函数和所述监督函数之间的散度,得到候选输出分布损失;
对所述候选输出分布损失进行近似处理,得到所述初始缺陷识别模型的输出分布损失。
8.如权利要求5述的方法,其特征在于,所述根据所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
对所述初始缺陷识别模型的所述缺陷预测损失和所述输出分布损失进行加权求和处理,得到所述初始缺陷识别模型的预测总损失;
根据所述初始缺陷识别模型的预测总损失,确定所述初始缺陷识别模型的收敛状态;
若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型。
9.如权利要求8述的方法,其特征在于,所述若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型进行优化训练,得到候选缺陷识别模型,包括:
若所述初始缺陷识别模型的收敛状态为未收敛状态,则根据所述预测总损失,对所述初始缺陷识别模型的模型参数进行调整;
获取所述初始缺失识别模型的第一优化训练次数;
若所述第一优化训练次数大于第一次数阈值,或调整后的初始缺陷识别模型的收敛状态为已收敛状态,则将所述调整后的初始缺陷识别模型,确定为候选缺陷识别模型。
10.如权利要求1所述的方法,其特征在于,所述根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练,包括:
通过所述候选缺陷识别模型对所述更新后的训练数据集合中的样本图像中的样本产品进行缺陷识别,得到更新缺陷标签,以及所述更新缺陷标签的更新不确定度;
根据所述更新后的训练数据集合中的样本图像中的样本产品的标注缺陷标签和所述更新缺陷标签,生成所述候选缺陷识别模型的缺陷预测损失;
根据所述更新缺陷标签、所述标注缺陷标签和所述更新不确定度,生成所述候选缺陷识别模型的输出分布损失;
根据所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。
11.如权利要求10所述的方法,其特征在于,所述根据所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型,包括:
对所述候选缺陷识别模型的所述缺陷预测损失和所述输出分布损失进行加权求和处理,得到所述候选缺陷识别模型的识别总损失;
根据所述候选识别模型的识别总损失,确定所述候选缺陷识别模型的收敛状态;
若所述候选缺陷识别模型的收敛状态为未收敛状态,则根据所述识别总损失,对所述候选缺陷识别模型进行优化训练,得到目标缺陷识别模型。
12.一种图像数据处理装置,其特征在于,包括:
获取模块,用于获取训练数据集合;所述训练数据集合包括样本图像,以及所述样本图像中的样本产品的标注缺陷标签;
识别模块,用于通过候选缺陷识别模型对所述样本图像中的样本产品进行缺陷识别,得到所述样本图像中的样本产品的识别缺陷标签,以及所述识别缺陷标签的识别不确定度;所述候选缺陷识别模型是通过所述训练数据集合进行优化训练得到的;
筛选模块,用于根据所述识别缺陷标签和所述识别不确定度,从所述训练数据集合中识别出标注缺陷标签具有噪声的样本图像,作为噪声样本图像;
训练模块,用于根据所述噪声样本图像更新所述训练数据集合,得到更新后的训练数据集合,根据所述更新后的训练数据集合对所述候选缺陷识别模型进行优化训练。
13.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至11中任一项所述的方法的步骤。
14.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
15.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至11中任一项所述的方法的步骤。
CN202310125206.6A 2023-01-19 2023-01-19 图像数据处理方法、装置、设备及存储介质 Pending CN116977767A (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202310125206.6A CN116977767A (zh) 2023-01-19 2023-01-19 图像数据处理方法、装置、设备及存储介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202310125206.6A CN116977767A (zh) 2023-01-19 2023-01-19 图像数据处理方法、装置、设备及存储介质

Publications (1)

Publication Number Publication Date
CN116977767A true CN116977767A (zh) 2023-10-31

Family

ID=88482050

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202310125206.6A Pending CN116977767A (zh) 2023-01-19 2023-01-19 图像数据处理方法、装置、设备及存储介质

Country Status (1)

Country Link
CN (1) CN116977767A (zh)

Similar Documents

Publication Publication Date Title
JP5214760B2 (ja) 学習装置、方法及びプログラム
CN112200081A (zh) 异常行为识别方法、装置、电子设备及存储介质
CN111444873A (zh) 视频中人物真伪的检测方法、装置、电子设备及存储介质
CN112966088B (zh) 未知意图的识别方法、装置、设备及存储介质
WO2019167784A1 (ja) 位置特定装置、位置特定方法及びコンピュータプログラム
CN113762326A (zh) 一种数据识别方法、装置、设备及可读存储介质
CN112183289A (zh) 一种花屏检测方法、装置、设备及介质
CN114816468A (zh) 云边协同系统、数据处理方法、电子设备及存储介质
CN117409419A (zh) 图像检测方法、设备及存储介质
CN113313215A (zh) 图像数据处理方法、装置、计算机设备和存储介质
CN115690514A (zh) 图像识别方法及相关设备
CN113723359A (zh) 用户情绪识别方法、装置、计算机设备及可读存储介质
CN117435999A (zh) 一种风险评估方法、装置、设备以及介质
CN116977767A (zh) 图像数据处理方法、装置、设备及存储介质
CN118115932A (zh) 图像回归器训练方法与相关方法、装置、设备及介质
CN113505716B (zh) 静脉识别模型的训练方法、静脉图像的识别方法及装置
CN111209567B (zh) 提高检测模型鲁棒性的可知性判断方法及装置
CN116958724A (zh) 一种产品分类模型的训练方法和相关装置
CN112990147A (zh) 一种涉政图像的识别方法、装置、电子设备及存储介质
CN112784691A (zh) 一种目标检测模型训练方法、目标检测方法和装置
CN118276925B (zh) 基于人工智能的数据溯源管理系统及方法
CN114760484B (zh) 直播视频识别方法、装置、计算机设备和存储介质
CN115171048B (zh) 基于图像识别的资产分类方法、系统、终端及存储介质
CN109214411B (zh) 一种基于训练模型识别典型图片对新增实体的验证方法及系统
CN115273861A (zh) 音频处理方法、装置、计算机设备、存储介质及程序产品

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination