CN116486144A - 噪声标签检测器的生成方法、噪声标签检测方法和装置 - Google Patents
噪声标签检测器的生成方法、噪声标签检测方法和装置 Download PDFInfo
- Publication number
- CN116486144A CN116486144A CN202310315307.XA CN202310315307A CN116486144A CN 116486144 A CN116486144 A CN 116486144A CN 202310315307 A CN202310315307 A CN 202310315307A CN 116486144 A CN116486144 A CN 116486144A
- Authority
- CN
- China
- Prior art keywords
- noise
- pixel
- label
- image
- pixels
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000000034 method Methods 0.000 title claims abstract description 90
- 238000012549 training Methods 0.000 claims abstract description 129
- 238000012545 processing Methods 0.000 claims abstract description 15
- 230000006870 function Effects 0.000 claims description 39
- 238000001514 detection method Methods 0.000 claims description 26
- 238000004590 computer program Methods 0.000 claims description 12
- 230000015654 memory Effects 0.000 claims description 10
- 238000013135 deep learning Methods 0.000 abstract description 3
- 238000010586 diagram Methods 0.000 description 14
- 238000003709 image segmentation Methods 0.000 description 10
- 238000004891 communication Methods 0.000 description 9
- 238000004364 calculation method Methods 0.000 description 8
- 230000005484 gravity Effects 0.000 description 8
- 238000004422 calculation algorithm Methods 0.000 description 5
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 230000003287 optical effect Effects 0.000 description 3
- 230000008569 process Effects 0.000 description 3
- 238000013473 artificial intelligence Methods 0.000 description 2
- 230000008901 benefit Effects 0.000 description 2
- 230000000694 effects Effects 0.000 description 2
- 230000003993 interaction Effects 0.000 description 2
- 230000011218 segmentation Effects 0.000 description 2
- 238000003491 array Methods 0.000 description 1
- 230000001413 cellular effect Effects 0.000 description 1
- 238000010276 construction Methods 0.000 description 1
- 238000013136 deep learning model Methods 0.000 description 1
- 238000013461 design Methods 0.000 description 1
- 239000004973 liquid crystal related substance Substances 0.000 description 1
- 230000007787 long-term memory Effects 0.000 description 1
- 238000010801 machine learning Methods 0.000 description 1
- 239000013307 optical fiber Substances 0.000 description 1
- 239000004065 semiconductor Substances 0.000 description 1
- 230000001953 sensory effect Effects 0.000 description 1
- 238000006467 substitution reaction Methods 0.000 description 1
- 230000000007 visual effect Effects 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Computing Systems (AREA)
- Databases & Information Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Artificial Intelligence (AREA)
- Physics & Mathematics (AREA)
- General Physics & Mathematics (AREA)
- Multimedia (AREA)
- Image Analysis (AREA)
Abstract
本公开提供了噪声标签检测器的生成方法、噪声标签检测方法和装置,涉及计算机视觉领域,尤其涉及图像处理领域、深度学习等技术领域。具体实现方案为:获取噪声样本集中任一像素所对应的第一训练历史;其中,噪声样本集包括多个样本图像,噪声样本集中的部分或全部样本图像包括标签错误的像素,标签用于表征像素所属的类别;第一训练历史包含样本图像中像素所属类别的第一预测结果;以及,利用第一训练历史、以及噪声样本集的噪声信息,生成噪声标签检测器。本公开能够检测出图像中标签错误的像素。
Description
技术领域
本公开涉及计算机视觉领域,尤其涉及图像处理领域、深度学习等技术领域。
背景技术
图像语义分割是计算机视觉领域的一种传统任务,旨在对图像进行像素级的分类与识别。
目前,图像分割模型的训练效果,取决于大量包含标签像素的图像,然而,获取大量图像以及对图像中各个像素的正确标签,是极其困难的。采用该标签错误的像素对图像分割模型进行训练,会造成训练得到的图像分割模型的准确度低。
发明内容
本公开提供了噪声标签检测器的生成方法、噪声标签检测方法和装置。
根据本公开的一方面,提供了一种噪声标签检测器的生成方法,噪声标签检测器用于检测样本图像中标签错误的像素,该方法包括:
获取噪声样本集中任一像素所对应的第一训练历史;其中,噪声样本集包括多个样本图像,噪声样本集中的部分或全部样本图像包括标签错误的像素,标签用于表征像素所属的类别;第一训练历史包含样本图像中像素所属类别的第一预测结果;以及,
利用第一训练历史、以及噪声样本集的噪声信息,生成噪声标签检测器。
根据本公开的另一方面,提供了一种噪声标签检测方法,包括:
获取待检测图像中任一像素所对应的第二训练历史;
其中,待检测图像包括带有标签的像素,标签用于表征像素所属的类别;第二训练历史包含待检测图像中像素所属类别的第三预测结果;以及,
根据第二训练历史和噪声标签检测器,以得到像素对应的预测属性,像素对应的预测属性用于表征像素的标签的正确率;
噪声标签检测器通过上述任一方法生成。
根据本公开的另一方面,提供了一种噪声标签检测器的生成装置,噪声标签检测器用于检测样本图像中标签错误的像素,装置包括:
第一获取模块,用于获取噪声样本集中任一像素所对应的第一训练历史;其中,噪声样本集包括多个样本图像,噪声样本集中的部分或全部样本图像包括标签错误的像素,标签用于表征像素所属的类别;第一训练历史包含样本图像中像素所属类别的第一预测结果;以及,
生成模块,用于利用第一训练历史、以及噪声样本集的噪声信息,生成噪声标签检测器。
根据本公开的另一方面,提供了一种噪声标签检测装置,包括:
第二获取模块,用于获取待检测图像中任一像素所对应的第二训练历史;
其中,待检测图像包括带有标签的像素,标签用于表征像素所属的类别;第二训练历史包含待检测图像中像素所属类别的第三预测结果;以及,
预测模块,用于根据第二训练历史和噪声标签检测器,以得到像素对应的预测属性,像素对应的预测属性用于表征像素的标签的正确率;
噪声标签检测器通过上述装置生成。
根据本公开的另一方面,提供了一种电子设备,包括:
至少一个处理器;以及
与该至少一个处理器通信连接的存储器;其中,
该存储器存储有可被该至少一个处理器执行的指令,该指令被该至少一个处理器执行,以使该至少一个处理器能够执行本公开中任一实施例的方法。
根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,其中,该计算机指令用于使该计算机执行根据本公开中任一实施例的方法。
根据本公开的另一方面,提供了一种计算机程序产品,包括计算机程序,该计算机程序在被处理器执行时实现根据本公开中任一实施例的方法。
本公开通过利用噪声样本集中任一像素所对应的第一训练历史、以及噪声样本集的噪声信息,生成噪声标签检测器,该噪声标签检测器具有高准确度的特点;本公开提出的噪声标签检测器能够准确地检测出图像中标签错误的像素。
应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
附图用于更好地理解本方案,不构成对本公开的限定。其中:
图1是根据本公开实施例的应用场景示意图;
图2是根据本公开实施例的噪声标签检测器的生成方法的流程示意图;
图3是根据本公开实施例的噪声标签检测器的生成方法的示意性框图;
图4是根据本公开实施例的噪声标签检测方法的流程示意图;
图5是根据本公开实施例的噪声标签检测方法的示意性框图;
图6是根据本公开实施例的噪声标签检测器的生成装置600的结构示意图;
图7是根据本公开实施例的噪声标签检测器的生成装置700的结构示意图;
图8是根据本公开实施例的噪声标签检测装置800的结构示意图;
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。
具体实施方式
以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
本文中术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,A和/或B,可以表示:单独存在A,同时存在A和B,单独存在B这三种情况。本文中术语“至少一种”表示多种中的任意一种或多种中的至少两种的任意组合,例如,包括A、B、C中的至少一种,可以表示包括从A、B和C构成的集合中选择的任意一个或多个元素。本文中术语“第一”、“第二”表示指代多个类似的技术用语并对其进行区分,并不是限定顺序的意思,或者限定只有两个的意思,例如,第一特征和第二特征,是指代有两类/两个特征,第一特征可以为一个或多个,第二特征也可以为一个或多个。
图像语义分割是计算机视觉领域的一种传统任务,旨在对图像进行像素级的分类与识别。目前,图像分割模型的训练效果,取决于大量包含标签像素的图像,然而,获取大量图像以及图像中各个像素的正确标签,是极其困难的。
一般情况下,如果采用标签错误的像素对图像分割模型进行训练,会在一定程度上影响训练好的图像分割模型的准确度。因此,为了从训练集的角度提高图像分割模型的准确性,本公开实施例提出了一种噪声标签检测器的生成方法,该标签噪声检测器能够用于检测样本图像中标签错误的像素,能够尽可能地避免标签错误的像素在图像分割模型的训练过程中产生不利于该图像分割模型准确性的影响。
图1是根据本公开实施例的应用场景示意图。如图1所示,本公开实施例提出的噪声标签检测器的应用场景可以包括终端设备110和服务器120。具体地,该终端设备110可以向服务器120发送待检测图像,服务器120可以采用噪声标签检测器(该噪声标签检测器可以采用本公开实施例提出的噪声标签检测器的生成方法得到)对该待检测图像进行检测,以得到检测结果,其中,该检测结果可以包括待检测图像中标签错误的像素。如图1所示,服务器120还可以向终端设备110反馈检测结果。需要说明的是,本公开实施例并不对终端设备110的数量进行限制,以图1为例,该噪声标签检测器的应用场景可以包括一个或者多个终端设备110,例如,该终端设备110可以包括智能手机、平板电脑和笔记本电脑。当然,本公开实施例并不限制该终端设备的种类,以上仅为示例,例如,本公开实施例提出的终端设备110还可以包括台式电脑、可穿戴设备、智能家居、以及头戴设备等智能终端。在一些实施方式中,本公开实施例提出的终端设备110可以通过无线网络、有线网络、以及可移动存储介质与服务器120进行数据交互。需要说明的是,该服务器120可以包括独立的物理服务器、多个物理服务器构成的服务器集群、分布式系统、以及提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(CDN,Content Delivery Network)、大数据和人工智能平台的云服务器。另外,本公开实施例提出的应用场景还可以单独包括终端设备110。具体地,该噪声标签检测器可以直接部署于终端设备110中。此时,终端设备110可以包括单独的服务器、若干台服务器组成的服务器集群、以及云计算服务中心。
图2是根据本公开实施例的噪声标签检测器的生成方法的流程示意图,该噪声标签检测器用于检测样本图像中标签错误的像素,该方法可以应用于噪声标签检测器的生成装置,例如,该装置可以部署于单机、多机或集群系统中的终端或服务器或其它处理设备执行的情况下,其中,终端可以为用户设备(UE,User Equipment)、移动设备、个人数字处理(PDA,Personal Digital Assistant)手持设备、计算设备、车载设备、可穿戴设备等。在一些可能的实现方式中,该方法还可以通过处理器调用存储器中存储的计算机可读指令的方式来实现。如图2所示,该噪声标签检测器的生成方法包括:
S210、获取噪声样本集中任一像素所对应的第一训练历史;其中,该噪声样本集包括多个样本图像,该噪声样本集中的部分或全部样本图像包括标签错误的像素,该标签用于表征该像素所属的类别;该第一训练历史包含该样本图像中像素所属类别的第一预测结果;以及,
S220、利用该第一训练历史、以及该噪声样本集的噪声信息,生成噪声标签检测器。
其中,该第一训练历史可以包括噪声样本集中任一像素所对应的训练痕迹,可以采用时间序列数据表示该第一训练历史,该第一训练历史提供了区分错误标签的像素和正确标签的像素所需的特征。
一示例中,该噪声样本集中的部分或全部样本图像可以包括标签错误的像素,即该像素对应的标签表征的所属类别和该像素实际的所属类别不同。例如,以该样本图像属于人脸图像为例,如果该人脸图像中像素的所属类别包括背景类、脸部类、眼部类和嘴部类,那么如果该人脸图像中任一像素对应的标签所表征的所属类别为背景类,而该像素实际的所属类别为脸部类,则确定该像素为标签错误的像素。
当然,本公开实施例提出的噪声样本集中的部分或全部样本图像还可以包括标签模糊的像素,即该像素所对应的标签无法清楚地表征该像素的所属类别、或者该像素所对应的标签表征的所属类别存在歧义。例如,仍以该样本图像属于人脸图像,且人脸图像中像素的所属类别包括背景类、脸部类、眼部类、以及嘴部类为例,如果该人脸图像中任一像素的标签为空白,则确定该像素所对应的标签无法清楚地表征该像素的所属类别;或者,如果该人脸图像中任一像素的标签所表征的所属类别包括背景类和脸部类,则确定该像素对应的标签表征的所属类别存在歧义。
本公开实施例提出的噪声标签检测器的生成方法,能够在保证该噪声标签检测器准确率的前提下,降低生成该噪声标签检测器所需的训练时间和计算成本。另外,采用本公开实施例生成的噪声标签检测器,可以基于样本图像中像素所对应的第一训练历史,准确地检测出该样本图像中标签错误的像素。
相应地,本公开实施例所采用的噪声样本集中的部分或全部样本图像可以指随机获取的图像,该图像至少包括一个标签错误的像素。
这里,由于无法保证随机状态下,能够收集到大量包含标签错误像素的图像;或者,无法保证该随机获取的图像中包含足够数量的标签错误的像素,因此,采用随机获取图像所组成的噪声样本集至少存在以下问题:图像数量过少、以及图像中存在的标签错误的像素过少。因此采用随机获取图像所组成的噪声样本集(即包括多个随机获取的图像的集合)无法得到满足要求的第一训练历史。
相应地,为了解决上述问题,本公开实施例提出了一种获取噪声样本集的方法,该方法可以对原始样本集进行噪声处理,以得到噪声样本集,该原始样本集中的部分或全部样本图像可以不包括标签错误的像素、或者包括较少标签错误的像素。
但是,由于获取不包括错误标签的样本图像(即该样本图像中的全部像素的标签正确)难度大、成本高、且耗时长,因此,一般情况下可以采用包含较少错误标签的样本图像(即该样本图像包含较少标签错误的像素)所组成的原始样本集。例如,采用包含较少错误标签的样本图像组成的原始样本集可以为目标检测数据集(Pascal VOC)、或者深度学习图像数据集(MS COCO)。这里,采用包含较少标签错误的样本图像组成的原始样本集的具体方法,至少包括以下内容:
对原始样本集进行噪声处理,得到该噪声样本集;
其中,该原始样本集中标签错误的像素数量小于或等于第一阈值,该噪声样本集中标签错误的像素数量大于或等于第二阈值;
该第二阈值大于或等于该第一阈值。
在一些实施方式中,如果采用D表示原始样本集,DN表示噪声样本集,那么此时相较于DN,D中包含的标签错误的像素更少。
采用原始样本集获取噪声样本集的方式,能够保证噪声样本集中包含足够数量标签错误的像素,同时能够提高噪声样本集中标签错误的像素的鲁棒性,在一定程度上为后续生成准确率较高的噪声标签检测器提供保证。
图3是根据本公开实施例的噪声标签检测器的生成方法的示意性框图。如图3所示,在得到噪声样本集DN之后,可以利用噪声样本集DN对深度模型进行训练,得到该噪声样本集DN中任一像素所对应的第一训练历史。
具体地,获取噪声样本集中任一像素所对应的第一训练历史,包括:
利用该噪声样本集对深度模型进行训练,以获取该噪声样本集中任一像素所对应的第一训练历史。
其中,该深度模型可以包括全卷积网络(FCN,Fully Convolutional Networks)等模型。
另外,该第一训练历史可以包括噪声样本集中任一像素在一次训练中所得到的训练历史;或者,该第一训练历史可以包括噪声样本集中任一像素在多次(如t次,t为大于1的整数)训练中得到的训练历史,即该噪声样本集中任一像素在t次训练中,所得到的t个训练历史的集合。
相应地,可以采用式子(1)确定第t次训练时,该噪声样本集DN中第i张样本图像上的像素(h,w)所对应的第一训练历史:
其中,LN c(i,h,w,t)表示第t次训练时,噪声样本集DN中第i张样本图像上的像素(h,w)所对应的第一训练历史(即表征噪声样本集DN中第i张样本图像上的像素(h,w)所属类别为c类时的预测结果);xi,h,w表示噪声样本集DN中第i张样本图像上的像素(h,w);yN i,h,w表示噪声样本集DN中第i张样本图像上的像素(h,w)所对应的标签;f表示深度模型;表示噪声样本集DN中第i张样本图像上的像素(h,w)在深度模型f上进行第t次训练。
需要说明是,本公开实施例在利用该噪声样本集对深度模型进行第t次训练之前,还可以利用该深度模型在第t-1次训练时,得到的训练历史对该深度模型的参数进行调整,从而提高该深度模型输出的第一训练历史的准确率。例如,可以基于反向传播(BP,BackPropagation)算法或者随机梯度下降(SGD,stochastic gradient descent)算法或者其变体来调整该深度学习模型的参数。
本公开实施例在保证第一训练历史准确度的前提下,能够减少获取该第一训练历史所消耗的时间,提高获取第一训练历史的效率。同时,由于本公开实施例提出的获取第一训练历史的方式,降低了该第一训练历史的误差,从而能够提高后续生成的噪声标签检测器的准确率。
如图3所示,本公开实施例提出的噪声标签检测器的生成方法,还需要预先获取该噪声样本集中的噪声信息,以便于后续利用该第一训练历史、以及该噪声样本集的噪声信息,生成噪声标签检测器。
这里,噪声样本集的噪声信息能够用于表征该噪声样本集中任一像素对应的第一真实属性,该第一真实属性包括标签错误或标签正确。
例如,以采用K表示噪声样本集的噪声信息为例,此时噪声样本集的噪声信息K可以包括多个ki,h,w。具体地,该ki,h,w可以表示噪声样本集DN中第i张样本图像上像素(h,w)所对应的第一真实属性。例如,当ki,h,w=1时,表示像素(h,w)的第一真实属性为标签错误,即此时噪声样本集中像素(h,w)所对应的标签与该像素的真实标签不符;当ki,h,w=0时表示该像素的第一真实属性为标签正确,即此时噪声样本集中像素(h,w)所对应的标签与该像素的真实标签相符。即,噪声样本集DN中的第i张样本图像上像素所对应的第一真实属性如式(2)所示:
其中,yi,h,wN表示噪声样本集DN中像素(h,w)实际对应的标签;yi,h,w表示像素(h,w)所对应的正确标签。
当然,本公开实施例并不限制ki,h,w的具体表示形式,例如,还可以在ki,h,w=1时,表示该像素(h,w)的第一真实属性为标签正确;在ki,h,w=0时,表示该像素(h,w)的第一真实属性为标签错误。
本公开实施例通过噪声样本集的噪声信息表征该噪声样本集任一像素对应的第一真实属性,提高了确定该噪声样本集中任一像素对应的第一真实属性的准确度。
以上简单介绍了如何获取噪声样本集、噪声样本集中任一像素所对应的第一训练历史、以及获取该噪声样本集中的噪声信息。
如图3所示,本公开实施例提出的噪声标签检测器的生成方法,在获取噪声样本集、噪声样本集中任一像素所对应的第一训练历史、以及该噪声样本集中的噪声信息之后,还可以利用该第一训练历史、以及该噪声样本集的噪声信息,生成噪声标签检测器。以下将对如何生成噪声标签检测器做详细说明。
在本公开实施例中,可以利用噪声样本集的噪声信息,获取该样本图像中任一像素所对应的第一真实属性,并基于该像素所对应的第一训练历史、以及该像素所对应的第一真实生成该噪声标签检测器。
此时,利用该第一训练历史、以及该噪声样本集的噪声信息,生成噪声标签检测器,可以包括:
将任一像素所对应的第一训练历史输入初始噪声标签检测器,得到该像素对应的预测属性;并且根据该噪声样本集的噪声信息,确定该像素对应的第一真实属性;
利用该像素对应的预测属性和该第一真实属性,计算初始噪声标签检测器的损失函数;以及,
根据该损失函数对该初始噪声标签检测器进行调整,以得到最终的噪声标签检测器。
一示例中,在训练噪声标签检测器时,可以将[像素的第一训练历史]输入噪声标签检测器,并由噪声标签检测器输出该像素的预测属性。
需要说明的是,该像素对应的预测属性可以用于表征该像素的标签的正确率。该像素对应的预测属性所表征的该像素的标签的正确率可以由该噪声样本集的噪声信息确定。
以该预测属性为[0,1]范围内的任一有理数为例,如果在该噪声样本集的噪声信息K中,ki,h,w=1时表示像素(h,w)的第一真实属性为标签错误,ki,h,w=0时表示该像素的第一真实属性为标签正确,那么此时,如果该初始噪声标签检测器针对任一像素输出的预测属性为0.9,可以认为该初始噪声标签检测器对该像素的预测结果是:该像素标签错误的可能性是90%;如果该初始噪声标签检测器针对任一像素输出的预测属性为0.1,可以认为该初始噪声标签检测器对该像素的预测结果是:该像素标签正确的可能性是90%、也就是标签错误的可能性是10%。反之,如果在该噪声样本集的噪声信息K中,ki,h,w=0时,表示像素(h,w)的第一真实属性为标签错误,ki,h,w=1时表示该像素的第一真实属性为标签正确,那么此时,如果该初始噪声标签检测器针对任一像素输出的预测属性为0.9,可以认为初始噪声标签检测器对该像素的预测结果是:该像素标签正确的可能性是90%,如果该初始噪声标签检测器针对任一像素输出的预测属性为0.1,可认为初始噪声标签检测器对该像素的预测结果是:该像素标签正确的可能性是10%、也就是该像素标签错误的可能性是90%。
在一些实施方式中,以ki,h,w=1表示像素(h,w)的第一真实属性为标签错误,ki,h,w=0表示该像素的第一真实属性为标签正确为例。如果该噪声标签检测器输出的预测属性为0.1,而该像素所对应的第一真实属性为1,则说明该噪声标签检测器无法检测出标签错误的样本,因此该噪声标签检测器存在较大误差,这种情况下,可以根据初始噪声标签检测器输出的预测属性与该像素的第一实属性确定损失函数。
如果噪声标签检测器输出的预测属性为0.9,且该像素对应的第一真实属性为1,则该结果说明噪声标签检测器能够检测出标签错误的样本,因此该噪声标签检测器不存在较大误差。
相应地,利用该像素对应的预测属性和该第一真实属性,计算初始噪声标签检测器的损失函数,包括:
将该噪声样本集中像素所对应的第一训练历史输入初始噪声标签检测器,以得到该样本图像中像素所对应的预测属性;并且根据该样本图像中像素所对应的第一真实属性和该像素的预测属性,计算二元交叉熵损失函数;将该样本图像中各个像素对应的二元交叉熵损失函数相加,以得到该样本图像所对应的损失函数。
进一步地,可以采用该损失函数,对初始噪声标签检测器进行调整以得到该噪声标签检测器。即,采用式子(3)确定噪声标签检测器:
其中,表示训练好的噪声标签检测器,g表示初始噪声标签检测器;/>表示噪声样本集DN中第i张样本图像上的像素(h,w)所对应的第一训练历史,/>表示噪声样本集DN中第i张样本图像上的像素(h,w)所对应的预测属性;ki,h,w表示噪声样本集DN中第i张样本图像上的像素(h,w)对应的第一真实属性;/>表示计算a和b的二元交叉熵损失函数。
其中,初始噪声标签检测器可以包括擅长处理时序信息的长短期记忆(InceptionTime)模型。其中,该Inception Time模型针对只包含标签正确的像素的集合仍有效。此外,在生成噪声标签检测器的过程中,还可加入其他类别信息以显著增加噪声标签检测器的参数量和计算量,进而提高噪声标签检测器的鲁棒性。
需要说明是,本公开实施例可以采用优化器对该初始噪声标签检测器进行调整,其中,该优化器可以包括AdamW。
通过利用样本图像中任一像素对应的第一训练历史,以及该像素对应的第一真实属性生成的噪声标签检测器不仅具有高准确度的优点,而且降低生成噪声标签检测器所需的时间。
但是,由于噪声样本集中的部分或全部样本图像包括标签错误的像素,因此噪声样本集中,标签错误的像素的数量较大,如果利用噪声样本集中全部标签错误的像素所对应的第一训练历史、以及该噪声样本集的噪声信息对该噪声标签检测器进行训练,会耗费很多不必要的时间和成本。
因此,针对上述问题,本公开实施例提出了一种利用样本图像中任一区域所对应的第一训练历史、以及该区域所对应的噪声信息,生成噪声标签检测器的方式。该方法可以在保证噪声标签检测器准确度的前提下,降低生成噪声标签检测器所需的成本和时间。
具体地,利用该第一训练历史、以及该噪声样本集的噪声信息,生成噪声标签检测器,包括:
将该样本图像划分为多个区域,任一区域包括多个像素;
针对任一区域,确定初始噪声标签检测器的损失函数;并根据该损失函数,对该初始噪声标签检测器进行调整,以得到最终的噪声标签检测器。
本公开实施例提出的针对样本图像中任一区域,生成噪声标签检测器的方式,能够在保障该噪声标签检测器的准确性的前提下,降低生成该噪声标签检测器所需的计算和存储成本。
其中,将该样本图像划分为多个区域,包括:
根据该样本图像中多个像素的语义特征、纹理特征、颜色特征和亮度特征中的至少之一对该样本图像进行划分,以得到多个区域;和/或,
根据预设尺寸对该样本图像进行划分,以得到多个区域。
例如,可以根据该样本图像中多个像素的语义特征、纹理特征、颜色特征和亮度特征中的至少之一,将该样本图像划分为多个超像素区域。该超像素区域可以为由一系列位置相邻且颜色、亮度和纹理等特征相似的像素点组成的小区域。这些小区域大多保留了图像的有效信息,且一般不会破坏图像中包含的边界信息。具体地,可以采用线性迭代聚类(SLIC,simple linear iterative clustering)算法、或者快速移位图像分割(Quickshift)算法将样本图像分割为多个超像素区域。
当然,本公开实施例还可以根据预设尺寸对该样本图像进行划分。例如,可以针对标签噪声检测器所需的精度,将该样本图像划分为多个尺寸为10x10个像素的区域。需要说明是,本公开还可以将该样本图像划分为多个尺寸不相同的区域,例如,还可以将该样本图像分割为一个10x10个像素的区域和两个20x20个像素的区域。当然,本公开实施例并不限制该区域的尺寸,以上仅为示例。
本公开实施例提出的样本图像划分方式,不仅不会破坏图像中包含的边界信息,还能够保障划分出的多个区域能够保留该样本图像中的有效信息,避免产生出现存在不包含有效信息的区域。
相应地,本公开实施例还需要针对任一区域,确定初始噪声标签检测器的损失函数,并利用该损失函数对初始噪声标签检测器进行调整,以得到噪声标签检测器。
具体地,针对任一区域,确定初始噪声标签检测器的损失函数,包括:
根据区域中像素所对应的第一训练历史,计算区域所属类别的第二预测结果;
将该区域所属类别的第二预测结果输入初始噪声标签检测器,得到该区域对应的预测属性;并且根据该噪声样本集的噪声信息,确定该区域对应的第二真实属性;以及,
利用该区域对应的预测属性和该第二真实属性,计算初始噪声标签检测器的损失函数。
需要说明的是,该区域对应的预测属性可以用于表征该区域的标签的正确率。其中,该预测属性可以包括标签错误的像素在该区域中所占的比重、或者标签正确的像素该区域中所占的比重。
相应地,利用该区域对应的预测属性和该第二真实属性,计算初始噪声标签检测器的损失函数,包括:
根据该区域中多个像素所对应的第一训练历史,得到该区域所对应的第二检测结果,并将该第二检测结果输入初始噪声标签检测器,以得到该样本图像中该区域所对应的预测属性;并且根据该样本图像中区域所对应的第二真实属性和该像素的预测属性,计算二元交叉熵损失函数;将该样本图像中各个区域对应的二元交叉熵损失函数相加,以得到该样本图像所对应的损失函数。
进一步地,可以采用该损失函数对初始噪声标签检测器进行调整以得到该噪声标签检测器。即,采用式子(4)确定噪声标签检测器:
其中,表示噪声标签检测器,g表示初始噪声标签检测器;/>表示噪声样本集DN中第i张样本图像上的区域m所对应的第二检测结果,/>表示噪声样本集DN中第i张样本图像上的区域m所对应的预测属性;ki,m表示噪声样本集DN中第i张样本图像上的区域m对应的第二真实属性;/>表示计算a和b的二元交叉熵损失函数。
采用本公开实施例获取的损失函数,能够快速地对初始噪声标签检测器进行收敛,从而在保证噪声标签检测器准确度的前提下,能够减少生成噪声标签检测器所需的时间。
进一步地,根据噪声样本集的噪声信息,确定该区域对应的第二真实属性,包括:
利用该噪声样本集的噪声信息,确定该区域中标签错误的像素和/或标签正确的像素;
根据区域中标签错误的像素数量和/或标签正确的像素数量、以及所属区域所包含的像素数量,确定该区域对应的第二真实属性。
通过利用样本图像中任一区域对应的第二检测结果,以及该区域对应的第二真实属性生成的噪声标签检测器不仅具有高准确度的优点,而且降低生成噪声标签检测器所需的存储成本和计算成本。
其中,第二真实属性可以用于表征以下至少之一:
标签错误的像素在该区域中所占的比重;
标签正确的像素在该区域中所占的比重。
一示例中,在训练噪声标签检测器时,可以将[区域的第二检测结果]输入初始噪声标签检测器,由初始噪声标签检测器输出该区域的预测属性。
以第二真实属性和预测属性均用于表征标签错误的像素在该区域中所占的比重为例。如果该预测属性和该第二真实属性均为[0,1]范围内的任一有理数,如果噪声标签检测器检测出该区域的预测属性为0,则认为噪声标签检测器对该区域的预测结果是:标签错误的像素在区域中所占的比重为0;如果噪声标签检测器检测出该区域的预测属性1,则认为噪声标签检测器对该区域的预测结果是:标签错误的像素在该区域中所占的比重为1。
例如,如果噪声标签检测器输出的预测属性为0.6,而该区域的真实属性为0.4,则证明该噪声标签检测器的预测标签错误的像素在该区域中所占的比重的不够准确,这种情况下,可以根据声标签检测器输出的预测属性与该区域的第二真实属性确定损失函数。
本公开实施例提出的利用该标签错误的像素在该区域中所占的比重、或者该标签正确的像素在该区域中所占的比重,能够提高确定该区域对应的第二真实属性的正确率,以便于提高后续噪声标签检测的准确性。
本公开实施例还提出一种噪声标签检测方法,图4是根据本公开实施例的噪声标签检测方法的流程示意图,可以采用上述任一实施方式中提出的噪声标签检测器进行噪声标签检测,如图4所示,该噪声标签检测方法包括:
S410、获取待检测图像中任一像素所对应的第二训练历史;其中,待检测图像包括带有标签的像素,标签用于表征像素所属的类别;第二训练历史包含待检测图像中像素所属类别的第三预测结果;以及,
S420、根据第二训练历史和噪声标签检测器,以得到像素对应的预测属性,像素对应的预测属性用于表征像素的标签的正确率;
噪声标签检测器通过任一噪声标签检测器的生成方法生成。
本公开实施例提出的噪声标签检测方法,能够基于待检测图像中像素所对应的第二训练历史,快速、高效地检测出该待检测图像中标签错误的像素。
图5是根据本公开实施例的噪声标签检测方法的示意性框图。如图5所示,可以利用待检测图像对深度模型进行训练,以得到待检测图像中任一像素所对应的第二训练历史,并将第二训练历史输入噪声标签检测器,以得到该待检测图像中标签错误的像素。如图5所示,该噪声标签检测器可以利用上述噪声标签检测器的生成方法得到。
在一些实施方式中,该根据第二训练历史和噪声标签检测器,得到预测属性,包括:
将该待检测图像划分为多个待检测区域,任一待检测区域包括多个像素;
根据任一待检测区域中像素所对应的第二训练历史,计算该待检测区域所属类别的第四预测结果;
将该待检测区域所属类别的第四预测结果输入该噪声标签检测器,以得到该待检测区域对应的预测属性,该待检测区域对应的预测属性用于表征该待检测区域中像素的标签的正确率。
本公开实施例提出的针对待检测图像中任一区域,对该待检测图形进行噪声标签检测的方式,无需对每一个像素均进行处理,能够大大降低计算和存储成本,因此能够在保证该噪声标签检测结果的准确性的前提下,降低噪声标签检测所需的成本。
设定预测属性用于表征标签错误的像素在该区域中所占的比重,那么以该预测属性为[0,1]范围内的任一有理数为例,如果噪声标签检测器检测出该区域的预测属性为0.3,则认为噪声标签检测器对该区域的预测结果是:标签错误的像素在区域中所占的比重为30%;如果噪声标签检测器检测出该区域的预测属性为0.9,则认为噪声标签检测器对该区域的预测结果是:标签错误的像素在该区域中所占的比重为90%。
在一些实施方式中,该将待检测图像划分为多个待检测区域,包括:
根据该待检测图像中多个像素的语义特征、纹理特征、颜色特征和亮度特征中的至少之一对该待检测图像进行划分,以得到多个待检测区域;和/或,
根据预设尺寸对该待检测图像进行划分,以得到多个待检测区域。
本公开实施例提出的待检测图像划分方式,不仅不会破坏图像中包含的边界信息,还能够保障划分出的多个区域能够保留该待检测图像的有效信息,提高标签噪声检测的效率。
在一些实施方式中,该根据第二训练历史和噪声标签检测器,得到预测属性,包括:
将该待检测图像中任一像素对应的第二训练历史输入该噪声标签检测器,以得到该像素对应的预测属性,该像素对应的预测属性用于表征该像素的标签的正确率。
设定预测属性为1时,表示该像素为标签错误的像素;预测属性为0时,表示该像素为标签正确的像素,那么如果初始噪声标签检测器检测出像素对应的预测属性为0.9;则认为初始噪声标签检测器对该像素的预测结果是:该像素标签错误的可能性是90%;如果初始噪声标签检测器预测出像素对应的预测属性为0.1,则认为初始噪声标签检测器对该像素的预测结果是:该像素标签错误的可能性是10%、也就是该像素标签正确的可能性是90%。
利用待检测图像中任一像素所对应的第二训练历史和该噪声标签检测器,得到的该像素对应的预测属性具有准确度高的特点,并且得到该像素对应的预测属性所需的时间较短。
在一些实施方式中,该获取待检测图像中任一像素所对应的第二训练历史,包括:
利用该待检测图像对深度模型进行训练,以获取该待检测图像中任一像素所对应的第二训练历史。
本公开实施例提出的获取第二训练历史的方法,能够在保证第二训练历史准确度的前提下,减少获取该第二训练历史所消耗的时间。
本公开实施例还提出一种噪声标签检测器的生成装置,噪声标签检测器用于检测样本图像中标签错误的像素。图6是根据本公开实施例的噪声标签检测器的生成装置600的结构示意图,包括:
第一获取模块610,用于获取噪声样本集中任一像素所对应的第一训练历史;其中,噪声样本集包括多个样本图像,噪声样本集中的部分或全部样本图像包括标签错误的像素,标签用于表征像素所属的类别;第一训练历史包含样本图像中像素所属类别的第一预测结果;以及,
生成模块620,用于利用第一训练历史、以及噪声样本集的噪声信息,生成噪声标签检测器。
在一些实施方式中,噪声样本集的噪声信息用于表征噪声样本集中任一像素对应的第一真实属性,该第一真实属性包括标签错误或标签正确。
图7是根据本公开实施例的噪声标签检测器的生成装置700的结构示意图,如图7所示,在一些实施方式中,该生成模块620,还包括:
划分子模块621,用于将该样本图像划分为多个区域,任一区域包括多个像素;
确定子模块622,用于针对任一区域,确定初始噪声标签检测器的损失函数;并根据损失函数,对该初始噪声标签检测器进行调整,以得到最终的噪声标签检测器。
在一些实施方式中,该确定子模块622,用于:
根据该区域中像素所对应的第一训练历史,计算该区域所属类别的第二预测结果;
将该区域所属类别的第二预测结果输入初始噪声标签检测器,得到该区域对应的预测属性;并且根据该噪声样本集的噪声信息,确定该区域对应的第二真实属性;以及,
利用该区域对应的预测属性和该第二真实属性,计算初始噪声标签检测器的损失函数。
在一些实施方式中,该确定子模块622,用于:
利用该噪声样本集的噪声信息,确定该区域中标签错误的像素和/或标签正确的像素;
根据区域中标签错误的像素数量和/或标签正确的像素数量、以及该区域所包含的像素数量,确定该区域对应的第二真实属性。
在一些实施方式中,该第二真实属性用于表征以下至少之一:
标签错误的像素在该区域中所占的比重;
标签正确的像素在该区域中所占的比重。
在一些实施方式中,该划分子模块621,用于:
根据该样本图像中多个像素的语义特征、纹理特征、颜色特征和亮度特征中的至少之一对该样本图像进行划分,以得到多个区域;和/或,
根据预设尺寸对该样本图像进行划分,以得到多个区域。
在一些实施方式中,该生成模块620,用于:
将任一像素所对应的第一训练历史输入初始噪声标签检测器,得到该像素对应的预测属性;并且根据该噪声样本集的噪声信息,确定该像素对应的第一真实属性;
利用该像素对应的预测属性和该第一真实属性,计算初始噪声标签检测器的损失函数;以及,
根据该损失函数对该初始噪声标签检测器进行调整,以得到最终的噪声标签检测器。
在一些实施方式中,第一获取模块610,用于利用该噪声样本集对深度模型进行训练,以获取该噪声样本集中任一像素所对应的第一训练历史。
在一些实施方式中,还包括:
处理模块730,用于对原始样本集进行噪声处理,得到噪声样本集;
其中,原始样本集中标签错误的像素数量小于或等于第一阈值,噪声样本集中标签错误的像素数量大于或等于第二阈值;
第二阈值大于或等于第一阈值。
本公开实施例还提出一种噪声标签检测装置,图8是根据本公开实施例的噪声标签检测装置800的结构示意图,包括:
第二获取模块810,用于获取待检测图像中任一像素所对应的第二训练历史;
其中,该待检测图像包括带有标签的像素,该标签用于表征该像素所属的类别;该第二训练历史包含该待检测图像中像素所属类别的第三预测结果;以及,
预测模块820,用于根据该第二训练历史和噪声标签检测器,以得到该像素对应的预测属性,该像素对应的预测属性用于表征该像素的标签的正确率;该噪声标签检测器通过上述任一噪声标签检测器的生成装置生成。
在一些实施方式中,预测模块820,用于:
将该待检测图像划分为多个待检测区域,任一待检测区域包括多个像素;
根据任一待检测区域中像素所对应的第二训练历史,计算该待检测区域所属类别的第四预测结果;
将该待检测区域所属类别的第四预测结果输入该噪声标签检测器,以得到该待检测区域对应的预测属性,该待检测区域对应的预测属性用于表征该待检测区域中像素的标签的正确率。
在一些实施方式中,该预测模块820,用于:
根据该待检测图像中多个像素的语义特征、纹理特征、颜色特征和亮度特征中的至少之一对该待检测图像进行划分,以得到多个待检测区域;和/或,
根据预设尺寸对该待检测图像进行划分,以得到多个待检测区域。
在一些实施方式中,该预测模块820,用于将该待检测图像中任一像素对应的第二训练历史输入噪声标签检测器,以得到像素对应的预测属性,该像素对应的预测属性用于表征该像素的标签的正确率。
在一些实施方式中,该第二获取模块810,用于利用该待检测图像对深度模型进行训练,以获取该待检测图像中任一像素所对应的第二训练历史。
本公开实施例的装置的各模块、子模块的具体功能和示例的描述,可以参见上述方法实施例中对应步骤的相关描述,在此不再赘述。
本公开的技术方案中,所涉及的用户个人信息的获取,存储和应用等,均符合相关法律法规的规定,且不违背公序良俗。
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质和一种计算机程序产品。
图9示出了可以用来实施本公开的实施例的示例电子设备900的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字助理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
如图9所示,设备900包括计算单元901,其可以根据存储在只读存储器(ROM)902中的计算机程序或者从存储单元908加载到随机访问存储器(RAM)903中的计算机程序,来执行各种适当的动作和处理。在RAM 903中,还可存储设备900操作所需的各种程序和数据。计算单元901、ROM 902以及RAM 903通过总线904彼此相连。输入/输出(I/O)接口905也连接至总线904。
设备900中的多个部件连接至I/O接口905,包括:输入单元906,例如键盘、鼠标等;输出单元907,例如各种类型的显示器、扬声器等;存储单元908,例如磁盘、光盘等;以及通信单元909,例如网卡、调制解调器、无线通信收发机等。通信单元909允许设备900通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
计算单元901可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元901的一些示例包括但不限于中央处理单元(CPU)、图形处理单元(GPU)、各种专用的人工智能(AI)计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(DSP)、以及任何适当的处理器、控制器、微控制器等。计算单元901执行上文所描述的各个方法和处理,例如噪声标签检测器的生成方法和噪声标签检测方法。例如,在一些实施例中,噪声标签检测器的生成方法和噪声标签检测方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元908。在一些实施例中,计算机程序的部分或者全部可以经由ROM902和/或通信单元909而被载入和/或安装到设备900上。当计算机程序加载到RAM 903并由计算单元901执行时,可以执行上文描述的噪声标签检测器的生成方法和噪声标签检测方法的一个或多个步骤。备选地,在其他实施例中,计算单元901可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行噪声标签检测器的生成方法和噪声标签检测方法。
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、现场可编程门阵列(FPGA)、专用集成电路(ASIC)、专用标准产品(ASSP)、芯片上系统的系统(SOC)、负载可编程逻辑设备(CPLD)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPROM或快闪存储器)、光纤、便捷式紧凑盘只读存储器(CD-ROM)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,CRT(阴极射线管)或者LCD(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入、或者触觉输入)来接收来自用户的输入。
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(LAN)、广域网(WAN)和互联网。
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。
Claims (20)
1.一种噪声标签检测器的生成方法,所述噪声标签检测器用于检测样本图像中标签错误的像素,所述方法包括:
获取噪声样本集中任一像素所对应的第一训练历史;其中,所述噪声样本集包括多个样本图像,所述噪声样本集中的部分或全部所述样本图像包括标签错误的像素,所述标签用于表征所述像素所属的类别;所述第一训练历史包含所述样本图像中像素所属类别的第一预测结果;以及,
利用所述第一训练历史、以及所述噪声样本集的噪声信息,生成噪声标签检测器。
2.根据权利要求1所述的方法,其中,所述噪声样本集的噪声信息用于表征所述噪声样本集中任一所述像素对应的第一真实属性,所述第一真实属性包括标签错误或标签正确。
3.根据权利要求2所述的方法,其中,所述利用所述第一训练历史、以及所述噪声样本集的噪声信息,生成噪声标签检测器,包括:
将所述样本图像划分为多个区域,任一所述区域包括多个像素;
针对任一所述区域,确定初始噪声标签检测器的损失函数;并根据所述损失函数,对所述初始噪声标签检测器进行调整,以得到最终的噪声标签检测器。
4.根据权利要求3所述的方法,其中,所述针对任一所述区域,确定初始噪声标签检测器的损失函数,包括:
根据所述区域中像素所对应的第一训练历史,计算所述区域所属类别的第二预测结果;
将所述区域所属类别的第二预测结果输入初始噪声标签检测器,得到所述区域对应的预测属性;并且根据所述噪声样本集的噪声信息,确定所述区域对应的第二真实属性;以及,
利用所述区域对应的预测属性和所述第二真实属性,计算初始噪声标签检测器的损失函数。
5.根据权利要求4所述方法,其中,所述根据所述噪声样本集的噪声信息,确定所述区域对应的第二真实属性,包括:
利用所述噪声样本集的噪声信息,确定所述区域中所述标签错误的像素和/或所述标签正确的像素;
根据所述区域中标签错误的像素数量和/或标签正确的像素数量、以及所述区域所包含的像素数量,确定所述区域对应的第二真实属性。
6.根据权利要求4或5所述的方法,所述第二真实属性用于表征以下至少之一:
所述标签错误的像素在所述区域中所占的比重;
所述标签正确的像素在所述区域中所占的比重。
7.根据权利要求3-6中任一所述的方法,其中,所述将所述样本图像划分为多个区域,包括:
根据所述样本图像中多个像素的语义特征、纹理特征、颜色特征和亮度特征中的至少之一对所述样本图像进行划分,以得到所述多个区域;和/或,
根据预设尺寸对所述样本图像进行划分,以得到所述多个区域。
8.根据权利要求2所述的方法,其中,所述利用所述第一训练历史、以及所述噪声样本集的噪声信息,生成噪声标签检测器,包括:
将任一所述像素所对应的第一训练历史输入初始噪声标签检测器,得到所述像素对应的预测属性;并且根据所述噪声样本集的噪声信息,确定所述像素对应的第一真实属性;
利用所述像素对应的预测属性和所述第一真实属性,计算初始噪声标签检测器的损失函数;以及,
根据所述损失函数对所述初始噪声标签检测器进行调整,以得到最终的噪声标签检测器。
9.根据权利要求1-8中任一所述的方法,其中,所述获取噪声样本集中任一像素所对应的第一训练历史,包括:
利用所述噪声样本集对深度模型进行训练,以获取所述噪声样本集中任一所述像素所对应的第一训练历史。
10.根据权利要求1-9中任一所述的方法,还包括:
对原始样本集进行噪声处理,得到所述噪声样本集;
其中,所述原始样本集中标签错误的像素数量小于或等于第一阈值,所述噪声样本集中标签错误的像素数量大于或等于第二阈值;
所述第二阈值大于或等于所述第一阈值。
11.一种噪声标签检测方法,包括:
获取待检测图像中任一像素所对应的第二训练历史;
其中,所述待检测图像包括带有标签的像素,所述标签用于表征所述像素所属的类别;所述第二训练历史包含所述待检测图像中像素所属类别的第三预测结果;以及,
根据所述第二训练历史和噪声标签检测器,以得到所述像素对应的预测属性,所述像素对应的预测属性用于表征所述像素的标签的正确率;
所述噪声标签检测器通过权利要求1-10中任一所述的方法生成。
12.根据权利要求11所述的方法,其中,所述根据所述第二训练历史和噪声标签检测器,得到预测属性,包括:
将所述待检测图像划分为多个待检测区域,任一所述待检测区域包括多个像素;
根据任一所述待检测区域中像素所对应的第二训练历史,计算所述待检测区域所属类别的第四预测结果;
将所述待检测区域所属类别的第四预测结果输入所述噪声标签检测器,以得到所述待检测区域对应的预测属性,所述待检测区域对应的预测属性用于表征所述待检测区域中像素的标签的正确率。
13.根据权利要求12所述的方法,其中,所述将所述待检测图像划分为多个待检测区域,包括:
根据所述待检测图像中多个像素的语义特征、纹理特征、颜色特征和亮度特征中的至少之一对所述待检测图像进行划分,以得到所述多个待检测区域;和/或,
根据预设尺寸对所述待检测图像进行划分,以得到所述多个待检测区域。
14.根据权利要求11所述的方法,其中,所述根据所述第二训练历史和噪声标签检测器,得到预测属性,包括:
将所述待检测图像中任一所述像素对应的第二训练历史输入所述噪声标签检测器,以得到所述像素对应的预测属性,所述像素对应的预测属性用于表征所述像素的标签的正确率。
15.根据权利要求11-14中任一所述的方法,其中,所述获取待检测图像中任一像素所对应的第二训练历史,包括:
利用所述待检测图像对深度模型进行训练,以获取所述待检测图像中任一所述像素所对应的第二训练历史。
16.一种噪声标签检测器的生成装置,所述噪声标签检测器用于检测样本图像中标签错误的像素,所述装置包括:
第一获取模块,用于获取噪声样本集中任一像素所对应的第一训练历史;其中,所述噪声样本集包括多个样本图像,所述噪声样本集中的部分或全部所述样本图像包括标签错误的像素,所述标签用于表征所述像素所属的类别;所述第一训练历史包含所述样本图像中像素所属类别的第一预测结果;以及,
生成模块,用于利用所述第一训练历史、以及所述噪声样本集的噪声信息,生成噪声标签检测器。
17.一种噪声标签检测装置,包括:
第二获取模块,用于获取待检测图像中任一像素所对应的第二训练历史;
其中,所述待检测图像包括带有标签的像素,所述标签用于表征所述像素所属的类别;所述第二训练历史包含所述待检测图像中像素所属类别的第三预测结果;以及,
预测模块,用于根据所述第二训练历史和噪声标签检测器,以得到所述像素对应的预测属性,所述像素对应的预测属性用于表征所述像素的标签的正确率;
所述噪声标签检测器通过权利要求16所述的装置生成。
18.一种电子设备,包括:
至少一个处理器;以及
与所述至少一个处理器通信连接的存储器;其中,
所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-10或11-15中任一项所述的方法。
19.一种存储有计算机指令的非瞬时计算机可读存储介质,其中,所述计算机指令用于使所述计算机执行根据权利要求1-10或11-15中任一项所述的方法。
20.一种计算机程序产品,包括计算机程序,所述计算机程序在被处理器执行时实现根据权利要求1-10或11-15中任一项所述的方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310315307.XA CN116486144A (zh) | 2023-03-28 | 2023-03-28 | 噪声标签检测器的生成方法、噪声标签检测方法和装置 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202310315307.XA CN116486144A (zh) | 2023-03-28 | 2023-03-28 | 噪声标签检测器的生成方法、噪声标签检测方法和装置 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN116486144A true CN116486144A (zh) | 2023-07-25 |
Family
ID=87225952
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202310315307.XA Pending CN116486144A (zh) | 2023-03-28 | 2023-03-28 | 噪声标签检测器的生成方法、噪声标签检测方法和装置 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN116486144A (zh) |
-
2023
- 2023-03-28 CN CN202310315307.XA patent/CN116486144A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN113222942A (zh) | 多标签分类模型的训练方法和预测标签的方法 | |
CN113537192B (zh) | 图像检测方法、装置、电子设备及存储介质 | |
CN113657483A (zh) | 模型训练方法、目标检测方法、装置、设备以及存储介质 | |
CN115358392B (zh) | 深度学习网络的训练方法、文本检测方法及装置 | |
CN114882321A (zh) | 深度学习模型的训练方法、目标对象检测方法和装置 | |
CN110633717A (zh) | 一种目标检测模型的训练方法和装置 | |
CN113205041A (zh) | 结构化信息提取方法、装置、设备和存储介质 | |
CN113902696A (zh) | 图像处理方法、装置、电子设备和介质 | |
CN113887630A (zh) | 图像分类方法、装置、电子设备和存储介质 | |
CN113902899A (zh) | 训练方法、目标检测方法、装置、电子设备以及存储介质 | |
CN116188917B (zh) | 缺陷数据生成模型训练方法、缺陷数据生成方法及装置 | |
CN113643260A (zh) | 用于检测图像质量的方法、装置、设备、介质和产品 | |
CN116309963B (zh) | 一种图像的批量标注方法、装置、电子设备及存储介质 | |
CN112784102A (zh) | 视频检索方法、装置和电子设备 | |
CN116758280A (zh) | 目标检测方法、装置、设备以及存储介质 | |
CN115496916B (zh) | 图像识别模型的训练方法、图像识别方法以及相关装置 | |
CN116468479A (zh) | 确定页面质量评估维度方法、页面质量的评估方法和装置 | |
CN115359322A (zh) | 一种目标检测模型训练方法、装置、设备和存储介质 | |
CN113379592B (zh) | 图片中敏感区域的处理方法、装置和电子设备 | |
CN115346072A (zh) | 图像分类模型的训练方法及装置、电子设备和存储介质 | |
CN116486144A (zh) | 噪声标签检测器的生成方法、噪声标签检测方法和装置 | |
CN117746069B (zh) | 以图搜图的模型训练方法、和以图搜图方法 | |
CN114693950B (zh) | 一种图像特征提取网络的训练方法、装置及电子设备 | |
CN116563665B (zh) | 目标检测模型的训练方法、目标检测方法、装置及设备 | |
CN114092739A (zh) | 图像处理方法、装置、设备、存储介质和程序产品 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |