CN118135321A - 一种基于样本标注质量修正的图像分类算法、系统、设备及介质 - Google Patents
一种基于样本标注质量修正的图像分类算法、系统、设备及介质 Download PDFInfo
- Publication number
- CN118135321A CN118135321A CN202410316767.9A CN202410316767A CN118135321A CN 118135321 A CN118135321 A CN 118135321A CN 202410316767 A CN202410316767 A CN 202410316767A CN 118135321 A CN118135321 A CN 118135321A
- Authority
- CN
- China
- Prior art keywords
- quality
- sample
- image classification
- labeling
- score
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Pending
Links
- 238000002372 labelling Methods 0.000 title claims abstract description 148
- 238000012937 correction Methods 0.000 title claims abstract description 49
- 238000007635 classification algorithm Methods 0.000 title claims abstract description 32
- 238000013145 classification model Methods 0.000 claims abstract description 45
- 230000004927 fusion Effects 0.000 claims abstract description 22
- 238000013441 quality evaluation Methods 0.000 claims abstract description 18
- 238000001303 quality assessment method Methods 0.000 claims abstract description 4
- 238000012549 training Methods 0.000 claims description 7
- 238000004590 computer program Methods 0.000 claims description 6
- 238000003860 storage Methods 0.000 claims description 4
- 238000002790 cross-validation Methods 0.000 claims description 3
- 238000012163 sequencing technique Methods 0.000 claims description 3
- 238000000034 method Methods 0.000 abstract description 14
- 230000000694 effects Effects 0.000 abstract description 3
- 238000005457 optimization Methods 0.000 abstract description 3
- 238000011156 evaluation Methods 0.000 description 6
- 238000004519 manufacturing process Methods 0.000 description 4
- 238000013507 mapping Methods 0.000 description 3
- 238000012986 modification Methods 0.000 description 3
- 230000004048 modification Effects 0.000 description 3
- 238000010276 construction Methods 0.000 description 2
- 238000009826 distribution Methods 0.000 description 2
- 230000006870 function Effects 0.000 description 2
- 238000012360 testing method Methods 0.000 description 2
- 238000003326 Quality management system Methods 0.000 description 1
- 238000013459 approach Methods 0.000 description 1
- 238000013528 artificial neural network Methods 0.000 description 1
- 230000003190 augmentative effect Effects 0.000 description 1
- 230000006399 behavior Effects 0.000 description 1
- 230000009286 beneficial effect Effects 0.000 description 1
- 238000004891 communication Methods 0.000 description 1
- 238000007405 data analysis Methods 0.000 description 1
- 238000013434 data augmentation Methods 0.000 description 1
- 238000011161 development Methods 0.000 description 1
- 230000002708 enhancing effect Effects 0.000 description 1
- 238000007689 inspection Methods 0.000 description 1
- 238000011835 investigation Methods 0.000 description 1
- 238000012544 monitoring process Methods 0.000 description 1
- 238000007781 pre-processing Methods 0.000 description 1
- 238000012545 processing Methods 0.000 description 1
- 238000011158 quantitative evaluation Methods 0.000 description 1
- 238000012552 review Methods 0.000 description 1
- 238000012795 verification Methods 0.000 description 1
- 239000002699 waste material Substances 0.000 description 1
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T7/00—Image analysis
- G06T7/0002—Inspection of images, e.g. flaw detection
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/774—Generating sets of training patterns; Bootstrap methods, e.g. bagging or boosting
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/77—Processing image or video features in feature spaces; using data integration or data reduction, e.g. principal component analysis [PCA] or independent component analysis [ICA] or self-organising maps [SOM]; Blind source separation
- G06V10/80—Fusion, i.e. combining data from various sources at the sensor level, preprocessing level, feature extraction level or classification level
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V20/00—Scenes; Scene-specific elements
- G06V20/70—Labelling scene content, e.g. deriving syntactic or semantic representations
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20081—Training; Learning
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20084—Artificial neural networks [ANN]
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/20—Special algorithmic details
- G06T2207/20212—Image combination
- G06T2207/20221—Image fusion; Image merging
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06T—IMAGE DATA PROCESSING OR GENERATION, IN GENERAL
- G06T2207/00—Indexing scheme for image analysis or image enhancement
- G06T2207/30—Subject of image; Context of image processing
- G06T2207/30168—Image quality inspection
-
- Y—GENERAL TAGGING OF NEW TECHNOLOGICAL DEVELOPMENTS; GENERAL TAGGING OF CROSS-SECTIONAL TECHNOLOGIES SPANNING OVER SEVERAL SECTIONS OF THE IPC; TECHNICAL SUBJECTS COVERED BY FORMER USPC CROSS-REFERENCE ART COLLECTIONS [XRACs] AND DIGESTS
- Y02—TECHNOLOGIES OR APPLICATIONS FOR MITIGATION OR ADAPTATION AGAINST CLIMATE CHANGE
- Y02P—CLIMATE CHANGE MITIGATION TECHNOLOGIES IN THE PRODUCTION OR PROCESSING OF GOODS
- Y02P90/00—Enabling technologies with a potential contribution to greenhouse gas [GHG] emissions mitigation
- Y02P90/30—Computing systems specially adapted for manufacturing
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- General Physics & Mathematics (AREA)
- Physics & Mathematics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Evolutionary Computation (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Software Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Artificial Intelligence (AREA)
- Computing Systems (AREA)
- Quality & Reliability (AREA)
- Computational Linguistics (AREA)
- Image Analysis (AREA)
Abstract
本发明提供一种基于样本标注质量修正的图像分类算法、系统、设备及介质,其特征在于,包括:获取已标注图片,进行样本标注质量评分,生成较为全面的样本标注质量评估;基于所述样本标注质量评估,进行样本标注质量评分融合,生成每个样本标注的质量评分;基于所述样本标注的质量评分,进行样本质量的图像分类模型修正,生成样本质量模型修正图像分类模型。现有的方法难以基于样本标注质量科学地调整这些权重,并将其有效地整合到图像分类模型中。本发明提出了一种基于样本标注质量修正的图像分类算法,解决在没有任何先验知识的情况下,实现图像的数据样本质量判定以及模型优化,量化了图像样本标注质量,并基于样本质量评分,提升了图像分类模型的效果。
Description
技术领域
本发明涉及机器视觉在工业领域,尤其涉及一种基于样本标注质量修正的图像分类算法。
背景技术
经过调研发现,现有技术在图像样本标注质量的评估方面存在困难,特别是在工业领域的图片分类模型中。主要面临三大挑战:首先,标注样本的质量对于大规模数据集至关重要,但评估这些质量需要投入大量时间和人力,同时标注者的主观性也可能影响标签的准确性。目前,我们缺乏一种自动化的量化评估方法来准确衡量这些质量。其次,样本标注的质量受到多种因素的影响,但现有技术无法有效地将这些因素融合,以提供一个综合的样本质量评分。最后,将样本标注质量评分纳入分类模型需要为样本赋予不同的权重。然而,现有的方法难以基于样本标注质量科学地调整这些权重,并将其有效地整合到图像分类模型中。
为了解决这些问题,本发明提出了一种在工业领域应用机器视觉的方法。该方法旨在实现工业图像分类任务中样本质量的判定,以及利用样本质量信息提高模型分类精度的自动化流程。由于工业图像数据的标注质量可能因标注者的主观性而参差不齐,导致一致性较差,目前的标注质量评估方法都需要专家和从业人员手动参与,难以自动化评估。本发明基于构建样本标注质量分数,通过对图像分类模型的修正,实现更准确的分类结果。本发明引入了样本标注质量分数的概念,并通过交叉验证、类别代表性以及类别倾斜程度三种因素来确定样本标注质量分数。样本标注质量分数是对每个数据样本的评估,反映了其在分类任务中的重要性和可靠性。通过构建样本质量融合模型融合多种样本标注质量评分,并将其通过代价敏感学习范式融入图像分类模型。
发明内容
针对上述问题,为了解决行业痛点,科学评估和利用样本质量,本发明提出了一种基于样本标注质量修正的图像分类算法,解决在没有任何先验知识的情况下,实现图像的数据样本质量判定以及模型优化,量化了图像样本标注质量,并基于样本质量评分,提升了图像分类模型的效果。
本发明提出一种基于样本标注质量修正的图像分类算法,通过构建样本标注质量分数,以及通过构建多种质量评价分数对标注质量进行评价,同时基于标注质量分数通过代价敏感学习对图像分类模型的修正,实现更准确的分类结果。与传统的标注质量评价方法相比更加全面和自动化。与传统图像分类算法相比,在标注质量较差的工业场景下具有更高的识别分类准确率。
一种基于样本标注质量修正的图像分类算法,主要包括:
S1:获取已标注图片,进行样本标注质量评分,生成较为全面的样本标注质量评估;
优选的,样本标注质量评分包含三个对于样本质量进行评价的子步骤,分别从样本标注一致性、样本标注的类别代表能力以及样本标注倾斜程度三个角度得到三种不同的样本标注质量因素评分。以得到较为全面的样本标注质量评估,以解决样本标注缺乏量化评估方式的问题。
优选的,质量因素评分1利用置信学习估计样本标注的置信度。具体而言,将训练数据分成n组,利用交叉验证确定样本标注一致性程度,以此来作为质量因素评分1。
优选的,质量因素评分2利用表示学习对图片编码,得到的图片表示向量的平均内类距和平均类间距指标获得每个样本在特征层面对于类别的代表性,以此来作为质量因素评分2。
优选的,质量因素评分3通过统计样本偏斜指标,得到样本类别偏斜程度,以此来作为质量因素评分3。
S2:基于获取的样本标注质量评估,进行样本标注质量评分融合,生成每个样本标注的质量评分;
优选的,样本标注质量评分融合模块根据上述三种样本质量因素构建样本质量判定模型,通过专家对一小部分样本质量进行排序,通过排序学习模型的范式拟合样本质量因素判定模型f(质量因素1,质量因素2,质量因素3),以得到每个样本标注的质量评分。以解决难以融合多种标注质量因素问题。
S3:基于获取每个样本标注的质量评分,进行样本质量的图像分类模型修正,生成样本质量模型修正图像分类模型。
优选的,样本质量的图像分类模型修正基于一个基础图像分类模型,利用质量评分融合模块得到的样本质量分数,将样本质量分数通过代价敏感学习范式,将数据标注质量评分融入基础图像分类模型。以解决如何准确科学地调整样本的权重问题。
基于上述提出的基于样本标注质量修正的图像分类算法,为了更好地实现本发明,进一步地提出一种基于样本标注质量修正的图像分类系统,包括:样本标注质量评分模块、样本标注质量评分融合模块、样本质量的图像分类模型修正模块;
所述样本标注质量评分模块,包括:质量因素评分模块1、质量因素评分模块2、质量因素评分模块3;
所述样本标注质量评分模块,用于分别从样本标注一致性、样本标注的类别代表能力以及样本标注倾斜程度三个角度得到三种不同的样本标注质量因素评分;
所述样本标注质量评分融合模块,用于根据所述样本标注质量评分模块得到的样本质量因素,构建样本质量判定模型,通过排序学习模型的范式拟合样本质量因素判定模型f,得到每个样本标注的质量评分;
所述样本质量的图像分类模型修正模块,用于基于一个基础图像分类模型,利用所述样本标注质量评分融合模块得到的样本质量分数,将样本质量分数通过代价敏感学习范式,将数据标注质量评分融入基础图像分类模型。
基于上述提出的基于样本标注质量修正的图像分类算法,为了更好地实现本发明,进一步地提出一种电子设备,包括存储器和处理器;所述存储器上存储有计算机程序;当所述计算机程序在所述处理器上执行时,实现上述的基于样本标注质量修正的图像分类算法。
基于上述提出的基于样本标注质量修正的图像分类算法,为了更好地实现本发明,进一步地提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机指令;当所述计算机指令在上述的电子设备上执行时,实现上述的基于样本标注质量修正的图像分类算法。
有益效果:
1.提高数据生产效率:通过标注质量评价分数,可以筛选出高质量的标注样本,减少模型训练时所需的数据量。这将减少数据预处理和训练时间,提高生产效率。
2.降低成本:标注质量评价分数可以帮助避免使用低质量的标注样本,从而减少后续处理阶段中由于错误标注导致的资源浪费和修复成本。
3.提高模型精度:通过融合标注质量分数,可以调整模型对不同标注样本的权重,使模型更加关注高质量的样本,从而提高分类模型的性能和准确度。
4.提高模型鲁棒性:使用高质量的标注数据可以减少标注噪声和错误,从而提高模型的鲁棒性和泛化能力。模型可以更好地应对嘈杂或有挑战性的样本,提高分类准确性和稳定性。
5.提升模型可解释性:通过标注质量评价分数,可以识别和排除低质量的标注样本。这样可以提高模型对于关键特征的学习和理解,增强模型的可解释性和可信度。
6.优化数据采集策略:通过标注质量评价分数,可以了解标注数据的质量分布和标注者的表现情况。根据评价结果,可以针对性地优化数据采集策略,选择更可靠和高质量的标注来源,提高数据采集效率和效果。
7.改进标注质量管理:通过对标注质量进行评价和监控,可以建立标注质量管理的体系和流程。这包括培训标注者、制定标注规范、实施标注质量检查等措施,从而提高整体标注质量和一致性。
8.提供更精细的反馈信息:通过标注质量评价分数,可以向标注者提供更精细的反馈信息,指导其改进标注质量。这有助于标注者不断提升标注技能和专业水平,进一步提高标注质量。
9.提高工业产品质量:在工业场景中,通过标注质量评价分数,可以确保工业产品标注的准确性和一致性,从而提高产品质量和可靠性。
10.改善决策支持:在工业场景中,通过使用高质量的标注数据,工业决策者可以获得更准确的数据分析和预测结果,从而更好地指导决策和优化生产流程。
总而言之,本专利可以提高模型鲁棒性、可解释性和数据采集策略的优化,改进标注质量管理,并提供更精细的反馈信息。并在工业场景下提高产品质量、降低人工错误率和改善决策支持。这将帮助提升整个工业流程的效率和可持续发展。
附图说明
图1为一种基于样本标注质量修正的图像分类算法的流程图;
图2为一种基于样本标注质量修正的图像分类算法的质量评价模块1的原理流程图;
图3为一种基于样本标注质量修正的图像分类算法的质量评价模块2的原理流程图;
图4为一种基于样本标注质量修正的图像分类算法的质量评价模块3的原理流程图;
图5为一种基于样本标注质量修正的图像分类算法的样本标注质量评分融合模块的原理流程图;
图6为一种基于样本标注质量修正的图像分类算法的样本标注质量模型修正模块的原理流程图。
具体实施方式
为了更清楚地说明本发明实施例的技术方案,下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,应当理解,所描述的实施例仅仅是本发明的一部分实施例,而不是全部的实施例,因此不应被看作是对保护范围的限定。基于本发明中的实施例,本领域普通技术工作人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
在本发明的描述中,需要说明的是,除非另有明确的规定和限定,术语“设置”“相连”“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;也可以是直接相连,也可以是通过中间媒介间接相连,可以是两个元件内部的连通。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本发明中的具体含义。
本发明的输入是一个已标注好的带标注数据集,这里我们用LD指代,带标注数据集的数据部分用D指代,标注部分用L指代。通过样本标注质量评分模块得到三种样本标注质量评分,通过样本标注质量评分融合模块融合三种样本标注质量评分。通过基于样本质量的图像分类模型修正模块得到图像分类模型,用于应用场景推理和识别。
本发明提供一种基于样本标注质量修正的图像分类算法,根据图1至图6,具体的实施方式为:
S1:获取已标注图片,进行样本标注质量评分,生成较为全面的样本标注质量评估;
优选的,本发明通过三种质量评分模型,进行样本标注质量评分,对LD中的每条数据标注记录进行评分,具体流程如下:
根据图2所示,质量因素评分1利用交叉验证确定样本标注一致性程度,以此来作为质量因素评分1。
工作原理流程如下:将LD拆分成n份数据,每份数据中的各类别数量分布应与总体相似,这里每份数据用LD{1-n}指代;相应的,其标注和数据分别用L{1-n},D{1-n}指代。通过每份数据训练得到一个分类器C{1-n}。利用每个分类器Ci可以对所有的数据进行预测,然后与数据的真实类别标签比较,每条数据标注得到n个得分作为数据标注的置信度,整合这n个得分就可以得到样本标注一致性程度,以此来作为质量因素评分1,标记为F1。
根据图3所示,质量因素评分2利用表示学习对图片编码,得到的图片表示向量,评估向量对于样本类别的代表性,以此来作为质量因素评分2。
工作原理流程如下:首先通过诸如dino等图像表示学习模型对LD中的数据D进行编码,所得到的图像表示向量表示为V,计算每条数据的表示向量的平均类内距离和平均类间距离,整合这两个指标得到样本类别的代表性,以此来作为质量因素评分2,标记为F2。
根据图4所示,质量因素评分3通过统计LD中各类别的样本数量与总体数量相比得到类别数量倾斜程度,然后计算类别间样本相似性对数量倾斜程度进行修正,得到样本类别偏斜程度,以此来作为质量因素评分3,标记为F3。
S2:基于获取的样本标注质量评估,进行样本标注质量评分融合,生成每个样本标注的质量评分;
根据图5所示,标注样本通过样本标注质量评分得到三种标注质量评分分数F1F2F3,融合三种样本质量评分,构建三种样本质量评分与专家评分的映射模型。
工作原理和流程如下:首先将LD分为两个部分,分别是LDtrain和LDtest,专家对于LDtrain中的质量标注进行打分,打分方式可以是绝对分数,也可以是标注质量顺序。然后通过LDtrain与专家标注构建质量融合模型,对LDtest中的标注质量分数进行预测,得到样本的最终标注质量分数Fa。当打分方式为绝对分数时,损失函数用Mean Square Error(MSE)等预测系损失函数。当打分方式为标注质量排序时,损失函数用pointwise、pairwise、listwise等排序学习系损失函数。
S3:基于获取每个样本标注的质量评分,进行样本质量的图像分类模型修正,生成样本质量模型修正图像分类模型。
优选的,样本标注质量模型修正,利用通过样本标注质量评分融合,得到了样本标注的质量评分Fa,以及基础图像分类模型G(.)构建基于标注质量评分修正的图像分类模型。模型构建基于代价敏感学习范式,将样本质量分数与代价敏感学习中的代价建立联系,修正图像基础分类模型G’(.),得到基于样本标注质量的图像分类模型输出,供应用用以推理和预测。
(1)样本标注质量评分的替代方案有人工评估、一致性评估等方法。人工评估是由专家或标注质量评估者对标注数据进行人工审核和评估。他们可以根据预定义的评估标准和指标,对标注结果进行打分或提供反馈意见。一致性评估是通过比较不同标注者对相同样本的标注结果,评估标注者之间的一致性。常用的一致性指标包括Cohen's kappa系数、Fleiss'kappa系数等。然而这些方法一方面需要大量人工参数,难以自动化生成;另一方面,考虑标注质量较为片面,难以综合性地形成样本标注评价指标。
样本标注质量评分融合的替代方案可以用简单的投票、加权等模式进行融合。然而,多种样本因素与最终的专家评分的映射关系往往具有非线性特征,所以这里通过一个深度神经网络来刻画多种样本因素与专家评分的映射关系,进而拟合样本标注质量评分融合模型。
样本标注质量模型修正的替代方案是可以从数据层面进行操作,比如如果数据质量比较高且比较重要,就可以通过数据增强的手段对于数据标注质量较高的数据进行增广。而如果确定了数据标注质量比较低的样本时,则可以直接删除。然而这种非此即彼的处理方式,一方面大大降低了模型调整的灵活性,另一方面,也难以充分利用标注样本的价值。
本实施例提出一种基于样本标注质量修正的图像分类系统,包括:样本标注质量评分模块、样本标注质量评分融合模块、样本质量的图像分类模型修正模块;
所述样本标注质量评分模块,包括:质量因素评分模块1、质量因素评分模块2、质量因素评分模块3;
所述样本标注质量评分模块,用于分别从样本标注一致性、样本标注的类别代表能力以及样本标注倾斜程度三个角度得到三种不同的样本标注质量因素评分;
所述样本标注质量评分融合模块,用于根据所述样本标注质量评分模块得到的样本质量因素,构建样本质量判定模型,通过排序学习模型的范式拟合样本质量因素判定模型f,得到每个样本标注的质量评分;
所述样本质量的图像分类模型修正模块,用于基于一个基础图像分类模型,利用所述样本标注质量评分融合模块得到的样本质量分数,将样本质量分数通过代价敏感学习范式,将数据标注质量评分融入基础图像分类模型。
本实施例还提出一种电子设备,包括存储器和处理器;所述存储器上存储有计算机程序;当所述计算机程序在所述处理器上执行时,实现上述的基于样本标注质量修正的图像分类算法。
本实施例还提出一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机指令;当所述计算机指令在上述的电子设备上执行时,实现上述的基于样本标注质量修正的图像分类算法。
以上所述,仅是本发明的较佳实施例,并非对本发明做任何形式上的限制,凡是依说明书据本发明的技术实质对以上实施例所作的任何简单修改、等同变化,均落入本发明的保护范围之内。
Claims (10)
1.一种基于样本标注质量修正的图像分类算法,其特征在于,包括:
获取已标注图片,进行样本标注质量评分,生成样本标注质量评估;
基于所述样本标注质量评估,进行样本标注质量评分融合,生成每个样本标注的质量评分;
基于所述样本标注的质量评分,进行样本质量的图像分类模型修正,生成样本质量模型修正图像分类模型。
2.如权利要求1所述的基于样本标注质量修正的图像分类算法,其特征在于,所述样本标注质量评分,由质量因素评分1、质量因素评分2、质量因素评分3组成;所述样本标注质量评分分别从样本标注一致性、样本标注的类别代表能力和样本标注倾斜程度三个角度得到三种不同的样本标注质量因素评分。
3.如权利要求2所述的基于样本标注质量修正的图像分类算法,其特征在于,所述质量因素评分1利用置信学习估计样本标注的置信度,将训练数据分成n组,利用交叉验证确定样本标注一致性程度,得到质量因素评分1。
4.如权利要求2所述的基于样本标注质量修正的图像分类算法,其特征在于,所述质量因素评分2利用表示学习对图片编码,得到的图片表示向量的平均内类距和平均类间距指标获得每个样本在特征层面对于类别的代表性,得到质量因素评分2。
5.如权利要求2所述的基于样本标注质量修正的图像分类算法,其特征在于,所述质量因素评分3通过统计样本偏斜指标,得到样本类别偏斜程度,得到质量因素评分3。
6.如权利要求1所述的基于样本标注质量修正的图像分类算法,其特征在于,所述样本标注质量评分融合,根据所述质量因素评分1、质量因素评分2、质量因素评分3构建样本质量判定模型,通过专家对一小部分样本质量进行排序,通过排序学习模型的范式拟合样本质量因素判定模型f(质量因素1,质量因素2,质量因素3),得到每个样本标注的质量评分。
7.如权利要求1所述的基于样本标注质量修正的图像分类算法,其特征在于,所述样本质量的图像分类模型修正,基于一个基础图像分类模型,利用所述质量评分融合得到的样本质量分数,将所述样本质量分数通过代价敏感学习范式,将所述数据标注质量评分融入基础图像分类模型。
8.一种基于样本标注质量修正的图像分类系统,其特征在于,包括:样本标注质量评分模块、样本标注质量评分融合模块、样本质量的图像分类模型修正模块;
所述样本标注质量评分模块,包括:质量因素评分模块1、质量因素评分模块2、质量因素评分模块3;
所述样本标注质量评分模块,用于分别从样本标注一致性、样本标注的类别代表能力以及样本标注倾斜程度三个角度得到三种不同的样本标注质量因素评分;
所述样本标注质量评分融合模块,用于根据所述样本标注质量评分模块得到的样本质量因素,构建样本质量判定模型,通过排序学习模型的范式拟合样本质量因素判定模型f,得到每个样本标注的质量评分;
所述样本质量的图像分类模型修正模块,用于基于一个基础图像分类模型,利用所述样本标注质量评分融合模块得到的样本质量分数,将样本质量分数通过代价敏感学习范式,将数据标注质量评分融入基础图像分类模型。
9.一种电子设备,其特征在于,包括存储器和处理器;所述存储器上存储有计算机程序;当所述计算机程序在所述处理器上执行时,实现如权利要求1-7任一项所述的基于样本标注质量修正的图像分类算法。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机指令;当所述计算机指令在如权利要求9所述的电子设备上执行时,实现如权利要求1-7任一项所述的基于样本标注质量修正的图像分类算法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410316767.9A CN118135321A (zh) | 2024-03-19 | 2024-03-19 | 一种基于样本标注质量修正的图像分类算法、系统、设备及介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202410316767.9A CN118135321A (zh) | 2024-03-19 | 2024-03-19 | 一种基于样本标注质量修正的图像分类算法、系统、设备及介质 |
Publications (1)
Publication Number | Publication Date |
---|---|
CN118135321A true CN118135321A (zh) | 2024-06-04 |
Family
ID=91234135
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202410316767.9A Pending CN118135321A (zh) | 2024-03-19 | 2024-03-19 | 一种基于样本标注质量修正的图像分类算法、系统、设备及介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN118135321A (zh) |
-
2024
- 2024-03-19 CN CN202410316767.9A patent/CN118135321A/zh active Pending
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN112711543B (zh) | 一种基于加权软件网络的工作量感知缺陷预测方法 | |
CN110634060A (zh) | 一种用户信用风险的评估方法、系统、装置及存储介质 | |
CN112183652A (zh) | 一种联邦机器学习环境下的边缘端偏见检测方法 | |
CN114819777A (zh) | 一种基于数字孪生技术的企业销售业务分析管理系统 | |
Kang et al. | Predicting subjectivity in image aesthetics assessment | |
CN115294009A (zh) | 一种基于机器学习检测电池极耳焊接缺陷的方法、设备及存储介质 | |
CN111221915B (zh) | 基于CWK-means的在线学习资源质量分析方法 | |
CN118135321A (zh) | 一种基于样本标注质量修正的图像分类算法、系统、设备及介质 | |
CN115730152A (zh) | 基于用户画像分析的大数据处理方法及大数据处理系统 | |
CN115984053A (zh) | 试题推荐方法、装置、电子设备和存储介质 | |
CN116152011A (zh) | 基于模糊神经网络的制造服务数据价值评估方法及装置 | |
CN115456693A (zh) | 一种大数据驱动的汽车外造型设计的自动评估方法 | |
CN114091961A (zh) | 一种基于半监督svm的电力企业供应商评价方法 | |
CN114463268A (zh) | 一种基于贝叶斯深度学习的图像分析方法 | |
CN113781239A (zh) | 一种策略确定方法、装置、电子设备以及存储介质 | |
CN118211061B (zh) | 多指标融合和业务感知的采集系统运行监测方法及系统 | |
CN118211171B (zh) | 一种基于知识图谱的目标路径挖掘方法 | |
CN116977021B (zh) | 基于大数据的系统对接自动推单方法 | |
CN117933832B (zh) | 航天器地面等效性试验的指标权重评估方法 | |
Li | Statistical Method of Social Audit Risk Based on Machine Learning in the Context of Big Data | |
CN118036920A (zh) | 一种基于光伏需求的供应商竞争型匹配方法及系统 | |
CN117454250A (zh) | 一种基于人工智能预测的数据处理方法 | |
CN115511327A (zh) | 一种卫星通信系统的质量评价系统及方法 | |
CN116644985A (zh) | 一种企业经营数据处理方法和系统 | |
CN118797270A (zh) | 多维高精度专家画像刻画方法 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination |