CN115578605A - 基于增量学习的数据分类方法、装置、设备及存储介质 - Google Patents
基于增量学习的数据分类方法、装置、设备及存储介质 Download PDFInfo
- Publication number
- CN115578605A CN115578605A CN202211430792.7A CN202211430792A CN115578605A CN 115578605 A CN115578605 A CN 115578605A CN 202211430792 A CN202211430792 A CN 202211430792A CN 115578605 A CN115578605 A CN 115578605A
- Authority
- CN
- China
- Prior art keywords
- data
- visual image
- image data
- classification model
- data classification
- Prior art date
- Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
- Granted
Links
- 238000000034 method Methods 0.000 title claims abstract description 50
- 230000000007 visual effect Effects 0.000 claims abstract description 267
- 238000013145 classification model Methods 0.000 claims abstract description 154
- 238000012549 training Methods 0.000 claims abstract description 76
- 230000006870 function Effects 0.000 claims abstract description 68
- 238000001514 detection method Methods 0.000 claims abstract description 55
- 238000004821 distillation Methods 0.000 claims description 19
- 238000007689 inspection Methods 0.000 claims description 15
- 238000012163 sequencing technique Methods 0.000 claims description 14
- 238000011176 pooling Methods 0.000 claims description 10
- 238000000605 extraction Methods 0.000 claims description 5
- 238000004140 cleaning Methods 0.000 claims description 3
- 238000012545 processing Methods 0.000 abstract description 3
- 238000004891 communication Methods 0.000 description 5
- 238000013527 convolutional neural network Methods 0.000 description 4
- 238000010586 diagram Methods 0.000 description 4
- 230000035807 sensation Effects 0.000 description 2
- 230000009286 beneficial effect Effects 0.000 description 1
- 230000000694 effects Effects 0.000 description 1
- 238000005516 engineering process Methods 0.000 description 1
- 238000011156 evaluation Methods 0.000 description 1
- 230000010354 integration Effects 0.000 description 1
- 230000003993 interaction Effects 0.000 description 1
- 238000013140 knowledge distillation Methods 0.000 description 1
- 238000003062 neural network model Methods 0.000 description 1
- 230000003287 optical effect Effects 0.000 description 1
- 238000005070 sampling Methods 0.000 description 1
Images
Classifications
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/764—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using classification, e.g. of video objects
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
- G06N3/00—Computing arrangements based on biological models
- G06N3/02—Neural networks
- G06N3/08—Learning methods
-
- G—PHYSICS
- G06—COMPUTING; CALCULATING OR COUNTING
- G06V—IMAGE OR VIDEO RECOGNITION OR UNDERSTANDING
- G06V10/00—Arrangements for image or video recognition or understanding
- G06V10/70—Arrangements for image or video recognition or understanding using pattern recognition or machine learning
- G06V10/82—Arrangements for image or video recognition or understanding using pattern recognition or machine learning using neural networks
Landscapes
- Engineering & Computer Science (AREA)
- Theoretical Computer Science (AREA)
- Evolutionary Computation (AREA)
- Physics & Mathematics (AREA)
- Artificial Intelligence (AREA)
- General Physics & Mathematics (AREA)
- Computing Systems (AREA)
- Health & Medical Sciences (AREA)
- General Health & Medical Sciences (AREA)
- Software Systems (AREA)
- Databases & Information Systems (AREA)
- Medical Informatics (AREA)
- Computer Vision & Pattern Recognition (AREA)
- Multimedia (AREA)
- Life Sciences & Earth Sciences (AREA)
- Biomedical Technology (AREA)
- Biophysics (AREA)
- Computational Linguistics (AREA)
- Data Mining & Analysis (AREA)
- Molecular Biology (AREA)
- General Engineering & Computer Science (AREA)
- Mathematical Physics (AREA)
- Image Analysis (AREA)
Abstract
本发明涉及预测数据处理技术领域,公开了一种基于增量学习的数据分类方法、装置、设备及存储介质,所述方法包括:获取待分类的视觉图像数据和初始数据分类模型;在初始数据分类模型不满足预设上线指标规则时,获取与待分类的视觉图像数据相关联的检测视觉数据;根据视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型;通过目标数据分类模型对待分类的视觉图像数据进行分类;通过上述方式,在初始数据分类模型不满足预设上线指标规则时,根据检测视觉数据和检测视觉数据以及目标损失函数增量训练出目标数据分类模型,然后通过目标数据分类模型进行视觉图像数据的分类,从而能够有效提高分类视觉图像数据的准确性和效率。
Description
技术领域
本发明涉及预测数据处理技术领域,尤其涉及基于增量学习的数据分类方法、装置、设备及存储介质。
背景技术
在计算机中,视觉图像数据分类通常是利用卷积神经网络的模型结构,即通过卷积神经网络可以自动提取视觉图像数据的特征,而不需要人工进行特征提取,然而,卷积神经网络的训练往往会遇到灾难性遗忘的问题,例如,在使用旧视觉图像数据训练得到数据分类模型后,再利用新视觉图像数据进行训练,学习新视觉图像数据的知识会覆盖原来旧视觉图像数据的知识,导致新训练的数据分类模型在旧视觉图像数据上指标降低,为解决上述技术问题,目前常用的相关技术为联合训练和旧模型微调训练实现数据分类模型的迭代更新,但是联合训练耗时较长且训练所占用的内存容量较大,而旧模型微调训练后的模型无法满足部署上线的指标规则,造成最终分类视觉图像数据的准确性和效率较低。
上述内容仅用于辅助理解本发明的技术方案,并不代表承认上述内容是现有技术。
发明内容
本发明的主要目的在于提供一种基于增量学习的数据分类方法、装置、设备及存储介质,旨在解决现有技术因分类模型训练时间较长和目标分类模型训练时无法有效利用已训练好的模型知识,造成分类视觉图像数据的准确性和效率较低的技术问题。
为实现上述目的,本发明提供了一种基于增量学习的数据分类方法,所述基于增量学习的数据分类方法包括以下步骤:
获取待分类的视觉图像数据和初始数据分类模型;
在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据;
根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型;
通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
可选地,所述获取待分类的视觉图像数据和初始数据分类模型,包括:
获取待分类的视觉图像数据,对所述待分类的视觉图像数据进行清洗;
对清洗后的视觉图像数据进行特征提取,得到视觉图像特征数据;
根据所述视觉图像特征数据确定所需的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络;
根据所述所需的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络训练出初始数据分类模型。
可选地,所述根据所述所需的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络训练出初始数据分类模型之后,还包括:
在所述初始数据分类模型满足预设上线指标规则时,对所述初始数据分类模型进行上线部署。
可选地,所述在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据,包括:
在所述初始数据分类模型不满足预设上线指标规则时,获取所述待分类的视觉图像数据的批次信息;
根据所述批次信息在预设视觉数据库中查询出漏检视觉数据和过检视觉数据;
根据所述漏检视觉数据和过检视觉数据得到与所述待分类的视觉图像数据相关联的检测视觉数据。
可选地,所述根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型,包括:
根据初始数据分类模型和所述视觉图像数据推理出对应的softmax输出值;
通过预设熵值算法对所述softmax输出值进行计算,得到当前熵值;
按照所述当前熵值的大小关系对所述视觉图像数据进行排序,得到视觉图像数据排序结果;
在所述视觉图像数据排序结果中选取出前N个视觉图像数据作为目标视觉图像数据;
根据所述目标视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型。
可选地,所述根据所述目标视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型,包括:
获取初始分类损失函数和预设蒸馏损失函数;
将所述初始分类损失函数和所述预设蒸馏损失函数进行拼接,得到目标损失函数;
通过所述目标损失函数根据所述目标视觉图像数据、检测视觉数据训练出目标数据分类模型。
可选地,所述通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类之前,还包括:
获取所述目标数据分类模型的增量训练耗时和增量占用内存容量;
获取联合模型训练的联合训练耗时和联合占用内存容量;
在所述联合训练耗时大于增量训练耗时且所述联合占用内存容量大于增量占用内存容量时,判断所述目标数据分类模型是否满足预设上线指标规则;
在所述目标数据分类模型满足预设上线指标规则时,继续执行通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
此外,为实现上述目的,本发明还提出一种基于增量学习的数据分类装置,所述基于增量学习的数据分类装置包括:
获取模块,用于获取待分类的视觉图像数据和初始数据分类模型;
判断模块,用于在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据;
训练模块,用于根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型;
分类模块,用于通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
此外,为实现上述目的,本发明还提出一种基于增量学习的数据分类设备,所述基于增量学习的数据分类设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于增量学习的数据分类程序,所述基于增量学习的数据分类程序配置为实现如上文所述的基于增量学习的数据分类方法。
此外,为实现上述目的,本发明还提出一种存储介质,所述存储介质上存储有基于增量学习的数据分类程序,所述基于增量学习的数据分类程序被处理器执行时实现如上文所述的基于增量学习的数据分类方法。
本发明提出的基于增量学习的数据分类方法,通过获取待分类的视觉图像数据和初始数据分类模型;在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据;根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型;通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类;通过上述方式,在初始数据分类模型不满足预设上线指标规则时,根据检测视觉数据和检测视觉数据以及目标损失函数增量训练出目标数据分类模型,然后通过目标数据分类模型进行视觉图像数据的分类,从而能够有效提高分类视觉图像数据的准确性和效率。
附图说明
图1是本发明实施例方案涉及的硬件运行环境的基于增量学习的数据分类设备的结构示意图;
图2为本发明基于增量学习的数据分类方法第一实施例的流程示意图;
图3为本发明基于增量学习的数据分类方法一实施例的整体流程示意图;
图4为本发明基于增量学习的数据分类方法第二实施例的流程示意图;
图5为本发明基于增量学习的数据分类装置第一实施例的功能模块示意图。
本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
应当理解,此处所描述的具体实施例仅用以解释本发明,并不用于限定本发明。
参照图1,图1为本发明实施例方案涉及的硬件运行环境的基于增量学习的数据分类设备结构示意图。
如图1所示,该基于增量学习的数据分类设备可以包括:处理器1001,例如中央处理器(Central Processing Unit,CPU),通信总线1002、用户接口1003,网络接口1004,存储器1005。其中,通信总线1002用于实现这些组件之间的连接通信。用户接口1003可以包括显示屏(Display)、输入单元比如键盘(Keyboard),可选用户接口1003还可以包括标准的有线接口、无线接口。网络接口1004可选的可以包括标准的有线接口、无线接口(如无线保真(Wireless-Fidelity,Wi-Fi)接口)。存储器1005可以是高速的随机存取存储器(RandomAccess Memory,RAM)存储器,也可以是稳定的非易失性存储器(Non-Volatile Memory,NVM),例如磁盘存储器。存储器1005可选的还可以是独立于前述处理器1001的存储装置。
本领域技术人员可以理解,图1中示出的结构并不构成对基于增量学习的数据分类设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。
如图1所示,作为一种存储介质的存储器1005中可以包括操作系统、网络通信模块、用户接口模块以及基于增量学习的数据分类程序。
在图1所示的基于增量学习的数据分类设备中,网络接口1004主要用于与网络一体化平台工作站进行数据通信;用户接口1003主要用于与用户进行数据交互;本发明基于增量学习的数据分类设备中的处理器1001、存储器1005可以设置在基于增量学习的数据分类设备中,所述基于增量学习的数据分类设备通过处理器1001调用存储器1005中存储的基于增量学习的数据分类程序,并执行本发明实施例提供的基于增量学习的数据分类方法。
基于上述硬件结构,提出本发明基于增量学习的数据分类方法实施例。
参照图2,图2为本发明基于增量学习的数据分类方法第一实施例的流程示意图。
在第一实施例中,所述基于增量学习的数据分类方法包括以下步骤:
步骤S10,获取待分类的视觉图像数据和初始数据分类模型。
需要说明的是,本实施例的执行主体为基于增量学习的数据分类设备,还可为其他可实现相同或相似功能的设备,例如数据分类控制器等,本实施例对此不作限制,在本实施例中,以数据分类控制器为例进行说明。
应当理解的是,视觉图像数据指的是在视觉领域中需要进行分类的图像数据,该视觉图像数据可以通过数字摄像头捕捉得到,初始数据分类模型指的是通常进行图像分类的模型,该初始数据分类模型可以为基于卷积神经网络的数据分类模型。
进一步地,步骤S10,包括:获取待分类的视觉图像数据,对所述待分类的视觉图像数据进行清洗;对清洗后的视觉图像数据进行特征提取,得到视觉图像特征数据;根据所述视觉图像特征数据确定所需的卷积层通道偏置、输出层偏置以及主干网络数量;根据所述所需的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络训练出初始数据分类模型。
可以理解的是,在得到待分类的视觉图像数据后,首先对待分类的视觉图像数据进行清洗,以筛除待分类的视觉图像数据中重复、无效以及错误的数据,视觉图像特征数据指的是能够唯一识别视觉图像数据的特征数据,在得到视觉图像特征数据后,根据视觉图像特征数据确定所需的卷积层通道偏置、输出层偏置以及主干网络数量,由于视觉图像数据具有采样频率块、像素数量少以及图像种类多的特性,因此,需要对常规的神经网络模型的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络进行调整,然后基于训练的样本视觉图像数据训练出初始数据分类模型。
进一步地,所述根据所述所需的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络训练出初始数据分类模型之后,还包括:在所述初始数据分类模型满足预设上线指标规则时,对所述初始数据分类模型进行上线部署。
应当理解的是,预设上线指标规则指的是判定分类模型是否满足上线的指标要求的规则,在得到初始数据分类模型后,需要判断初始数据分类模型是否满足预设上线指标规则,若是,则将初始数据分类模型上线部署,若否,则使用增量学习迭代训练模型。
步骤S20,在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据。
可以理解的是,相关联的检测视觉数据指的是与待分类的视觉图像数据相关联的视觉数据,该相关联的检测视觉数据包括与待分类的视觉图像数据相同批次的漏检和/或过检的数据,在判定初始数据分类模型不满足预设上线指标规则时,从预设视觉数据库中查询出与待分类的视觉图像数据相关联的检测视觉数据。
进一步地,步骤S20,包括:在所述初始数据分类模型不满足预设上线指标规则时,获取所述待分类的视觉图像数据的批次信息;根据所述批次信息在预设视觉数据库中查询出漏检视觉数据和过检视觉数据;根据所述漏检视觉数据和过检视觉数据得到与所述待分类的视觉图像数据相关联的检测视觉数据。
应当理解的是,批次信息指的是捕捉待分类的视觉图像数据的批次的相关信息,该批次信息可以为批次号,预设视觉数据指的是存储有不同类型不同批次的视觉数据的数据库,在得到批次信息后,根据批次信息在预设视觉数据库中查询出与待分类的视觉图像数据相同批次的漏检视觉数据和过检视觉数据,然后将漏检视觉数据和过检视觉数据作为与待分类的视觉图像数据相关联的检测视觉数据。
步骤S30,根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型。
应当理解的是,目标损失函数指的是训练出目标数据分类模型的损失函数,该目标损失函数可以为基于知识蒸馏的损失函数,基于目标损失函数训练出的目标数据分类模型可以保护待分类的视觉图像数据所代表的知识不被遗忘,提高增量学习迭代模型的训练效果。
步骤S40,通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
可以理解的是,在得到目标数据分类模型后,通过目标数据分类模型对待分类的视觉图像数据进行分类,即快速、准确地将待分类的视觉图像数据划分至所属的类别。
进一步地,步骤S40之前,还包括:获取所述目标数据分类模型的增量训练耗时和增量占用内存容量;获取联合模型训练的联合训练耗时和联合占用内存容量;在所述联合训练耗时大于增量训练耗时且所述联合占用内存容量大于增量占用内存容量时,判断所述目标数据分类模型是否满足预设上线指标规则;在所述目标数据分类模型满足预设上线指标规则时,继续执行通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
应当理解的是,增量训练耗时指的是采用增量学习的方式迭代出目标数据分类模型所耗费的时长,同样,增量占用内存容量指的是采用增量学习的方式迭代出目标数据分类模型所占用的内存容量,联合训练耗时指的是采用联合方式训练出数据分类模型所耗费的时长,同样,联合占用内存容量指的是采用联合方式训练出数据分类模型所占用的内存容量,在判定联合训练耗时大于增量训练耗时且联合占用内存容量大于增量占用内存容量时,表明采用增量学习迭代出的目标数据分类模型在耗时和占用内存容量两评价指标上的性能更优,然后继续判断目标数据分类模型是否满足预设上线指标规则,若是,则表明采用增量学习迭代出的目标数据分类模型在保留待分类的视觉图像数据的基础上,还能获取相关联的检测视觉数据,使目标数据分类模型的指标得到提升,另外,通过模型微调的方式在训练模型时所耗费的时间较短且占用内存容量较少,但是模型训练时会将数据分类模型原有的关于待分类的视觉图像数据所代表的知识覆盖,导致训练后的模型在待分类的视觉图像数据上的指标差,无法满足预设上线指标规则。
可以理解的是,参考图3,图3为整体流程示意图,具体为:根据训练的样本视觉图像数据训练出初始数据分类模型,然后判断初始数据分类模型是否满足预设上限指标规则,若是,则将初始数据分类模型线上部署,若否,则从预设视觉数据库中查询出与待分类的视觉图像数据相关联的检测视觉数据,根据初始数据分类模型和视觉图像数据推理出对应的softmax输出值,并保存其输出,通过预设熵值算法对softmax输出值进行计算,得到当前熵值(enteropy),在当前熵值(enteropy)排序得到的视觉图像数据排序结果中选取出前N个视觉图像数据作为目标视觉图像数据,最后根据目标视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型,然后继续执行判断目标数据分类模型是否预设上限指标规则。
本实施例通过获取待分类的视觉图像数据和初始数据分类模型;在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据;根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型;通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类;通过上述方式,在初始数据分类模型不满足预设上线指标规则时,根据检测视觉数据和检测视觉数据以及目标损失函数增量训练出目标数据分类模型,然后通过目标数据分类模型进行视觉图像数据的分类,从而能够有效提高分类视觉图像数据的准确性和效率。
在一实施例中,如图4所述,基于第一实施例提出本发明基于增量学习的数据分类方法第二实施例,所述步骤S30,包括:
步骤S301,根据初始数据分类模型和所述视觉图像数据推理出对应的softmax输出值。
应当理解的是,softmax输出值指的是在初始分类模型上softmax推理出的数值,具体是在得到视觉图像数据后,在初始数据分类模型上共同推理出对应的softmax输出值。
步骤S302,通过预设熵值算法对所述softmax输出值进行计算,得到当前熵值。
可以理解的是,预设熵值算法指的是计算与softmax输出值相对应的熵值的算法,在得到softmax输出值后,通过预设熵值算法对softmax输出值,以得到当前熵值,具体为:
其中,H(x)为当前熵值,i为分类类别序号,Xi为初始数据分类模型对应分类类别的输出值,P(x)为softmax输出值。
步骤S303,按照所述当前熵值的大小关系对所述视觉图像数据进行排序,得到视觉图像数据排序结果。
应当理解的是,在得到当前熵值后,该当前熵值的数量为多个,然后按照从大到小的顺序对多个熵值进行排序,例如,当前熵值有五个,分别为a、b、c、d以及e,此时的视觉图像数据排序结果为d、b、a、c以及e。
步骤S304,在所述视觉图像数据排序结果中选取出前N个视觉图像数据作为目标视觉图像数据。
可以理解的是,目标视觉图像数据指的是待分类的视觉图像数据中的代表图像数据,在得到视觉图像数据排序结果后,从视觉图像数据排序结果中选取出前N个视觉图像数据作为目标视觉图像数据,该N可以为待分类的视觉图像数据的总数量的百分比,例如,待分类的视觉图像数据的总数量为20,选取总数量的40%作为目标视觉图像数据,即N=20*40%=8。
步骤S305,根据所述目标视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型。
进一步地,步骤S305,包括:获取初始分类损失函数和预设蒸馏损失函数;将所述初始分类损失函数和所述预设蒸馏损失函数进行拼接,得到目标损失函数;通过所述目标损失函数根据所述目标视觉图像数据、检测视觉数据训练出目标数据分类模型。
可以理解的是,预设蒸馏损失函数可以常规的基于蒸馏的损失函数,该预设蒸馏损失函数可以为soft版本的cross-entropy loss,初始分类损失函数指的是常规的用于训练初始数据分类模型的损失函数,然后将初始分类损失函数和所述预设蒸馏损失函数拼接出目标损失函数,具体为:
需要说明的是,预设蒸馏损失函数的具体为:
本实施例根据初始数据分类模型和所述视觉图像数据推理出对应的softmax输出值;通过预设熵值算法对所述softmax输出值进行计算,得到当前熵值;按照所述当前熵值的大小关系对所述视觉图像数据进行排序,得到视觉图像数据排序结果;在所述视觉图像数据排序结果中选取出前N个视觉图像数据作为目标视觉图像数据;根据所述目标视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型;通过上述方式,在推理出softmax输出值后,通过预设熵值算法计算出与softmax输出值对应的当前熵值,然后在排序好的视觉图像数据排序结果中选取出前N个视觉图像数据作为目标视觉图像数据,再通过目标视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型,从而能够训练出满足低训练耗时、占用内存容量小以及满足预设上线指标规则的高性能的目标数据分类模型。
此外,本发明实施例还提出一种存储介质,所述存储介质上存储有基于增量学习的数据分类程序,所述基于增量学习的数据分类程序被处理器执行时实现如上文所述的基于增量学习的数据分类方法的步骤。
由于本存储介质采用了上述所有实施例的全部技术方案,因此至少具有上述实施例的技术方案所带来的所有有益效果,在此不再一一赘述。
此外,参照图5,本发明实施例还提出一种基于增量学习的数据分类装置,所述基于增量学习的数据分类装置包括:
获取模块10,用于获取待分类的视觉图像数据和初始数据分类模型。
判断模块20,用于在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据。
训练模块30,用于根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型。
分类模块40,用于通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
本实施例通过获取待分类的视觉图像数据和初始数据分类模型;在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据;根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型;通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类;通过上述方式,在初始数据分类模型不满足预设上线指标规则时,根据检测视觉数据和检测视觉数据以及目标损失函数增量训练出目标数据分类模型,然后通过目标数据分类模型进行视觉图像数据的分类,从而能够有效提高分类视觉图像数据的准确性和效率。
需要说明的是,以上所描述的工作流程仅仅是示意性的,并不对本发明的保护范围构成限定,在实际应用中,本领域的技术人员可以根据实际的需要选择其中的部分或者全部来实现本实施例方案的目的,此处不做限制。
另外,未在本实施例中详尽描述的技术细节,可参见本发明任意实施例所提供的基于增量学习的数据分类方法,此处不再赘述。
在一实施例中,所述获取模块10,还用于获取待分类的视觉图像数据,对所述待分类的视觉图像数据进行清洗;对清洗后的视觉图像数据进行特征提取,得到视觉图像特征数据;根据所述视觉图像特征数据确定所需的卷积层通道偏置、输出层偏置以及主干网络数量;根据所述所需的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络训练出初始数据分类模型。
在一实施例中,所述获取模块10,还用于在所述初始数据分类模型满足预设上线指标规则时,对所述初始数据分类模型进行上线部署。
在一实施例中,所述判断模块20,还用于在所述初始数据分类模型不满足预设上线指标规则时,获取所述待分类的视觉图像数据的批次信息;根据所述批次信息在预设视觉数据库中查询出漏检视觉数据和过检视觉数据;根据所述漏检视觉数据和过检视觉数据得到与所述待分类的视觉图像数据相关联的检测视觉数据。
在一实施例中,所述训练模块30,还用于根据初始数据分类模型和所述视觉图像数据推理出对应的softmax输出值;通过预设熵值算法对所述softmax输出值进行计算,得到当前熵值;按照所述当前熵值的大小关系对所述视觉图像数据进行排序,得到视觉图像数据排序结果;在所述视觉图像数据排序结果中选取出前N个视觉图像数据作为目标视觉图像数据;根据所述目标视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型。
在一实施例中,所述训练模块30,还用于获取初始分类损失函数和预设蒸馏损失函数;将所述初始分类损失函数和所述预设蒸馏损失函数进行拼接,得到目标损失函数;通过所述目标损失函数根据所述目标视觉图像数据、检测视觉数据训练出目标数据分类模型。
在一实施例中,所述分类模块40,还用于获取所述目标数据分类模型的增量训练耗时和增量占用内存容量;获取联合模型训练的联合训练耗时和联合占用内存容量;在所述联合训练耗时大于增量训练耗时且所述联合占用内存容量大于增量占用内存容量时,判断所述目标数据分类模型是否满足预设上线指标规则;在所述目标数据分类模型满足预设上线指标规则时,继续执行通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
本发明所述基于增量学习的数据分类装置的其他实施例或具有实现方法可参照上述各方法实施例,此处不再赘余。
此外,需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个……”限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质(如只读存储器(Read Only Memory,ROM)/RAM、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,一体化平台工作站,或者网络设备等)执行本发明各个实施例所述的方法。
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
Claims (10)
1.一种基于增量学习的数据分类方法,其特征在于,所述基于增量学习的数据分类方法包括以下步骤:
获取待分类的视觉图像数据和初始数据分类模型;
在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据;
根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型;
通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
2.如权利要求1所述的基于增量学习的数据分类方法,其特征在于,所述获取待分类的视觉图像数据和初始数据分类模型,包括:
获取待分类的视觉图像数据,对所述待分类的视觉图像数据进行清洗;
对清洗后的视觉图像数据进行特征提取,得到视觉图像特征数据;
根据所述视觉图像特征数据确定所需的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络;
根据所述所需的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络训练出初始数据分类模型。
3.如权利要求2所述的基于增量学习的数据分类方法,其特征在于,所述根据所述所需的卷积层、Pooling层、ReLU层、全连接层、Softmax层的Caffe分类网络训练出初始数据分类模型之后,还包括:
在所述初始数据分类模型满足预设上线指标规则时,对所述初始数据分类模型进行上线部署。
4.如权利要求1所述的基于增量学习的数据分类方法,其特征在于,所述在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据,包括:
在所述初始数据分类模型不满足预设上线指标规则时,获取所述待分类的视觉图像数据的批次信息;
根据所述批次信息在预设视觉数据库中查询出漏检视觉数据和过检视觉数据;
根据所述漏检视觉数据和过检视觉数据得到与所述待分类的视觉图像数据相关联的检测视觉数据。
5.如权利要求1所述的基于增量学习的数据分类方法,其特征在于,所述根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型,包括:
根据初始数据分类模型和所述视觉图像数据推理出对应的softmax输出值;
通过预设熵值算法对所述softmax输出值进行计算,得到当前熵值;
按照所述当前熵值的大小关系对所述视觉图像数据进行排序,得到视觉图像数据排序结果;
在所述视觉图像数据排序结果中选取出前N个视觉图像数据作为目标视觉图像数据;
根据所述目标视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型。
6.如权利要求5所述的基于增量学习的数据分类方法,其特征在于,所述根据所述目标视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型,包括:
获取初始分类损失函数和预设蒸馏损失函数;
将所述初始分类损失函数和所述预设蒸馏损失函数进行拼接,得到目标损失函数;
通过所述目标损失函数根据所述目标视觉图像数据、检测视觉数据训练出目标数据分类模型。
7.如权利要求1至6中任一项所述的基于增量学习的数据分类方法,其特征在于,所述通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类之前,还包括:
获取所述目标数据分类模型的增量训练耗时和增量占用内存容量;
获取联合模型训练的联合训练耗时和联合占用内存容量;
在所述联合训练耗时大于增量训练耗时且所述联合占用内存容量大于增量占用内存容量时,判断所述目标数据分类模型是否满足预设上线指标规则;
在所述目标数据分类模型满足预设上线指标规则时,继续执行通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
8.一种基于增量学习的数据分类装置,其特征在于,所述基于增量学习的数据分类装置包括:
获取模块,用于获取待分类的视觉图像数据和初始数据分类模型;
判断模块,用于在所述初始数据分类模型不满足预设上线指标规则时,获取与所述待分类的视觉图像数据相关联的检测视觉数据;
训练模块,用于根据所述视觉图像数据、检测视觉数据以及目标损失函数增量训练出目标数据分类模型;
分类模块,用于通过所述目标数据分类模型对所述待分类的视觉图像数据进行分类。
9.一种基于增量学习的数据分类设备,其特征在于,所述基于增量学习的数据分类设备包括:存储器、处理器及存储在所述存储器上并可在所述处理器上运行的基于增量学习的数据分类程序,所述基于增量学习的数据分类程序配置有实现如权利要求1至7中任一项所述的基于增量学习的数据分类方法。
10.一种存储介质,其特征在于,所述存储介质上存储有基于增量学习的数据分类程序,所述基于增量学习的数据分类程序被处理器执行时实现如权利要求1至7中任一项所述的基于增量学习的数据分类方法。
Priority Applications (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211430792.7A CN115578605B (zh) | 2022-11-16 | 2022-11-16 | 基于增量学习的数据分类方法、装置、设备及存储介质 |
Applications Claiming Priority (1)
Application Number | Priority Date | Filing Date | Title |
---|---|---|---|
CN202211430792.7A CN115578605B (zh) | 2022-11-16 | 2022-11-16 | 基于增量学习的数据分类方法、装置、设备及存储介质 |
Publications (2)
Publication Number | Publication Date |
---|---|
CN115578605A true CN115578605A (zh) | 2023-01-06 |
CN115578605B CN115578605B (zh) | 2023-04-07 |
Family
ID=84588237
Family Applications (1)
Application Number | Title | Priority Date | Filing Date |
---|---|---|---|
CN202211430792.7A Active CN115578605B (zh) | 2022-11-16 | 2022-11-16 | 基于增量学习的数据分类方法、装置、设备及存储介质 |
Country Status (1)
Country | Link |
---|---|
CN (1) | CN115578605B (zh) |
Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150572A (zh) * | 2012-12-11 | 2013-06-12 | 中国科学院深圳先进技术研究院 | 在线式视觉跟踪方法 |
CN112559784A (zh) * | 2020-11-02 | 2021-03-26 | 浙江智慧视频安防创新中心有限公司 | 基于增量学习的图像分类方法及系统 |
CN112990280A (zh) * | 2021-03-01 | 2021-06-18 | 华南理工大学 | 面向图像大数据的类增量分类方法、系统、装置及介质 |
CN113205142A (zh) * | 2021-05-08 | 2021-08-03 | 浙江大学 | 一种基于增量学习的目标检测方法和装置 |
US20210319266A1 (en) * | 2020-04-13 | 2021-10-14 | Google Llc | Systems and methods for contrastive learning of visual representations |
CN113963436A (zh) * | 2021-10-14 | 2022-01-21 | 山东大学 | 基于深度学习的安全帽识别增量学习与角色判定方法 |
CN114693914A (zh) * | 2022-03-24 | 2022-07-01 | 中南大学 | 基于增量学习的目标检测方法及自动驾驶方法 |
-
2022
- 2022-11-16 CN CN202211430792.7A patent/CN115578605B/zh active Active
Patent Citations (7)
Publication number | Priority date | Publication date | Assignee | Title |
---|---|---|---|---|
CN103150572A (zh) * | 2012-12-11 | 2013-06-12 | 中国科学院深圳先进技术研究院 | 在线式视觉跟踪方法 |
US20210319266A1 (en) * | 2020-04-13 | 2021-10-14 | Google Llc | Systems and methods for contrastive learning of visual representations |
CN112559784A (zh) * | 2020-11-02 | 2021-03-26 | 浙江智慧视频安防创新中心有限公司 | 基于增量学习的图像分类方法及系统 |
CN112990280A (zh) * | 2021-03-01 | 2021-06-18 | 华南理工大学 | 面向图像大数据的类增量分类方法、系统、装置及介质 |
CN113205142A (zh) * | 2021-05-08 | 2021-08-03 | 浙江大学 | 一种基于增量学习的目标检测方法和装置 |
CN113963436A (zh) * | 2021-10-14 | 2022-01-21 | 山东大学 | 基于深度学习的安全帽识别增量学习与角色判定方法 |
CN114693914A (zh) * | 2022-03-24 | 2022-07-01 | 中南大学 | 基于增量学习的目标检测方法及自动驾驶方法 |
Non-Patent Citations (1)
Title |
---|
万磊等: "Softmax分类器深度学习图像分类方法应用综述", 《导航与控制》 * |
Also Published As
Publication number | Publication date |
---|---|
CN115578605B (zh) | 2023-04-07 |
Similar Documents
Publication | Publication Date | Title |
---|---|---|
CN110163234B (zh) | 一种模型训练方法、装置和存储介质 | |
CN106547744B (zh) | 一种图像检索方法及系统 | |
JP7493323B2 (ja) | 情報処理装置、情報処理装置の制御方法およびプログラム | |
CN109189767B (zh) | 数据处理方法、装置、电子设备及存储介质 | |
Sznitman et al. | Active testing for face detection and localization | |
CN110472082B (zh) | 数据处理方法、装置、存储介质及电子设备 | |
US11301506B2 (en) | Automated digital asset tagging using multiple vocabulary sets | |
CN110378386B (zh) | 基于有监督的无标记异常识别方法、装置及存储介质 | |
JP6897749B2 (ja) | 学習方法、学習システム、および学習プログラム | |
CN111814828B (zh) | 智能空间规划方法、装置、设备及存储介质 | |
CN108334805A (zh) | 检测文档阅读顺序的方法和装置 | |
US12014530B2 (en) | Image recognition device and method | |
CN112651996B (zh) | 目标检测跟踪方法、装置、电子设备和存储介质 | |
CN111859004A (zh) | 检索图像的获取方法、装置、设备及可读存储介质 | |
CN115292542A (zh) | 基于试题配图的试题搜索方法、系统、存储介质及设备 | |
CN113515653A (zh) | 基于历史数据的模型推荐方法、装置、设备及存储介质 | |
CN114581419A (zh) | 变压器绝缘套管缺陷检测方法、相关设备及可读存储介质 | |
CN114330090A (zh) | 一种缺陷检测方法、装置、计算机设备和存储介质 | |
CN115578605B (zh) | 基于增量学习的数据分类方法、装置、设备及存储介质 | |
CN117112336A (zh) | 智能通信设备异常检测方法、设备、存储介质及装置 | |
CN112163415A (zh) | 针对反馈内容的用户意图识别方法、装置及电子设备 | |
CN116524296A (zh) | 设备缺陷检测模型的训练方法、装置和设备缺陷检测方法 | |
JP6613937B2 (ja) | 品質予測装置、品質予測方法、プログラム及びコンピュータ読み取り可能な記録媒体 | |
CN114742297A (zh) | 动力电池的处理方法 | |
CN114139658A (zh) | 分类模型的训练方法及计算机可读存储介质 |
Legal Events
Date | Code | Title | Description |
---|---|---|---|
PB01 | Publication | ||
PB01 | Publication | ||
SE01 | Entry into force of request for substantive examination | ||
SE01 | Entry into force of request for substantive examination | ||
GR01 | Patent grant | ||
GR01 | Patent grant |